Table of Contents
Hlavní poznatky
- RegEx v Google Docs umožňuje složité vyhledávání, i když nemůže nahradit text vzory.
- Používání RegEx zlepšuje přesnost při hledání a nahrazování textu, zejména ve velkých dokumentech.
- RegEx může efektivně odstranit citační čísla, identifikovat duplicitní slova a vyčistit webové odkazy.
Při práci s rozsáhlým dokumentem je často užitečné rychle nalézt konkrétní textové řetězce. Funkce Hledat a nahradit v Google Docs je užitečný nástroj, ale skrytá funkce může tuto moc ještě zvýšit: Regulární výrazy (RegEx).
Maximalizace vyhledávání a nahrazování s RegEx
Schopnost lokalizovat konkrétní text v dokumentu je cenná. Funkce Hledat a nahradit v Google Docs ji vylepšuje tím, že nabízí další pohodlí. Můžete však posunout své vyhledávací schopnosti na další úroveň pomocí regulárních výrazů (RegEx). RegEx je mocný nástroj, který používá posloupnost znaků k shodě vzorů uvnitř textu, což vám umožňuje nacházet obsah s pozoruhodnou přesností.
V Google Docs můžete použít RegEx k upřesnění svého vyhledávacího procesu. Zatímco standardní funkce Hledat vám dovoluje hledat pouze pevný text, RegEx vám umožňuje definovat vzory a snadno najít složité sekvence.
Bohužel, Google Docs v současné době nepodporuje nahrazování textu pomocí vzorů RegEx. Takže i když můžete použít RegEx k vyhledání konkrétních řetězců, můžete je nahradit pouze pevným textem.
Na rozdíl od Google Docs nabízí Google Sheets funkci REGEXREPLACE, která umožňuje hledání a nahrazování textu pomocí RegEx, čímž se stává vysoce efektivním nástrojem pro
nalezení a nahrazení v Google Sheets
.
Navzdory této omezenosti Google Docs může RegEx ušetřit značné množství času, zejména při práci s rozsáhlými dokumenty. Jelikož je volba RegEx ve výchozím nastavení nezaškrtnutá, je snadné ji přehlédnout. Jakmile se však s její funkcionalitou seznámíte, zjistíte, že RegEx je překvapivě jednoduchý a může se stát neocenitelnou součástí vašeho editačního nástroje.
Abyste začali používat Hledat a nahradit s RegEx v Google Docs, stiskněte Ctrl/Cmd + F pro otevření nabídky Hledat. Poté klikněte na tři vertikální tečky pro otevření okna Hledat a nahradit. Zaškrtněte políčko Použít regulární výrazy a jste připraveni začít.
Pokud dáváte přednost, můžete okno Hledat a nahradit otevřít jedinou zkratkou:
Ctrl + H
na Windows nebo
Cmd + Shift + H
na Mac.
Google Docs používá syntaxi RE2 pro RegEx a můžete si prohlédnout kompletní syntaktický průvodce na stránce GitHub RE2 pro podrobnější informace. Ale pokud nejste seznámeni s RegEx, následující příklady běžných použití vám mohou pomoci je vysvětlit.
Nahrazení slov s větší přesností
Jedním z běžných problémů se standardní funkcí Hledat a nahradit je, že často nahrazuje slova uvnitř jiných slov. Například, pokud chcete nahradit slovo „bar“ slovem „pub“, můžete omylem změnit „bargain“ na „pubgain“ nebo „barbershop“ na „pubbershop“. To může vést k trapným a nesprávným změnám.
Toto je moment, kdy RegEx přichází na pomoc. Pomocí RegEx můžete specifikovat, že chcete najít pouze konkrétní slovo „bar“ a nikoli případy, kde je „bar“ součástí delšího slova. V syntaxi RegEx RE2 \b označuje hranice slova, což zajišťuje, že vyhledávání je omezeno na samotné slovo, aniž by ovlivnilo jiná slova, která obsahují stejné znaky.
Pro tento příklad následující posloupnost najde pouze slovo „bar“:
\b(bar)\b
Když tuto posloupnost zadáte, můžete do pole Nahraďte s napsat „pub“ a s důvěrou kliknout na Nahradit vše, vědoma si, že budou nahrazeny pouze přesné shody slova „bar“.
Odstranit citační čísla
Články potřebují citační čísla, aby informovaly čtenáře, odkud informace pocházejí a ujistily je o její platnosti. Pokud však citujete z webové stránky, nemusíte tato citační čísla potřebovat, protože váš text nebude obsahovat dlouhou referenční stránku. V takových případech mohou citační čísla znepravidelnit váš text a učinit ho nepřehledným.
Pomocí RegEx můžete rychle odstranit tato citační čísla v Google Docs, což vám ponechá pouze potřebný text. Zvažte text níže:
Odstraňování citačních čísel a závorek jedno po druhém může být únavné. Nicméně, RegEx sekvence níže může najít všechna citační čísla najednou:
\[\d+\]
\d+ znamená, že hledáme jeden nebo více číslic, a závorky ([ ]) znamenají, že číslice budou uvnitř závorek. Odtud nechte pole Nahraďte s prázdné a klikněte na Nahradit vše pro smazání citačních čísel.
Najít duplicitní slova
Duplicitní slova často pronikají naší psaním, zejména po úpravách. Můj mozek je má tendenci automaticky přehlížet, což ztěžuje jejich nalezení při korekturách. Zatímco dobrý gramatický kontrolor může chytnout duplicitní slova, můžete také použít RegEx v Google Docs k jejich nalezení.
Jednou z parádních funkcí RegEx je zpětný odkaz, který umožňuje posloupnosti pamatovat si, co hledala. To můžete použít k nalezení duplicitních po sobě jdoucích slov s RegEx:
\b(\w+)\s+\1\b
Výše uvedený kód označuje hranice slova s \b, značí slovo s \w+ a umisťuje toto slovo do závorek pro vytvoření zachycené skupiny, aby slovo mohlo být později odkázáno. \s+ představuje jeden nebo více znaků mezery a \1 je zpětný odkaz na první zachycenou skupinu (samotné slovo).
Stručně řečeno, RegEx sekvence hledá slovo, následované mezerou, a poté stejné slovo znovu. Toto efektivně zvýrazňuje všechna duplicitní slova ve vašem dokumentu.
Pokud by Google Docs podporoval RegEx pro nahrazování, mohli byste odstranit všechny ty duplicitní slova jedním krokem. Jak to je, budete muset každé najít pomocí RegEx, a pak je odstranit jednotlivě.
Úklid webových odkazů
URL často obsahují zbytečné sledovací parametry, což je činí dlouhými a nepřitažlivými. Tyto parametry obvykle pomáhají webové stránce sledovat informace jako to, jak jste stránku našli, zda jste přihlášeni, a další. I když s tímto sledováním možná souhlasíte, tyto další parametry dělají URL delší než je nutné.
RegEx může pomoci vyčistit tyto URL odstraněním všeho, co následuje za otazníkem, což je obvykle místo, kde sledovací parametry začínají:
\?(.+)
Posloupnost začíná otazníkem. Tečka (.) shoduje jakýkoli znak a plus (+) znamená jeden nebo více předchozího prvku (v tomto případě jakýkoli znak). Ačkoli sekvence RegEx úspěšně zvýrazní zbytečné parametry v URL, existuje jeden drobný problém: pokud máte větu s skutečným otazníkem použitým pro interpunkci, sekvence RegEx ho také shoduje.
Abychom se tomu vyhnuli, můžete upravit sekvenci RegEx:
\?(?!\s)(.+)
V této sekvenci je ?! negativní look-ahead aserce, která zajišťuje, že znak ihned následující za otazníkem není bílé místo (\s). Tímto se vyloučí skutečné otázky z vzoru.
Teď můžete bez obav odstranit nepořádek z URL tím, že je nahradíte ničím. S čistšími URL bude tabulka mnohem méně zaneřáděná:
Ujistěte se, že zkontrolujete své konečné URL, abyste viděli, že stále fungují!
Tyto příklady jsou jen některé z nespočetných způsobů, jak může RegEx pomoci v Google Docs. I když se na první pohled mohou zdát zastrašující, RegEx je přímočarý, jakmile si na ně zvyknete. Začněte experimentovat a brzy zjistíte, kolik času a úsilí vám RegEx může ušetřit.