Odhalování a odstraňování duplicit v Tabulkách Google: Průvodce krok za krokem
Pro detekci duplicitních záznamů v Tabulkách Google existují dva hlavní přístupy: využití funkce COUNTIF a nástroje pro čištění dat.
O aplikaci Tabulky Google
Tabulky Google představují bezplatnou cloudovou tabulkovou aplikaci od společnosti Google, která konkuruje Microsoft Office. Tato aplikace umožňuje uživatelům pracovat s daty, provádět výpočty a další operace.
Tabulky Google slouží k úpravě, uspořádání a ukládání dat. Společně s Diskem Google a Prezentacemi Google tvoří součást kancelářského balíčku Dokumenty Google.
Hlavní výhodou Tabulek Google oproti Excelu je možnost spolupráce více uživatelů v reálném čase.
Tabulky Google zjednodušují tvorbu databází díky intuitivnímu rozhraní a praktickým nástrojům pro organizaci dat.
Používání Tabulek Google zvyšuje produktivitu a šetří čas. Uživatelé se nemusí obávat ztráty dat nebo nechtěného přepsání souborů, protože aplikace je založena na cloudu.
Tabulky Google jsou oblíbené pro práci s tabulkami a databázemi a jsou dostupné na všech běžných operačních systémech pro stolní počítače i mobilní zařízení.
Zjednodušení tvorby databází s Tabulkami Google
Vytváření databází bylo dříve náročné a časově zdlouhavé. Díky pokroku technologií, zejména Tabulkám Google, se však tento proces výrazně zjednodušil. Aplikace nabízí řadu funkcí, jako je vkládání grafů, vzorců a obrázků.
Mnoho firem využívá Tabulky Google pro správu a ukládání dat v reálném čase, namísto nákladných databázových systémů jako PostgreSQL, MySQL nebo SQL Server. Pro menší datové sady jsou Tabulky Google oblíbenou alternativou.
Ačkoli Tabulky Google nejsou komplexním systémem pro správu databází pro velké společnosti, pro malé podniky a projekty skvěle fungují a efektivně spravují firemní finance.
Důležité je, že nabízí zdarma řadu pokročilých funkcí, jako je Google Sheets API, skripty aplikací, spouštěče formulářů, časované spouštěče a ImportXML.
Skripty aplikací umožňují připojení k různým databázím prostřednictvím JDBC služby, která podporuje MySQL, Microsoft SQL Server a další databáze.
Firmy mohou s využitím těchto možností snížit své náklady na různé systémy pro správu dat.
Nyní se zaměříme na dopad duplicitních záznamů v databázi.
Negativní dopad duplicitních hodnot v databázi
Duplicitní záznamy v databázi mohou mít negativní vliv na data, zejména pokud se používají pro analýzu nebo vytváření reportů.
V některých případech mohou duplikáty zkreslit data a vést k nepřesným závěrům. Jindy mohou ztížit používání a pochopení dat.
Proto je zásadní být si vědom možných důsledků duplicitních záznamů a přijmout opatření k jejich prevenci nebo eliminaci.
Zvýraznění duplicit v jednom sloupci Tabulky Google
V této sekci se podíváme, jak zvýraznit duplicitní data v Tabulkách Google a jak je následně odstranit.
Běžně používaný vzorec pro zvýraznění duplicit je:
=COUNTIF(rozsah, kritérium)
Následuje podrobný návod, jak tento vzorec použít v Tabulkách Google.
V horním menu vyberte možnost „Formát“ a poté zvolte „Podmíněné formátování“.
Po kliknutí na „Podmíněné formátování“ se na pravé straně zobrazí nové možnosti.
Nejprve definujte rozsah buněk, ve kterých chcete zvýraznit duplikáty. Poté v sekci „Pravidla formátování“ vyberte z rozbalovacího menu možnost „Vlastní vzorec je“.
Do pole pro vzorec vložte následující:
=COUNTIF($G$6:$G$14,G6)>1
Písmeno „G“ v buňce je nutné nahradit příslušným písmenem sloupce, ve kterém chcete duplikáty zvýraznit.
Po kliknutí na tlačítko „Hotovo“ se duplicitní hodnoty ve sloupci zvýrazní.
V sekci „Styl formátování“ můžete změnit barvu zvýraznění nebo další možnosti formátování:
V uvedeném příkladu jsme demonstrovali, jak zvýraznit duplikáty v jednom sloupci.
V následující části se zaměříme na zvýrazňování duplicit ve více sloupcích.
Zvýraznění duplicit ve více sloupcích v Tabulkách Google
Postup pro zvýraznění duplicit ve více sloupcích je v podstatě stejný, jako v předchozím případě. Rozdíly spočívají ve vzorci a rozsahu buněk.
Pro lepší pochopení si to ukážeme na příkladu.
Opět vyberte možnost „Podmíněné formátování“ v menu „Formát“. Možnosti se zobrazí na pravé straně.
Rozsah buněk definujte v sekci „Použít na rozsah“.
V sekci „Pravidla formátování“ zadejte následující vzorec pro zvýraznění duplicit ve více sloupcích:
=COUNTIF($F$6:$I$8,F6)>1
Tento vzorec je jednoduchý a snadno implementovatelný. Určuje pouze rozsah buněk, ve kterých se mají hledat duplikáty.
Po aplikování tohoto vzorce se duplicitní hodnoty ve čtyřech sloupcích zvýrazní.
V tomto příkladu jsme také změnili barvu zvýraznění na modrou.
V další části si ukážeme, jak zvýraznit duplicitní záznamy v řádcích.
Zvýraznění duplicitních řádků v Tabulkách Google
Identifikace duplicitních řádků se v Tabulkách Google mírně liší od zvýraznění duplicitních sloupců.
Nebudeme opakovat každý krok, protože postup je stejný. Zaměříme se pouze na odlišný vzorec.
Podíváme se na příklad.
Rozsah buněk, ve kterých chcete zvýraznit duplikáty, zadáte v sekci „Použít na rozsah“ v možnostech podmíněného formátování.
V sekci „Vlastní vzorec je“ zadejte:
=COUNTIF(ARRAYFORMULA($A$3:$A$10&$B$3:$B$10&$C$3:$C$10),$A3&$B3&$C3)>1
I když vzorec vypadá složitě, obsahuje pouze počáteční a koncové buňky v řádcích, ve kterých chcete duplikáty zvýraznit.
Po spuštění vzorce se zobrazí výsledek.
Barvu zvýraznění lze upravit ve stejném menu, jako u zvýraznění duplicitních sloupců.
Zvýraznění duplicit v Tabulkách Google podle specifických kritérií
Pro zvýraznění duplikátů podle specifických kritérií je nutné použít operátor hvězdička („*“), který funkci COUNTIF umožní propojit dva definované rozsahy.
Syntaxe vzorce je:
=(COUNTIF(Rozsah,Kritérium)>1) * (Nová Podmínka)
Pro lepší pochopení se podíváme na příklad.
Kritérium: Chcete zvýraznit všechny duplicitní řádky v databázi, ale první výskyt duplicitních řádků ponechat nedotčený.
Podíváme se, jak to provést v Tabulce Google. Všechny kroky, kromě změny vzorce, jsou stejné jako v předchozích případech.
Vzorec pro splnění výše uvedených kritérií je následující:
=COUNTIF(ArrayFormula($A$3:$A3&$B$3:$B3&$C$3:$C3),$A3&$B3&$C3)>1
Tento vzorec zahrnuje začátek a konec čísel buněk.
Následující tabulka ukazuje, že první výskyt „Apple“ a „Orange“ je přeskočen a zvýrazněny jsou až ty následující.
Dosud jsme probrali, jak zvýraznit duplicitní data v řádcích, sloupcích a podle specifických kritérií.
V následující části si stručně ukážeme, jak odstranit duplicitní data pomocí zástupce.
Zástupce pro odstranění duplicit
Vyberte databázi nebo sloupec, ze kterého chcete odstranit duplicitní záznamy. V horní nabídce vyberte „Data“, poté „Vyčištění dat“, dále „Odstranit duplikáty“ a klikněte na OK.
Po kliknutí na „Odstranit duplikáty“ se zobrazí okno s možnostmi výběru. Po potvrzení dojde k odstranění duplikátů.
Můžete také zaškrtnout možnost „Data obsahují záhlaví“. Pokud váš list obsahuje záhlaví, zaškrtněte toto políčko, aby ho Tabulka Google při mazání duplikátů ignorovala.
Po potvrzení výběru kliknutím na tlačítko „Odstranit duplikáty“ se duplikáty odstraní a zobrazí se stav.
Jak vytvořit jedinečný seznam?
Pojďme extrahovat jedinečný seznam z databáze, která obsahuje duplikáty.
Vzorec je velmi snadný na pochopení a použití.
Pro demonstraci použijeme jednu z předchozích tabulek.
Syntaxe pro vytvoření jedinečného seznamu je:
=unique(rozsah start: rozsah konec)
Jak je vidět na obrázku, vzorec je nastaven ve sloupci D, kde je definován rozsah buněk, ze kterého chceme extrahovat jedinečná data. Po spuštění se výsledek zobrazí ve sloupci D.
Jak odstranit mezery v Tabulkách Google?
Při práci s textovými nebo číselnými daty v Tabulkách Google se často setkáváme s nadbytečnými mezerami v buňkách, což může být nepříjemné.
V této části si ukážeme, jak se těchto mezer zbavit.
Použijme k odstranění nadbytečných mezer následující tabulku:
Vyberte sloupec nebo datovou sadu, která obsahuje nadbytečné mezery. V horní nabídce vyberte „Data“, poté „Vyčištění dat“ a následně možnost „Oříznout mezery“.
Po výběru možnosti „Oříznout mezery“ se zobrazí výsledek. Jak vidíte, sloupec je nyní bez nadbytečných mezer.
Závěrečné shrnutí
Duplicitní data nejen zbytečně zabírají čas, ale mohou také vést k problémům a nákladným chybám.
V malých tabulkách můžete duplikáty najít ručně, ale u větších to zabere spoustu času a je náchylné k chybám. Výše uvedené metody vám pomohou duplikáty v dokumentu Google identifikovat a odstranit.
Další informace naleznete v ultimátním přehledu FAQ o Tabulkách Google.