Odstraňovanie duplikátov v Tabuľkách Google

Odstranovanie Duplikatov V Tabulkach Google



Duplicitné údaje môžu často viesť k zmätku, chybám a skresleným informáciám. Našťastie nám Tabuľky Google poskytujú množstvo nástrojov a techník na zjednodušenie úlohy identifikácie a odstraňovania týchto nadbytočných záznamov. Od základných porovnávaní buniek až po pokročilé prístupy založené na vzorcoch budete pripravení premeniť neprehľadné hárky na organizované, hodnotné zdroje.
Či už pracujete so zoznamami zákazníkov, výsledkami prieskumov alebo akýmkoľvek iným súborom údajov, odstránenie duplicitných záznamov je základným krokom k spoľahlivej analýze a rozhodovaniu.
V tejto príručke sa ponoríme do dvoch metód, ktoré vám umožnia identifikovať a odstrániť duplicitné hodnoty.

Vytvorenie tabuľky

Najprv sme vytvorili tabuľku v Tabuľkách Google, ktorá bude použitá v príkladoch ďalej v tomto článku. Táto tabuľka má 3 stĺpce: Stĺpec A s hlavičkou „Názov“ obsahuje názvy; Stĺpec B má hlavičku „Vek“, ktorá obsahuje vek ľudí; a nakoniec, stĺpec C, hlavička „Mesto“, obsahuje mestá. Ak si všimneme, niektoré položky v tejto tabuľke sú duplicitné, ako napríklad položky pre „John“ a „Sara“.









Na tejto tabuľke budeme pracovať na odstránení týchto duplicitných hodnôt rôznymi metódami.



Metóda 1: Použitie funkcie „Odstrániť duplikáty“ v Tabuľkách Google

Prvou metódou, o ktorej tu diskutujeme, je odstránenie duplicitných hodnôt pomocou funkcie „Odstrániť duplikáty“ v Tabuľke Google. Táto metóda natrvalo odstráni duplicitné položky z vybratého rozsahu buniek.





Na demonštráciu tejto metódy opäť zvážime vyššie vygenerovanú tabuľku.

Ak chcete začať pracovať na tejto metóde, najprv musíme vybrať celý rozsah obsahujúci naše údaje vrátane hlavičiek. V tomto scenári sme vybrali bunky A1:C11 .



V hornej časti okna Tabuľky Google uvidíte navigačný panel s rôznymi ponukami. Nájdite a kliknite na možnosť „Údaje“ na navigačnom paneli.

Po kliknutí na možnosť „Údaje“ sa zobrazí rozbaľovacia ponuka, ktorá vám poskytne rôzne nástroje a funkcie súvisiace s údajmi, ktoré možno použiť na analýzu, čistenie a manipuláciu s údajmi.

V tomto príklade budeme musieť vstúpiť do ponuky „Údaje“, aby sme prešli na možnosť „Čistenie údajov“, ktorá obsahuje funkciu „Odstrániť duplikáty“.

Po otvorení dialógového okna „Odstrániť duplikáty“ sa nám zobrazí zoznam stĺpcov v našej množine údajov. Na základe týchto stĺpcov budú nájdené a odstránené duplikáty. V dialógovom okne označíme príslušné zaškrtávacie políčka podľa toho, ktoré stĺpce chceme použiť na identifikáciu duplikátov.

V našom príklade máme tri stĺpce: „Meno“, „Vek“ a „Mesto“. Keďže chceme identifikovať duplikáty na základe všetkých troch stĺpcov, zaškrtli sme všetky tri políčka. Okrem toho musíte začiarknuť políčko „Údaje majú riadok hlavičky“, ak má vaša tabuľka hlavičky. Keďže vo vyššie uvedenej tabuľke máme hlavičky, začiarkli sme políčko „Údaje majú riadok hlavičky“.

Keď vyberieme stĺpce na identifikáciu duplikátov, môžeme pokračovať v odstraňovaní týchto duplikátov z našej množiny údajov.

V spodnej časti dialógového okna „Odstrániť duplikáty“ nájdete tlačidlo s názvom „Odstrániť duplikáty“. Kliknite na toto tlačidlo.

Po kliknutí na „Odstrániť duplikáty“ spracujú Tabuľky Google vašu žiadosť. Stĺpce budú naskenované a všetky riadky s duplicitnými hodnotami v týchto stĺpcoch budú odstránené, čím sa úspešne odstránia duplikáty.

Vyskakovacie okno potvrdí, že duplicitné hodnoty boli z tabuľky odstránené. Ukazuje, že boli nájdené a odstránené dva duplicitné riadky, takže v tabuľke zostalo osem jedinečných záznamov.

Po použití funkcie „Odstrániť duplikáty“ sa naša tabuľka aktualizuje takto:

Dôležitá poznámka, ktorú treba zvážiť, je, že odstránenie duplikátov pomocou tejto funkcie je trvalá akcia. Duplicitné riadky budú odstránené z vašej množiny údajov a túto akciu nebudete môcť vrátiť späť, pokiaľ nemáte zálohu údajov. Uistite sa teda, že ste vybrali správne stĺpce na nájdenie duplikátov dvojitou kontrolou výberu.

Metóda 2: Použitie funkcie UNIQUE na odstránenie duplikátov

Druhá metóda, o ktorej tu budeme diskutovať, je použitie UNIKÁTNY funkciu v Tabuľkách Google. The UNIKÁTNY Funkcia získava odlišné hodnoty zo zadaného rozsahu alebo stĺpca údajov. Hoci priamo neodstraňuje duplikáty z pôvodných údajov, vytvára zoznam jedinečných hodnôt, ktoré môžete použiť na transformáciu alebo analýzu údajov bez duplikátov.

Vytvorme príklad na pochopenie tejto metódy.
Použijeme tabuľku, ktorá bola vygenerovaná v úvodnej časti tohto návodu. Ako už vieme, tabuľka obsahuje určité údaje, ktoré sú duplicitné. Vybrali sme teda bunku „E2“ na zapísanie UNIKÁTNY vzorec do. Vzorec, ktorý sme napísali, je nasledujúci:

= UNIQUE(A2:A11)

Pri použití v Tabuľkách Google vzorec UNIQUE získava jedinečné hodnoty v samostatnom stĺpci. Tento vzorec sme teda poskytli s rozsahom od bunky A2 do A11 , ktorý sa použije v stĺpci A. Tento vzorec teda extrahuje jedinečné hodnoty zo stĺpca A a zobrazí ich v stĺpci, kde bol vzorec napísaný.

Vzorec sa použije na určený rozsah, keď stlačíte kláves Enter.

Na tejto snímke vidíme, že dve bunky sú prázdne. Je to preto, že v tabuľke boli duplikované dve hodnoty, a to , John a Emily. The UNIKÁTNY zobrazí iba jeden výskyt každej hodnoty.

Táto metóda neodstránila duplicitné hodnoty priamo zo zadaného stĺpca, ale vytvorila ďalší stĺpec, ktorý nám poskytne jedinečné položky tohto stĺpca, čím sa odstránia duplikáty.

Záver

Odstránenie duplikátov v Tabuľkách Google je užitočná metóda na analýzu údajov. Táto príručka demonštrovala dve metódy, ktoré vám umožňujú jednoducho odstrániť duplicitné položky z vašich údajov. Prvá metóda vysvetlila použitie Tabuliek Google na odstránenie duplicitnej funkcie. Táto metóda skenuje špecifikovaný rozsah buniek a eliminuje duplikáty. Ďalšou metódou, o ktorej sme diskutovali, je použitie vzorca na získanie duplicitných hodnôt. Hoci duplikáty priamo neodstraňuje z rozsahu, namiesto toho zobrazuje jedinečné hodnoty v novom stĺpci.