Jedinečný dátový rámec Pandas

Jedinecny Datovy Ramec Pandas



Najpopulárnejšia knižnica Python, ktorá sa používa v dátovej vede, sa nazýva Pandas. Programátorom Pythonu ponúka vysokovýkonné, užívateľsky prívetivé nástroje na analýzu údajov. Keď pochopíte základné funkcie a ako ich používať, Pandas je účinný nástroj na zmenu údajov. V „pandách“ sú štandardnými metódami na ukladanie údajov v tabuľkovej forme dátové rámce. Môžeme použiť niektoré metódy „pandy“ na získanie jedinečných hodnôt v stĺpci DataFrame „pandy“. Keď potrebujeme získať jedinečné hodnoty v stĺpcoch DataFrame a nechceme duplikovať hodnoty v stĺpci DataFrame „pandy“, môžeme na to použiť metódy, ktoré „pandy“ poskytujú. Pozrime sa na takéto metódy v tejto príručke spolu s niekoľkými príkladmi a výstupmi na získanie jedinečných hodnôt v stĺpci „pandy“ v DataFrame.

Metódy na získanie jedinečných hodnôt v stĺpcoch DataFrame „pandy“.

Na získanie jedinečných hodnôt v stĺpcoch DataFrame „pandy“ môžeme použiť dva spôsoby. Vypustíme duplicitné hodnoty a získame iba jedinečné hodnoty v stĺpcoch údajových rámcov. Metódy, ktoré „pandy“ poskytujú na vykonanie tejto úlohy, sú:







  • Použitím metódy unique().
  • Použitím metódy drop_dupliactes().

Teraz použijeme obe metódy v kódoch „pandy“ na získanie jedinečných hodnôt v stĺpcoch DataFrame „pandy“.



Príklad #01

Aplikácia „Spyder“ sa tu používa na generovanie týchto kódov „pandy“ na využitie metód, ktoré nám pomáhajú získať jedinečné hodnoty v stĺpcoch DataFrame „pandy“. Pred vytvorením DataFrame musíme importovať moduly „pandy“, ktoré sú potrebné pre kód „pandy“. Použitím výrazu „import“ a umiestnením „pandy ako pd“ tieto moduly importujeme.



Teraz pomocou „pd“ môžeme rýchlo získať funkcie alebo metódy „pandy“. Potom vložíme „Údaje o predmete“, do ktorého pridáme „Meno“ a do „Meno“ pridáme údaje o mene, ktoré sú „Rímsky, William, Peter, Smith, John, Milli, Thomas a James“. Potom do „Subj“ pridáme údaje o predmete, ktoré sú „Matematika, ekonómia, veda, matematika, štatistika, štatistika, štatistika a počítač“. Potom tieto „Subject_data“ konvertujeme na DataFrame „Subject_df“ pomocou metódy „pd.DataFrame()“. Umiestnime „Subject_df“ do metódy „print()“, takže sa zobrazí na termináli.





Teraz chceme získať jedinečné hodnoty v stĺpci 'Pandy' DataFrame 'Subj'. Na tento účel tu používame metódu „unique()“ a pridáme názov stĺpca a tiež názov DataFrame, ako je uvedené nižšie. Túto metódu pridáme do „print()“, takže výsledok sa zobrazí aj na termináli.



Teraz stlačíme „Shift+Enter“, aby sme získali výsledok tohto kódu a ten sa vykreslí na termináli a je zobrazený aj tu, ktorý obsahuje DataFrame so všetkými hodnotami. Toto je pôvodný DataFrame, ktorý sme pridali do kódu a pod ním sa zobrazujú jedinečné hodnoty stĺpca „Subj“. Zruší duplicitné hodnoty a zobrazí jedinečné hodnoty stĺpca „Subj“ DataFrame.

Príklad #02

Vytvárame „Sample_list“, ktorý obsahuje niektoré informácie. Vložíme „Layla, 21, 28, 31, 14 a 39“, ktorý sa zobrazí ako prvý stĺpec, keď tento zoznam prevedieme na DataFrame. Potom pridáme „Lusy, 31, 25, 34, 26 a 21“ ako druhý riadok DataFrame. Potom máme „Peter, 38, 20, 20, 35 a 24“ a „Layla 38, 23, 39 24, 23“, čo bude tretí a štvrtý riadok DataFrame. Vložíme aj tri ďalšie údaje, ktorými sú „Stella, 21, 24, 24, 28, 31“, „Layla, 33, 32, 26, 30, 25“ a tiež „Peter, 21, 21, 31, 21, 29“ .

Teraz konvertujeme „Sample_list“ na „DF_Sample“, čo je názov DataFrame tu vložením funkcie „pd.DataFrame()“. Tiež sme nastavili názov stĺpcov tohto DataFrame a tieto názvy sú „Name, Ass_1, Ass_2, Ass_3, Ass_4 a Ass_5“. Potom použijeme funkciu „print()“, ktorá pomáha pri zobrazovaní dátového rámca „DF_Sample“. Teraz v tomto príklade používame inú metódu na získanie jedinečných hodnôt v stĺpci DataFrame. Táto metóda je metódou „drop_duplicates()“ funkcie „pandy“.

V metóde „drop_duplicates()“ nastavujeme názov stĺpca, v ktorom chceme získať jedinečné hodnoty v stĺpci DataFrame. Jedinečné hodnoty stĺpca „Name“ získame odstránením duplicitných hodnôt v tomto stĺpci pomocou metódy „drop_duplicates()“ a tiež vykreslením týchto jedinečných hodnôt pomocou funkcie „print()“.

Názvy, ktoré sú duplikované, sa po použití metódy „drop_duplicates()“ vypustia a vykreslia sa jedinečné hodnoty. Môžete si všimnúť, že názov „Layla“ sa zobrazuje v troch bunkách stĺpca „Name“. Keď sa však na tento stĺpec použije metóda „drop_duplicates()“, všetky duplicitné hodnoty sa vypustia a na obrazovke sa objaví jeden názov „Layla“. Po odstránení duplicitných hodnôt sa objavil nový DataFrame, ktorý obsahuje jedinečné hodnoty v tomto stĺpci „Name“. Týmto spôsobom môžeme odstrániť duplicitné hodnoty a získať jedinečnú hodnotu v stĺpci DataFrame pomocou metódy „drop_duplicates()“.

Príklad #03

Opäť sa používa rovnaký DataFrame a teraz tu aplikujeme metódu „unique()“. Pomocou metódy „unique()“ umiestnime názov stĺpca, ako aj názov DataFrame, na ktorý chceme použiť metódu „unique()“ na získanie jedinečných hodnôt. Toto vykreslí iba jedinečné hodnoty tohto stĺpca a tieto hodnoty sa nezobrazia vo forme DataFrame.

Tu DataFrame obsahuje sedem hodnôt v stĺpci „Name“, ale keď na tento stĺpec použijeme metódu „unique()“, objavili sa iba štyri hodnoty a toto sú jedinečné hodnoty tohto stĺpca. Nezobrazuje duplicitné hodnoty.

Príklad #04

DataFrame, ktorý vytvoríme v tomto príklade, je „F_G_df“. Do tohto DataFrame vložíme „Moje_ovocie“ a „moja_Vegy“. Stĺpec „Moje_ovocie“ obsahuje „Jablko, pomaranč, jablko, hruška, liči, jablko, jablko, hruška a jablko“. Ďalej máme „My_Vegs“, ktorý obsahuje názvy zeleniny, ktoré sú „Chilli, Bringle, Mrkva, Zemiaky, Zemiaky, Mrkva, Cibuľa, Cesnak a Zázvor“. Tento DataFrame obsahuje iba dva stĺpce.

Teraz získavame jedinečné hodnoty v oboch stĺpcoch pomocou metódy „unique()“. Uvádzame názov DataFrame. Potom zadajte názov prvého stĺpca. Potom použijeme metódu append(). V tomto dodatku opäť umiestnime názov DataFrame a názov druhého stĺpca a umiestnime metódu „unique()“. Získate tak jedinečné hodnoty oboch stĺpcov a potom pripojíte jedinečné hodnoty oboch stĺpcov a zobrazia sa na obrazovke.

Najprv sa vykreslí DataFrame, ktorý obsahuje všetky hodnoty. Potom sa použije metóda „unique()“ a nižšie sa vykreslia jedinečné hodnoty oboch stĺpcov. V tomto kóde získame jedinečné hodnoty vo viacerých stĺpcoch DataFrame pomocou metódy „unique()“.

Záver

Úplné vysvetlenie získania jedinečných hodnôt v stĺpci DataFrame nájdete v tejto príručke. Diskutovali sme o metódach „unique()“ a „drop_duplicates()“, ktoré nám pomáhajú získať jedinečné hodnoty stĺpca DataFrame. Skúmali sme, ako použiť tieto metódy v kóde „pandy“ pomocou týchto metód tu v našich kódoch. V tejto príručke sme ilustrovali rôzne príklady a ukázali sme vám, ako získať jedinečné hodnoty jedného stĺpca pomocou metódy „unique()“, ako aj metódy „drop_duplicates()“. Tiež sme skúmali, ako získať jedinečné hodnoty vo viacerých stĺpcoch pomocou metódy „unique()“ v tejto príručke.