Pandy do slovníka

Pandy Do Slovnika



„V Pythone sa na ukladanie informácií ako párov kľúč – hodnota používa dátová štruktúra nazývaná slovník. Objekty slovníka sú optimalizované na extrahovanie údajov/hodnôt, keď sú známy kľúč alebo kľúče. Majte na pamäti, že slovníky môžu obsahovať duplicitné kľúče. Aby sme efektívne našli hodnoty pomocou súvisiaceho indexu, môžeme previesť sériu alebo dátový rámec pandy s relevantným indexom na objekt slovníka s pármi kľúč – hodnota „index: hodnota“. Na dosiahnutie tejto úlohy je možné použiť metódu „to_dict()“. Táto funkcia je vstavaná funkcia, ktorá sa nachádza v triede Series modulu pandas. Dátový rámec sa konvertuje na dátový slovník sérií podobný pythonskému zoznamu pomocou metódy pandas.to_dict() v závislosti od zadanej hodnoty parametra orient.“

Ako previesť pandy do slovníka Pythonu?

Existuje niekoľko spôsobov, ako previesť pandy do slovníka. Na transformáciu dátového rámca Pandas na slovník Pythonu však použijeme metódu to_dict() v Pandas. Pomocou funkcie to_dict() môžeme orientovať páry kľúč – hodnota vráteného slovníka rôznymi spôsobmi. Syntax funkcie je nasledovná:







Syntax



pandas.to_dict ( východ = „diktát“, do = )



Parametre

orientovať sa: Na aký dátový typ sa majú stĺpce (série) konvertovať, je špecifikované hodnotou reťazca („dict“, „list“, „records“, „index“, „series“, „split“). Napríklad kľúčové slovo „zoznam“ poskytne pythonovský slovník objektov zoznamu s kľúčmi „Názov stĺpca“ a „Zoznam“ (konvertované série) ako výstup.





do: trieda, môže byť odovzdaná ako inštancia alebo skutočná trieda. Napríklad inštancia triedy môže byť odovzdaná v prípade predvoleného diktátu. Predvolená hodnota parametra je dict.

Typ návratu: Slovník konvertovaný z dátového rámca alebo série.



Príklad č. 01: Konverzia dátového rámca Pandas na slovník

Pomocou n-tice zoznamov vo funkcii pd.DataFrame() vytvoríme základný dátový rámec s niekoľkými stĺpcami a riadkami, aby sme ho neskôr mohli previesť na pythonovský slovník.


Vytvorili sme náš dátový rámec odovzdaním zoznamu do funkcie pd.DataFrame(). Vo vyššie uvedenom dátovom rámci máme tri stĺpce „spoločnosť“, „predaj“ a „výnos“. V stĺpci company máme uložené názvy náhodných spoločností ako („A&B“, „Max_tech“, „XT“, „MJ“, „Quanto“, „Mini_X“, „Zomo“, „AU“, „HL“ , „ZMX“, „Earny“), stĺpec „predaj“ predstavuje tržby každej spoločnosti ako („217“, „200“, „199“, „150“, „210“, „216“, „185 ““, „189“, „202“, „159“, „205“) a stĺpec „výnosy“ obsahuje hodnoty predstavujúce výnosy každej spoločnosti v porovnaní s príslušnými predajmi (340000   320000  300000 270000  315000  325000 0 000 0 000 0 000 0 000 305 000). Teraz prevedieme náš dátový rámec „df“ do pythonového slovníka.


Aplikovaním metódy to_dict() na dátový rámec df sme skonvertovali dátový rámec pandy na slovník.

Príklad č. 02: Konverzia dátového rámca Pandas vytvoreného zo súboru CSV na slovník

V príklade č. 1 sme vytvorili dátový rámec pomocou n-tic v zozname. Teraz si pomocou CSV súboru vytvoríme dataframe a následne ho pomocou funkcie to_dict() prevedieme do slovníka.


Na čítanie súboru ako dátového rámca sme použili funkciu pd.read_csv(). Vo vyššie uvedenom dátovom rámci máme dva stĺpce (Názov a Značky) a sedemnásť riadkov (od 0 do 16). Teraz použijeme metódu to_dict().


Táto funkcia previedla náš dátový rámec „df“ na pythonovský slovník.

Príklad č. 03: Preveďte dátový rámec Pandas na slovník obsahujúci zoznamy hodnôt

V predchádzajúcich príkladoch sme previedli pandy do pythonového slovníka obsahujúceho viacero slovníkov. Pri konverzii dátového rámca na objekt slovníka by označenia stĺpcov mali slúžiť ako kľúče slovníka a všetky údaje alebo hodnoty stĺpcov by sa mali pridať do výsledného slovníka ako zoznam hodnôt pre každý kľúč.


Vytvorili sme dátový rámec s tromi stĺpcami „meno“, „krajina“ a „vek“. V stĺpci „meno“ sme uložili hodnoty údajov („Anna“, „Marty“, „Carl“, „Mary“, „Cleb“, „Ali“, „Alexa“, „Becky“, „Ryan“) . Zatiaľ čo ostatné stĺpce krajina a vek sú silné hodnoty ako („USA“, „Anglicko“, „USA“, „Francúzsko“, „Rusko“, „Rusko“, „Francúzsko“, „Anglicko“, „USA“) a ( 34, 32, 30, 27, 31, 33, 35, 25, 30). Vytvoríme slovník obsahujúci zoznamy pomocou parametra „list“ v metóde to_dict().


Použitím parametra list ako argumentu vo funkcii to_list() sme vygenerovali slovník obsahujúci viacero zoznamov.

Príklad č. 03: Preveďte dátový rámec Pandas na slovník obsahujúci sériu hodnôt

Keď je potrebné transformovať DataFrame na slovník, názov stĺpca slúži ako kľúče slovníka a index riadka a údaje v stĺpci ako hodnota pre zodpovedajúce kľúče v slovníku.


Požadovaný dátový rámec sme vytvorili pomocou metódy pd.DataFrame(). V nedávno vytvorenom dátovom rámci máme dva stĺpce. V stĺpci názvu sú uložené hodnoty údajov ako reťazec („Kim“, „Morris“, „Casper“, „Milli“, „Dave“, „Will“, „Billy“), zatiaľ čo stĺpce značiek pozostávajú z číselných údajov ako ( 8, 9, 6, 7, 10, 7, 8). Parameter „series“ použijeme ako reťazec vo funkcii to_dict().

Príklad č. 04: Preveďte dátový rámec Pandas na slovník bez indexu a hlavičky

Parameter „split“ funkcie to_dict() možno použiť na extrahovanie údajov z DataFrame bez hlavičiek stĺpcov alebo keď potrebujeme z údajov odstrániť hlavičku a index riadkov. Označenia stĺpcov, index riadkov a skutočné údaje sú pomocou tohto parametra rozdelené do troch komponentov. Vytvorme dátový rámec, aby sme ho mohli rozdeliť na tri časti a previesť ho do slovníka.


Vytvorili sme dva stĺpce s menovkami „meno“ a „vek“ s hodnotami („Dave“, „Morris“, „Billy“, „Milli“, „Kim“, „Will“, „Casper“) a (19, 19 , 25, 21, 19, 21, 23). Preveďme ich do pythonových slovníkov.


Pomocou kľúča „údaje“ môžeme získať údaje z výsledného slovníka bez indexu alebo hlavičky.

Príklad č. 05: Preveďte dátový rámec Pandas do slovníka podľa indexu riadkov a riadkov

Parameter „record“ možno použiť vo funkcii to_dict() na uloženie údajov každého riadku dátového rámca do viacerých odlišných objektov slovníka v rámci zoznamu, alebo keď sú potrebné údaje po riadkoch. Vráti sa zoznam obsahujúci objekty slovníka. Slovník s menovkou stĺpca ako kľúčom a údajmi stĺpca ako hodnotou pre každý riadok.


Vytvorili sme dátový rámec so stĺpcami „meno“ a „plat“. Stĺpec „meno“ obsahuje hodnoty údajov („Leo“, „Haris“, „Wanda“, „Mike“, „Kelly“, „Adam“, „Jack“) a stĺpec plat obsahuje hodnoty (12 000, 12 500 , 14 000, 11 000, 12 000, 13 000, 12 500). Teraz vytvorte zoznam s viacerými pythonovými slovníkmi obsahujúcimi údaje každého riadku.


Parameter index možno použiť aj na konverziu údajov každého riadku z dátového rámca do slovníka. Vráti sa zoznam obsahujúci položky slovníka. Každý riadok generuje slovník. Kde index riadka bude kľúč a hodnota bude slovník údajov a označenie stĺpca.

Záver

V tomto návode sme diskutovali o tom, ako môžeme previesť objekty dataframe alebo pandas do pythonového slovníka. Videli sme syntax funkcie to_dict(), aby sme pochopili parametre tejto funkcie a ako môžete upraviť výstup funkcie zadaním funkcie s rôznymi parametrami. V príkladoch tohto tutoriálu sme použili metódu to_dict(), vstavanú funkciu pandas, na zmenu objektov pandas na slovník python.