Séria Pandas do CSV

Seria Pandas Do Csv



Metóda “Series.to_csv()” v Pandas vypíše zadaný objekt série v notácii hodnôt oddelených čiarkou (csv). Táto funkcia jednoducho preberá hodnoty zo série a upravuje ich formát pridaním čiarok na oddelenie hodnôt indexu a stĺpca.

Ak chcete použiť túto funkciu, musíme použiť nasledujúcu syntax:









Tento článok vám poskytne dve rôzne techniky, ako sa naučiť používať túto metódu v programe python.



Príklad č. 1: Použitie metódy Series.to_csv() na konverziu série s DatetimeIndex na hodnoty oddelené čiarkami

Na úpravu série do formátu CSV použijeme funkciu „Series.to_csv()“. Táto ilustrácia vygeneruje sériu s DatetimeIndex a potom ju skonvertuje do formátu hodnôt oddelených čiarkami.





Na uvedenie tejto metódy do prevádzky potrebujeme nástroj, ktorý podporuje programovanie v pythone. Na zostavovanie kódov je zvolený nástroj „Spyder“. Aby sme na ňom napísali skript, najprv sme spustili nainštalovaný nástroj v našom systéme. Program python potrebuje knižnicu na uplatnenie svojich metód na dosiahnutie požadovaného výsledku. Knižnica, ktorú sme tu nahrali, sú „Pandy“. V tom istom riadku kódu je alias tejto knižnice označený ako „pd“. Takže kdekoľvek v programe musíme napísať „pandy“, aby sme získali prístup k funkcii. Namiesto toho by sme napísali „pd“.

Prvým krokom na začatie s kódom je vygenerovanie série Pandas. Potrebujeme napísať „pd“, aby sme použili metódu vytvárania série z pandy. Funkcia „pd.Series()“ sa volá na vytvorenie série so špecifikovanými hodnotami. Hodnoty, ktoré sme poskytli pre sériu, sú „Istanbul“, „Izmir“, „Ankara“, „Ankara“, „Antalya“, „Konya“ a „Bursa“. Ak chcete pomenovať toto pole hodnôt, môžete tak urobiť pomocou parametra „name“. Tu sme toto pole hodnôt nazvali „Mestá“, pretože obsahuje názvy 6 miest. Na uloženie tejto série bol vytvorený objekt série „Turecko“.



Na vytvorenie DatetimeIndex sme vyvolali metódu „pd.date_range()“. Medzi zátvorky tejto funkcie sme vložili 4 argumenty, ktoré sú: „start“, „freq“, „periods“ a „tz“.

Argument „začiatok“ vyžaduje dátum a čas, aby sa z neho začal generovať rozsah dátumov. Tu sme uviedli dátum a čas začiatku ako „2022-03-02 02:30“. Parameter „frekvencia“ klasifikuje frekvenciu pre rozsah dátumov. Poskytli sme mu teda hodnotu „D“. Teraz vytvorí rozsah dátumov s dennou frekvenciou. Argument „obdobie“ je nastavený na „6“, čo znamená, že vygeneruje rozsah dátumov na 6 dní. Posledný parameter je „tz“, ktorý určuje časové pásmo pre špecifikovanú oblasť. Špecifikovali sme časové pásmo pre „Ázia/Istanbul“.

Na uloženie tohto rozsahu dátumov sme vytvorili premennú „Dátum a čas“. Na nastavenie DatetimeIndex sme použili vlastnosť „Series.index“. Názov série „Turecko“ je dodávaný s vlastnosťou „.index“ a je mu priradený rozsah dátumov a časov uložený v premennej „Datetime“. Vlastnosť „index“ teda prevezme hodnoty z premennej „Datetime“ a urobí z nich zoznam indexov série „Turecko“. Nakoniec, aby sme zobrazili sériu výstupov, použili sme metódu „print()“ a odovzdali sme sériu „Turecko“ ako vstup na zobrazenie jej obsahu.

Práve sme stlačili možnosť „Spustiť súbor“ na spustenie skriptu. V dôsledku toho môžeme vidieť sériu s DatetimeIndex začínajúcou od „2022-03-02 02:30:00+03:00“ a končiacou na „2022-03-07 02:30:00+03:00“, ktorá vytvára obdobie 6 dní. Pod sériou je tiež uvedené „Freq :D“, názov zoznamu polí „Cities“ a dtype „object“.

Teraz sa naučíme previesť túto sériu, ktorú sme práve videli na snímke vyššie, do formátu CSV. Na úpravu série na hodnoty oddelené čiarkami máme metódu poskytnutú modulom pandas, ktorá je „Series.to_csv()“. Táto metóda preberá hodnoty poskytnutého radu a pridáva čiarky medzi hodnoty stĺpca.

Zavolá sa funkcia “Series.to_csv()”. Názov série, ktorú chceme konvertovať, je uvedený pri metóde ako „Turkey.to_csv()“. Aby sme zachovali hodnoty oddelené čiarkou, vytvorili sme premennú „Comma_Separated“ a potom sme jej obsah umiestnili do výstupného okna vyvolaním funkcie „print()“.

Tu je náš seriál vo formáte csv. Na snímke vidíme, že hodnoty indexu a série boli oddelené pomocou čiarok v nich.

Príklad č. 2: Použitie metódy Series.to_csv() na konverziu série s hodnotami NaN na hodnoty oddelené čiarkou

Druhou technikou na vykonanie metódy „Series.to_csv()“ je použiť túto metódu na konverziu série, ktorá obsahuje nejaké nulové položky, do formátu CSV.

Najprv sme doviezli potrebné balíčky. „pd“ je alias pre pandy a „np“ ako alias pre numpy. Tu je načítaná sada nástrojov numpy, pretože do našej série urobíme nejaké nulové položky pomocou „np.NaN“, pričom ju vytvoríme pomocou metódy pandas „pd.Series()“.

Funkcia „pd.Series()“ sa vyvolá na vytvorenie série pand s týmito hodnotami: „Nile“, „Amazon“, np.NaN, „Ganges“, „Mississippi“, „np.NaN“, „Yangtze“, „Dunaj“, „Mekong“, „np.NaN“ a „Volga“. Celkovo je pre sériu definovaných 21 hodnôt, z ktorých 3 položky obsahujú hodnoty „np.NaN“, čo znamená, že v sérii chýbajú 3 hodnoty. Vlastnosť „name“ špecifikuje názov pre toto pole hodnôt, ktoré sme poskytli „Tituly“. Vlastnosť „index“ sa používa na nastavenie užívateľom definovaného zoznamu indexov namiesto toho, aby sa použil predvolený zoznam.

Tu chceme indexový zoznam s hodnotami „10“, „11“, „12“, „13“, „14“, „16“, „17“, „18“, „19“, „20“, a 21“. Teraz bude mať naša séria zoznam indexov začínajúci od „10“ namiesto „0“. Teraz túto sériu uložte, aby sme ju mohli neskôr použiť v programe. Inicializovali sme sériový objekt „Rivers“ a pridelili sme mu výstupný rad generovaný volaním metódy „pd.Series()“. Séria sa dá vidieť tak, že ju vystavíte pomocou funkcie „print()“ od pythonu.

Vykreslený výstup na termináli vytlačil sériu, ktorej zoznam indexov začína od 10 a končí na 21, čo znamená, že séria má 21 hodnôt.

Séria bude transformovaná do formátu CSV pomocou metódy „Series.to_csv()“.

S našou sériou „Turecko“ sme vyvolali metódu „Series.to_csv()“. Preto táto metóda vezme hodnoty zo série „Turecko“ a prevedie ich do formátu hodnôt oddelených čiarkou. Výsledok sa uloží do premennej „Converted_csv“. A nakoniec sa skonvertovaná séria vytlačí pomocou funkcie „print()“.

Na snímke výsledku nižšie môžete vidieť, že hodnoty série sú teraz zmenené tak, že na ich oddelenie od zoznamu indexov sa používa čiarka. Okrem toho tam, kde chýbajú hodnoty, sa vytlačí iba indexové číslo s čiarkou.

Záver

Modifikácia série pand do formátu CSV je praktický prístup. Dá sa to dosiahnuť pomocou funkcie pandas “Series.to_csv()”. Táto príručka uviedla do praxe dve techniky na použitie tejto metódy. V prvej ilustrácii sme túto metódu použili na konverziu série s DatetimeIndex na formát hodnôt oddelených čiarkami. Druhá inštancia použila funkciu „Series.to_csv()“   na úpravu série s niektorými chýbajúcimi položkami do formátu CSV. Obe techniky boli prakticky implementované pomocou nástroja „Spyder“ v operačnom systéme Windows.