Pandy Sumový stĺpec

Pandy Sumovy Stlpec



„Tento článok ukáže, ako sčítať všetky alebo konkrétne stĺpce v dátovom rámci Pandas pomocou Pythonu. Funkcia DataFrame.sum() bude použitá spolu s niekoľkými užitočnými parametrami v početných príkladoch tohto návodu.“

Keď tento tutoriál skončí, možno budete vedieť, ako:







    • Nájdite súčet stĺpca dátového rámca v Pandas.
    • Pridanie stĺpcov dátového rámca dohromady
    • Pridajte stĺpce do dátového rámca Pandas, ktoré spĺňajú zadanú podmienku.
    • Určte súčet po zoskupení údajov dátového rámca.

Ako určiť súčet stĺpcov dátového rámca?

Funkcia „dataframe.sum()“ v Pandas vracia celkový súčet pre zadanú os. Ak je vstupom os indexu, funkcia pridá hodnoty každého stĺpca jednotlivo, potom urobí to isté pre každý stĺpec a vráti sériu, v ktorej je uložený súčet údajov/hodnoty v každom stĺpci. Okrem toho podporuje výpočet súčtu dátového rámca ignorovaním chýbajúcich hodnôt.



Syntax: DataFrame.sum(axis = Žiadne, skipna = Žiadne, úroveň = Žiadne, numeric_only = Žiadne, min_count = 0, **kwargs)



Kde,





os: {stĺpce (1), index (0)}{101}

objednať: Pri výpočte výsledku ignorujte hodnoty NA/null.



úroveň: Ak je špecifikovaná os hierarchická (viac index), pred konverziou na sériu počítajte do určitej úrovne indexu.

numeric_only: Prijateľné sú len stĺpce float, int a boolean. Ak Žiadne, skúste použiť všetko; ak nie, len číselné údaje. Pre série, neimplementované.

min_count: Počet možných hodnôt potrebných na dokončenie operácie. Výsledkom bude NA, ak je prítomných menej non-NA hodnôt ako min_count.

Vrátenie: DataFrame (ak je úroveň špecifikovaná) alebo Series.

Príklad č. 01: Určite súčet stĺpca dátového rámca a všetkých stĺpcov

Najprv sme požadovali dátový rámec s platnými dátovými typmi, t. j. int, float atď., stĺpec alebo stĺpce, pre ktoré môžeme nájsť súčet dát. Dátový rámec sa vytvorí pomocou funkcie pd.DataFrame().


Vytvorili sme požadovaný dátový rámec z pythonského slovníka vo funkcii pd.DataFrame(). Vo vyššie vytvorenom dátovom rámci sú štyri stĺpce „Názov“, „deň1“, „deň2“ a „deň3“. Zo štyroch stĺpcov sú tri stĺpce, t. 5, 2, 3, 4, 6, 2) a (7, 4, 3, 5, 6, 2, 1, 4). Môžeme nájsť len súčet pre tieto tri stĺpce. Súčet pre obe série (t. j. stĺpec) a celý dátový rámec možno určiť pomocou metódy sum(). Začnime tým, že sa naučíme sčítať všetky údaje v stĺpci Pandy.


Na určenie súčtu sme použili metódu sum() v stĺpci „deň2“. Funkcia vrátila hodnotu súčtu 28. Podobne ako v tomto prípade môžeme určiť súčet každého stĺpca Dataframe. Dosiahne sa to jednoduchým použitím metódy sum() naprieč celým dátovým rámcom.


Ako je možné vidieť, súčet v stĺpci „deň1“ je 31; pre „deň 2“ je hodnota súčtu 28, zatiaľ čo pre stĺpec „deň 3“ je hodnota súčtu 32.

Príklad č. 02: Použitie funkcie sum() na zhrnutie hodnôt stĺpca dátového rámca

Ako môžete vidieť z výstupu predchádzajúceho príkladu, funkcia nevrátila skutočné údaje stĺpca údajového rámca, ktoré tvorili súčet. Priradením metódy „DataFrame.sum()“ k stĺpcu DataFrame však získate prístup ku každému stĺpcu v rámci DataFrame vrátane stĺpca súčtu. Najprv vytvoríme ďalší dátový rámec pre tento príklad.


Pomocou pd.DataFrame() bol vytvorený náš dátový rámec. Vytvorili sme dátový rámec s tromi stĺpcami: položka, cena a daň. Položka stĺpca obsahujúca hodnoty reťazca („pero“, „značka“, „pravítko“, „guma“, „ceruzka“, „schránka“, „zošívačka“, „špendlíky“), stĺpec cena, v ktorej sú uložené hodnoty (20, 15, 10, 3, 5, 30, 35, 10) a stĺpec „daň“ pozostáva z hodnôt (8, 5, 3, 3, 4, 10, 5, 2). Teraz spočítajme hodnoty stĺpcov ceny a dane a výsledky uložíme do nového stĺpca pri zachovaní pôvodných stĺpcov dátového rámca.


Ako si možno všimnúť spolu s novým stĺpcom „total“, funkcia vracia aj pôvodné stĺpce daného dátového rámca. V stĺpci „celkom“ je uložený súčet hodnôt stĺpcov „cena“ a „daň“ ku každému údaju „položka“.

Príklad č. 03: Použitie funkcie sum() na určenie súčtu špecifikovaných stĺpcov dátového rámca

Na súčet viacerých stĺpcov dátového rámca môžeme určiť zoznam s menovkami stĺpcov a potom použiť metódu sum() na zoznam, aby sme našli súčet. Rovnako ako predchádzajúce príklady, najprv vytvoríme dátový rámec.


Vytvorili sme náš dátový rámec so štyrmi stĺpcami „študenti“, „známky1“, „známky2“ a „známky3“. Stĺpec „študenti“ obsahuje údaje („Larry“, „James“, „Rob“, „Arya“, „Max“, „Ben“, „Gwen“, „Bill“) a stĺpec „marks1“ ukladá hodnoty (8, 9, 6, 8, 10, 7, 9, 9), pričom v stĺpcoch „marks2“ a „marks3“ sú uložené číselné hodnoty (6, 6, 8, 6, 7, 9, 10, 9 ) a (7, 6, 9, 7, 8, 7, 10, 10).


Najprv sme vytvorili objekt zoznamu s menovkami stĺpcov „študenti“, „známky1“ a „známky3“. Potom sa na zoznam aplikuje metóda sum(). Funkcia sčítala hodnoty stĺpcov známky1 a známky3 len preto, že stĺpec „študenti“ je nečíselný, takže funkcia sum() nemôže nájsť súčet hodnôt stĺpca „študenti“. Do stĺpca „súčet“ sme uložili súčet hodnôt stĺpcov „známky1“ a „známky3“.

Príklad č. 04: Pridajte stĺpce dátového rámca Pandas, ktoré spĺňajú špecifikovanú podmienku

V tomto príklade pridáme hodnoty zadaných stĺpcov, ak spĺňajú zadanú podmienku.


V novovytvorenom dátovom rámci je 5 stĺpcov, t. j. „spoločnosť“, „1. týždeň_predaj“, „2. týždeň_predaj“, „3. týždeň_predaj“ a „pobočky“. Teraz predpokladajme, že nechceme pridávať hodnotu posledného stĺpca, keď pridávame alebo hľadáme súčet hodnôt daných riadkov dátového rámca. Povedzme, že sme len chceli pridať hodnoty stĺpcov so slovom „týždeň“ v ich štítkoch. Na určenie, či sa slovo „týždeň“ nachádza v označení stĺpca alebo nie, je možné vytvoriť porozumenie zoznamu.


Teraz sme získali stĺpce, ktoré majú v štítkoch slovo „týždeň“. Stĺpce obsahujúce slovo „týždeň“ môžeme zhrnúť pomocou argumentu axis=1 vo funkcii sum().


Týmto spôsobom môžeme bezpečne zhrnúť údaje v stĺpcoch po riadkoch bez toho, aby sme zahrnuli všetky stĺpce, ktoré nechceme.

Príklad č. 5: Stanovte súčet po zoskupení údajov dátového rámca

Súčet stĺpcov dátového rámca môžeme nájsť aj po zoskupení dát jedného alebo viacerých stĺpcov. Metóda groupby() sa použije na zoskupenie údajov do kategórií v stĺpci. Vytvorme dátový rámec, aby sme mohli zoskupiť údaje jedného z jeho stĺpcov.


Teraz zoskupíme údaje do stĺpca „vek“ a spočítame hodnoty stĺpcov „skóre1“ a „skóre2“ pre každú kategóriu skupiny.


Vidíme, že sčítanie údajov v dátovom rámci po prvom zoskupení hodnôt údajov podľa veku vedie k súčtu po stĺpcoch v závislosti od vekových skupín.

Záver

V tomto návode sme sa vás pokúsili naučiť, ako vypočítať súčet naprieč dátovými rámcami pomocou metódy súčtu Pandas. V príkladoch tohto príspevku sme diskutovali o riadkovom a stĺpcovom pridávaní hodnôt. Okrem toho ste sa naučili, ako podmienečne pridávať stĺpce a ako sčítať hodnoty po zoskupení stĺpca dátového rámca. Teraz môžete byť schopní sčítať stĺpce dátového rámca alebo sčítať hodnoty v stĺpci dátového rámca sami.