Pomocou Pandas.DataFrame.Drop
Na vypustenie konkrétnych riadkov alebo konkrétnych stĺpcov z Pandas DataFrame používame funkciu pandas.DataFrame.drop(). Použime túto funkciu na vypustenie všetkých riadkov a stĺpcov.
Syntax :
Nasleduje syntax funkcie pandas.DataFrame.drop(). Používame iba tri parametre a v tejto príručke diskutujeme iba o týchto troch. K tejto funkcii existuje podrobný návod:
pandy. DataFrame . pokles ( štítky , os , index , stĺpci , úrovni , na mieste , chyby )
- Musíme odovzdať zoznam indexov riadkov parametru „labels“, aby sme odstránili všetky riadky z DataFrame. Môžeme tiež odovzdať atribút DataFrame.index, ktorý vyberie všetky indexy riadkov. Podobne musíme tomuto parametru odovzdať všetky názvy stĺpcov alebo odovzdať vlastnosť DataFrame.columns.
- Ak odovzdávate stĺpce parametru „labels“, nastavte parameter „axis“ na 1. Štandardne je os = 0, ktorá odkazuje na riadky.
- Môžeme vykonať operáciu (Delete) na existujúcom DataFrame. Nastavte parameter „inplace“ na hodnotu „True“.
Príklad 1:
Predstavte si dátový rámec „Campaign1“ so štyrmi riadkami a dvoma stĺpcami. Najprv zrušte všetky riadky tak, že indexy riadkov prenesiete do parametra „labels“ a potom zrušte všetky stĺpce odovzdaním štítkov stĺpcov do parametra „labels“.
importovať pandy
# Create DataFrame - Campaign1 s 2 stĺpcami a 4 záznamami
Kampaň1 = pandy. DataFrame ( [ [ 'java camp' , 'India' ] , [ 'linux camp' , 'USA' ] , [ 'c/c++ camp' , 'India' ] , [ 'python camp' , 'USA' ] ] ,
stĺpci = [ 'Campaign_Name' , 'miesto' ] )
vytlačiť ( Kampaň1 , ' \n ' )
# Zrušte všetky riadky
Kampaň1. pokles ( štítky = [ 0 , 1 , 2 , 3 ] , na mieste = Pravda )
vytlačiť ( Kampaň1 , ' \n ' )
# Zrušte všetky stĺpce
Kampaň1. pokles ( štítky = [ 'Campaign_Name' , 'miesto' ] , na mieste = Pravda , os = 1 )
vytlačiť ( Kampaň1 , ' \n ' )
Výkon :
Po odstránení riadkov sa riadky odstránia, ale stĺpce existujú. Po odstránení stĺpcov je stĺpec „Campaign1“ prázdny.
Príklad 2:
Využite predchádzajúci dátový rámec „Campaign1“ a zrušte riadky tak, že do parametra „labels“ odošlete „Campaign1.index“ a potom zrušte stĺpce zadaním „Campaign.columns“ do parametra „labels“.
importovať pandy# Create DataFrame - Campaign1 s 2 stĺpcami a 4 záznamami
Kampaň1 = pandy. DataFrame ( [ [ 'java camp' , 'India' ] , [ 'linux camp' , 'USA' ] , [ 'c/c++ camp' , 'India' ] , [ „python camp“ , 'USA' ] ] ,
stĺpci = [ 'Campaign_Name' , 'miesto' ] )
vytlačiť ( Kampaň1 , ' \n ' )
# Zrušte všetky riadky
Kampaň1. pokles ( štítky = Kampaň1. index , na mieste = Pravda )
# Zrušte všetky stĺpce
Kampaň1. pokles ( štítky = Kampaň1. stĺpci , na mieste = Pravda , os = 1 )
vytlačiť ( Kampaň1 )
Výkon :
Po odstránení riadkov sa riadky odstránia, ale stĺpce existujú. Po odstránení stĺpcov je stĺpec „Campaign1“ prázdny.
Používanie Iloc[]
Vlastnosť pandas.DataFrame.iloc[] sa používa na výber údajov na základe pozície indexu. Túto vlastnosť môžeme použiť na výber 0 riadkov a 0 stĺpcov z DataFrame. Tu neodstraňujeme skutočný DataFrame, ale vyberieme 0 záznamov.
Syntax :
Najprv musíme odstrániť stĺpce a potom riadky.
- Vyberte 0 stĺpcov – DataFrame.iloc[:,0:0]
- Vyberte 0 riadkov – DataFrame.iloc[0:0]
Príklad :
Použite rovnaký DataFrame a vyberte prázdny DataFrame pomocou vlastnosti iloc[].
importovať pandy# Create DataFrame - Campaign1 s 2 stĺpcami a 4 záznamami
Kampaň1 = pandy. DataFrame ( [ [ 'java camp' , 'India' ] , [ 'linux camp' , 'USA' ] , [ 'c/c++ camp' , 'India' ] , [ „python camp“ , 'USA' ] ] ,
stĺpci = [ 'Campaign_Name' , 'miesto' ] )
vytlačiť ( Kampaň1 , ' \n ' )
# Zrušte všetky riadky
Kampaň1. pokles ( štítky = [ 0 , 1 , 2 , 3 ] , na mieste = Pravda )
vytlačiť ( Kampaň1 , ' \n ' )
# Zrušte všetky stĺpce
Kampaň1. pokles ( štítky = [ 'Campaign_Name' , 'miesto' ] , na mieste = Pravda , os = 1 )
vytlačiť ( Kampaň1 , ' \n ' )
Výkon :
Pomocou kľúčového slova Del
Všetky údaje budú z DataFrame odstránené pomocou kľúčového slova „del“ opakovaním všetkých riadkov v rámci cyklu „for“.
importovať pandy# Create DataFrame - Campaign1 so 4 stĺpcami a 4 záznamami
Kampaň1 = pandy. DataFrame ( [ [ 'java camp' , 'India' ] , [ 'linux camp' , 'USA' ] , [ 'c/c++ camp' , 'India' ] , [ „python camp“ , 'USA' ] ] ,
stĺpci = [ 'Campaign_Name' , 'miesto' ] )
vytlačiť ( Kampaň1 , ' \n ' )
# Použitie kľúčového slova del
pre i v Kampaň 1:
z Kampaň1 [ i ]
vytlačiť ( Kampaň1 )
Výkon :
Teraz je DataFrame prázdny.
Pomocou funkcie Pop().
Všetky údaje budú z DataFrame odstránené pomocou funkcie pop() opakovaním všetkých riadkov v rámci cyklu „for“. Táto funkcia je špecifikovaná v rámci cyklu „for“.
importovať pandy# Create DataFrame - Campaign1 so 4 stĺpcami a 4 záznamami
Kampaň1 = pandy. DataFrame ( [ [ 'java camp' , 'India' ] , [ 'linux camp' , 'USA' ] , [ 'c/c++ camp' , 'India' ] , [ „python camp“ , 'USA' ] ] ,
stĺpci = [ 'Campaign_Name' , 'miesto' ] )
vytlačiť ( Kampaň1 , ' \n ' )
# Použitie pop()
pre i v Kampaň 1:
Kampaň1. pop ( i )
vytlačiť ( Kampaň1 )
Výkon :
Teraz je DataFrame prázdny.
Záver
Naučili sme sa, ako vyčistiť Pandas DataFrame odstránením riadkov a stĺpcov. Najprv sme vypustili riadky z DataFrame pomocou funkcie drop() a potom sme vypustili stĺpce, keď sme použili vlastnosť iloc[] na výber 0 riadkov. Nakoniec sme diskutovali o tom, ako odstrániť záznamy z DataFrame pomocou kľúčového slova „del“ a funkcie pop().