Vymažte DataFrame v Pandas

Vymazte Dataframe V Pandas



Odstránenie údajov z Pandas DataFrame sa vykonáva pomocou funkcie pandas.DataFrame.drop(). Okrem tejto funkcie môžeme vybrať riadky z DataFrame bez ohľadu na stĺpce/riadky. Dá sa to urobiť aj pomocou hranatých zátvoriek. V tejto príručke tiež použijeme kľúčové slovo „del“ a funkciu pop() na vymazanie všetkých riadkov iterovaním dátového rámca pomocou cyklu „for“.

Pomocou Pandas.DataFrame.Drop

Na vypustenie konkrétnych riadkov alebo konkrétnych stĺpcov z Pandas DataFrame používame funkciu pandas.DataFrame.drop(). Použime túto funkciu na vypustenie všetkých riadkov a stĺpcov.

Syntax :







Nasleduje syntax funkcie pandas.DataFrame.drop(). Používame iba tri parametre a v tejto príručke diskutujeme iba o týchto troch. K tejto funkcii existuje podrobný návod:



pandy. DataFrame . pokles ( štítky , os , index , stĺpci , úrovni , na mieste , chyby )
  1. Musíme odovzdať zoznam indexov riadkov parametru „labels“, aby sme odstránili všetky riadky z DataFrame. Môžeme tiež odovzdať atribút DataFrame.index, ktorý vyberie všetky indexy riadkov. Podobne musíme tomuto parametru odovzdať všetky názvy stĺpcov alebo odovzdať vlastnosť DataFrame.columns.
  2. Ak odovzdávate stĺpce parametru „labels“, nastavte parameter „axis“ na 1. Štandardne je os = 0, ktorá odkazuje na riadky.
  3. Môžeme vykonať operáciu (Delete) na existujúcom DataFrame. Nastavte parameter „inplace“ na hodnotu „True“.

Príklad 1:

Predstavte si dátový rámec „Campaign1“ so štyrmi riadkami a dvoma stĺpcami. Najprv zrušte všetky riadky tak, že indexy riadkov prenesiete do parametra „labels“ a potom zrušte všetky stĺpce odovzdaním štítkov stĺpcov do parametra „labels“.



importovať pandy

# Create DataFrame - Campaign1 s 2 stĺpcami a 4 záznamami
Kampaň1 = pandy. DataFrame ( [ [ 'java camp' , 'India' ] , [ 'linux camp' , 'USA' ] , [ 'c/c++ camp' , 'India' ] , [ 'python camp' , 'USA' ] ] ,
stĺpci = [ 'Campaign_Name' , 'miesto' ] )
vytlačiť ( Kampaň1 , ' \n ' )

# Zrušte všetky riadky
Kampaň1. pokles ( štítky = [ 0 , 1 , 2 , 3 ] , na mieste = Pravda )
vytlačiť ( Kampaň1 , ' \n ' )

# Zrušte všetky stĺpce
Kampaň1. pokles ( štítky = [ 'Campaign_Name' , 'miesto' ] , na mieste = Pravda , os = 1 )
vytlačiť ( Kampaň1 , ' \n ' )

Výkon :





Po odstránení riadkov sa riadky odstránia, ale stĺpce existujú. Po odstránení stĺpcov je stĺpec „Campaign1“ prázdny.



Príklad 2:

Využite predchádzajúci dátový rámec „Campaign1“ a zrušte riadky tak, že do parametra „labels“ odošlete „Campaign1.index“ a potom zrušte stĺpce zadaním „Campaign.columns“ do parametra „labels“.

importovať pandy

# Create DataFrame - Campaign1 s 2 stĺpcami a 4 záznamami
Kampaň1 = pandy. DataFrame ( [ [ 'java camp' , 'India' ] , [ 'linux camp' , 'USA' ] , [ 'c/c++ camp' , 'India' ] , [ „python camp“ , 'USA' ] ] ,
stĺpci = [ 'Campaign_Name' , 'miesto' ] )
vytlačiť ( Kampaň1 , ' \n ' )

# Zrušte všetky riadky
Kampaň1. pokles ( štítky = Kampaň1. index , na mieste = Pravda )

# Zrušte všetky stĺpce
Kampaň1. pokles ( štítky = Kampaň1. stĺpci , na mieste = Pravda , os = 1 )
vytlačiť ( Kampaň1 )

Výkon :

Po odstránení riadkov sa riadky odstránia, ale stĺpce existujú. Po odstránení stĺpcov je stĺpec „Campaign1“ prázdny.

Používanie Iloc[]

Vlastnosť pandas.DataFrame.iloc[] sa používa na výber údajov na základe pozície indexu. Túto vlastnosť môžeme použiť na výber 0 riadkov a 0 stĺpcov z DataFrame. Tu neodstraňujeme skutočný DataFrame, ale vyberieme 0 záznamov.

Syntax :

Najprv musíme odstrániť stĺpce a potom riadky.

  1. Vyberte 0 stĺpcov – DataFrame.iloc[:,0:0]
  2. Vyberte 0 riadkov – DataFrame.iloc[0:0]

Príklad :

Použite rovnaký DataFrame a vyberte prázdny DataFrame pomocou vlastnosti iloc[].

importovať pandy

# Create DataFrame - Campaign1 s 2 stĺpcami a 4 záznamami
Kampaň1 = pandy. DataFrame ( [ [ 'java camp' , 'India' ] , [ 'linux camp' , 'USA' ] , [ 'c/c++ camp' , 'India' ] , [ „python camp“ , 'USA' ] ] ,
stĺpci = [ 'Campaign_Name' , 'miesto' ] )
vytlačiť ( Kampaň1 , ' \n ' )

# Zrušte všetky riadky
Kampaň1. pokles ( štítky = [ 0 , 1 , 2 , 3 ] , na mieste = Pravda )
vytlačiť ( Kampaň1 , ' \n ' )

# Zrušte všetky stĺpce
Kampaň1. pokles ( štítky = [ 'Campaign_Name' , 'miesto' ] , na mieste = Pravda , os = 1 )
vytlačiť ( Kampaň1 , ' \n ' )

Výkon :

Pomocou kľúčového slova Del

Všetky údaje budú z DataFrame odstránené pomocou kľúčového slova „del“ opakovaním všetkých riadkov v rámci cyklu „for“.

importovať pandy

# Create DataFrame - Campaign1 so 4 stĺpcami a 4 záznamami
Kampaň1 = pandy. DataFrame ( [ [ 'java camp' , 'India' ] , [ 'linux camp' , 'USA' ] , [ 'c/c++ camp' , 'India' ] , [ „python camp“ , 'USA' ] ] ,
stĺpci = [ 'Campaign_Name' , 'miesto' ] )
vytlačiť ( Kampaň1 , ' \n ' )

# Použitie kľúčového slova del
pre i v Kampaň 1:
z Kampaň1 [ i ]
vytlačiť ( Kampaň1 )

Výkon :

Teraz je DataFrame prázdny.

Pomocou funkcie Pop().

Všetky údaje budú z DataFrame odstránené pomocou funkcie pop() opakovaním všetkých riadkov v rámci cyklu „for“. Táto funkcia je špecifikovaná v rámci cyklu „for“.

importovať pandy

# Create DataFrame - Campaign1 so 4 stĺpcami a 4 záznamami
Kampaň1 = pandy. DataFrame ( [ [ 'java camp' , 'India' ] , [ 'linux camp' , 'USA' ] , [ 'c/c++ camp' , 'India' ] , [ „python camp“ , 'USA' ] ] ,
stĺpci = [ 'Campaign_Name' , 'miesto' ] )
vytlačiť ( Kampaň1 , ' \n ' )

# Použitie pop()
pre i v Kampaň 1:
Kampaň1. pop ( i )
vytlačiť ( Kampaň1 )

Výkon :

Teraz je DataFrame prázdny.

Záver

Naučili sme sa, ako vyčistiť Pandas DataFrame odstránením riadkov a stĺpcov. Najprv sme vypustili riadky z DataFrame pomocou funkcie drop() a potom sme vypustili stĺpce, keď sme použili vlastnosť iloc[] na výber 0 riadkov. Nakoniec sme diskutovali o tom, ako odstrániť záznamy z DataFrame pomocou kľúčového slova „del“ a funkcie pop().