Ako čítať súbor excel (xlsx) v pythone

How Read Excel File Python



The .xlsx je rozšírenie dokumentu programu Excel, ktorý môže ukladať veľké množstvo údajov v tabuľkovej forme, a mnoho typov aritmetických a logických výpočtov je možné ľahko vykonať v tabuľke programu Excel. Niekedy je na účely programovania potrebné prečítať údaje z dokumentu programu Excel pomocou skriptu Python. V Pythone existuje veľa modulov na čítanie dokumentu programu Excel. Niektoré z užitočných modulov sú xlrd , openpyxl a pandy . V tomto tutoriále boli ukázané spôsoby, ako použiť tieto moduly na čítanie súboru programu Excel v Pythone.

Predpoklad:

Na kontrolu príkladov tohto tutoriálu bude potrebný fiktívny súbor Excel s príponou .xlsx. Môžete použiť akýkoľvek existujúci súbor programu Excel alebo vytvoriť nový. Tu je nový súbor programu Excel s názvom výpredaje.xlsx súbor bol vytvorený s nasledujúcimi údajmi. Tento súbor sa používa na čítanie pomocou rôznych modulov pythonu v ďalšej časti tohto tutoriálu.







výpredaje.xlsx



Dátum predaja Predajca Čiastka
12.05.18 Sila Ahmed 60 000
06.06.19 Ja Hossain 50 000
08/09/20 Sarmin Jahan 45 000
07.04.07 Mahmudul Hasan 30 000

Príklad 1: Prečítajte si súbor programu Excel pomocou xlrd

Modul xlrd nie je predvolene nainštalovaný v Pythone. Preto musíte modul pred použitím nainštalovať. Najnovšia verzia tohto modulu nepodporuje súbor programu Excel s príponou .xlsx. Na čítanie súboru xlsx si teda musíte nainštalovať verziu 1.2.0 tohto modulu. Spustite nasledujúci príkaz z terminálu a nainštalujte požadovanú verziu xlrd .



$pipInštalácia xlrd== 1.2.0

Po dokončení procesu inštalácie vytvorte súbor pythonu s nasledujúcim skriptom na čítanie výpredaje.xlsx súbor pomocou xlrd modul. open_workbook () funkcia sa používa v skripte otvorte súbor xlsx na čítanie. Tento súbor programu Excel obsahuje iba jeden list. Takže workbook.sheet_by_index () V skripte bola použitá funkcia s hodnotou argumentu 0. Ďalej vnorené „Za“ loop použil na čítanie hodnôt buniek pracovného hárka pomocou hodnôt riadkov a stĺpcov. V skripte boli použité dve funkcie range () na definovanie veľkosti riadka a stĺpca na základe údajov listu. The cell_value () funkcia použila na čítanie konkrétnej hodnoty bunky listu v každej iterácii slučky. Každé pole vo výstupe bude oddelené jedným priestorom na kartách.





# Importujte modul xlrd
import xlrd

# Otvorte zošit
zošit = xlrd.open_workbook(„sales.xlsx“)

# Otvorte pracovný list
pracovný list = workbook.sheet_by_index(0)

# Opakujte riadky a stĺpce
preivrozsah(0,5):
prejvrozsah(0,3):
# Vytlačte hodnoty buniek pomocou medzery na karte
vytlačiť(worksheet.cell_value(ja, j),koniec=' t')
vytlačiť('')

Výkon:

Po spustení vyššie uvedeného skriptu sa zobrazí nasledujúci výstup.



Príklad 2: Prečítajte si súbor programu Excel pomocou openpyxl

The openpyxl je ďalším modulom pythonu na čítanie súboru xlsx a tiež nie je predvolene nainštalovaný v jazyku Python. Pred použitím tohto modulu spustite z terminálu nasledujúci modul a nainštalujte ho.

$pipInštaláciaopenpyxl

Po dokončení procesu inštalácie vytvorte súbor pythonu s nasledujúcim skriptom na čítanie výpredaje.xlsx súbor. Rovnako ako modul xlrd, openpyxl modul má load_workbook () funkcia na otvorenie súboru xlsx na čítanie. The výpredaje.xlsx Súbor sa používa ako hodnota argumentu tejto funkcie. Predmetom wookbook.active bol vytvorený v skripte na čítanie hodnôt súboru max_row a max_stĺpec vlastnosti. Tieto vlastnosti boli použité vo vnorených slučkách na čítanie obsahu súboru výpredaje.xlsx súbor. Na čítanie riadkov hárka bola použitá funkcia range () a na čítanie stĺpcov hárka funkcia iter_cols (). Každé pole vo výstupe bude oddelené dvoma medzerami na záložkách.

# Importujte modul openyxl
importovať openpyxl

# Definujte premennú na načítanie wookbooku
wookbook = openpyxl.load_workbook(„sales.xlsx“)

# Definujte premennú na čítanie aktívneho listu:
pracovný list = wookbook.active

# Opakovaním slučky prečítajte hodnoty buniek
preivrozsah(0, pracovný list.max_row):
pre s vworksheet.iter_cols(1, pracovný list.max_stĺpec):
vytlačiť(s[i].hodnota,koniec=' t t')
vytlačiť('')

Výkon:

Po spustení vyššie uvedeného skriptu sa zobrazí nasledujúci výstup.

Príklad 3: Prečítajte si súbor programu Excel pomocou príkazov pandas

Modul pandas nie je nainštalovaný s predchádzajúcim modulom podobným pythonu. Ak ste ho teda nenainštalovali skôr, musíte ho nainštalovať. Spustite nasledujúci príkaz a nainštalujte súbor pandy z terminálu.

$pipInštaláciapandy

Po dokončení procesu inštalácie vytvorte súbor pythonu s nasledujúcim skriptom na čítanie výpredaje.xlsx súbor. The read_excel () funkcia pandas sa používa na čítanie súboru xlsx. Táto funkcia bola použitá v skripte na čítanie súboru výpredaje.xlsx súbor. The DataFrame () Funkcia tu použila na čítanie obsahu súboru xlsx v dátovom rámci a uloženie hodnôt do pomenovanej premennej údaje . Hodnota údajov bola vytlačená neskôr.

# Importujte pandy
dovoz pandakopd

# Načítajte súbor xlsx
excel_data = pd.read_excel(„sales.xlsx“)
# Prečítajte si hodnoty súboru v dátovom rámci
data = pd.DataFrame(excel_data,stĺpce=[„Dátum predaja“,„Predajca“,„Suma“])
# Vytlačte obsah
vytlačiť(„Obsah súboru je: n', údaje)

Výkon:

Po spustení vyššie uvedeného skriptu sa zobrazí nasledujúci výstup. Výstup tohto skriptu sa líši od predchádzajúcich dvoch príkladov. Čísla riadkov sa vytlačia v prvom stĺpci, kde sa hodnota riadku počíta od 0. Hodnoty dátumu sú zarovnané centrálne. Mená predajcov sú zarovnané vpravo. Suma je zarovnaná doľava.

Záver:

Používatelia pythonu musia pracovať so súbormi xlsx na rôzne účely programovania. V tomto tutoriále boli ukázané tri rôzne spôsoby čítania súboru xlsx pomocou troch modulov pythonu. Každý modul má rôzne funkcie a vlastnosti na čítanie súboru xlsx. Tento tutoriál pomôže používateľom pythonu po prečítaní tohto tutoriálu ľahko prečítať súbor xlsx pomocou skriptu python.