Predpoklad:
Na kontrolu príkladov tohto tutoriálu bude potrebný fiktívny súbor Excel s príponou .xlsx. Môžete použiť akýkoľvek existujúci súbor programu Excel alebo vytvoriť nový. Tu je nový súbor programu Excel s názvom výpredaje.xlsx súbor bol vytvorený s nasledujúcimi údajmi. Tento súbor sa používa na čítanie pomocou rôznych modulov pythonu v ďalšej časti tohto tutoriálu.
výpredaje.xlsx
Dátum predaja | Predajca | Čiastka |
---|---|---|
12.05.18 | Sila Ahmed | 60 000 |
06.06.19 | Ja Hossain | 50 000 |
08/09/20 | Sarmin Jahan | 45 000 |
07.04.07 | Mahmudul Hasan | 30 000 |
Príklad 1: Prečítajte si súbor programu Excel pomocou xlrd
Modul xlrd nie je predvolene nainštalovaný v Pythone. Preto musíte modul pred použitím nainštalovať. Najnovšia verzia tohto modulu nepodporuje súbor programu Excel s príponou .xlsx. Na čítanie súboru xlsx si teda musíte nainštalovať verziu 1.2.0 tohto modulu. Spustite nasledujúci príkaz z terminálu a nainštalujte požadovanú verziu xlrd .
$pipInštalácia xlrd== 1.2.0
Po dokončení procesu inštalácie vytvorte súbor pythonu s nasledujúcim skriptom na čítanie výpredaje.xlsx súbor pomocou xlrd modul. open_workbook () funkcia sa používa v skripte otvorte súbor xlsx na čítanie. Tento súbor programu Excel obsahuje iba jeden list. Takže workbook.sheet_by_index () V skripte bola použitá funkcia s hodnotou argumentu 0. Ďalej vnorené „Za“ loop použil na čítanie hodnôt buniek pracovného hárka pomocou hodnôt riadkov a stĺpcov. V skripte boli použité dve funkcie range () na definovanie veľkosti riadka a stĺpca na základe údajov listu. The cell_value () funkcia použila na čítanie konkrétnej hodnoty bunky listu v každej iterácii slučky. Každé pole vo výstupe bude oddelené jedným priestorom na kartách.
# Importujte modul xlrd
import xlrd
# Otvorte zošit
zošit = xlrd.open_workbook(„sales.xlsx“)
# Otvorte pracovný list
pracovný list = workbook.sheet_by_index(0)
# Opakujte riadky a stĺpce
preivrozsah(0,5):
prejvrozsah(0,3):
# Vytlačte hodnoty buniek pomocou medzery na karte
vytlačiť(worksheet.cell_value(ja, j),koniec=' t')
vytlačiť('')
Výkon:
Po spustení vyššie uvedeného skriptu sa zobrazí nasledujúci výstup.
Príklad 2: Prečítajte si súbor programu Excel pomocou openpyxl
The openpyxl je ďalším modulom pythonu na čítanie súboru xlsx a tiež nie je predvolene nainštalovaný v jazyku Python. Pred použitím tohto modulu spustite z terminálu nasledujúci modul a nainštalujte ho.
$pipInštaláciaopenpyxlPo dokončení procesu inštalácie vytvorte súbor pythonu s nasledujúcim skriptom na čítanie výpredaje.xlsx súbor. Rovnako ako modul xlrd, openpyxl modul má load_workbook () funkcia na otvorenie súboru xlsx na čítanie. The výpredaje.xlsx Súbor sa používa ako hodnota argumentu tejto funkcie. Predmetom wookbook.active bol vytvorený v skripte na čítanie hodnôt súboru max_row a max_stĺpec vlastnosti. Tieto vlastnosti boli použité vo vnorených slučkách na čítanie obsahu súboru výpredaje.xlsx súbor. Na čítanie riadkov hárka bola použitá funkcia range () a na čítanie stĺpcov hárka funkcia iter_cols (). Každé pole vo výstupe bude oddelené dvoma medzerami na záložkách.
# Importujte modul openyxlimportovať openpyxl
# Definujte premennú na načítanie wookbooku
wookbook = openpyxl.load_workbook(„sales.xlsx“)
# Definujte premennú na čítanie aktívneho listu:
pracovný list = wookbook.active
# Opakovaním slučky prečítajte hodnoty buniek
preivrozsah(0, pracovný list.max_row):
pre s vworksheet.iter_cols(1, pracovný list.max_stĺpec):
vytlačiť(s[i].hodnota,koniec=' t t')
vytlačiť('')
Výkon:
Po spustení vyššie uvedeného skriptu sa zobrazí nasledujúci výstup.
Príklad 3: Prečítajte si súbor programu Excel pomocou príkazov pandas
Modul pandas nie je nainštalovaný s predchádzajúcim modulom podobným pythonu. Ak ste ho teda nenainštalovali skôr, musíte ho nainštalovať. Spustite nasledujúci príkaz a nainštalujte súbor pandy z terminálu.
$pipInštaláciapandyPo dokončení procesu inštalácie vytvorte súbor pythonu s nasledujúcim skriptom na čítanie výpredaje.xlsx súbor. The read_excel () funkcia pandas sa používa na čítanie súboru xlsx. Táto funkcia bola použitá v skripte na čítanie súboru výpredaje.xlsx súbor. The DataFrame () Funkcia tu použila na čítanie obsahu súboru xlsx v dátovom rámci a uloženie hodnôt do pomenovanej premennej údaje . Hodnota údajov bola vytlačená neskôr.
# Importujte pandydovoz pandakopd
# Načítajte súbor xlsx
excel_data = pd.read_excel(„sales.xlsx“)
# Prečítajte si hodnoty súboru v dátovom rámci
data = pd.DataFrame(excel_data,stĺpce=[„Dátum predaja“,„Predajca“,„Suma“])
# Vytlačte obsah
vytlačiť(„Obsah súboru je: n', údaje)
Výkon:
Po spustení vyššie uvedeného skriptu sa zobrazí nasledujúci výstup. Výstup tohto skriptu sa líši od predchádzajúcich dvoch príkladov. Čísla riadkov sa vytlačia v prvom stĺpci, kde sa hodnota riadku počíta od 0. Hodnoty dátumu sú zarovnané centrálne. Mená predajcov sú zarovnané vpravo. Suma je zarovnaná doľava.
Záver:
Používatelia pythonu musia pracovať so súbormi xlsx na rôzne účely programovania. V tomto tutoriále boli ukázané tri rôzne spôsoby čítania súboru xlsx pomocou troch modulov pythonu. Každý modul má rôzne funkcie a vlastnosti na čítanie súboru xlsx. Tento tutoriál pomôže používateľom pythonu po prečítaní tohto tutoriálu ľahko prečítať súbor xlsx pomocou skriptu python.