PyTorch je rámec pre hlboké učenie, ktorý používateľom umožňuje vytvárať/budovať a trénovať neurónové siete. Množina údajov je dátová štruktúra, ktorá obsahuje množinu/kolekciu vzoriek údajov a označení. Poskytuje spôsob prístupu k údajom ako celku alebo pomocou operácií indexovania a segmentovania. Navyše, množina údajov môže tiež aplikovať transformácie na údaje, ako je orezanie, zmena veľkosti atď. Používatelia môžu jednoducho iterovať a vizualizovať množinu údajov v PyTorch.
Tento zápis ilustruje metódu iterácie a vizualizácie konkrétneho súboru údajov pomocou PyTorch.
Ako iterovať a vizualizovať množinu údajov pomocou PyTorch?
Ak chcete iterovať a vizualizovať konkrétny súbor údajov pomocou PyTorch, postupujte podľa uvedených krokov:
Krok 1: Importujte potrebnú knižnicu
Najprv importujte požadované knižnice. Napríklad sme importovali nasledujúce knižnice:
dovozová baterka
z torch.utils.data import Dataset
z importovaných dátových množín torchvision
z torchvision.transforms import ToTensor
import matplotlib.pyplot ako plt
Tu:
-
- “ dovozová baterka importuje knižnicu PyTorch.
- “ z torch.utils.data import Dataset ” importuje triedu „Dataset“ z modulu „torch.utils.data“ PyTorch na vytváranie vlastných množín údajov v PyTorch.
- “ z importovaných dátových množín torchvision ” importuje modul „datasets“ z knižnice „torchvision“, ktorá poskytuje preddefinované súbory údajov pre úlohy počítačového videnia.
- “ z torchvision.transforms import ToTensor ” importuje transformáciu „ToTensor“ z „torchvision.transforms“ na konverziu obrázkov PIL alebo polí NumPy na tenzory PyTorch.
- “ import matplotlib.pyplot as plt ” importuje knižnicu matplotlib na vizualizáciu údajov:
Krok 2: Načítajte množinu údajov
Teraz načítame súbor údajov FashionMNIST z torchvision na účely školenia aj testovania s nasledujúcimi parametrami:
tr_data = množiny údajov.FashionMNIST ( koreň = 'údaje' , vlak = pravda, Stiahnuť ▼ = pravda, transformovať =ToTensor ( ))
ts_data = množiny údajov.FashionMNIST ( koreň = 'údaje' , vlak = nepravda, Stiahnuť ▼ = pravda, transformovať =ToTensor ( )
)
Tu:
-
- “ FashionMNIST ” načíta množinu údajov FashionMNIST z knižnice torchvision.
- “ root=”data” ” určuje adresár, do ktorého bude množina údajov uložená alebo načítaná, ak už existuje. V našom prípade je to adresár „data“.
- “ vlak “ označuje tréningový alebo testovací súbor údajov.
- “ download=Pravda ” stiahne súbor údajov, ak ešte nie je prítomný.
- “ transform=ToTensor() ” použije transformáciu ToTensor na konverziu obrázkov v množine údajov na tenzory PyTorch:
Krok 3: Označenie tried v množine údajov
Ďalej vytvorte slovník, ktorý mapuje indexy tried na ich zodpovedajúce označenia tried v množine údajov FashionMNIST. Poskytuje ľuďom čitateľné štítky pre každú triedu. Tu sme vytvorili „ mapovaný_štítok ” slovník a použijeme ho na konverziu indexov tried na ich zodpovedajúce označenia tried:
mapovaný_štítok = {0 : 'tričko' ,
1 : 'Nohavice' ,
2 : 'pulover' ,
3 : 'šaty' ,
4 : 'kabát' ,
5 : 'Sandal' ,
6 : 'tričko' ,
7 : 'tenisky' ,
8 : 'taška' ,
9 : 'Členková obuv' ,
}
Krok 4: Vizualizujte množinu údajov
Nakoniec vizualizujte vzorky v tréningových údajoch pomocou knižnice „matplotlib“:
obr = plt.figura ( veľkosť figy = ( 8 , 8 ) )kol , riadok = 3 , 3
pre i v rozsah ( 1 , kol * riadok + 1 ) :
sample_index = pochodeň.randint ( len ( tr_date ) , veľkosť = ( 1 , ) ) .položka ( )
img, label = tr_data [ vzorový_index ]
fig.add_subplot ( riadok, kol , i )
plt.title ( mapovaný_štítok [ štítok ] )
plt.axis ( 'vypnuté' )
plt.imshow ( img.stlačiť ( ) , cmmap = 'sivá' )
plt.show ( )
Poznámka : K nášmu Zápisníku Google Colab môžete pristupovať tu odkaz .
To bolo všetko o iterácii a vizualizácii požadovaného súboru údajov pomocou PyTorch.
Záver
Ak chcete iterovať a vizualizovať konkrétny súbor údajov pomocou PyTorch, najprv importujte potrebné knižnice. Potom načítajte požadovaný súbor údajov na školenie a testovanie s požadovanými parametrami. Ďalej označte triedy v množine údajov a vizualizujte vzorky v trénovacích údajoch pomocou knižnice „matplotlib“. Tento zápis ilustroval metódu iterácie a vizualizácie konkrétneho súboru údajov pomocou PyTorch.