Ako iterovať a vizualizovať množinu údajov pomocou PyTorch?

Ako Iterovat A Vizualizovat Mnozinu Udajov Pomocou Pytorch



PyTorch je rámec pre hlboké učenie, ktorý používateľom umožňuje vytvárať/budovať a trénovať neurónové siete. Množina údajov je dátová štruktúra, ktorá obsahuje množinu/kolekciu vzoriek údajov a označení. Poskytuje spôsob prístupu k údajom ako celku alebo pomocou operácií indexovania a segmentovania. Navyše, množina údajov môže tiež aplikovať transformácie na údaje, ako je orezanie, zmena veľkosti atď. Používatelia môžu jednoducho iterovať a vizualizovať množinu údajov v PyTorch.

Tento zápis ilustruje metódu iterácie a vizualizácie konkrétneho súboru údajov pomocou PyTorch.







Ako iterovať a vizualizovať množinu údajov pomocou PyTorch?

Ak chcete iterovať a vizualizovať konkrétny súbor údajov pomocou PyTorch, postupujte podľa uvedených krokov:



Krok 1: Importujte potrebnú knižnicu



Najprv importujte požadované knižnice. Napríklad sme importovali nasledujúce knižnice:





dovozová baterka
z torch.utils.data import Dataset
z importovaných dátových množín torchvision
z torchvision.transforms import ToTensor
import matplotlib.pyplot ako plt


Tu:

    • dovozová baterka importuje knižnicu PyTorch.
    • z torch.utils.data import Dataset ” importuje triedu „Dataset“ z modulu „torch.utils.data“ PyTorch na vytváranie vlastných množín údajov v PyTorch.
    • z importovaných dátových množín torchvision ” importuje modul „datasets“ z knižnice „torchvision“, ktorá poskytuje preddefinované súbory údajov pre úlohy počítačového videnia.
    • z torchvision.transforms import ToTensor ” importuje transformáciu „ToTensor“ z „torchvision.transforms“ na konverziu obrázkov PIL alebo polí NumPy na tenzory PyTorch.
    • import matplotlib.pyplot as plt ” importuje knižnicu matplotlib na vizualizáciu údajov:


Krok 2: Načítajte množinu údajov



Teraz načítame súbor údajov FashionMNIST z torchvision na účely školenia aj testovania s nasledujúcimi parametrami:

tr_data = množiny údajov.FashionMNIST ( koreň = 'údaje' , vlak = pravda, Stiahnuť ▼ = pravda, transformovať =ToTensor ( )
)

ts_data = množiny údajov.FashionMNIST ( koreň = 'údaje' , vlak = nepravda, Stiahnuť ▼ = pravda, transformovať =ToTensor ( )
)


Tu:

    • FashionMNIST ” načíta množinu údajov FashionMNIST z knižnice torchvision.
    • root=”data” ” určuje adresár, do ktorého bude množina údajov uložená alebo načítaná, ak už existuje. V našom prípade je to adresár „data“.
    • vlak “ označuje tréningový alebo testovací súbor údajov.
    • download=Pravda ” stiahne súbor údajov, ak ešte nie je prítomný.
    • transform=ToTensor() ” použije transformáciu ToTensor na konverziu obrázkov v množine údajov na tenzory PyTorch:


Krok 3: Označenie tried v množine údajov

Ďalej vytvorte slovník, ktorý mapuje indexy tried na ich zodpovedajúce označenia tried v množine údajov FashionMNIST. Poskytuje ľuďom čitateľné štítky pre každú triedu. Tu sme vytvorili „ mapovaný_štítok ” slovník a použijeme ho na konverziu indexov tried na ich zodpovedajúce označenia tried:

mapovaný_štítok = {
0 : 'tričko' ,
1 : 'Nohavice' ,
2 : 'pulover' ,
3 : 'šaty' ,
4 : 'kabát' ,
5 : 'Sandal' ,
6 : 'tričko' ,
7 : 'tenisky' ,
8 : 'taška' ,
9 : 'Členková obuv' ,
}



Krok 4: Vizualizujte množinu údajov

Nakoniec vizualizujte vzorky v tréningových údajoch pomocou knižnice „matplotlib“:

obr = plt.figura ( veľkosť figy = ( 8 , 8 ) )
kol , riadok = 3 , 3
pre i v rozsah ( 1 , kol * riadok + 1 ) :
sample_index = pochodeň.randint ( len ( tr_date ) , veľkosť = ( 1 , ) ) .položka ( )
img, label = tr_data [ vzorový_index ]
fig.add_subplot ( riadok, kol , i )
plt.title ( mapovaný_štítok [ štítok ] )
plt.axis ( 'vypnuté' )
plt.imshow ( img.stlačiť ( ) , cmmap = 'sivá' )
plt.show ( )





Poznámka : K nášmu Zápisníku Google Colab môžete pristupovať tu odkaz .

To bolo všetko o iterácii a vizualizácii požadovaného súboru údajov pomocou PyTorch.

Záver

Ak chcete iterovať a vizualizovať konkrétny súbor údajov pomocou PyTorch, najprv importujte potrebné knižnice. Potom načítajte požadovaný súbor údajov na školenie a testovanie s požadovanými parametrami. Ďalej označte triedy v množine údajov a vizualizujte vzorky v trénovacích údajoch pomocou knižnice „matplotlib“. Tento zápis ilustroval metódu iterácie a vizualizácie konkrétneho súboru údajov pomocou PyTorch.