Je založený na jazykovom modeli GPT-3, ktorý dokáže generovať súvislý a plynulý text na rôzne témy. DALL-E rozširuje GPT-3 pridaním komponentu videnia, ktorý dokáže kódovať aj dekódovať obrázky. To umožňuje DALL-E porozumieť textu aj obrázkom a vytvárať ich nové kombinácie.
Tento článok preskúma niektoré z najzaujímavejších a najkreatívnejších textových výziev, ktoré DALL-E dokáže spracovať, a ukáže vám niekoľko príkladov obrázkov, ktoré vytvára.
Ako používať textové výzvy s DALL-E?
DALL-E kombinuje GPT-3, výkonný jazykový model, a CLIP, model videnia, ktorý sa dá naučiť z prirodzeného jazyka. DALL-E dokáže vytvárať prirodzené a nápadité obrázky v závislosti od akéhokoľvek zadávania textu. OpenAI to vyžaduje zaregistrujte sa a prihláste sa na používanie DALL-E 2. Na tento účel sa môžete dozvedieť viac o procese registrácie a prihlásenia v tomto článku “ Ako sa zaregistrovať a prihlásiť do DALL-E 2? “:
Ak chcete používať textové výzvy s DALL-E, musíte vykonať niekoľko základných krokov:
1. Napíšte každý malý prvok do textovej výzvy
DALL-E dokáže spracovať zložité a abstraktné textové výzvy, ako sú metafory, analógie, kompozície, transformácie a obmedzenia. Používatelia môžu využívať prirodzený jazyk, kľúčové slová alebo kombináciu oboch.
Príklad
DALL-E dokáže generovať obrázky na základe textových výziev. Tieto textové výzvy vyžadujú, aby DALL-E koherentne a realisticky kombinoval rôzne koncepty, tvary, farby, textúry a materiály. Použite napríklad textovú výzvu „ päťuholník vyrobený zo syra, ktorý je v plameňoch ' ako je uvedené nižšie:
2. Získajte konkrétne informácie o štýle
Ďalšou vlastnosťou DALL-E je jeho schopnosť generovať viacero obrázkov pre tú istú textovú výzvu, pričom každý má inú interpretáciu alebo štýl.
Príklad
DALL-E dokáže generovať obrázky „ mačka v obleku “, ktoré sa líšia typom obleku, pózou mačky, pozadím a výrazom tváre. To ukazuje, že DALL-E má bohatú a rôznorodú predstavivosť a dokáže vytvárať obrázky, ktoré sú nielen presné, ale aj prekvapivé a vtipné:
3. Relevantné pre konkrétne domény alebo kontexty
DALL-E môže tiež generovať obrázky, ktoré sú relevantné pre konkrétne domény alebo kontexty, ako je umenie, história, kultúra, veda alebo fikcia.
Príklad
DALL-E dokáže generovať obrázky „ obraz ženy s dvoma očami od Picassa “. Textová výzva vyžaduje, aby DALL-E mal určité znalosti alebo znalosť domény alebo kontextu a aby generoval obrázky, ktoré sú konzistentné a vhodné:
4. Nezabudnite písať o farbách
Do textovej výzvy môžete pridať modifikátory na určenie štýlu, farby, perspektívy alebo rozloženia obrázka.
Príklad
Príkladom je zadanie textovej výzvy „ modrý dom s červenou strechou v štýle Van Gogha “, ako je vidieť na obrázku nižšie:
Bonusový tip: Ako spresniť textové výzvy a Upraviť obrázky?
Voliteľne môžu používatelia upravovať textové výzvy alebo upravovať obrázky pomocou niektorých nástrojov, ktoré poskytuje DALL-E.
Príklad
Môžete stlačiť pravé tlačidlo myši na obrázku a stlačiť „ Upraviť obrázok ” možnosť zmeniť farbu alebo tvar objektu na obrázku:
Používatelia môžu tiež využiť „ priblížiť ” nástroj na priblíženie alebo oddialenie určitej časti obrázka, ako je uvedené nižšie:
Toto je všetko o rôznom použití textových výziev s DALL-E.
Záver
Ak chcete použiť textové výzvy s DALL-E, používatelia musia napísať každý malý prvok do textovej výzvy a špecifikovať štýl, domény, kontexty a farby. DALL-E je úžasný nástroj, ktorý vám môže pomôcť vytvárať úžasné a originálne obrázky z textových výziev. Je to tiež zábavný spôsob, ako preskúmať svoju predstavivosť a zistiť, čo dokáže DALL-E vymyslieť. Majte však na pamäti, že DALL-E nie je dokonalý a môže niekedy generovať obrázky, ktoré sú nevhodné, nezmyselné alebo nepresné. Vždy používajte DALL-E zodpovedne a s rešpektom.