Aké sú dátové typy Amazon Redshift?

Ake Su Datove Typy Amazon Redshift



Amazon Redshift je cloudové riešenie od AWS, ktoré plní účel dátového skladu. Dátový sklad je veľký priestor v cloude, ktorý ukladá obrovské množstvo údajov. Rozdiel medzi dátovým skladom a databázou je v tom, že prvý neuchováva len aktuálne dáta, ale aj kompletnú históriu dát.

V tomto článku sa dozviete o Amazon Redshift od AWS a typoch údajov, ktoré táto služba podporuje.







Čo je Amazon RedShift?

Ide o cloudové riešenie pre dátové sklady, ktoré je založené na 'PostgreSQL' . Využíva technológiu tzv „Massively Parallel Processing (MPP)“ na spracovanie petabajtov dát rýchlosťou blesku. To poskytuje jednoduché riešenie predikcie v reálnom čase na základe historických údajov a riešení streamovania.



Nasledujúci obrázok ukazuje pracovný mechanizmus Amazon Redshift:







Toto grafické vysvetlenie fungovania Amazon Redshift je veľmi jednoduché a jasné. Poskytuje nám informácie o tom, ako sa údaje získavajú a ďalej spracúvajú na generovanie výstupov a vytváranie aplikácií založených na údajoch.

Architektúru dátového skladu Amazon Redshift možno vidieť aj na obrázku nižšie:



Teraz sa zameriame na využitie a funkcie tejto služby.

Vlastnosti

Ako už bolo spomenuté, Amazon Redshift je založený na PostgreSQL a využíva technológiu s názvom Massively Parallel Processing, ktorá mu umožňuje rýchlo spracovať petabajty údajov. Preto Redshift ponúka množstvo funkcií a použití. Niektoré z týchto funkcií sú uvedené nižšie:

  • Zabezpečenie a šifrovanie údajov.
  • Business Analytics.
  • Podpora aplikácií riadená údajmi.
  • Prediktívna analýza.
  • Automatické opakovanie úloh.
  • Súbežné škálovanie údajov.
  • Skladovanie údajov.

Niektoré ďalšie funkcie tejto služby možno vidieť na obrázku nižšie:

Toto bola väčšina funkcií, ktoré Redshift ponúka a teraz prejdeme k dátovým typom podporovaným touto službou.

Typy údajov

Amazon Redshift je riešenie na skladovanie dát s veľkým množstvom funkcií. Podporuje štruktúrované aj neštruktúrované typy údajov. Keďže je založený na PostgreSQL, s údajmi je možné manipulovať prostredníctvom jednoduchých SQL dotazov.

Teraz vyvstáva ďalšia otázka, t. j. ako sa tieto formáty údajov navzájom líšia? Poďme diskutovať o týchto dvoch formátoch údajov.

Štruktúrované dáta

Vysoko formátovaný typ údajov, ktorý sa dá ľahko preložiť pomocou algoritmov strojového učenia, sa nazýva štruktúrované údaje. SQL databáza pracuje so štruktúrovanými dátami. Štruktúrované údaje sú v tabuľkovej forme, ako sú údaje používané relačnými databázami

Jedným z najpoužívanejších SQL databázových systémov je MYSQL. Jeho architektúru je možné vidieť nižšie na danom obrázku:

Neštruktúrované dáta

Neštruktúrované údaje sú menej vzorované a formátujú menej údajov, ako sú údaje používané v nerelačných databázach. MongoDB je slávna nerelačná databáza. SQL dotazy nefungujú na nerelačných databázach, preto sa tieto databázy nazývajú aj databázy NoSQL.

Ako už bolo spomenuté, MongoDB je neštruktúrovaný databázový systém a jeho architektúru je možné vidieť nižšie na danom obrázku:

Prešli sme dva základné typy údajov používané v databázach a teraz prejdeme k skutočným typom údajov, ktoré podporuje Amazon Redshift. Ide o tieto typy údajov:

  • Číselné údaje
  • Údaje o postave
  • Údaje o dátume a čase
  • Booleovské údaje
  • Údaje HLLSKETCH
  • SUPER údaje
  • NÁHRADNÉ Údaje

Poďme diskutovať o týchto typoch údajov:

Číselné údaje

Tento typ údajov je samozrejmý. Podporuje údaje, ktoré sú vo forme celých čísel, desatinných miest, s pohyblivou rádovou čiarkou a iných číselných typov údajov.

Charakteristiky celočíselného dátového typu možno vidieť na obrázku nižšie:

Desatinný typ údajov ukladá údaje na základe presnosti od používateľa. Jeho vlastnosti sú nasledovné:

Údaje o postave

Typy údajov CHAR a VARCHAR spadajú do kategórie typov údajov založených na znakoch. NCHAR a NVARCHAR sú tiež typy údajov znakového typu. Na rozdiel od CHAR a VARCHAR tieto dva dátové typy ukladajú znaky Unicode s pevnou dĺžkou. Pozrime sa na vlastnosti týchto dátových typov, ako napríklad:

  • CHAR, CHARACTER, NCHAR majú rozsah 4KB.
  • VARCHAR, NVARCHAR má rozsah 64KB.
  • BPCHAR má rozsah 256 bajtov.
  • TEXT má rozsah 260 bajtov.

Údaje o dátume a čase

Typy údajov dátumu a času sú DATE, TIME, TIMETZ, TIMESTAMP, TIMESTAMPTZ. Funkčné možnosti týchto typov údajov sú nasledovné:

  • DATE jednoducho ukladá dátumy kalendára.
  • TIME ukladá čas bez odkazu na akékoľvek časové pásmo. Štandardne je to UTC.
  • TIMETZ ukladá čas vzhľadom na časové pásmo. Štandardne je to UTC v užívateľských aj systémových tabuľkách.
  • TIMESTAMP obsahuje nielen čas, ale aj dátumy. Štandardne je to UTC v užívateľských aj systémových tabuľkách.
  • TIMESTAMPTZ zahŕňa nielen čas, ale aj dátumy. Štandardne je to UTC iba v používateľských tabuľkách.

Booleovské údaje

Booleovský dátový typ je binárny dátový typ, čo znamená, že existujú iba dve hodnoty. Tabuľka charakteristík pre typ údajov Boolean je uvedená nižšie na obrázku:

Údaje HLLSKETCH

Tento typ údajov sa používa na ukladanie náčrtov. Červený posun môže predstavovať náčrty v riedkej alebo hustej forme. Náčrty začínajú ako riedke a postupne sa stávajú hustými, keď hustý formát poskytuje väčšiu efektivitu sledovaním odkazu.

SUPER údaje

Tento typ údajov sa zaoberá neštruktúrovanými údajmi, ktoré môžu byť vo forme polí, vnorených štruktúr alebo JSON. Neexistuje žiadny model ani formát údajov. Používatelia môžu preskúmať ďalšie informácie pomocou odkazu.

NÁHRADNÉ Údaje

Tento typ údajov ukladá aj znaky. Dĺžka je však obmedzená. Amazon Redshift umožňuje pretypovanie údajov VARBYTE do údajov ľubovoľného typu celého čísla alebo typu znaku. Ak chcete získať ďalšie informácie o tomto type údajov, kliknite na odkaz nižšie.

To je všetko o Amazon Redshift a typoch údajov, ktoré podporuje.

Záver

Amazon Redshift je služba AWS, ktorá vo svojej základnej forme slúži na účely dátového skladu, ale je veľmi výkonným a funkčným riešením pre analýzu a predikciu. Tento článok sa zaoberá Redshiftom a typmi údajov, ktoré podporuje. Tieto typy údajov boli stručne vysvetlené spolu s ich charakteristikami.