logo

Co je Redshift?

  • Redshift je rychlá a výkonná, plně spravovaná služba datového skladu o velikosti petabajtů v cloudu.
  • Zákazníci mohou používat Redshift za pouhých 0,25 $ za hodinu bez závazků nebo předem a škálovat na petabajt nebo více za 1 000 $ za terabajt ročně.

OLAP

OLAP je Online systém pro zpracování analýzy používá Červený posuv .

Příklad transakce OLAP:

Předpokládejme, že chceme vypočítat čistý zisk pro EMEA a Tichomoří pro produkt digitálního rádia. To vyžaduje vytáhnout velké množství záznamů. Níže jsou uvedeny záznamy potřebné pro výpočet čistého zisku:

  • Součet rádií prodaných v EMEA.
  • Součet rádií prodaných v Pacifiku.
  • Jednotkové náklady na rádio v každém regionu.
  • Prodejní cena každého rádia
  • Prodejní cena – jednotková cena

K načtení výše uvedených záznamů jsou nutné složité dotazy. Databáze Data Warehousing používají architekturu různých typů jak z hlediska databáze, tak z hlediska infrastruktury.

Konfigurace Redshift

Rudý posuv

Redshift se skládá ze dvou typů uzlů:

    Jediný uzel Víceuzlový

Jeden uzel: Jeden uzel ukládá až 160 GB.

Víceuzlový: Víceuzlový je uzel, který se skládá z více než jednoho uzlu. Je dvou typů:

    Vedoucí uzel
    Spravuje připojení klientů a přijímá dotazy. Vedoucí uzel přijímá dotazy z klientských aplikací, analyzuje dotazy a vyvíjí prováděcí plány. Koordinuje se s paralelním prováděním těchto plánů s výpočetním uzlem a kombinuje mezivýsledky všech uzlů a poté vrací konečný výsledek klientské aplikaci.Výpočetní uzel
    Výpočetní uzel provede prováděcí plány a pak jsou mezivýsledky odeslány vedoucímu uzlu k agregaci před odesláním zpět do klientské aplikace. Může mít až 128 výpočetních uzlů.

Pojďme pochopit koncept vedoucího uzlu a vypočítat uzly pomocí příkladu.

Rudý posuv

Sklad Redshift je kolekce výpočetních zdrojů známých jako uzly a tyto uzly jsou organizovány ve skupině známé jako cluster. Každý cluster běží v Redshift Engine, který obsahuje jednu nebo více databází.

Když spustíte instanci Redshift, začne s jedním uzlem o velikosti 160 GB. Když chcete růst, můžete přidat další uzly a využít tak výhody paralelního zpracování. Máte vedoucí uzel, který spravuje více uzlů. Uzel Leader zpracovává připojení klienta i výpočetní uzly. Ukládá data do výpočetních uzlů a provádí dotaz.

Proč je Redshift 10x rychlejší

Redshift je 10x rychlejší z následujících důvodů:

    Sloupcové úložiště dat
    Místo ukládání dat jako série řádků, Amazon Redshift organizuje data podle sloupců. Systémy založené na řádcích jsou ideální pro zpracování transakcí, zatímco systémy založené na sloupcích jsou ideální pro datové sklady a analýzy, kde dotazy často zahrnují agregace prováděné přes velké sady dat. Vzhledem k tomu, že jsou zpracovávány pouze sloupce zahrnuté v dotazech a sloupcová data jsou ukládána na paměťové médium postupně, systémy založené na sloupcích vyžadují méně I/O, čímž se zlepšuje výkon dotazů.Pokročilá komprese
    Sloupcová datová úložiště mohou být komprimována mnohem více než řádková datová úložiště, protože podobná data jsou uložena postupně na disku. Amazon Redshift využívá více kompresních technik a často může dosáhnout značné komprese ve srovnání s tradičními datovými úložišti vztahů.
    Amazon Redshift nevyžaduje indexy ani materializované pohledy, takže vyžaduje méně místa než tradiční relační databázové systémy. Při načítání dat do prázdné tabulky Amazon Redshift automaticky vzorkuje vaše data a vybere nejvhodnější kompresní techniku.Masivně paralelní zpracování
    Amazon Redshift automaticky distribuuje data a načte dotaz mezi různé uzly. Amazon Redshift usnadňuje přidávání nových uzlů do vašeho datového skladu, což nám umožňuje dosahovat rychlejšího výkonu dotazů, jak se váš datový sklad rozrůstá.

Funkce Redshift

Vlastnosti Redshift jsou uvedeny níže:

stream java filtru
Rudý posuv
    Snadné nastavení, nasazení a správa
      Automatizované poskytování
      Redshift se snadno nastavuje a ovládá. Nový datový sklad můžete nasadit pomocí několika kliknutí v konzole AWS a Redshift automaticky zajistí infrastrukturu za vás. V AWS jsou všechny administrativní úkony automatizované, jako je zálohování a replikace, musíte se soustředit na svá data, ne na administraci.Automatické zálohování
      Redshift automaticky zálohuje vaše data do S3. Můžete také replikovat snímky v S3 v jiné oblasti pro jakoukoli obnovu po havárii.
    Nákladově efektivní
      Žádné poplatky předem, plaťte průběžně
      Amazon Redshift je cenově nejvýhodnější služba datového skladu, protože musíte platit pouze za to, co používáte.
      Jeho náklady začínají na 0,25 USD za hodinu bez závazku a bez nákladů předem a mohou se rozšířit až na 250 USD za terabajt za rok.
      Amazon Redshift je jediná služba datového skladu, která nabízí ceny na vyžádání bez jakýchkoliv nákladů předem, a také nabízí ceny vyhrazené instance, které ušetří až 75 % tím, že poskytují 1–3leté období.Vyberte typ uzlu.
      Pro optimalizaci Redshift si můžete vybrat kterýkoli ze dvou uzlů.
        Hustý výpočetní uzel
        Hustý výpočetní uzel může vytvořit vysoce výkonné datové sklady pomocí rychlých CPU, velkého množství paměti RAM a SSD disků.Hustý úložný uzel
        Pokud chcete snížit náklady, můžete použít uzel Dense storage. Vytváří nákladově efektivní datový sklad pomocí větší jednotky pevného disku.
    Rychlé přizpůsobení vašim potřebám.
      Datové sklady v rozsahu petabajtů
      Amazon Redshift automaticky škáluje nahoru nebo dolů uzly podle potřeby změn. Pomocí několika kliknutí v konzole AWS nebo jediného volání API lze snadno změnit počet uzlů v datovém skladu.Analýza datových jezer v exabajtovém měřítku
      Je to funkce Redshift, která vám umožňuje spouštět dotazy proti exabajtům dat v Amazon S3. Amazon S3 je bezpečná a cenově výhodná data pro ukládání neomezených dat v otevřeném formátu.Neomezená souběh
      Je to funkce Redshift znamená, že více dotazů může přistupovat ke stejným datům v Amazon S3. Umožňuje spouštět dotazy napříč více uzly bez ohledu na složitost dotazu nebo množství dat.
    Dotaz na vaše datové jezero
    Amazon Redshift je jediný datový sklad, který se používá k dotazování na datové jezero Amazon S3 bez načítání dat. To poskytuje flexibilitu ukládáním často používaných dat v Redshift a nestrukturovaných nebo málo používaných dat v Amazon S3.Zajistit
    Pomocí několika nastavení parametrů můžete nastavit Redshift tak, aby používal SSL k zabezpečení vašich dat. Můžete také povolit šifrování, všechna data zapsaná na disk budou šifrována.Rychlejší výkon
    Amazon Redshift poskytuje sloupcové ukládání dat, kompresi a paralelní zpracování pro snížení množství I/O potřebného k provádění dotazů. To zlepšuje výkon dotazů.