- Redshift je rychlá a výkonná, plně spravovaná služba datového skladu o velikosti petabajtů v cloudu.
- Zákazníci mohou používat Redshift za pouhých 0,25 $ za hodinu bez závazků nebo předem a škálovat na petabajt nebo více za 1 000 $ za terabajt ročně.
OLAP
OLAP je Online systém pro zpracování analýzy používá Červený posuv .
Příklad transakce OLAP:
Předpokládejme, že chceme vypočítat čistý zisk pro EMEA a Tichomoří pro produkt digitálního rádia. To vyžaduje vytáhnout velké množství záznamů. Níže jsou uvedeny záznamy potřebné pro výpočet čistého zisku:
- Součet rádií prodaných v EMEA.
- Součet rádií prodaných v Pacifiku.
- Jednotkové náklady na rádio v každém regionu.
- Prodejní cena každého rádia
- Prodejní cena – jednotková cena
K načtení výše uvedených záznamů jsou nutné složité dotazy. Databáze Data Warehousing používají architekturu různých typů jak z hlediska databáze, tak z hlediska infrastruktury.
Konfigurace Redshift
Redshift se skládá ze dvou typů uzlů:
Jeden uzel: Jeden uzel ukládá až 160 GB.
Víceuzlový: Víceuzlový je uzel, který se skládá z více než jednoho uzlu. Je dvou typů:
Spravuje připojení klientů a přijímá dotazy. Vedoucí uzel přijímá dotazy z klientských aplikací, analyzuje dotazy a vyvíjí prováděcí plány. Koordinuje se s paralelním prováděním těchto plánů s výpočetním uzlem a kombinuje mezivýsledky všech uzlů a poté vrací konečný výsledek klientské aplikaci.
Výpočetní uzel provede prováděcí plány a pak jsou mezivýsledky odeslány vedoucímu uzlu k agregaci před odesláním zpět do klientské aplikace. Může mít až 128 výpočetních uzlů.
Pojďme pochopit koncept vedoucího uzlu a vypočítat uzly pomocí příkladu.
Sklad Redshift je kolekce výpočetních zdrojů známých jako uzly a tyto uzly jsou organizovány ve skupině známé jako cluster. Každý cluster běží v Redshift Engine, který obsahuje jednu nebo více databází.
Když spustíte instanci Redshift, začne s jedním uzlem o velikosti 160 GB. Když chcete růst, můžete přidat další uzly a využít tak výhody paralelního zpracování. Máte vedoucí uzel, který spravuje více uzlů. Uzel Leader zpracovává připojení klienta i výpočetní uzly. Ukládá data do výpočetních uzlů a provádí dotaz.
Proč je Redshift 10x rychlejší
Redshift je 10x rychlejší z následujících důvodů:
Místo ukládání dat jako série řádků, Amazon Redshift organizuje data podle sloupců. Systémy založené na řádcích jsou ideální pro zpracování transakcí, zatímco systémy založené na sloupcích jsou ideální pro datové sklady a analýzy, kde dotazy často zahrnují agregace prováděné přes velké sady dat. Vzhledem k tomu, že jsou zpracovávány pouze sloupce zahrnuté v dotazech a sloupcová data jsou ukládána na paměťové médium postupně, systémy založené na sloupcích vyžadují méně I/O, čímž se zlepšuje výkon dotazů.
Sloupcová datová úložiště mohou být komprimována mnohem více než řádková datová úložiště, protože podobná data jsou uložena postupně na disku. Amazon Redshift využívá více kompresních technik a často může dosáhnout značné komprese ve srovnání s tradičními datovými úložišti vztahů.
Amazon Redshift nevyžaduje indexy ani materializované pohledy, takže vyžaduje méně místa než tradiční relační databázové systémy. Při načítání dat do prázdné tabulky Amazon Redshift automaticky vzorkuje vaše data a vybere nejvhodnější kompresní techniku.
Amazon Redshift automaticky distribuuje data a načte dotaz mezi různé uzly. Amazon Redshift usnadňuje přidávání nových uzlů do vašeho datového skladu, což nám umožňuje dosahovat rychlejšího výkonu dotazů, jak se váš datový sklad rozrůstá.
Funkce Redshift
Vlastnosti Redshift jsou uvedeny níže:
stream java filtru
Redshift se snadno nastavuje a ovládá. Nový datový sklad můžete nasadit pomocí několika kliknutí v konzole AWS a Redshift automaticky zajistí infrastrukturu za vás. V AWS jsou všechny administrativní úkony automatizované, jako je zálohování a replikace, musíte se soustředit na svá data, ne na administraci.
Redshift automaticky zálohuje vaše data do S3. Můžete také replikovat snímky v S3 v jiné oblasti pro jakoukoli obnovu po havárii.
Amazon Redshift je cenově nejvýhodnější služba datového skladu, protože musíte platit pouze za to, co používáte.
Jeho náklady začínají na 0,25 USD za hodinu bez závazku a bez nákladů předem a mohou se rozšířit až na 250 USD za terabajt za rok.
Amazon Redshift je jediná služba datového skladu, která nabízí ceny na vyžádání bez jakýchkoliv nákladů předem, a také nabízí ceny vyhrazené instance, které ušetří až 75 % tím, že poskytují 1–3leté období.
Pro optimalizaci Redshift si můžete vybrat kterýkoli ze dvou uzlů.
Hustý výpočetní uzel může vytvořit vysoce výkonné datové sklady pomocí rychlých CPU, velkého množství paměti RAM a SSD disků.
Pokud chcete snížit náklady, můžete použít uzel Dense storage. Vytváří nákladově efektivní datový sklad pomocí větší jednotky pevného disku.
Amazon Redshift automaticky škáluje nahoru nebo dolů uzly podle potřeby změn. Pomocí několika kliknutí v konzole AWS nebo jediného volání API lze snadno změnit počet uzlů v datovém skladu.
Je to funkce Redshift, která vám umožňuje spouštět dotazy proti exabajtům dat v Amazon S3. Amazon S3 je bezpečná a cenově výhodná data pro ukládání neomezených dat v otevřeném formátu.
Je to funkce Redshift znamená, že více dotazů může přistupovat ke stejným datům v Amazon S3. Umožňuje spouštět dotazy napříč více uzly bez ohledu na složitost dotazu nebo množství dat.
Amazon Redshift je jediný datový sklad, který se používá k dotazování na datové jezero Amazon S3 bez načítání dat. To poskytuje flexibilitu ukládáním často používaných dat v Redshift a nestrukturovaných nebo málo používaných dat v Amazon S3.
Pomocí několika nastavení parametrů můžete nastavit Redshift tak, aby používal SSL k zabezpečení vašich dat. Můžete také povolit šifrování, všechna data zapsaná na disk budou šifrována.
Amazon Redshift poskytuje sloupcové ukládání dat, kompresi a paralelní zpracování pro snížení množství I/O potřebného k provádění dotazů. To zlepšuje výkon dotazů.