Co je to Data?
Data jsou sbírkou zřetelné malé jednotky informací. Může být použit v různých formách, jako je text, čísla, média, bajty, atd., může být uložen v kusech papíru nebo elektronické paměti atd.
Slovo 'data' pochází ze slova 'datum', což znamená 'jediná informace.' Je to množné číslo slova datum.
V oblasti výpočetní techniky jsou data informacemi, které lze převést do formy pro efektivní pohyb a zpracování. Data jsou zaměnitelná.
Co je databáze?
A databáze je organizovaný soubor dat, takže k nim lze snadno přistupovat a spravovat je.
Data můžete uspořádat do tabulek, řádků, sloupců a indexovat je, abyste snáze našli relevantní informace.
Obslužné programy databáze vytvořit databázi takovým způsobem, že pouze jedna sada softwarových programů poskytuje přístup k datům všem uživatelům.
The hlavní účel databáze je provozovat velké množství informací ukládáním, načítáním a správou dat.
Je jich mnoho dynamické webové stránky na World Wide Web, které jsou dnes zpracovávány prostřednictvím databází. Například model, který kontroluje dostupnost pokojů v hotelu. Je to příklad dynamické webové stránky, která využívá databázi.
Je jich mnoho dostupné databáze jako MySQL, Sybase, Oracle, MongoDB, Informix, PostgreSQL, SQL Server atd.
Moderní databáze jsou spravovány systémem správy databází (DBMS).
SQL nebo Structured Query Language se používá k práci s daty uloženými v databázi. SQL závisí na relační algebře a n-ticovém relačním počtu.
Válcová struktura se používá k zobrazení obrazu databáze.
Evoluce databází
Databáze dokončila více než 50 let cesty svého vývoje od systému plochých souborů k relačním a objektovým relačním systémům. Prošlo několik generací.
Evoluce
File-Based
Rok 1968 byl rokem, kdy byla představena databáze založená na souborech. V databázích založených na souborech byla data udržována v plochém souboru. Přestože soubory mají mnoho výhod, existuje několik omezení.
Jednou z hlavních výhod je, že souborový systém má různé přístupové metody, např. sekvenční, indexovaný a náhodný.
Vyžaduje rozsáhlé programování v jazyce třetí generace, jako je COBOL, BASIC.
Hierarchický datový model
1968-1980 byla éra Hierarchické databáze. Prominentní hierarchický databázový model byl prvním DBMS IBM. Říkalo se tomu IMS (Information Management System).
V tomto modelu jsou soubory propojeny způsobem rodič/dítě.
Níže uvedený diagram představuje Hierarchický datový model. Malý kruh představuje předměty.
Stejně jako souborový systém měl i tento model určitá omezení, jako je složitá implementace, postrádá strukturální nezávislost, nemůže snadno zvládnout vztah mnoho-mnoho atd.
Síťový datový model
Charles Bachman vyvinula první DBMS ve společnosti Honeywell s názvem Integrated Data Store (IDS). Byl vyvinut na počátku 60. let, ale standardizován byl v roce 1971 skupinou CODASYL (Conference on Data Systems Languages).
V tomto modelu jsou soubory propojeny jako vlastníci a členové, podobně jako u běžného síťového modelu.
Síťový datový model identifikoval následující komponenty:
- Schéma sítě (organizace databáze)
- Podschéma (zobrazení databáze na uživatele)
- Jazyk správy dat (procedurální)
Tento model měl také určitá omezení, jako je složitost systému a obtížné navrhování a údržba.
Relační databáze
1970 – současnost: Je to éra relační databáze a správy databází. V roce 1970 navrhl relační model E.F. Codd.
Relační databázový model má dvě hlavní terminologie nazývané instance a schéma.
Instance je tabulka s řádky nebo sloupci
Schéma určuje strukturu, jako je název relace, typ každého sloupce a název.
Tento model používá některé matematické koncepty, jako je teorie množin a predikátová logika.
První internetová databázová aplikace byla vytvořena v roce 1995.
Během éry relační databáze bylo zavedeno mnohem více modelů, jako je objektově orientovaný model, objektově-relační model atd.
boolean na řetězec
Cloudová databáze
Cloudová databáze vám usnadňuje ukládání, správu a získávání jejich strukturovaných, nestrukturovaných dat prostřednictvím cloudové platformy. Tato data jsou dostupná přes internet. Cloudové databáze se také nazývají databáze jako služba (DBaaS), protože jsou nabízeny jako spravovaná služba.
Některé nejlepší možnosti cloudu jsou:
- AWS (Amazon Web Services)
- Snowflake Computing
- Oracle Database Cloud Services
- Microsoft SQL server
- Google cloud klíč
Výhody cloudové databáze
Nižší náklady
Obecně platí, že poskytovatel společnosti nemusí investovat do databází. Může udržovat a podporovat jedno nebo více datových center.
Automatizovaný
Cloudové databáze jsou obohaceny o řadu automatizovaných procesů, jako je obnova, převzetí služeb při selhání a automatické škálování.
Zvýšená dostupnost
Ke své cloudové databázi můžete přistupovat kdykoli a odkudkoli. Vše, co potřebujete, je pouze připojení k internetu.
NoSQL databáze
NoSQL databáze je přístup k návrhu takových databází, které mohou pojmout širokou škálu datových modelů. NoSQL znamená „nejen SQL“. Jedná se o alternativu k tradičním relačním databázím, ve kterých jsou data umístěna v tabulkách a datové schéma je dokonale navrženo před vytvořením databáze.
NoSQL databáze jsou užitečné pro velkou sadu distribuovaných dat.
Některé příklady databázového systému NoSQL s jejich kategorií jsou:
- MongoDB, CouchDB, Cloudant (na základě dokumentů)
- Memcached, Redis, Koherence (obchod s páry klíč–hodnota)
- HBase, Velký stůl, Akumulace (Tabelární)
Výhoda NoSQL
Vysoká škálovatelnost
NoSQL dokáže zpracovat velké množství dat díky škálovatelnosti. Pokud data rostou, databáze NoSQL je škáluje tak, aby s nimi nakládala efektivně.
Vysoká dostupnost
NoSQL podporuje automatickou replikaci. Automatická replikace ji činí vysoce dostupnou, protože v případě jakéhokoli selhání se data replikují do předchozího konzistentního stavu.
Nevýhoda NoSQL
Open source
NoSQL je open-source databáze, takže pro NoSQL zatím neexistuje žádný spolehlivý standard.
Manažerská výzva
Správa dat v NoSQL je mnohem složitější než relační databáze. Instalace je velmi náročná a každodenní správa ještě hektičtější.
GUI není k dispozici
Nástroje grafického uživatelského rozhraní pro databázi NoSQL nejsou na trhu snadno dostupné.
Záloha
Zálohování je velkým slabým místem pro databáze NoSQL. Některé databáze, jako je MongoDB, nemají žádné výkonné přístupy k zálohování dat.
Objektově orientované databáze
Objektově orientované databáze obsahují data ve formě objektů a tříd. Objekty jsou entitou reálného světa a typy jsou kolekce objektů. Objektově orientovaná databáze je kombinací vlastností relačního modelu s objektově orientovanými principy. Je to alternativní implementace k relačnímu modelu.
Objektově orientované databáze dodržují pravidla objektově orientovaného programování. Objektově orientovaný systém správy databází je hybridní aplikace.
Objektově orientovaný databázový model obsahuje následující vlastnosti.
Vlastnosti objektově orientovaného programování
- Objekty
- Třídy
- Dědictví
- Polymorfismus
- Zapouzdření
Vlastnosti relační databáze
- Atomicita
- Konzistence
- Integrita
- Trvanlivost
- Konkurence
- Zpracování dotazu
Databáze grafů
Databáze grafů je databáze NoSQL. Jedná se o grafické znázornění dat. Obsahuje uzly a hrany. Uzel představuje entitu a každá hrana představuje vztah mezi dvěma hranami. Každý uzel v databázi grafů představuje jedinečný identifikátor.
Grafové databáze jsou výhodné pro hledání vztahu mezi daty, protože zvýrazňují vztah mezi relevantními daty.
Grafové databáze jsou velmi užitečné, když databáze obsahuje komplexní vztah a dynamické schéma.
Většinou se používá v řízení dodavatelského řetězce , identifikující zdroj IP telefonie .
DBMS (systém správy databáze)
Database management System je software, který se používá k ukládání a načítání databáze. Například Oracle, MySQL atd.; toto jsou některé populární nástroje DBMS.
- DBMS poskytuje rozhraní pro provádění různých operací, jako je vytváření, mazání, úpravy atd.
- DBMS umožňuje uživateli vytvářet své databáze podle svých požadavků.
- DBMS přijímá požadavek z aplikace a poskytuje konkrétní data prostřednictvím operačního systému.
- DBMS obsahuje skupinu programů, které se chovají podle pokynů uživatele.
- Poskytuje zabezpečení databáze.
Výhoda DBMS
Řídí redundanci
Ukládá všechna data do jediného databázového souboru, takže může řídit redundanci dat.
Sdílení dat
Oprávněný uživatel může sdílet data mezi více uživateli.
Záloha
Poskytuje subsystém zálohování a obnovy. Tento systém obnovy vytváří automatická data ze selhání systému a v případě potřeby data obnovuje.
Více uživatelských rozhraní
Poskytuje jiný typ uživatelských rozhraní, jako je GUI, aplikační rozhraní.
Nevýhoda DBMS
Velikost
Zabírá velké místo na disku a velkou paměť pro efektivní provoz.
Náklady
DBMS vyžaduje ke spuštění softwaru DBMS vysokorychlostní datový procesor a větší paměť, takže je drahý.
Složitost
DBMS vytváří další složitost a požadavky.
RDBMS (systém správy relačních databází)
Slovo RDBMS se nazývá „systém správy relačních databází“. Je reprezentován jako tabulka, která obsahuje řádky a sloupce.
RDBMS je založen na relačním modelu; zavedl jej E. F. Codd.
Relační databáze obsahuje následující komponenty:
- Stůl
- Záznam/ Tuple
- Název pole/sloupce/atributu
- Instance
- Schéma
- Klíče
RDBMS je tabulkový DBMS, který zachovává bezpečnost, integritu, přesnost a konzistenci dat.