Proces převodu dat z jedné formy do druhé je známý jako kódování. Používá se k transformaci dat tak, aby data mohla být podporována a používána různými systémy. Kódování funguje podobně jako převod teploty ze stupňů Celsia na Fahrenheita, protože se pouze převede do jiné formy, ale původní hodnota zůstane vždy stejná. Kódování se používá hlavně ve dvou oblastech:
Poznámka: Kódování se liší od šifrování, protože jeho hlavním účelem není data skrýt, ale převést je do formátu, aby mohla být správně spotřebována.
V tomto tématu budeme diskutovat o různých typech kódovacích technik, které se používají ve výpočetní technice.
Typ kódovací techniky
Kódování znaků
Kódování znaků kóduje znaky do bajtů . Informuje počítače, jak interpretovat nulu a jedničky na skutečné znaky, čísla a symboly. Počítač rozumí pouze binárním datům; proto je nutné tyto znaky převést na číselné kódy. Aby toho bylo dosaženo, je každý znak převeden na binární kód a za tímto účelem jsou textové dokumenty uloženy s typy kódování. To lze provést spárováním čísel se znaky. Pokud nepoužijeme kódování znaků, naše webové stránky nebudou zobrazovat znaky a text ve správném formátu. Sníží se tak čitelnost a stroj nebude schopen správně zpracovat data. Kromě toho kódování znaků zajišťuje, že každý znak má správnou reprezentaci v počítačovém nebo binárním formátu.
Existují různé typy technik kódování znaků, které jsou uvedeny níže:
Kódování HTML
Kódování HTML se používá k zobrazení stránky HTML ve správném formátu. Pomocí kódování se webový prohlížeč dozví, kterou znakovou sadu má použít.
V HTML se v HTML Markup používají různé znaky, například . Abychom tyto znaky zakódovali jako obsah, musíme použít kódování.
Kódování URL
URL (Uniform resource locator) Kódování se používá převádět znaky v takovém formátu, aby mohly být přenášeny přes internet . Je také známé jako kódování procent. Kódování URL se provádí za účelem odeslání adresy URL na internet pomocí znakové sady ASCII. Jiné než ASCII znaky jsou nahrazeny % následovaným hexadecimálními číslicemi.
Kódování UNICODE
Unicode je kódovací standard pro univerzální znakovou sadu. Umožňuje kódování, reprezentaci a zpracování textu reprezentovaného ve většině jazyků nebo systémů psaní, které jsou celosvětově dostupné. Poskytuje kód nebo číslo pro každý znak v každém podporovaném jazyce. Může reprezentovat přibližně všechny možné znaky ve všech jazycích. Konkrétní sekvence bitů je známá jako kódovací jednotka.
Standard UNICODE může k reprezentaci znaků používat 8, 16 nebo 32 bitů.
Standard Unicode definuje formát UTF (Unicode Transformation Format) pro kódování bodů kódu.
Standard kódování UNICODE má následující schémata UTF:
UTF8 je definováno standardem UNICODE, což je kódování znaků s proměnnou šířkou používané v elektronické komunikaci. UTF-8 je schopno zakódovat všech 1 112 064 platných bodů kódu znaků v Unicode pomocí jedné až čtyř jednobajtových (8bitových) kódových jednotek.
Kódování UTF16 představuje body kódu znaku pomocí jednoho ze dvou 16bitových celých čísel.
Kódování UTF32 představuje každý bod kódu jako 32bitová celá čísla.
Kódování Base64
Kódování Base64 se používá ke kódování binárních dat do ekvivalentních znaků ASCII. Kódování Base64 se používá v poštovním systému, protože poštovní systémy, jako je SMTP, nemohou pracovat s binárními daty, protože přijímají pouze textová data ASCII. Používá se také při jednoduché autentizaci HTTP ke kódování přihlašovacích údajů. Kromě toho se také používá k přenosu binárních dat do souborů cookie a dalších parametrů, aby byla data nečitelná, aby se zabránilo manipulaci. Pokud je obrázek nebo jiný soubor přenesen bez kódování Base64, dojde k jeho poškození, protože poštovní systém není schopen pracovat s binárními daty.
Base64 představuje data do bloků po 3 bytech, kde každý bajt obsahuje 8 bitů; představuje tedy 24 bitů. Těchto 24 bitů je rozděleno do čtyř skupin po 6 bitech. Každá z těchto skupin nebo bloků je převedena na ekvivalentní hodnotu Base64.
Kódování ASCII
Americký standardní kód pro výměnu informací (ASCII) je typ kódování znaků. Byl to první standard kódování znaků vydaný v roce 1963.
ASCII kód se používá k reprezentaci anglických znaků jako čísel, kde je každému písmenu přiřazeno číslo 0 až 127. Většina moderních schémat kódování znaků je založena na ASCII, i když podporují mnoho dalších znaků. Jedná se o jednobajtové kódování pouze pomocí spodních 7 bitů. V souboru ASCII je každý abecední, číselný nebo speciální znak reprezentován 7bitovým binárním číslem. Každý znak klávesnice má ekvivalentní hodnotu ASCII.
Kódování obrazu a zvuku a videa
Kódování obrazu a zvuku a videa se provádí za účelem úspory úložného prostoru. Mediální soubor, jako je obrázek, zvuk a video, jsou zakódovány, aby byly uloženy v efektivnějším a komprimovaném formátu.
Tyto kódované soubory obsahují stejný obsah s obvykle podobnou kvalitou, ale v komprimované velikosti, takže je lze uložit na méně místa, lze je snadno přenášet poštou nebo je lze stáhnout do systému.
Můžeme to chápat jako . Zvukový soubor WAV je převeden na soubor .MP3, aby se jeho velikost zmenšila o 1/10čtdo původní velikosti.