Strojové učení je podmnožinou umělé inteligence, která umožňuje stroji automaticky se učit z dat, zlepšovat výkon z minulých zkušeností a vytvářet předpovědi. . Strojové učení obsahuje sadu algoritmů, které pracují s velkým množstvím dat. Data jsou přiváděna do těchto algoritmů, aby je trénovaly, a na základě školení sestavují model a provádějí konkrétní úkol.
Tyto algoritmy ML pomáhají řešit různé obchodní problémy, jako je regrese, klasifikace, prognózování, seskupování a asociace atd.
Na základě metod a způsobu učení se strojové učení dělí především na čtyři typy, kterými jsou:
- Strojové učení pod dohledem
- Strojové učení bez dozoru
- Částečně řízené strojové učení
- Posílení učení
V tomto tématu poskytneme podrobný popis typů strojového učení spolu s jejich příslušnými algoritmy:
1. Strojové učení pod dohledem
Jak jeho název napovídá, Strojové učení pod dohledem je založen na supervizi. To znamená, že v technice učení pod dohledem trénujeme stroje pomocí „označeného“ souboru dat a na základě školení stroj předpovídá výstup. Zde označená data určují, že některé vstupy jsou již namapovány na výstup. Ještě vzácněji, můžeme říci; nejprve stroj natrénujeme se vstupem a odpovídajícím výstupem a poté požádáme stroj, aby předpověděl výstup pomocí testovací datové sady.
Pochopme učení pod dohledem na příkladu. Předpokládejme, že máme vstupní datovou sadu obrázků koček a psů. Nejprve tedy poskytneme stroji školení, aby porozuměl obrázkům, jako je např tvar a velikost ocasu kočky a psa, tvar očí, barva, výška (psi jsou vyšší, kočky jsou menší) atd. Po dokončení školení vložíme obrázek kočky a požádáme stroj, aby identifikoval objekt a předpověděl výstup. Nyní je stroj dobře vycvičený, takže zkontroluje všechny vlastnosti předmětu, jako je výška, tvar, barva, oči, uši, ocas atd., a zjistí, že je to kočka. Takže to zařadí do kategorie Cat. Toto je proces, jak stroj identifikuje objekty v Supervised Learning.
Hlavním cílem techniky učení s dohledem je mapování vstupní proměnné (x) s výstupní proměnnou (y). Některé aplikace řízeného učení v reálném světě jsou Posouzení rizik, Detekce podvodů, Filtrování spamu, atd.
Kategorie strojového učení pod dohledem
Strojové učení pod dohledem lze rozdělit do dvou typů problémů, které jsou uvedeny níže:
jak třídit seznam polí v jazyce Java
a) Klasifikace
Klasifikační algoritmy se používají k řešení klasifikačních problémů, ve kterých je výstupní proměnná kategorická, jako např. Ano nebo Ne, Muž nebo Žena, Červená nebo Modrá atd . Klasifikační algoritmy předpovídají kategorie přítomné v datové sadě. Některé příklady klasifikačních algoritmů v reálném světě jsou Detekce spamu, filtrování e-mailů atd.
Některé oblíbené klasifikační algoritmy jsou uvedeny níže:
b) Regrese
Regresní algoritmy se používají k řešení regresních problémů, ve kterých existuje lineární vztah mezi vstupními a výstupními proměnnými. Používají se k predikci kontinuálních výstupních proměnných, jako jsou trendy na trhu, předpověď počasí atd.
Některé oblíbené regresní algoritmy jsou uvedeny níže:
Výhody a nevýhody supervizovaného učení
výhody:
- Vzhledem k tomu, že řízené učení pracuje s označenou datovou sadou, můžeme mít přesnou představu o třídách objektů.
- Tyto algoritmy jsou užitečné při predikci výstupu na základě předchozích zkušeností.
Nevýhody:
- Tyto algoritmy nejsou schopny řešit složité úlohy.
- Pokud se testovací data liší od trénovacích dat, může předpovědět nesprávný výstup.
- Trénink algoritmu vyžaduje spoustu výpočetního času.
Aplikace řízeného učení
Některé běžné aplikace supervizovaného učení jsou uvedeny níže:
srovnání s javou
Při segmentaci obrazu se používají algoritmy supervizovaného učení. V tomto procesu se klasifikace obrazu provádí na různých obrazových datech s předdefinovanými štítky.
Řízené algoritmy se také používají v lékařské oblasti pro diagnostické účely. To se provádí pomocí lékařských snímků a minulých označených dat se štítky pro chorobné stavy. Pomocí takového procesu může stroj identifikovat onemocnění pro nové pacienty.
2. Strojové učení bez dozoru
Učení bez dozoru g se liší od techniky učení pod dohledem; jak jeho název napovídá, není potřeba dohled. To znamená, že při strojovém učení bez dozoru je stroj trénován pomocí neoznačené datové sady a stroj předpovídá výstup bez jakéhokoli dohledu.
Při učení bez dozoru jsou modely trénovány s daty, která nejsou klasifikována ani označena, a model na tato data pracuje bez jakéhokoli dohledu.
Hlavním cílem algoritmu učení bez dozoru je seskupovat nebo kategorie netříděných datových souborů podle podobností, vzorů a rozdílů. Stroje jsou instruovány, aby našly skryté vzory ze vstupní datové sady.
Vezměme si příklad, abychom to pochopili vzácněji; předpokládejme, že existuje koš obrázků ovoce a vložíme jej do modelu strojového učení. Obrázky jsou pro model zcela neznámé a úkolem stroje je najít vzory a kategorie objektů.
Nyní tedy stroj objeví své vzory a rozdíly, jako je rozdíl barev, tvarový rozdíl, a předpovídá výstup, když je testován pomocí testovací datové sady.
Kategorie strojového učení bez dozoru
Učení bez dozoru lze dále rozdělit do dvou typů, které jsou uvedeny níže:
1) Shlukování
Technika shlukování se používá, když chceme z dat najít inherentní skupiny. Je to způsob, jak seskupit objekty do shluku tak, aby objekty s největší podobností zůstaly v jedné skupině a měly méně nebo žádné podobnosti s objekty jiných skupin. Příkladem shlukovacího algoritmu je seskupování zákazníků podle jejich nákupního chování.
Některé z populárních shlukovacích algoritmů jsou uvedeny níže:
2) Sdružení
Učení asociačních pravidel je technika učení bez dozoru, která nachází zajímavé vztahy mezi proměnnými v rámci velkého souboru dat. Hlavním cílem tohoto učícího algoritmu je najít závislost jedné datové položky na jiné datové položce a podle toho tyto proměnné zmapovat tak, aby mohl generovat maximální zisk. Tento algoritmus se používá hlavně v Analýza tržního koše, těžba využití webu, nepřetržitá produkce , atd.
Některé populární algoritmy učení asociačních pravidel jsou Apriori algoritmus, Eclat, FP-růstový algoritmus.
Výhody a nevýhody algoritmu učení bez dozoru
výhody:
- Tyto algoritmy mohou být použity pro komplikované úlohy ve srovnání s těmi pod dohledem, protože tyto algoritmy pracují na neoznačené datové sadě.
- Algoritmy bez dozoru jsou vhodnější pro různé úkoly, protože získání neoznačené datové sady je snazší ve srovnání s označenou datovou sadou.
Nevýhody:
- Výstup algoritmu bez dozoru může být méně přesný, protože datová sada není označena a algoritmy nejsou trénovány s přesným výstupem dříve.
- Práce s učením bez dozoru je obtížnější, protože pracuje s neoznačenou datovou sadou, která se nemapuje s výstupem.
Aplikace nekontrolovaného učení
3. Semi-supervised learning
Semi-supervised learning je typ algoritmu strojového učení, který leží mezi strojovým učením pod dohledem a bez dozoru. . Představuje přechod mezi algoritmy Supervised (s označenými tréninkovými daty) a Unsupervised learning (bez označených tréninkových dat) a používá kombinaci označených a neoznačených datových sad během tréninkového období.
A I když je polořízené učení střední cestou mezi učením pod dohledem a učením bez dozoru a funguje na datech, která se skládají z několika štítků, většinou sestává z neoznačených dat. Protože štítky jsou nákladné, ale pro firemní účely mohou mít málo štítků. Je zcela odlišné od učení pod dohledem a bez dozoru, protože jsou založeny na přítomnosti a nepřítomnosti štítků.
Abychom překonali nevýhody řízeného učení a algoritmů učení bez dohledu, zavádí se koncept polořízeného učení. . Hlavním cílem polořízeného učení je efektivně využít všechna dostupná data, spíše než pouze označená data jako u supervizovaného učení. Zpočátku jsou podobná data seskupena spolu s algoritmem učení bez dozoru a dále pomáhá označit neoznačená data do označených dat. Je to proto, že označená data jsou srovnatelně dražší akvizice než neoznačená data.
Tyto algoritmy si můžeme představit na příkladu. Učení pod dohledem znamená, že student je pod dohledem instruktora doma i na vysoké škole. Dále, pokud tento student sám analyzuje stejný koncept bez jakékoli pomoci od instruktora, spadá do učení bez dozoru. V rámci polořízeného učení se student musí po analýze stejného konceptu pod vedením instruktora na vysoké škole revidovat.
Výhody a nevýhody polořízeného učení
výhody:
- Je to jednoduché a snadno pochopitelný algoritmus.
- Je vysoce účinný.
- Používá se k řešení nedostatků algoritmů supervised a unsupervised learning.
Nevýhody:
- Výsledky iterací nemusí být stabilní.
- Tyto algoritmy nemůžeme použít na data na úrovni sítě.
- Přesnost je nízká.
4. Posílení učení
Posílení učení funguje na základě procesu založeného na zpětné vazbě, ve kterém agent umělé inteligence (softwarová komponenta) automaticky prozkoumává své okolí pomocí úderů a stop, přijímání opatření, učení se ze zkušeností a zlepšování svého výkonu. Agent je odměněn za každou dobrou akci a potrestán za každou špatnou akci; proto cílem posilovacího vzdělávacího agenta je maximalizovat odměny.
V posilujícím učení neexistují žádná označená data jako učení pod dohledem a agenti se učí pouze ze svých zkušeností.
Proces posilování učení je podobný lidské bytosti; dítě se například učí různé věci zkušenostmi ze svého každodenního života. Příkladem posilovacího učení je hraní hry, kde Hra je prostředí, pohyby agenta v každém kroku definují stavy a cílem agenta je získat vysoké skóre. Agent dostává zpětnou vazbu ve smyslu trestů a odměn.
Díky svému způsobu práce se posilovací učení používá v různých oblastech, jako je např Teorie her, operační výzkum, teorie informace, multiagentní systémy.
mapování na stroji
Problém posilování učení lze formalizovat pomocí Markovův rozhodovací proces (MDP). V MDP agent neustále interaguje s prostředím a provádí akce; na každou akci okolí reaguje a generuje nový stav.
Kategorie posilovacího učení
Posílené učení je rozděleno hlavně do dvou typů metod/algoritmů:
Příklady použití posilovacího učení v reálném světě
Algoritmy RL jsou velmi oblíbené v herních aplikacích. Používá se k získání nadlidského výkonu. Některé populární hry, které používají RL algoritmy, jsou AlphaGO a AlphaGO Zero .
Dokument 'Resource Management with Deep Reinforcement Learning' ukázal, jak používat RL v počítači k automatickému učení a plánování zdrojů, aby čekaly na různé úlohy, aby se minimalizovalo průměrné zpomalení úlohy.
RL je široce používán v aplikacích robotiky. Roboti se používají v průmyslové a výrobní oblasti a tyto roboty jsou díky zesílenému učení výkonnější. Existují různá odvětví, která mají svou vizi budování inteligentních robotů pomocí AI a technologie strojového učení.
Text-mining, jedna ze skvělých aplikací NLP, je nyní implementována s pomocí Reinforcement Learning společnosti Salesforce.
Výhody a nevýhody posilovacího učení
Výhody
- Pomáhá při řešení složitých reálných problémů, které je obtížné vyřešit obecnými technikami.
- Model učení RL je podobný učení lidských bytostí; lze tedy nalézt nejpřesnější výsledky.
- Pomáhá dosáhnout dlouhodobých výsledků.
Nevýhoda
- RL algoritmy nejsou preferovány pro jednoduché problémy.
- RL algoritmy vyžadují obrovská data a výpočty.
- Příliš mnoho posilovacího učení může vést k přetížení stavů, což může oslabit výsledky.
Prokletí dimenzionality omezuje učení se zesílením pro skutečné fyzikální systémy.