logo

Typy strojového učení

Strojové učení je podmnožinou umělé inteligence, která umožňuje stroji automaticky se učit z dat, zlepšovat výkon z minulých zkušeností a vytvářet předpovědi. . Strojové učení obsahuje sadu algoritmů, které pracují s velkým množstvím dat. Data jsou přiváděna do těchto algoritmů, aby je trénovaly, a na základě školení sestavují model a provádějí konkrétní úkol.

Typy strojového učení

Tyto algoritmy ML pomáhají řešit různé obchodní problémy, jako je regrese, klasifikace, prognózování, seskupování a asociace atd.

Na základě metod a způsobu učení se strojové učení dělí především na čtyři typy, kterými jsou:

  1. Strojové učení pod dohledem
  2. Strojové učení bez dozoru
  3. Částečně řízené strojové učení
  4. Posílení učení
Typy strojového učení

V tomto tématu poskytneme podrobný popis typů strojového učení spolu s jejich příslušnými algoritmy:

1. Strojové učení pod dohledem

Jak jeho název napovídá, Strojové učení pod dohledem je založen na supervizi. To znamená, že v technice učení pod dohledem trénujeme stroje pomocí „označeného“ souboru dat a na základě školení stroj předpovídá výstup. Zde označená data určují, že některé vstupy jsou již namapovány na výstup. Ještě vzácněji, můžeme říci; nejprve stroj natrénujeme se vstupem a odpovídajícím výstupem a poté požádáme stroj, aby předpověděl výstup pomocí testovací datové sady.

Pochopme učení pod dohledem na příkladu. Předpokládejme, že máme vstupní datovou sadu obrázků koček a psů. Nejprve tedy poskytneme stroji školení, aby porozuměl obrázkům, jako je např tvar a velikost ocasu kočky a psa, tvar očí, barva, výška (psi jsou vyšší, kočky jsou menší) atd. Po dokončení školení vložíme obrázek kočky a požádáme stroj, aby identifikoval objekt a předpověděl výstup. Nyní je stroj dobře vycvičený, takže zkontroluje všechny vlastnosti předmětu, jako je výška, tvar, barva, oči, uši, ocas atd., a zjistí, že je to kočka. Takže to zařadí do kategorie Cat. Toto je proces, jak stroj identifikuje objekty v Supervised Learning.

Hlavním cílem techniky učení s dohledem je mapování vstupní proměnné (x) s výstupní proměnnou (y). Některé aplikace řízeného učení v reálném světě jsou Posouzení rizik, Detekce podvodů, Filtrování spamu, atd.

Kategorie strojového učení pod dohledem

Strojové učení pod dohledem lze rozdělit do dvou typů problémů, které jsou uvedeny níže:

jak třídit seznam polí v jazyce Java
    Klasifikace Regrese

a) Klasifikace

Klasifikační algoritmy se používají k řešení klasifikačních problémů, ve kterých je výstupní proměnná kategorická, jako např. Ano nebo Ne, Muž nebo Žena, Červená nebo Modrá atd . Klasifikační algoritmy předpovídají kategorie přítomné v datové sadě. Některé příklady klasifikačních algoritmů v reálném světě jsou Detekce spamu, filtrování e-mailů atd.

Některé oblíbené klasifikační algoritmy jsou uvedeny níže:

    Náhodný lesní algoritmus Algoritmus rozhodovacího stromu Logistický regresní algoritmus Podpora vektorového strojového algoritmu

b) Regrese

Regresní algoritmy se používají k řešení regresních problémů, ve kterých existuje lineární vztah mezi vstupními a výstupními proměnnými. Používají se k predikci kontinuálních výstupních proměnných, jako jsou trendy na trhu, předpověď počasí atd.

Některé oblíbené regresní algoritmy jsou uvedeny níže:

    Jednoduchý algoritmus lineární regrese Multivariační regresní algoritmus Algoritmus rozhodovacího stromu Regrese lasem

Výhody a nevýhody supervizovaného učení

výhody:

  • Vzhledem k tomu, že řízené učení pracuje s označenou datovou sadou, můžeme mít přesnou představu o třídách objektů.
  • Tyto algoritmy jsou užitečné při predikci výstupu na základě předchozích zkušeností.

Nevýhody:

  • Tyto algoritmy nejsou schopny řešit složité úlohy.
  • Pokud se testovací data liší od trénovacích dat, může předpovědět nesprávný výstup.
  • Trénink algoritmu vyžaduje spoustu výpočetního času.

Aplikace řízeného učení

Některé běžné aplikace supervizovaného učení jsou uvedeny níže:

srovnání s javou
    Segmentace obrázku:
    Při segmentaci obrazu se používají algoritmy supervizovaného učení. V tomto procesu se klasifikace obrazu provádí na různých obrazových datech s předdefinovanými štítky.Lékařská diagnóza:
    Řízené algoritmy se také používají v lékařské oblasti pro diagnostické účely. To se provádí pomocí lékařských snímků a minulých označených dat se štítky pro chorobné stavy. Pomocí takového procesu může stroj identifikovat onemocnění pro nové pacienty.Detekce podvodů -Klasifikační algoritmy supervizovaného učení se používají k identifikaci podvodných transakcí, podvodných zákazníků atd. Provádí se pomocí historických dat k identifikaci vzorců, které mohou vést k možnému podvodu.Detekce spamu -Při detekci a filtrování spamu se používají klasifikační algoritmy. Tyto algoritmy klasifikují e-mail jako spam nebo nikoli. Spamové e-maily jsou odesílány do složky nevyžádané pošty.Rozpoznávání řeči -Algoritmy řízeného učení se také používají při rozpoznávání řeči. Algoritmus je trénován s hlasovými daty a pomocí nich lze provádět různé identifikace, jako jsou hlasově aktivovaná hesla, hlasové příkazy atd.

2. Strojové učení bez dozoru

Učení bez dozoru g se liší od techniky učení pod dohledem; jak jeho název napovídá, není potřeba dohled. To znamená, že při strojovém učení bez dozoru je stroj trénován pomocí neoznačené datové sady a stroj předpovídá výstup bez jakéhokoli dohledu.

Při učení bez dozoru jsou modely trénovány s daty, která nejsou klasifikována ani označena, a model na tato data pracuje bez jakéhokoli dohledu.

Hlavním cílem algoritmu učení bez dozoru je seskupovat nebo kategorie netříděných datových souborů podle podobností, vzorů a rozdílů. Stroje jsou instruovány, aby našly skryté vzory ze vstupní datové sady.

Vezměme si příklad, abychom to pochopili vzácněji; předpokládejme, že existuje koš obrázků ovoce a vložíme jej do modelu strojového učení. Obrázky jsou pro model zcela neznámé a úkolem stroje je najít vzory a kategorie objektů.

Nyní tedy stroj objeví své vzory a rozdíly, jako je rozdíl barev, tvarový rozdíl, a předpovídá výstup, když je testován pomocí testovací datové sady.

Kategorie strojového učení bez dozoru

Učení bez dozoru lze dále rozdělit do dvou typů, které jsou uvedeny níže:

    Shlukování Sdružení

1) Shlukování

Technika shlukování se používá, když chceme z dat najít inherentní skupiny. Je to způsob, jak seskupit objekty do shluku tak, aby objekty s největší podobností zůstaly v jedné skupině a měly méně nebo žádné podobnosti s objekty jiných skupin. Příkladem shlukovacího algoritmu je seskupování zákazníků podle jejich nákupního chování.

Některé z populárních shlukovacích algoritmů jsou uvedeny níže:

    Algoritmus shlukování K-Means Algoritmus středního posunu Algoritmus DBSCAN Analýza hlavních komponent Nezávislá analýza komponent

2) Sdružení

Učení asociačních pravidel je technika učení bez dozoru, která nachází zajímavé vztahy mezi proměnnými v rámci velkého souboru dat. Hlavním cílem tohoto učícího algoritmu je najít závislost jedné datové položky na jiné datové položce a podle toho tyto proměnné zmapovat tak, aby mohl generovat maximální zisk. Tento algoritmus se používá hlavně v Analýza tržního koše, těžba využití webu, nepřetržitá produkce , atd.

Některé populární algoritmy učení asociačních pravidel jsou Apriori algoritmus, Eclat, FP-růstový algoritmus.

Výhody a nevýhody algoritmu učení bez dozoru

výhody:

  • Tyto algoritmy mohou být použity pro komplikované úlohy ve srovnání s těmi pod dohledem, protože tyto algoritmy pracují na neoznačené datové sadě.
  • Algoritmy bez dozoru jsou vhodnější pro různé úkoly, protože získání neoznačené datové sady je snazší ve srovnání s označenou datovou sadou.

Nevýhody:

  • Výstup algoritmu bez dozoru může být méně přesný, protože datová sada není označena a algoritmy nejsou trénovány s přesným výstupem dříve.
  • Práce s učením bez dozoru je obtížnější, protože pracuje s neoznačenou datovou sadou, která se nemapuje s výstupem.

Aplikace nekontrolovaného učení

    Analýza sítě:Učení bez dozoru se používá k identifikaci plagiátů a autorských práv v rámci síťové analýzy textových dat pro odborné články.Systémy doporučení:Systémy doporučení široce používají techniky učení bez dozoru pro vytváření aplikací doporučení pro různé webové aplikace a webové stránky elektronického obchodu.Detekce anomálií:Detekce anomálií je oblíbená aplikace učení bez dozoru, která dokáže identifikovat neobvyklé datové body v datové sadě. Slouží k odhalování podvodných transakcí.Dekompozice singulární hodnoty:Singulární Value Decomposition neboli SVD se používá k extrahování konkrétních informací z databáze. Například extrahování informací o každém uživateli nacházejícím se na určitém místě.

3. Semi-supervised learning

Semi-supervised learning je typ algoritmu strojového učení, který leží mezi strojovým učením pod dohledem a bez dozoru. . Představuje přechod mezi algoritmy Supervised (s označenými tréninkovými daty) a Unsupervised learning (bez označených tréninkových dat) a používá kombinaci označených a neoznačených datových sad během tréninkového období.

A I když je polořízené učení střední cestou mezi učením pod dohledem a učením bez dozoru a funguje na datech, která se skládají z několika štítků, většinou sestává z neoznačených dat. Protože štítky jsou nákladné, ale pro firemní účely mohou mít málo štítků. Je zcela odlišné od učení pod dohledem a bez dozoru, protože jsou založeny na přítomnosti a nepřítomnosti štítků.

Abychom překonali nevýhody řízeného učení a algoritmů učení bez dohledu, zavádí se koncept polořízeného učení. . Hlavním cílem polořízeného učení je efektivně využít všechna dostupná data, spíše než pouze označená data jako u supervizovaného učení. Zpočátku jsou podobná data seskupena spolu s algoritmem učení bez dozoru a dále pomáhá označit neoznačená data do označených dat. Je to proto, že označená data jsou srovnatelně dražší akvizice než neoznačená data.

Tyto algoritmy si můžeme představit na příkladu. Učení pod dohledem znamená, že student je pod dohledem instruktora doma i na vysoké škole. Dále, pokud tento student sám analyzuje stejný koncept bez jakékoli pomoci od instruktora, spadá do učení bez dozoru. V rámci polořízeného učení se student musí po analýze stejného konceptu pod vedením instruktora na vysoké škole revidovat.

Výhody a nevýhody polořízeného učení

výhody:

  • Je to jednoduché a snadno pochopitelný algoritmus.
  • Je vysoce účinný.
  • Používá se k řešení nedostatků algoritmů supervised a unsupervised learning.

Nevýhody:

  • Výsledky iterací nemusí být stabilní.
  • Tyto algoritmy nemůžeme použít na data na úrovni sítě.
  • Přesnost je nízká.

4. Posílení učení

Posílení učení funguje na základě procesu založeného na zpětné vazbě, ve kterém agent umělé inteligence (softwarová komponenta) automaticky prozkoumává své okolí pomocí úderů a stop, přijímání opatření, učení se ze zkušeností a zlepšování svého výkonu. Agent je odměněn za každou dobrou akci a potrestán za každou špatnou akci; proto cílem posilovacího vzdělávacího agenta je maximalizovat odměny.

V posilujícím učení neexistují žádná označená data jako učení pod dohledem a agenti se učí pouze ze svých zkušeností.

Proces posilování učení je podobný lidské bytosti; dítě se například učí různé věci zkušenostmi ze svého každodenního života. Příkladem posilovacího učení je hraní hry, kde Hra je prostředí, pohyby agenta v každém kroku definují stavy a cílem agenta je získat vysoké skóre. Agent dostává zpětnou vazbu ve smyslu trestů a odměn.

Díky svému způsobu práce se posilovací učení používá v různých oblastech, jako je např Teorie her, operační výzkum, teorie informace, multiagentní systémy.

mapování na stroji

Problém posilování učení lze formalizovat pomocí Markovův rozhodovací proces (MDP). V MDP agent neustále interaguje s prostředím a provádí akce; na každou akci okolí reaguje a generuje nový stav.

Kategorie posilovacího učení

Posílené učení je rozděleno hlavně do dvou typů metod/algoritmů:

    Pozitivní posilovací učení:Učení pozitivního posílení specifikuje zvýšení tendence, že by se požadované chování znovu objevilo přidáním něčeho. Zvyšuje sílu chování agenta a pozitivně ho ovlivňuje.Negativní posilovací učení:Negativní posilovací učení funguje přesně opačně než pozitivní RL. Vyhýbáním se negativnímu stavu zvyšuje tendenci, že by se specifické chování znovu objevilo.

Příklady použití posilovacího učení v reálném světě

    Videohry:
    Algoritmy RL jsou velmi oblíbené v herních aplikacích. Používá se k získání nadlidského výkonu. Některé populární hry, které používají RL algoritmy, jsou AlphaGO a AlphaGO Zero .Správa zdrojů:
    Dokument 'Resource Management with Deep Reinforcement Learning' ukázal, jak používat RL v počítači k automatickému učení a plánování zdrojů, aby čekaly na různé úlohy, aby se minimalizovalo průměrné zpomalení úlohy.Robotika:
    RL je široce používán v aplikacích robotiky. Roboti se používají v průmyslové a výrobní oblasti a tyto roboty jsou díky zesílenému učení výkonnější. Existují různá odvětví, která mají svou vizi budování inteligentních robotů pomocí AI a technologie strojového učení.Těžba textu
    Text-mining, jedna ze skvělých aplikací NLP, je nyní implementována s pomocí Reinforcement Learning společnosti Salesforce.

Výhody a nevýhody posilovacího učení

Výhody

  • Pomáhá při řešení složitých reálných problémů, které je obtížné vyřešit obecnými technikami.
  • Model učení RL je podobný učení lidských bytostí; lze tedy nalézt nejpřesnější výsledky.
  • Pomáhá dosáhnout dlouhodobých výsledků.

Nevýhoda

  • RL algoritmy nejsou preferovány pro jednoduché problémy.
  • RL algoritmy vyžadují obrovská data a výpočty.
  • Příliš mnoho posilovacího učení může vést k přetížení stavů, což může oslabit výsledky.

Prokletí dimenzionality omezuje učení se zesílením pro skutečné fyzikální systémy.