logo

Strojové učení pod dohledem

Učení pod dohledem je typ strojového učení, ve kterém jsou stroje trénovány pomocí dobře „označených“ tréninkových dat a na základě těchto dat stroje předpovídají výstup. Označená data znamenají, že některá vstupní data jsou již označena správným výstupem.

Při učení pod dohledem fungují trénovací data poskytovaná strojům jako supervizor, který učí stroje správně předvídat výstup. Uplatňuje stejný koncept, jaký se student učí pod dohledem učitele.

Supervizované učení je proces poskytování vstupních dat i správných výstupních dat do modelu strojového učení. Cílem algoritmu učení pod dohledem je najít mapovací funkci pro mapování vstupní proměnné (x) s výstupní proměnnou (y) .

V reálném světě lze učení pod dohledem využít Posouzení rizik, klasifikace obrázků, detekce podvodů, filtrování spamu , atd.

Jak řízené učení funguje?

Při učení pod dohledem jsou modely trénovány pomocí označené datové sady, kde se model učí o každém typu dat. Po dokončení trénovacího procesu je model testován na základě testovacích dat (podmnožina trénovací množiny) a následně předpovídá výstup.

Fungování supervizovaného učení lze snadno pochopit na níže uvedeném příkladu a diagramu:

Strojové učení pod dohledem

Předpokládejme, že máme datovou sadu různých typů tvarů, která zahrnuje čtverec, obdélník, trojúhelník a mnohoúhelník. Nyní prvním krokem je, že musíme model natrénovat pro každý tvar.

  • Pokud má daný tvar čtyři strany a všechny strany jsou stejné, bude označen jako a Náměstí .
  • Pokud má daný tvar tři strany, bude označen jako a trojúhelník .
  • Pokud má daný tvar šest stejných stran, bude označen jako šestiúhelník .

Nyní, po tréninku, testujeme náš model pomocí testovací sady a úkolem modelu je identifikovat tvar.

Stroj je již trénován na všechny typy tvarů, a když najde nový tvar, klasifikuje tvar na základě řady stran a předpovídá výstup.

Kroky zahrnuté v řízeném učení:

  • Nejprve určete typ trénovací datové sady
  • Sbírejte/shromažďujte označená tréninková data.
  • Rozdělte tréninkovou datovou sadu na trénink datová sada, testovací datová sada a validační datová sada .
  • Určete vstupní vlastnosti trénovací datové sady, která by měla mít dostatek znalostí, aby model mohl přesně předvídat výstup.
  • Určete vhodný algoritmus pro model, jako je podpůrný vektorový stroj, rozhodovací strom atd.
  • Spusťte algoritmus na trénovací datové sadě. Někdy potřebujeme ověřovací sady jako řídicí parametry, které jsou podmnožinou trénovacích datových sad.
  • Vyhodnoťte přesnost modelu poskytnutím testovací sady. Pokud model předpovídá správný výstup, znamená to, že náš model je přesný.

Typy kontrolovaných algoritmů strojového učení:

Učení pod dohledem lze dále rozdělit na dva typy problémů:

Strojové učení pod dohledem

1. Regrese

Regresní algoritmy se používají, pokud existuje vztah mezi vstupní proměnnou a výstupní proměnnou. Používá se pro predikci kontinuálních proměnných, jako je předpověď počasí, trendy trhu atd. Níže jsou uvedeny některé oblíbené regresní algoritmy, které spadají pod dohled:

  • Lineární regrese
  • Regresní stromy
  • Nelineární regrese
  • Bayesovská lineární regrese
  • Polynomiální regrese

2. Klasifikace

Klasifikační algoritmy se používají, když je výstupní proměnná kategorická, což znamená, že existují dvě třídy, jako je Ano-Ne, Muž-Žena, Pravda-nepravda atd.

Filtrování spamu,

  • Náhodný les
  • Rozhodovací stromy
  • Logistická regrese
  • Podpora vektorové stroje

Poznámka: Tyto algoritmy podrobně probereme v dalších kapitolách.

Výhody řízené výuky:

  • S pomocí učení pod dohledem může model předpovídat výstup na základě předchozích zkušeností.
  • Při řízeném učení můžeme mít přesnou představu o třídách objektů.
  • Model supervidovaného učení nám pomáhá řešit různé reálné problémy jako např detekce podvodů, filtrování spamu , atd.

Nevýhody výuky pod dohledem:

  • Modely učení pod dohledem nejsou vhodné pro řešení složitých úkolů.
  • Řízené učení nemůže předpovědět správný výstup, pokud se testovací data liší od trénovací datové sady.
  • Školení vyžadovalo spoustu výpočetního času.
  • Při učení pod dohledem potřebujeme dostatek znalostí o třídách objektů.