Lineární regrese a logistická regrese jsou dva slavné algoritmy strojového učení, které spadají pod techniku učení pod dohledem. Vzhledem k tomu, že oba algoritmy jsou ve své podstatě dohlížené, používají tyto algoritmy k předpovědím označenou datovou sadu. Ale hlavní rozdíl mezi nimi je v tom, jak jsou používány. Lineární regrese se používá k řešení regresních problémů, zatímco logistická regrese se používá k řešení klasifikačních problémů. Popis obou algoritmů je uveden níže spolu s tabulkou rozdílů.
Lineární regrese:
- Lineární regrese je jedním z nejjednodušších algoritmů strojového učení, který spadá pod techniku supervizovaného učení a používá se k řešení regresních problémů.
- Používá se pro predikci spojité závislé proměnné pomocí nezávislých proměnných.
- Cílem lineární regrese je najít nejvhodnější linii, která dokáže přesně předpovědět výstup spojité závislé proměnné.
- Pokud je pro predikci použita jedna nezávislá proměnná, pak se nazývá jednoduchá lineární regrese a pokud existuje více než dvě nezávislé proměnné, pak se taková regrese nazývá vícenásobná lineární regrese.
- Algoritmus nalezením nejvhodnější čáry stanoví vztah mezi závisle proměnnou a nezávislou proměnnou. A vztah by měl být lineární povahy.
- Výstupem pro lineární regresi by měly být pouze spojité hodnoty, jako je cena, věk, plat atd. Vztah mezi závisle proměnnou a nezávislou proměnnou lze ukázat na obrázku níže:
Na obrázku nahoře je závislá proměnná na ose Y (plat) a nezávislá proměnná na ose x (zkušenost). Regresní přímka může být zapsána jako:
y= a<sub>0</sub>+a<sub>1</sub>x+ ε
Kde0a a1jsou koeficienty a ε je chybový člen.
Logistická regrese:
- Logistická regrese je jedním z nejpopulárnějších algoritmů strojového učení, který spadá pod techniky supervizovaného učení.
- Může být použit pro klasifikaci i pro regresní problémy, ale hlavně pro klasifikační problémy.
- Logistická regrese se používá k predikci kategorické závislé proměnné pomocí nezávislých proměnných.
- Výstup problému logistické regrese může být pouze mezi 0 a 1.
- Logistickou regresi lze použít tam, kde je vyžadována pravděpodobnost mezi dvěma třídami. Například zda bude dnes pršet nebo ne, buď 0 nebo 1, pravda nebo nepravda atd.
- Logistická regrese je založena na konceptu odhadu maximální pravděpodobnosti. Podle tohoto odhadu by měla být pozorovaná data nejpravděpodobnější.
- V logistické regresi předáváme vážený součet vstupů aktivační funkcí, která může mapovat hodnoty mezi 0 a 1. Taková aktivační funkce je známá jako sigmoidní funkce a získaná křivka se nazývá sigmoidní křivka nebo S-křivka. Zvažte následující obrázek:
- Rovnice pro logistickou regresi je:
Rozdíl mezi lineární regresí a logistickou regresí:
Lineární regrese | Logistická regrese |
---|---|
Lineární regrese se používá k predikci spojité závislé proměnné pomocí daného souboru nezávislých proměnných. | Logistická regrese se používá k predikci kategorické závislé proměnné pomocí daného souboru nezávislých proměnných. |
Lineární regrese se používá k řešení regresního problému. | Logistická regrese se používá pro řešení klasifikačních problémů. |
V lineární regresi předpovídáme hodnotu spojitých proměnných. | V logistické regresi predikujeme hodnoty kategoriálních proměnných. |
V lineární regresi najdeme nejlépe vyhovující přímku, pomocí které můžeme snadno předpovědět výstup. | V Logistické regresi najdeme S-křivku, podle které můžeme vzorky klasifikovat. |
Pro odhad přesnosti se používá metoda odhadu nejmenších čtverců. | Pro odhad přesnosti se používá metoda odhadu maximální věrohodnosti. |
Výstupem pro lineární regresi musí být spojitá hodnota, jako je cena, stáří atd. | Výstupem Logistické regrese musí být kategorická hodnota, jako je 0 nebo 1, Ano nebo Ne atd. |
V lineární regresi se požaduje, aby vztah mezi závisle proměnnou a nezávislou proměnnou byl lineární. | V logistické regresi není požadováno mít lineární vztah mezi závislou a nezávislou proměnnou. |
Při lineární regresi může existovat kolinearita mezi nezávislými proměnnými. | V logistické regresi by mezi nezávislou proměnnou neměla být kolinearita. |