logo

Lineární regrese vs logistická regrese

Lineární regrese a logistická regrese jsou dva slavné algoritmy strojového učení, které spadají pod techniku ​​učení pod dohledem. Vzhledem k tomu, že oba algoritmy jsou ve své podstatě dohlížené, používají tyto algoritmy k předpovědím označenou datovou sadu. Ale hlavní rozdíl mezi nimi je v tom, jak jsou používány. Lineární regrese se používá k řešení regresních problémů, zatímco logistická regrese se používá k řešení klasifikačních problémů. Popis obou algoritmů je uveden níže spolu s tabulkou rozdílů.

inear Regression vs Logistic Regression

Lineární regrese:

  • Lineární regrese je jedním z nejjednodušších algoritmů strojového učení, který spadá pod techniku ​​supervizovaného učení a používá se k řešení regresních problémů.
  • Používá se pro predikci spojité závislé proměnné pomocí nezávislých proměnných.
  • Cílem lineární regrese je najít nejvhodnější linii, která dokáže přesně předpovědět výstup spojité závislé proměnné.
  • Pokud je pro predikci použita jedna nezávislá proměnná, pak se nazývá jednoduchá lineární regrese a pokud existuje více než dvě nezávislé proměnné, pak se taková regrese nazývá vícenásobná lineární regrese.
  • Algoritmus nalezením nejvhodnější čáry stanoví vztah mezi závisle proměnnou a nezávislou proměnnou. A vztah by měl být lineární povahy.
  • Výstupem pro lineární regresi by měly být pouze spojité hodnoty, jako je cena, věk, plat atd. Vztah mezi závisle proměnnou a nezávislou proměnnou lze ukázat na obrázku níže:
inear Regression vs Logistic Regression

Na obrázku nahoře je závislá proměnná na ose Y (plat) a nezávislá proměnná na ose x (zkušenost). Regresní přímka může být zapsána jako:

 y= a<sub>0</sub>+a<sub>1</sub>x+ &#x3B5; 

Kde0a a1jsou koeficienty a ε je chybový člen.

Logistická regrese:

  • Logistická regrese je jedním z nejpopulárnějších algoritmů strojového učení, který spadá pod techniky supervizovaného učení.
  • Může být použit pro klasifikaci i pro regresní problémy, ale hlavně pro klasifikační problémy.
  • Logistická regrese se používá k predikci kategorické závislé proměnné pomocí nezávislých proměnných.
  • Výstup problému logistické regrese může být pouze mezi 0 a 1.
  • Logistickou regresi lze použít tam, kde je vyžadována pravděpodobnost mezi dvěma třídami. Například zda bude dnes pršet nebo ne, buď 0 nebo 1, pravda nebo nepravda atd.
  • Logistická regrese je založena na konceptu odhadu maximální pravděpodobnosti. Podle tohoto odhadu by měla být pozorovaná data nejpravděpodobnější.
  • V logistické regresi předáváme vážený součet vstupů aktivační funkcí, která může mapovat hodnoty mezi 0 a 1. Taková aktivační funkce je známá jako sigmoidní funkce a získaná křivka se nazývá sigmoidní křivka nebo S-křivka. Zvažte následující obrázek:
inear Regression vs Logistic Regression
  • Rovnice pro logistickou regresi je:
inear Regression vs Logistic Regression

Rozdíl mezi lineární regresí a logistickou regresí:

Lineární regrese Logistická regrese
Lineární regrese se používá k predikci spojité závislé proměnné pomocí daného souboru nezávislých proměnných. Logistická regrese se používá k predikci kategorické závislé proměnné pomocí daného souboru nezávislých proměnných.
Lineární regrese se používá k řešení regresního problému. Logistická regrese se používá pro řešení klasifikačních problémů.
V lineární regresi předpovídáme hodnotu spojitých proměnných. V logistické regresi predikujeme hodnoty kategoriálních proměnných.
V lineární regresi najdeme nejlépe vyhovující přímku, pomocí které můžeme snadno předpovědět výstup. V Logistické regresi najdeme S-křivku, podle které můžeme vzorky klasifikovat.
Pro odhad přesnosti se používá metoda odhadu nejmenších čtverců. Pro odhad přesnosti se používá metoda odhadu maximální věrohodnosti.
Výstupem pro lineární regresi musí být spojitá hodnota, jako je cena, stáří atd. Výstupem Logistické regrese musí být kategorická hodnota, jako je 0 nebo 1, Ano nebo Ne atd.
V lineární regresi se požaduje, aby vztah mezi závisle proměnnou a nezávislou proměnnou byl lineární. V logistické regresi není požadováno mít lineární vztah mezi závislou a nezávislou proměnnou.
Při lineární regresi může existovat kolinearita mezi nezávislými proměnnými. V logistické regresi by mezi nezávislou proměnnou neměla být kolinearita.