LINEÁRNÍ REGRESE VE STROJOVÉM UČENÍ

Strojové učení je odvětví umělé inteligence, které se zaměřuje na vývoj algoritmů a statistických modelů, které se mohou učit z dat a předpovídat je. Lineární regrese je také typem algoritmu strojového učení, konkrétněji a algoritmus strojového učení pod dohledem který se učí z označených datových sad a mapuje datové body k nejoptimalizovanějším lineárním funkcím. které lze použít pro predikci nových datových sad.

Nejprve bychom měli vědět, co jsou to supervidované algoritmy strojového učení. Je to typ strojového učení, kde se algoritmus učí z označených dat. Označená data znamenají datovou sadu, jejíž příslušná cílová hodnota je již známa. Učení pod dohledem má dva typy:

Klasifikace : Předpovídá třídu datové sady na základě nezávislé vstupní proměnné. Třída je kategorické nebo diskrétní hodnoty. jako obraz zvířete je kočka nebo pes?
Regrese : Předpovídá spojité výstupní proměnné na základě nezávislé vstupní proměnné. jako je předpověď cen domů na základě různých parametrů, jako je stáří domu, vzdálenost od hlavní silnice, umístění, oblast atd.

Zde budeme diskutovat o jednom z nejjednodušších typů regrese, tj. Lineární regrese.

Obsah

Co je lineární regrese?
Typy lineární regrese
Jaká je nejlepší řada Fit?
Nákladová funkce pro lineární regresi
Předpoklady jednoduché lineární regrese
Předpoklady vícenásobné lineární regrese
Metriky hodnocení pro lineární regresi
Implementace lineární regrese v Pythonu
Regularizační techniky pro lineární modely
Aplikace lineární regrese
Výhody a nevýhody lineární regrese
Lineární regrese – často kladené otázky (FAQ)

Co je lineární regrese?

Lineární regrese je druh strojové učení pod dohledem algoritmus, který počítá lineární vztah mezi závisle proměnnou a jedním nebo více nezávislými rysy přizpůsobením lineární rovnice pozorovaným datům.

Pokud existuje pouze jeden nezávislý prvek, nazývá se to Jednoduchá lineární regrese , a pokud existuje více než jeden prvek, je známý jako Vícenásobná lineární regrese .

Podobně, když existuje pouze jedna závislá proměnná, bere se v úvahu Jednorozměrná lineární regrese , zatímco když existuje více než jedna závislá proměnná, je známá jako Vícerozměrná regrese .

jak získat emotikony jablka na android

Proč je lineární regrese důležitá?

Interpretovatelnost lineární regrese je pozoruhodná síla. Rovnice modelu poskytuje jasné koeficienty, které objasňují dopad každé nezávislé proměnné na závislou proměnnou, což usnadňuje hlubší pochopení základní dynamiky. Jeho jednoduchost je ctností, protože lineární regrese je transparentní, snadno implementovatelná a slouží jako základní koncept pro složitější algoritmy.

Lineární regrese není pouze prediktivním nástrojem; tvoří základ pro různé pokročilé modely. Techniky jako regularizace a podpůrné vektorové stroje čerpají inspiraci z lineární regrese a rozšiřují její užitečnost. Lineární regrese je navíc základním kamenem testování předpokladů a umožňuje výzkumníkům ověřit klíčové předpoklady o datech.

Typy lineární regrese

Existují dva hlavní typy lineární regrese:

Jednoduchá lineární regrese

Toto je nejjednodušší forma lineární regrese a zahrnuje pouze jednu nezávislou proměnnou a jednu závisle proměnnou. Rovnice pro jednoduchou lineární regresi je:
y=eta_{0}+eta_{1}X
kde:

Y je závislá proměnná
X je nezávislá proměnná
β0 je zachycení
β1 je sklon

Vícenásobná lineární regrese

To zahrnuje více než jednu nezávislou proměnnou a jednu závisle proměnnou. Rovnice pro vícenásobnou lineární regresi je:
y=eta_{0}+eta_{1}X+eta_{2}X+………eta_{n}X
kde:

Y je závislá proměnná
X1, X2, …, Xp jsou nezávislé proměnné
β0 je zachycení
β1, β2, …, βn jsou sklony

Cílem algoritmu je najít nejlepší Fit řada rovnice, která dokáže předpovídat hodnoty na základě nezávislých proměnných.

V regresi je přítomna sada záznamů s hodnotami X a Y a tyto hodnoty se používají k naučení funkce, takže pokud chcete předpovědět Y z neznámého X, lze tuto naučenou funkci použít. V regresi musíme najít hodnotu Y, takže je vyžadována funkce, která předpovídá spojité Y v případě regrese dané X jako nezávislé rysy.

Jaká je nejlepší řada Fit?

Naším primárním cílem při použití lineární regrese je najít nejvhodnější linii, což znamená, že chyba mezi předpokládanými a skutečnými hodnotami by měla být minimální. Nejméně chyb bude v nejlépe padnoucí řadě.

Nejlepší rovnice Fit Line poskytuje přímku, která představuje vztah mezi závislými a nezávislými proměnnými. Sklon čáry udává, jak moc se mění závislá proměnná při jednotkové změně v nezávislé proměnné (proměnných).

Lineární regrese

Zde se Y nazývá závislá nebo cílová proměnná a X se nazývá nezávislá proměnná známá také jako prediktor Y. Existuje mnoho typů funkcí nebo modulů, které lze použít pro regresi. Lineární funkce je nejjednodušším typem funkce. Zde může být X jeden prvek nebo více prvků představujících problém.

Lineární regrese provádí úlohu předpovědět hodnotu závislé proměnné (y) na základě dané nezávisle proměnné (x)). Proto je název lineární regrese. Na obrázku výše X (vstup) je pracovní zkušenost a Y (výstup) je plat osoby. Regresní přímka je pro náš model nejvhodnější.

K výpočtu nejlepších hodnot využíváme nákladovou funkci, abychom získali nejvhodnější křivku, protože různé hodnoty vah nebo koeficientu čar vedou k různým regresním přímkám.

Hypotézní funkce v lineární regresi

Jak jsme již dříve předpokládali, že naším nezávislým rysem je zkušenost, tj. X a příslušný plat Y je závislá proměnná. Předpokládejme, že existuje lineární vztah mezi X a Y, pak lze plat předpovědět pomocí:

hat{Y} = heta_1 + heta_2X

NEBO

hat{y}_i = heta_1 + heta_2x_i

Tady,

y_i epsilon Y ;; (i= 1,2, cdots , n) jsou štítky k datům (učení pod dohledem)
x_i epsilon X ;; (i= 1,2, cdots , n) jsou vstupní nezávislá tréninková data (jednorozměrná – jedna vstupní proměnná (parametr))
hat{y_i} epsilon hat{Y} ;; (i= 1,2, cdots , n) jsou předpokládané hodnoty.

Model získá nejlepší křivku regrese nalezením nejlepšího θ₁a θ₂hodnoty.

i ₁ : zachytit
i ₂ : koeficient x

Jakmile najdeme to nejlepší θ₁a θ₂hodnot, získáme nejvhodnější řadu. Takže když konečně použijeme náš model pro predikci, předpoví hodnotu y pro vstupní hodnotu x.

Jak aktualizovat θ ₁ a θ ₂ hodnoty, abyste získali nejvhodnější řadu?

Aby bylo dosaženo co nejlépe vyhovující regresní přímky, je cílem modelu předpovědět cílovou hodnotuhat{Y} tak, že rozdíl chyb mezi předpokládanou hodnotouhat{Y} a skutečná hodnota Y je minimální. Je tedy velmi důležité aktualizovat θ₁a θ₂hodnoty, abyste dosáhli nejlepší hodnoty, která minimalizuje chybu mezi předpokládanou hodnotou y (pred) a skutečnou hodnotou y (y).

minimizefrac{1}{n}sum_{i=1}^{n}(hat{y_i}-y_i)^2

Nákladová funkce pro lineární regresi

The nákladová funkce nebo ztrátová funkce není nic jiného než chyba nebo rozdíl mezi předpokládanou hodnotouhat{Y} a skutečnou hodnotu Y.

V lineární regresi je Střední kvadratická chyba (MSE) je použita nákladová funkce, která vypočítává průměr čtvercových chyb mezi předpokládanými hodnotamihat{y}_i a skutečné hodnoty{y}_i . Účelem je určit optimální hodnoty pro zachycení heta_1 a koeficient vstupního znaku heta_2 poskytnutí nejvhodnější čáry pro dané datové body. Lineární rovnice vyjadřující tento vztah jehat{y}_i = heta_1 + heta_2x_i .

Funkci MSE lze vypočítat takto:

ext{Cost function}(J) = frac{1}{n}sum_{n}^{i}(hat{y_i}-y_i)^2

Pomocí funkce MSE se použije iterativní proces sestupu gradientu k aktualizaci hodnot heta_1 & heta_2 . To zajišťuje, že hodnota MSE konverguje ke globálním minimům, což znamená nejpřesnější přizpůsobení lineární regresní přímky souboru dat.

Tento proces zahrnuje průběžné nastavování parametrů ( heta_1) a ( heta_2) na základě gradientů vypočítaných z MSE. Konečným výsledkem je lineární regresní přímka, která minimalizuje celkové čtvercové rozdíly mezi předpokládanými a skutečnými hodnotami a poskytuje optimální reprezentaci základního vztahu v datech.

Gradient sestup pro lineární regresi

Lineární regresní model lze trénovat pomocí optimalizačního algoritmu gradientní sestup iterativní úpravou parametrů modelu za účelem snížení střední kvadratická chyba (MSE) modelu na trénovací datové sadě. Chcete-li aktualizovat θ₁a θ₂hodnoty za účelem snížení funkce Cost (minimalizace hodnoty RMSE) a dosažení nejvhodnější linie, kterou model používá Gradient Descent. Myšlenka je začít s náhodným θ₁a θ₂hodnoty a poté iterativně aktualizovat hodnoty, až dosáhnete minimálních nákladů.

Gradient není nic jiného než derivace, která definuje účinky na výstupy funkce s malou variací ve vstupech.

co je build-essential ubuntu

Rozlišme nákladovou funkci (J) s ohledem na heta_1

egin {aligned} {J}’_{ heta_1} &=frac{partial J( heta_1, heta_2)}{partial heta_1} &= frac{partial}{partial heta_1} left[frac{1}{n} left(sum_{i=1}^{n}(hat{y}_i-y_i)^2 ight ) ight] &= frac{1}{n}left[sum_{i=1}^{n}2(hat{y}_i-y_i) left(frac{partial}{partial heta_1}(hat{y}_i-y_i) ight ) ight] &= frac{1}{n}left[sum_{i=1}^{n}2(hat{y}_i-y_i) left(frac{partial}{partial heta_1}( heta_1 + heta_2x_i-y_i) ight ) ight] &= frac{1}{n}left[sum_{i=1}^{n}2(hat{y}_i-y_i) left(1+0-0 ight ) ight] &= frac{1}{n}left[sum_{i=1}^{n}(hat{y}_i-y_i) left(2 ight ) ight] &= frac{2}{n}sum_{i=1}^{n}(hat{y}_i-y_i) end {aligned}

Rozlišme nákladovou funkci (J) s ohledem na heta_2

egin {aligned} {J}’_{ heta_2} &=frac{partial J( heta_1, heta_2)}{partial heta_2} &= frac{partial}{partial heta_2} left[frac{1}{n} left(sum_{i=1}^{n}(hat{y}_i-y_i)^2 ight ) ight] &= frac{1}{n}left[sum_{i=1}^{n}2(hat{y}_i-y_i) left(frac{partial}{partial heta_2}(hat{y}_i-y_i) ight ) ight] &= frac{1}{n}left[sum_{i=1}^{n}2(hat{y}_i-y_i) left(frac{partial}{partial heta_2}( heta_1 + heta_2x_i-y_i) ight ) ight] &= frac{1}{n}left[sum_{i=1}^{n}2(hat{y}_i-y_i) left(0+x_i-0 ight ) ight] &= frac{1}{n}left[sum_{i=1}^{n}(hat{y}_i-y_i) left(2x_i ight ) ight] &= frac{2}{n}sum_{i=1}^{n}(hat{y}_i-y_i)cdot x_i end {aligned}

Cílem lineární regrese je nalezení koeficientů lineární rovnice, které nejlépe odpovídají tréninkovým datům. Pohybem ve směru záporného gradientu střední kvadratické chyby vzhledem ke koeficientům lze koeficienty měnit. A příslušný průsečík a koeficient X bude ifalpha je rychlost učení.

Gradientní sestup

egin{aligned} heta_1 &= heta_1 – alpha left( {J}’_{ heta_1} ight) &= heta_1 -alpha left( frac{2}{n}sum_{i=1}^{n}(hat{y}_i-y_i) ight) end{aligned} egin{aligned} heta_2 &= heta_2 – alpha left({J}’_{ heta_2} ight) &= heta_2 – alpha left(frac{2}{n}sum_{i=1}^{n}(hat{y}_i-y_i)cdot x_i ight) end{aligned}

Předpoklady jednoduché lineární regrese

Lineární regrese je mocným nástrojem pro pochopení a predikci chování proměnné, musí však splňovat několik podmínek, aby byla přesná a spolehlivá řešení.

Linearita : Nezávislé a závislé proměnné mají mezi sebou lineární vztah. To znamená, že změny v závislé proměnné následují změny v nezávislé proměnné (proměnných) lineárním způsobem. To znamená, že by měla existovat přímka, kterou lze nakreslit datovými body. Pokud vztah není lineární, pak lineární regrese nebude přesný model.
Nezávislost : Pozorování v souboru dat jsou na sobě nezávislá. To znamená, že hodnota závislé proměnné pro jedno sledování nezávisí na hodnotě závislé proměnné pro jiné sledování. Pokud nejsou pozorování nezávislá, pak lineární regrese nebude přesným modelem.
Homoscedasticita : Na všech úrovních nezávisle proměnné (proměnných) je rozptyl chyb konstantní. To znamená, že množství nezávislé proměnné (proměnných) nemá žádný vliv na rozptyl chyb. Pokud rozptyl reziduí není konstantní, pak lineární regrese nebude přesný model.

Homoscedasticita v lineární regresi
Normálnost : Zbytky by měly být normálně rozloženy. To znamená, že zbytky by měly sledovat křivku ve tvaru zvonu. Pokud rezidua nejsou normálně rozdělena, pak lineární regrese nebude přesný model.

Předpoklady vícenásobné lineární regrese

Pro vícenásobnou lineární regresi platí všechny čtyři předpoklady jednoduché lineární regrese. Kromě toho níže uvádíme několik dalších:

Žádná multikolinearita : Mezi nezávislými proměnnými není vysoká korelace. To naznačuje, že mezi nezávislými proměnnými existuje malá nebo žádná korelace. K multikolinearitě dochází, když dvě nebo více nezávislých proměnných spolu vysoce korelují, což může ztěžovat stanovení individuálního účinku každé proměnné na závisle proměnnou. Pokud existuje multikolinearita, pak vícenásobná lineární regrese nebude přesný model.
Aditivita: Model předpokládá, že vliv změn v prediktorové proměnné na proměnnou odezvy je konzistentní bez ohledu na hodnoty ostatních proměnných. Tento předpoklad implikuje, že neexistuje žádná interakce mezi proměnnými v jejich účincích na závisle proměnnou.
Výběr funkcí: Při vícenásobné lineární regresi je nezbytné pečlivě vybrat nezávislé proměnné, které budou zahrnuty do modelu. Zahrnutí irelevantních nebo nadbytečných proměnných může vést k nadměrnému přizpůsobení a zkomplikovat interpretaci modelu.
Převybavení: Přepasování nastává, když model odpovídá trénovacím datům příliš těsně, zachycuje šum nebo náhodné výkyvy, které nepředstavují skutečný základní vztah mezi proměnnými. To může vést ke špatnému výkonu zobecnění na nových, neviditelných datech.

Multikolinearita

Multikolinearita je statistický jev, ke kterému dochází, když jsou dvě nebo více nezávislých proměnných ve vícenásobném regresním modelu vysoce korelované, což ztěžuje posouzení individuálních účinků každé proměnné na závislou proměnnou.

Detekce multikolinearity zahrnuje dvě techniky:

Korelační matice: Zkoumání korelační matice mezi nezávislými proměnnými je běžný způsob detekce multikolinearity. Vysoké korelace (blízké 1 nebo -1) indikují potenciální multikolinearitu.
VIF (faktor variační inflace): VIF je míra, která kvantifikuje, jak moc se zvýší rozptyl odhadovaného regresního koeficientu, pokud jsou vaše prediktory korelovány. Vysoký VIF (typicky nad 10) naznačuje multikolinearitu.

Metriky hodnocení pro lineární regresi

Různé hodnotící opatření lze použít k určení síly jakéhokoli lineárního regresního modelu. Tyto hodnotící metriky často udávají, jak dobře model produkuje pozorované výstupy.

Nejběžnější měření jsou:

Střední kvadratická chyba (MSE)

Střední kvadratická chyba (MSE) je vyhodnocovací metrika, která vypočítává průměr druhých mocnin rozdílů mezi skutečnými a předpokládanými hodnotami pro všechny datové body. Rozdíl je umocněn, aby se zajistilo, že se negativní a pozitivní rozdíly navzájem nevyruší.

MSE = frac{1}{n}sum_{i=1}^{n}left ( y_i – widehat{y_{i}} ight )^2

Tady,

n je počet datových bodů.
a_ije skutečná nebo pozorovaná hodnota pro i^čtdatový bod.
widehat{y_{i}} je předpokládaná hodnota pro i^čtdatový bod.

MSE je způsob, jak kvantifikovat přesnost předpovědí modelu. MSE je citlivý na odlehlé hodnoty, protože velké chyby významně přispívají k celkovému skóre.

Střední absolutní chyba (MAE)

Střední absolutní chyba je vyhodnocovací metrika používaná k výpočtu přesnosti regresního modelu. MAE měří průměrný absolutní rozdíl mezi předpokládanými hodnotami a skutečnými hodnotami.

Matematicky je MAE vyjádřeno jako:

MAE =frac{1}{n} sum_{i=1}^{n}|Y_i – widehat{Y_i}|

Tady,

n je počet pozorování
A_ipředstavuje skutečné hodnoty.
widehat{Y_i} představuje předpokládané hodnoty

Nižší hodnota MAE indikuje lepší výkon modelu. Není citlivý na odlehlé hodnoty, protože považujeme za absolutní rozdíly.

Root Mean Squared Error (RMSE)

Druhá odmocnina rozptylu reziduí je Root Mean Squared Error . Popisuje, jak dobře se pozorované datové body shodují s očekávanými hodnotami, nebo jak se model absolutně shoduje s daty.

V matematickém zápisu to lze vyjádřit jako:
RMSE=sqrt{frac{RSS}{n}}=sqrtfrac{{{sum_{i=2}^{n}(y^{actual}_{i}}- y_{i}^{predicted})^2}}{n}
Namísto dělení celého počtu datových bodů v modelu počtem stupňů volnosti je třeba vydělit součet druhých mocnin zbytků, abychom získali nezkreslený odhad. Potom se toto číslo označuje jako zbytková standardní chyba (RSE).

V matematickém zápisu to lze vyjádřit jako:
RMSE=sqrt{frac{RSS}{n}}=sqrtfrac{{{sum_{i=2}^{n}(y^{actual}_{i}}- y_{i}^{predicted})^2}}{(n-2)}

RSME není tak dobrá metrika jako R-squared. Root Mean Squared Error může kolísat, když se jednotky proměnných liší, protože její hodnota závisí na jednotkách proměnných (nejedná se o normalizované měření).

Koeficient determinace (R-kvadrát)

R-Squared je statistika, která udává, jak velkou variaci může vyvinutý model vysvětlit nebo zachytit. Je vždy v rozsahu 0 až 1. Obecně platí, že čím lépe model odpovídá datům, tím větší je číslo R na druhou.
V matematickém zápisu to lze vyjádřit jako:
R^{2}=1-(^{frac{RSS}{TSS}})

Freddie mercury

Zbytkový součet čtverců (RSS): The součet čtverců rezidua pro každý datový bod v grafu nebo datech je známý jako zbytkový součet čtverců nebo RSS. Je to měření rozdílu mezi výstupem, který byl pozorován, a tím, co se očekávalo.
RSS=sum_{i=2}^{n}(y_{i}-b_{0}-b_{1}x_{i})^{2}
Celkový součet čtverců (TSS): Součet chyb datových bodů z průměru proměnné odpovědi je známý jako celkový součet čtverců nebo TSS.
TSS= sum_{}^{}(y-overline{y_{i}})^2

R-kvadratická metrika je mírou podílu rozptylu v závislé proměnné, která je vysvětlena jako nezávislé proměnné v modelu.

Upravená R-Squared Error

Upraveno R²měří podíl rozptylu v závislé proměnné, který je vysvětlen nezávislými proměnnými v regresním modelu. Upravený R-čtverec zohledňuje počet prediktorů v modelu a penalizuje model za zahrnutí irelevantních prediktorů, které významně nepřispívají k vysvětlení rozptylu v závislých proměnných.

Matematicky upraveno R²se vyjadřuje jako:

Adjusted , R^2 = 1 – (frac{(1-R^2).(n-1)}{n-k-1})

Tady,

n je počet pozorování
k je počet prediktorů v modelu
R²je koeficient determinace

Upravený R-square pomáhá předcházet nadměrnému vybavení. Penalizuje model dalšími prediktory, které významně nepřispívají k vysvětlení rozptylu v závislé proměnné.

Implementace lineární regrese v Pythonu

Importujte potřebné knihovny:

Python3

 import pandas as pd import numpy as np import matplotlib.pyplot as plt import matplotlib.axes as ax from matplotlib.animation import FuncAnimation>

Načtěte datovou sadu a oddělte vstupní a cílové proměnné

Zde je odkaz na datovou sadu: Odkaz na datovou sadu

Python3

 url = 'https://media.techcodeview.com data = pd.read_csv(url) data # Drop the missing values data = data.dropna() # training dataset and labels train_input = np.array(data.x[0:500]).reshape(500, 1) train_output = np.array(data.y[0:500]).reshape(500, 1) # valid dataset and labels test_input = np.array(data.x[500:700]).reshape(199, 1) test_output = np.array(data.y[500:700]).reshape(199, 1)>

Sestavte model lineární regrese a vykreslete regresní přímku

kroky:

Při dopředném šíření je lineární regresní funkce Y=mx+c aplikována počátečním přiřazením náhodné hodnoty parametru (m & c).
Napsali jsme funkci k nalezení nákladové funkce, tj. průměru

Python3

 class LinearRegression: def __init__(self): self.parameters = {} def forward_propagation(self, train_input): m = self.parameters['m'] c = self.parameters['c'] predictions = np.multiply(m, train_input) + c return predictions def cost_function(self, predictions, train_output): cost = np.mean((train_output - predictions) ** 2) return cost def backward_propagation(self, train_input, train_output, predictions): derivatives = {} df = (predictions-train_output) # dm= 2/n * mean of (predictions-actual) * input  dm = 2 * np.mean(np.multiply(train_input, df)) # dc = 2/n * mean of (predictions-actual)  dc = 2 * np.mean(df) derivatives['dm'] = dm derivatives['dc'] = dc return derivatives def update_parameters(self, derivatives, learning_rate): self.parameters['m'] = self.parameters['m'] - learning_rate * derivatives['dm'] self.parameters['c'] = self.parameters['c'] - learning_rate * derivatives['dc'] def train(self, train_input, train_output, learning_rate, iters): # Initialize random parameters  self.parameters['m'] = np.random.uniform(0, 1) * -1 self.parameters['c'] = np.random.uniform(0, 1) * -1 # Initialize loss  self.loss = [] # Initialize figure and axis for animation  fig, ax = plt.subplots() x_vals = np.linspace(min(train_input), max(train_input), 100) line, = ax.plot(x_vals, self.parameters['m'] * x_vals + self.parameters['c'], color='red', label='Regression Line') ax.scatter(train_input, train_output, marker='o', color='green', label='Training Data') # Set y-axis limits to exclude negative values  ax.set_ylim(0, max(train_output) + 1) def update(frame): # Forward propagation  predictions = self.forward_propagation(train_input) # Cost function  cost = self.cost_function(predictions, train_output) # Back propagation  derivatives = self.backward_propagation( train_input, train_output, predictions) # Update parameters  self.update_parameters(derivatives, learning_rate) # Update the regression line  line.set_ydata(self.parameters['m'] * x_vals + self.parameters['c']) # Append loss and print  self.loss.append(cost) print('Iteration = {}, Loss = {}'.format(frame + 1, cost)) return line, # Create animation  ani = FuncAnimation(fig, update, frames=iters, interval=200, blit=True) # Save the animation as a video file (e.g., MP4)  ani.save('linear_regression_A.webp'false'>Python3 #Příklad použití linear_reg = LinearRegression() parametry, ztráta = linear_reg.train(vstup_vlaku,_výstup vlaku, 0,0001, 20) Výstup: Iterace = 1, Ztráta = 9130,407560462196 Iterace = 1, 12991 Ztráta = 120791 Ztráta s = 140,31580932842422 Iterace = 1, ztráta = 23,795780526084116 opakování = 2, ztráta = 9,753848205147605 opakování = 3, ztráta = 8,061641745006835 8331350515579015 Iterace = 6, Ztráta = 7,830172502503967 Iterace = 7, Ztráta = 7,829814681591015 Iterace = 8 , Ztráta = 7,829770758846183 Iterace = 9, Ztráta = 7,829764664327399 Iterace = 10, Ztráta = 7,829763128602258 Iterace = 11, Ztráta = 7,829 Ztráta = 7,829 829761222379141 Iterace = 13, Ztráta = 7,829760310486438 Iterace = 14, Ztráta = 7,829759399646989 Iterace = 15, Ztráta = 7,829758489015161 Iterace = 16, Ztráta = 7,829757578489033 Iterace = 17, Ztráta = 7,829756668056319 Iterace = 18, Ztráta = 7,8757 Ztráta 557517 8 29754847466484 Iterace = 20, Ztráta = 7,829753937309139 Lineární regresní čára Lineární regresní čára poskytuje cenné poznatky o vztahu mezi dvěma proměnnými. Představuje nejlépe padnoucí čáru, která zachycuje celkový trend toho, jak se závislá proměnná (Y) mění v reakci na změny v nezávislé proměnné (X).   Pozitivní lineární regresní přímka: Pozitivní lineární regresní přímka označuje přímý vztah mezi nezávislou proměnnou (X) a závislou proměnnou (Y). To znamená, že s rostoucí hodnotou X roste i hodnota Y. Sklon kladné lineární regresní přímky je kladný, což znamená, že se přímka naklání nahoru zleva doprava.  Negativní lineární regresní přímka: Negativní lineární regresní přímka označuje inverzní vztah mezi nezávislou proměnnou (X) a závislou proměnnou (Y). To znamená, že jak se hodnota X zvyšuje, hodnota Y klesá. Sklon negativní lineární regresní přímky je záporný, což znamená, že se přímka naklání směrem dolů zleva doprava. Regulační techniky pro lineární modely Lasová regrese (L1 Regularizace) Lasová regrese je technika používaná pro regularizaci lineárního regresního modelu, přidává penalizaci termín na cílovou funkci lineární regrese, aby se zabránilo přemontování. Cílová funkce po aplikaci lasové regrese je: první člen je ztráta nejmenších čtverců, představující druhou mocninu rozdílu mezi předpokládanými a skutečnými hodnotami. druhý člen je regularizační člen L1, penalizuje součet absolutních hodnot regresního koeficientu θj. Ridge regrese (L2 Regularizace) Ridge regrese je technika lineární regrese, která ke standardnímu lineárnímu cíli přidává člen regularizace. Opět je cílem zabránit přemontování penalizací velkého koeficientu v lineární regresní rovnici. Je to užitečné, když má datová sada multikolinearitu, kde jsou prediktorové proměnné vysoce korelované.  Cílová funkce po aplikaci hřebenové regrese je: první člen je ztráta nejmenších čtverců, představující druhou mocninu rozdílu mezi předpokládanými a skutečnými hodnotami. druhý člen je regularizační člen L1, penalizuje součet čtverců hodnot regresního koeficientu θj. Elastická čistá regrese Elastická čistá regrese je hybridní regularizační technika, která kombinuje sílu regularizace L1 i L2 v cíli lineární regrese.   první člen je ztráta nejmenších čtverců. druhý termín je regularizace L1 a třetí je hřebenová regrese.???? je celková síla regularizace. α řídí mix mezi regularizací L1 a L2. Aplikace lineární regreseLineární regrese se používá v mnoha různých oblastech, včetně financí, ekonomie a psychologie, k pochopení a předpovědi chování konkrétní proměnné. Například ve financích lze lineární regresi použít k pochopení vztahu mezi cenou akcií společnosti a jejími zisky nebo k předpovědi budoucí hodnoty měny na základě její minulé výkonnosti. Výhody a nevýhody lineární regrese Výhody lineární regreseLineární regrese je relativně jednoduchý algoritmus, který usnadňuje pochopení a implementaci. Koeficienty lineárního regresního modelu lze interpretovat jako změnu v závislé proměnné pro jednojednotkovou změnu v nezávislé proměnné, což poskytuje pohled na vztahy mezi proměnnými. Lineární regrese je výpočetně efektivní a dokáže efektivně zpracovávat velké soubory dat. Lze ji rychle trénovat na velkých souborech dat, takže je vhodná pro aplikace v reálném čase. Lineární regrese je relativně odolná vůči odlehlým hodnotám ve srovnání s jinými algoritmy strojového učení. Odlehlé hodnoty mohou mít menší dopad na celkový výkon modelu. Lineární regrese často slouží jako dobrý základní model pro srovnání se složitějšími algoritmy strojového učení. Lineární regrese je dobře zavedený algoritmus s bohatou historií a je široce dostupný v různých strojových učeních. knihovny a softwarové balíky. Nevýhody lineární regreseLineární regrese předpokládá lineární vztah mezi závislými a nezávislými proměnnými. Pokud vztah není lineární, model nemusí fungovat dobře. Lineární regrese je citlivá na multikolinearitu, ke které dochází, když existuje vysoká korelace mezi nezávislými proměnnými. Multikolinearita může zvětšit rozptyl koeficientů a vést k nestabilním předpovědím modelu. Lineární regrese předpokládá, že vlastnosti jsou již ve vhodné formě pro model. Pro transformaci prvků do formátu, který může model efektivně používat, může být vyžadováno konstrukční inženýrství. Lineární regrese je náchylná k přesazení i nedostatečnému přizpůsobení. K přefitování dochází, když se model učí trénovací data příliš dobře a nedokáže zobecnit na neviditelná data. K nedostatečnému přizpůsobení dochází, když je model příliš jednoduchý na to, aby zachytil základní vztahy v datech. Lineární regrese poskytuje omezenou vysvětlovací schopnost pro složité vztahy mezi proměnnými. Pro hlubší pochopení mohou být nezbytné pokročilejší techniky strojového učení. ZávěrLineární regrese je základní algoritmus strojového učení, který se díky své jednoduchosti, interpretovatelnosti a účinnosti široce používá již mnoho let. Je to cenný nástroj pro pochopení vztahů mezi proměnnými a vytváření předpovědí v různých aplikacích.  Je však důležité si uvědomit jeho omezení, jako je jeho předpoklad linearity a citlivost na multikolinearitu. Když jsou tato omezení pečlivě zvážena, lineární regrese může být mocným nástrojem pro analýzu a predikci dat. Lineární regrese – často kladené otázky (FAQ) Co jednoduše znamená lineární regrese? Lineární regrese je algoritmus strojového učení pod dohledem, který předpovídá spojitou cílovou proměnnou na základě jedné nebo více nezávislých proměnných. Předpokládá lineární vztah mezi závislými a nezávislými proměnnými a k modelování tohoto vztahu používá lineární rovnici.   Proč používáme lineární regresi?  Lineární regrese se běžně používá pro: Předpovídání číselných hodnot na základě vstupních funkcí Předpovídání budoucích trendů na základě historických dat Identifikaci korelací mezi proměnnými Pochopení dopadu různých faktorů na konkrétní výsledekJak používat lineární regresi?Použijte lineární regresi proložením čáry k předpovědi vztahu mezi proměnnými porozumění koeficientům a vytváření předpovědí na základě vstupních hodnot pro informované rozhodování. Proč se to nazývá lineární regrese? Lineární regrese je pojmenována podle použití lineární rovnice k modelování vztahu mezi proměnnými, které představují přímou linii přizpůsobenou datovým bodům. Co jsou příklady lineární regrese? Příklady aplikací lineární regrese jsou předpovídání cen nemovitostí na základě plochy, odhad skóre zkoušek ze studijních hodin a předpovídání prodeje pomocí reklamních výdajů. >

TechCodeview

Co je lineární regrese?

Proč je lineární regrese důležitá?

Typy lineární regrese

Jednoduchá lineární regrese

Vícenásobná lineární regrese

Cílem algoritmu je najít nejlepší Fit řada rovnice, která dokáže předpovídat hodnoty na základě nezávislých proměnných.

Jaká je nejlepší řada Fit?

Hypotézní funkce v lineární regresi

Jak aktualizovat θ ₁ a θ ₂ hodnoty, abyste získali nejvhodnější řadu?

Nákladová funkce pro lineární regresi

Gradient sestup pro lineární regresi

Předpoklady jednoduché lineární regrese

Předpoklady vícenásobné lineární regrese

Multikolinearita

Metriky hodnocení pro lineární regresi

Střední kvadratická chyba (MSE)

Střední absolutní chyba (MAE)

Root Mean Squared Error (RMSE)

Koeficient determinace (R-kvadrát)

Upravená R-Squared Error

Implementace lineární regrese v Pythonu

Importujte potřebné knihovny:

Načtěte datovou sadu a oddělte vstupní a cílové proměnné

Sestavte model lineární regrese a vykreslete regresní přímku

kroky:

Lineární regrese ve strojovém učení

Co je lineární regrese?

Proč je lineární regrese důležitá?

Typy lineární regrese

Jednoduchá lineární regrese

Vícenásobná lineární regrese

Cílem algoritmu je najít nejlepší Fit řada rovnice, která dokáže předpovídat hodnoty na základě nezávislých proměnných.

Jaká je nejlepší řada Fit?

Hypotézní funkce v lineární regresi

Jak aktualizovat θ 1 a θ 2 hodnoty, abyste získali nejvhodnější řadu?

Nákladová funkce pro lineární regresi

Gradient sestup pro lineární regresi

Předpoklady jednoduché lineární regrese

Předpoklady vícenásobné lineární regrese

Multikolinearita

Metriky hodnocení pro lineární regresi

Střední kvadratická chyba (MSE)

Střední absolutní chyba (MAE)

Root Mean Squared Error (RMSE)

Koeficient determinace (R-kvadrát)

Upravená R-Squared Error

Implementace lineární regrese v Pythonu

Importujte potřebné knihovny:

Načtěte datovou sadu a oddělte vstupní a cílové proměnné

Sestavte model lineární regrese a vykreslete regresní přímku

kroky:

Jak aktualizovat θ ₁ a θ ₂ hodnoty, abyste získali nejvhodnější řadu?