V tomto článku se naučíme, jak používat funkci lm() k přizpůsobení lineárních modelů v programovacím jazyce R.
Lineární model se používá k predikci hodnoty neznámé proměnné na základě nezávislých proměnných. Většinou se používá pro zjišťování vztahu mezi proměnnými a prognózováním. Funkce lm() se používá k přizpůsobení lineárních modelů datovým rámcům v jazyce R. Lze jej použít k provedení regrese, jednovrstvové analýzy rozptylu a analýzy kovariance k předpovědi hodnoty odpovídající datům, která nejsou v datovém rámci. Ty jsou velmi užitečné při předpovídání ceny nemovitostí, předpovědi počasí atd.
Chcete-li přizpůsobit lineární model v jazyce R pomocí lm() funkce, Nejprve použijeme funkci data.frame() k vytvoření vzorového datového rámce, který obsahuje hodnoty, které je třeba přizpůsobit lineárnímu modelu pomocí regresní funkce. Poté pomocí funkce lm() přizpůsobíme určitou funkci danému datovému rámci.
Syntax:
lm( fiting_vzorec, dataframe )
Parametr:
fitting_formula: určuje vzorec pro lineární model. datový rámec: určuje název datového rámce, který obsahuje data.
Poté můžeme použít funkci Summary() k zobrazení souhrnu lineárního modelu. Funkce Summary() interpretuje nejdůležitější statistické hodnoty pro analýzu lineárního modelu.
scan.nextstring java
Syntax:
shrnutí( lineární_model )
Souhrn obsahuje následující klíčové informace:
- Reziduální standardní chyba: určuje směrodatnou odchylku chyby, kde druhá odmocnina rozptylu odečítá n mínus 1 + počet zapojených proměnných namísto dělení n-1. Více R-Squared: určuje, jak dobře váš model odpovídá datům. Upravený R-squared: normalizuje více R-squared tím, že bere v úvahu, kolik vzorků máte a kolik proměnných používáte. F-Statistic: je globální test, který kontroluje, zda je alespoň jeden z vašich koeficientů nenulový.
Příklad: Příklad pro ukázku použití funkce lm().
R
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view summary of linear model> summary>(linear_model)> |
>
>
Výstup:
Volání:
lm(vzorec = y ~ x^2, data = df)
Zbytky:
1 2 3 4 5
2.000e+00 5.329e-15 -3.000e+00 -2.000e+00 3.000e+00
Koeficienty:
Odhad Std. Chyba t hodnota Pr(>|t|)
(Zachycení) -7,0000 3,0876 -2,267 0,10821
x 6,0000 0,9309 6,445 0,00757 **
—
Signif. kódy: 0 ‘***’ 0,001 ‘**’ 0,01 ‘*’ 0,05 ‘.’ 0,1 ‘ ’ 1
Zbytková standardní chyba: 2,944 na 3 stupních volnosti
Vícenásobná R-squared: 0,9326, Upravená R-squared: 0,9102
F-statistika: 41,54 na 1 a 3 DF, p-hodnota: 0,007575
Diagnostické grafy
Diagnostické grafy nám pomáhají zobrazit vztah mezi různými statistickými hodnotami modelu. Pomáhá nám při analýze rozsahu odlehlých hodnot a účinnosti namontovaného modelu. Pro zobrazení diagnostických grafů lineárního modelu používáme funkci plot() v jazyce R.
Syntax:
plot( linear_model )
Příklad: Diagnostické grafy pro výše proložený lineární model.
R
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view diagnostic plot> plot>(linear_model)> |
>
>
Výstup:

Vykreslení lineárního modelu
Výše proložený lineární model můžeme vykreslit, abychom jej dobře vizualizovali pomocí metody abline(). Nejprve vyneseme bodový graf datových bodů a poté jej překryjeme abline grafem lineárního modelu pomocí funkce abline().
Syntax:
plot( df$x, df$y)
ukázkový kód javaabline( Lineární_model )
Příklad: Vykreslení lineárního modelu
R
řetězec do int
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Plot abline plot> plot>( df$x, df$y )> abline>( linear_model)> |
>
>
Výstup:

Předpovězte hodnoty pro neznámé datové body pomocí přizpůsobeného modelu
K predikci hodnot pro nové vstupy pomocí výše proloženého lineárního modelu používáme funkci Predikce(). Funkce predikce() vezme model a datový rámec s neznámými datovými body a předpovídá hodnotu pro každý datový bod podle přizpůsobeného modelu.
Syntax:
predikovat (model, data)
Parametr:
model: určuje lineární model. data: určuje datový rámec s neznámými datovými body.
Příklad: Předvídání nových vstupů
R
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Predict values> predict>( linear_model, newdata =>data.frame>(x=>c>(15,16,17)) )> |
>
>
Výstup:
1 2 3 83 89 95>