logo

Jak používat funkci lm() v R pro přizpůsobení lineárním modelům?

V tomto článku se naučíme, jak používat funkci lm() k přizpůsobení lineárních modelů v programovacím jazyce R.

Lineární model se používá k predikci hodnoty neznámé proměnné na základě nezávislých proměnných. Většinou se používá pro zjišťování vztahu mezi proměnnými a prognózováním. Funkce lm() se používá k přizpůsobení lineárních modelů datovým rámcům v jazyce R. Lze jej použít k provedení regrese, jednovrstvové analýzy rozptylu a analýzy kovariance k předpovědi hodnoty odpovídající datům, která nejsou v datovém rámci. Ty jsou velmi užitečné při předpovídání ceny nemovitostí, předpovědi počasí atd.



Chcete-li přizpůsobit lineární model v jazyce R pomocí lm() funkce, Nejprve použijeme funkci data.frame() k vytvoření vzorového datového rámce, který obsahuje hodnoty, které je třeba přizpůsobit lineárnímu modelu pomocí regresní funkce. Poté pomocí funkce lm() přizpůsobíme určitou funkci danému datovému rámci.

Syntax:

lm( fiting_vzorec, dataframe )



Parametr:

    fitting_formula: určuje vzorec pro lineární model. datový rámec: určuje název datového rámce, který obsahuje data.

Poté můžeme použít funkci Summary() k zobrazení souhrnu lineárního modelu. Funkce Summary() interpretuje nejdůležitější statistické hodnoty pro analýzu lineárního modelu.

scan.nextstring java

Syntax:



shrnutí( lineární_model )

Souhrn obsahuje následující klíčové informace:

    Reziduální standardní chyba: určuje směrodatnou odchylku chyby, kde druhá odmocnina rozptylu odečítá n mínus 1 + počet zapojených proměnných namísto dělení n-1. Více R-Squared: určuje, jak dobře váš model odpovídá datům. Upravený R-squared: normalizuje více R-squared tím, že bere v úvahu, kolik vzorků máte a kolik proměnných používáte. F-Statistic: je globální test, který kontroluje, zda je alespoň jeden z vašich koeficientů nenulový.

Příklad: Příklad pro ukázku použití funkce lm().

R




# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view summary of linear model> summary>(linear_model)>

>

>

Výstup:

Volání:

lm(vzorec = y ~ x^2, data = df)

Zbytky:

1 2 3 4 5

2.000e+00 5.329e-15 -3.000e+00 -2.000e+00 3.000e+00

Koeficienty:

Odhad Std. Chyba t hodnota Pr(>|t|)

(Zachycení) -7,0000 3,0876 -2,267 0,10821

x 6,0000 0,9309 6,445 0,00757 **

Signif. kódy: 0 ‘***’ 0,001 ‘**’ 0,01 ‘*’ 0,05 ‘.’ 0,1 ‘ ’ 1

Zbytková standardní chyba: 2,944 na 3 stupních volnosti

Vícenásobná R-squared: 0,9326, Upravená R-squared: 0,9102

F-statistika: 41,54 na 1 a 3 DF, p-hodnota: 0,007575

Diagnostické grafy

Diagnostické grafy nám pomáhají zobrazit vztah mezi různými statistickými hodnotami modelu. Pomáhá nám při analýze rozsahu odlehlých hodnot a účinnosti namontovaného modelu. Pro zobrazení diagnostických grafů lineárního modelu používáme funkci plot() v jazyce R.

Syntax:

plot( linear_model )

Příklad: Diagnostické grafy pro výše proložený lineární model.

R




# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view diagnostic plot> plot>(linear_model)>

>

>

Výstup:

Vykreslení lineárního modelu

Výše proložený lineární model můžeme vykreslit, abychom jej dobře vizualizovali pomocí metody abline(). Nejprve vyneseme bodový graf datových bodů a poté jej překryjeme abline grafem lineárního modelu pomocí funkce abline().

Syntax:

plot( df$x, df$y)

ukázkový kód java

abline( Lineární_model )

Příklad: Vykreslení lineárního modelu

R




řetězec do int
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Plot abline plot> plot>( df$x, df$y )> abline>( linear_model)>

>

>

Výstup:

Předpovězte hodnoty pro neznámé datové body pomocí přizpůsobeného modelu

K predikci hodnot pro nové vstupy pomocí výše proloženého lineárního modelu používáme funkci Predikce(). Funkce predikce() vezme model a datový rámec s neznámými datovými body a předpovídá hodnotu pro každý datový bod podle přizpůsobeného modelu.

Syntax:

predikovat (model, data)

Parametr:

    model: určuje lineární model. data: určuje datový rámec s neznámými datovými body.

Příklad: Předvídání nových vstupů

R




# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Predict values> predict>( linear_model, newdata =>data.frame>(x=>c>(15,16,17)) )>

>

>

Výstup:

1 2 3 83 89 95>