logo

Kovarianční matice

Kovarianční matice je typ matice používaný k popisu hodnot kovariance mezi dvěma položkami v náhodném vektoru. Je také známá jako variační-kovarianční matice, protože rozptyl každého prvku je reprezentován podél hlavní diagonály matice a kovariance je reprezentována mezi nediagonálními prvky. Kovarianční matice je obvykle čtvercová matice. Je také kladně semidefinitní a symetrický. Tato matice je užitečná, pokud jde o stochastické modelování a analýzu hlavních komponent.

Co je kovarianční matice?

The rozptyl -kovarianční matice je a čtvercová matice s diagonálními prvky, které představují rozptyl a nediagonálními komponentami, které vyjadřují kovarianci. Kovariance proměnné může nabývat jakékoli reálné hodnoty – kladné, záporné nebo nulové. Pozitivní kovariance naznačuje, že tyto dvě proměnné mají pozitivní vztah, zatímco negativní kovariance naznačuje, že nemají. Pokud se dva prvky spolu neliší, mají nulovou kovarianci.



Další informace Diagonální matice

Příklad kovarianční matice

Řekněme, že existují 2 datové sady X = [10, 5] a Y = [3, 9]. Rozptyl množiny X = 12,5 a rozptyl množiny Y = 18. Kovariance mezi oběma proměnnými je -15. Kovarianční matice je následující:

egin{bmatrix} Variance~of~Set~X & Coorelation~of~Both~Sets Coorelation~of~Both~Sets& Variance~of~Set~Y end{bmatrix}=egin{bmatrix} 12.5 & -15 -15& 18 end{bmatrix}

Vzorec kovarianční matice

Obecná forma kovarianční matice je dána takto:

Kovarianční matice

kde,

  • Vzorový rozptyl: kde (x1) =frac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1}
  • Ukázka Covarinace: (x1, a1) =frac{sum_{1}^{n}left (x_{i} -overline{x} ight )left(y_{i}-overline{y} ight)}{n-1}
  • Rozptyl populace: kde (xn) =frac{sum_{1}^{n}left ( x_{i} -mu ight )^{2} }{n}
  • Populační kovariance: (xn, an) =frac{sum_{1}^{n}left ( x_{i} -mu_{x} ight )left ( y_{i}-mu_{y} ight ) }{n}

Tady, m je průměr populace

overline x je průměr vzorku

n je počet pozorování

X i je pozorování v datové sadě x

Podívejme se na formát kovarianční matice 2 ⨯ 2 a 3 ⨯ 3

2 2 Kovarianční matice

Víme, že ve 2 ⨯ 2 matice jsou dva řádky a dva sloupce. Kovarianční matici 2 ⨯ 2 lze tedy vyjádřit jakoegin{bmatrix}mathrm{var(x)}& mathrm{cov(x,y)} \mathrm{cov(x,y)} &mathrm{var(y)}end{bmatrix}

jak zjistit, zda vás někdo zablokoval na Androidu

3 3 Kovarianční matice

V matici 3⨯3 jsou 3 řádky a 3 sloupce. Víme, že v kovarianční matici jsou diagonální prvky rozptyl a nediagonální prvky jsou kovariance. Kovarianční matici 3⨯3 lze tedy zadat jakoegin{bmatrix}mathrm{var(x)}&mathrm{cov(x,y)} &mathrm{cov(x,z)} \mathrm{cov(x,y)} &mathrm{var(y)} &mathrm{cov(y,z)} \mathrm{cov(x,z)} &mathrm{cov(y,z)} &mathrm{var(z)} \end{bmatrix}

Jak najít kovarianční matici?

Rozměry kovarianční matice jsou určeny počtem proměnných v daném souboru dat. Pokud jsou v sadě pouze dvě proměnné, pak by kovarianční matice měla dva řádky a dva sloupce. Podobně, pokud má soubor dat tři proměnné, pak by jeho kovarianční matice měla tři řádky a tři sloupce.

Údaje se týkají známek, které získala Anna, Caroline a Laura v psychologii a historii. Vytvořte kovarianční matici.

Student Psychologie (X) Historie (Y)
Anna 80 70
Caroline 63 dvacet
Laura 100 padesáti

Je třeba dodržet následující kroky:

Krok 1: Najděte průměr proměnné X. Sečtěte všechna pozorování v proměnné X a získaný součet vydělte počtem členů. Tedy (80 + 63 + 100)/3 = 81.

Krok 2: Odečtěte průměr ze všech pozorování. (80 – 81), (63 – 81), (100 – 81).

Krok 3: Vezměte druhé mocniny výše získaných rozdílů a poté je sečtěte. Tedy (80 – 81)2+ (63 – 81)2+ (100 – 81)2.

Krok 4: Najděte rozptyl X vydělením hodnoty získané v kroku 3 o 1 menší, než je celkový počet pozorování. var(X) = [(80 – 81)2+ (63 – 81)2+ (100 – 81)2] / (3 – 1) = 343.

Krok 5: Podobně opakujte kroky 1 až 4 pro výpočet rozptylu Y. Var(Y) = 633.

Krok 6: Vyberte dvojici proměnných.

Krok 7: Odečtěte průměr první proměnné (X) od všech pozorování; (80 – 81), (63 – 81), (100 – 81).

Krok 8: Opakujte totéž pro proměnnou Y; (70 – 47), (20 – 47), (50 – 47).

Krok 9: Vynásobte odpovídající výrazy: (80 – 81) (70 – 47), (63 – 81) (20 – 47), (100 – 81) (50 – 47).

Krok 10: Najděte kovarianci sečtením těchto hodnot a vydělením (n – 1). Cov(X, Y) = (80 – 81)(70 – 47) + (63 – 81)(20 – 47) + (100 – 81)(50 – 47)/3-1 = 481.

binární vyhledávací strom

Krok 11: K uspořádání termínů použijte obecný vzorec pro kovarianční matici. Matice se stává:egin{bmatrix} 343 & 481 481& 633 end{bmatrix}

Vlastnosti kovarianční matice

Vlastnosti kovarianční matice jsou uvedeny níže:

  • Kovarianční matice je vždy čtvercová, což znamená, že počet řádků v kovarianční matici je vždy roven počtu sloupců v ní.
  • Kovarianční matice je vždy symetrická, což znamená, že přemístit kovarianční matice se vždy rovná původní matici.
  • Kovarianční matice je vždy pozitivní a semi-definitivní.
  • The vlastní čísla kovarianční matice jsou vždy reálné a nezáporné.

Přečtěte si více,

  • Typy matic
  • Maticové násobení
  • Rozptyl a směrodatná odchylka

Vyřešené příklady na kovarianční matici

Příklad 1: Známky dosažené 3 studenty z fyziky a biologie jsou uvedeny níže:

Studentfyzika (X)biologie (Y)
A 92 80
B 60 30
C 100 70

Vypočítejte kovarianční matici z výše uvedených dat.

Řešení:

Vzorová kovarianční matice je dánafrac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1} .

Zde, μX= 84, n = 3

var(x) = [(92 – 84)2+ (60–84)2+ (100 – 84)2] / (3 – 1) = 448

Takže μa= 60, n = 3

var(y) = [(80 – 60)2+ (30–60)2+ (70–60)2] / (3 – 1) = 700

Nyní cov(x, y) = cov(y, x) = [(92 – 84)(80 – 60) + (60 – 84)(30 – 60) + (100 – 84)(70 – 60)] / (3 – 1) = 520.

Populační kovarianční matice je dána takto:egin{bmatrix} 448 & 520 520& 700 end{bmatrix}

java ahoj svět příklad

Příklad 2. Připravte populační kovarianční matici z následující tabulky:

StáříPočet lidí
29 68
26 60
30 58
35 40

Řešení:

zatímco smyčka java

Rozptyl populace je dánfrac{sum_{1}^{n}left ( x_{i} -mu ight )^{2} }{n} .

Zde, μX= 56,5, n = 4

var(x) = [(68 – 56,5)2+ (60 – 56,5)2+ (58 – 56,5)2+ (40 – 56,5)2]/4 = 104,75

Takže μa= 30, n = 4

var(y) = [(29 – 30)2+ (26 – 30)2+ (30 – 30)2+ (35 – 30)2]/4 = 10,5

Nyní cov(x, y) =frac{sum_{1}^{4}left ( x_{i} -mu_{x} ight )left ( y_{i}-mu_{y} ight ) }{4}

cov(x, y) = -27

Populační kovarianční matice je dána takto: egin{bmatrix} 104.7 &-27 -27& 10.5 end{bmatrix}

Příklad 3. Interpretujte následující kovarianční matici:

egin{bmatrix} & X & Y & Z X & 60 & 32 & -4 Y & 32 & 30 & 0 Z & -4 & 0 & 80 end{bmatrix}

Řešení:

  1. Diagonální prvky 60, 30 a 80 indikují odchylky v souborech dat X, Y a Z v tomto pořadí. Y ukazuje nejnižší rozptyl, zatímco Z zobrazuje nejvyšší rozptyl.
  2. Kovariance pro X a Y je 32. Protože se jedná o kladné číslo, znamená to, že když se X zvyšuje (nebo snižuje), Y se také zvyšuje (nebo snižuje)
  3. Kovariance pro X a Z je -4. Protože se jedná o záporné číslo, znamená to, že když X roste, Z klesá a naopak.
  4. Kovariance pro Y a Z je 0. To znamená, že mezi těmito dvěma soubory dat neexistuje žádný předvídatelný vztah.

Příklad 4. Najděte ukázkovou kovarianční matici pro následující data:

XAS
75 10.5 Čtyři pět
65 12.8 65
22 7.3 74
patnáct 2.1 76
18 9.2 56

Řešení:

Vzorová kovarianční matice je dánafrac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1} .

n = 5, mX= 22,4, var(X) = 321,2 / (5 – 1) = 80,3

ma= 12,58, var(Y) = 132,148 / 4 = 33,037

mS= 64, var(Z) = 570/4 = 142,5

cov(X, Y) =frac{sum_{1}^{5}left ( x_{i} -22.4 ight )left ( y_{i}-12.58 ight ) }{5-1} = -11.76

cov(X, Z) =frac{sum_{1}^{5}left ( x_{i} -22.4 ight )left ( z_{i}-64 ight ) }{5-1} = 34.97

cov(Y, Z) = frac{sum_{1}^{5}left ( y_{i} -12.58 ight )left ( z_{i}-64 ight ) }{5-1} = -40.87

Kovarianční matice je dána takto:

egin{bmatrix} 80.3 & -13.865 &14.25 -13.865 & 33.037 & -39.5250 14.25 & -39.5250 & 142.5 end{bmatrix}

Časté otázky o kovarianční matici

1. Definujte kovarianční matici

Kovarianční matice je typ matice používaný k popisu kovariančních hodnot mezi dvěma položkami v náhodném vektoru.

2. Jaký je vzorec pro matici kovariance?

Vzorec pro matici kovariance je uveden jako

left[egin{array}{ccc} operatorname{Var}left(x_1 ight) & ldots ldots & operatorname{Cov}left(x_n, x_1 ight) vdots & ldots & vdots vdots & ldots & vdots operatorname{Cov}left(x_n, x_1 ight) & ldots ldots & operatorname{Var}left(x_n ight) end{array} ight]

abstraktní třída Java

Kde, Vzorový rozptyl: kde (x1) =frac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1}

  • Ukázka Covarinace: (x1, a1) =frac{sum_{1}^{n}left (x_{i} -overline{x} ight )left(y_{i}-overline{y} ight)}{n-1}
  • Rozptyl populace: kde (xn) =frac{sum_{1}^{n}left ( x_{i} -mu ight )^{2} }{n}
  • Populační kovariance: (xn, an) =frac{sum_{1}^{n}left ( x_{i} -mu_{x} ight )left ( y_{i}-mu_{y} ight ) }{n}

3. Jaká je obecná forma kovarianční matice 3 ⨯ 3?

Obecná forma kovarianční matice 3 ⨯ 3 je dána takto:

egin{bmatrix}mathrm{var(x)}&mathrm{cov(x,y)} &mathrm{cov(x,z)} \mathrm{cov(x,y)} &mathrm{var(y)} &mathrm{cov(y,z)} \mathrm{cov(x,z)} &mathrm{cov(y,z)} &mathrm{var(z)} \end{bmatrix}

4. Jaké jsou vlastnosti kovarianční matice?

Kovarianční matice je čtvercová matice a má také symetrický charakter, tj. transpozice původní matice dává původní matici samotnou.

5. Jaké jsou sektory, kde lze použít kovarianční matici?

Kovarianční matice se používá v oblasti matematiky, strojového učení, financí a ekonomie. Kovarianční matice se používá v Cholskey Decomposition k provádění simulace Monte Carlo, která se používá k vytváření matematických modelů.