ROZPTYL | DEFINICE, VZOREC, PŘÍKLADY A VLASTNOSTI

Rozptyl je naměřená hodnota používaná ke zjištění, jak jsou data rozložena s ohledem na střední nebo průměrnou hodnotu souboru dat. Používá se ke zjištění, jak jsou distribuovaná data rozložena ve vztahu ke střední nebo průměrné hodnotě. Symbol použitý k definování rozptylu je σ². Je to čtverec standardní odchylky.

Ve statistice se používají dva typy rozptylu,

Vzorový rozptyl
Rozptyl populace

Rozptyl populace se používá k určení, jak každý datový bod v konkrétní populaci kolísá nebo je rozprostřen, zatímco rozptyl vzorku se používá k nalezení průměru čtverců odchylek od průměru.

V tomto článku se dozvíme o Rozptyl (vzorek, populace), jejich vzorce, vlastnosti a další podrobně.

Obsah

Co je variance?

Definice rozptylu

Typy rozptylu
Symbol rozptylu
Příklad rozptylu
Vzorec rozptylu

Vzorový vzorec rozptylu
Vzorec rozptylu populace
Vzorec rozptylu pro seskupená data
Vzorec odchylky pro neseskupená data
Vzorec pro výpočet rozptylu

Jak vypočítat rozptyl?
Rozptyl a směrodatná odchylka
Variance a kovariance
Vlastnosti rozptylu
Příklady na vzorci rozptylu
Shrnutí – Rozptyl
Nejčastější dotazy týkající se odchylky

Co je variance?

Měříme různé hodnoty dat a tyto hodnoty se používají pro různé účely. Data mohou být zadána ve dvou typech seskupených dat nebo neseskupených (diskrétních) datech. Pokud jsou data uvedena ve formě intervalů tříd, nazývá se seskupená data, zatímco pokud jsou data uvedena ve formě jednoho datového bodu, označuje se jako diskrétní nebo neseskupený datový bod. Rozptyl je mírou rozptylu dat vzhledem ke střední hodnotě dat. Říká nám, jak jsou data rozptýlena v dané datové hodnotě. Můžeme snadno vypočítat rozptyl vzorku a rozptyl populace pro seskupená i neseskupená data.

Definice rozptylu

Rozptyl je statistická míra, která kvantifikuje rozšíření nebo rozptyl sady datových bodů. Udává, jak moc se jednotlivé datové body v datovém souboru liší od průměru (průměru) datového souboru

Typy rozptylu

Rozptyl daných dat můžeme definovat ve dvou typech,

Rozptyl populace
Rozptyl vzorku

Nyní se o nich dozvíme podrobně.

Rozptyl populace

Populační rozptyl slouží ke zjištění rozptylu dané populace. Populace je definována jako skupina lidí a všichni lidé v této skupině jsou součástí populace. Vypovídá o tom, jak se populace skupiny liší s ohledem na průměrnou populaci.

Všichni členové skupiny jsou známí jako populace. Když chceme zjistit, jak se každý datový bod v dané populaci liší nebo je rozprostřen, použijeme rozptyl populace. Používá se k určení druhé mocniny vzdálenosti každého datového bodu od průměru populace.

Rozptyl vzorku

Pokud jsou údaje o populaci velmi velké, je obtížné vypočítat rozptyl populace souboru dat. V takovém případě vezmeme vzorek dat z daného souboru dat a najdeme rozptyl tohoto souboru dat, který se nazývá výběrový rozptyl. Při výpočtu průměru vzorku dbáme na to, abychom vypočítali průměr vzorku, tj. průměr souboru dat vzorku, nikoli průměr populace. Výběrový rozptyl můžeme definovat jako průměr druhé mocniny rozdílu mezi datovým bodem vzorku a průměrem vzorku.

Symbol rozptylu

Symbol pro rozptyl je typicky reprezentován řeckým písmenem sigma na druhou (σ²), když se odkazuje na rozptyl populace. Pro rozptyl vzorku se často označuje s².

Příklad rozptylu

Koncept rozptylu můžeme pochopit pomocí níže uvedeného příkladu.

Najděte populační rozptyl dat {4,6,8,10}

Řešení:

Průměr = (4+6+8+10)/4 = 7

4 (4-7)² 9

6 (6-7)² 1

8 (8-7)² 1

10 (10-7)² 9

Rozptyl = (9+1+1+9)/4 = 20/4 = 5

Rozptyl dat je tedy 5

Vzorec rozptylu

Rozptyl pro soubor dat je označen symbolem σ². Pro údaje o populaci se jeho vzorec rovná součtu čtverců rozdílů datových záznamů od průměru děleného počtem záznamů. Zatímco u ukázkových dat dělíme hodnotu čitatele rozdílem mezi počtem záznamů a jednotou.

Vzorec vzorce rozptylu

Pokud je souborem dat vzorek, vzorec rozptylu je dán,

p ² = ∑ (x _i - X) ² /(n – 1)

kde,

X je průměr ukázkové datové sady

n je celkový počet pozorování

Vzorec rozptylu populace

Pokud máme soubor dat o populaci, vzorec je zapsán jako,

p ² = ∑ (x _i - X) ² /n

kde,

X je průměr souboru údajů o populaci

n je celkový počet pozorování

Můžeme také vypočítat rozptyl pro seskupené a neseskupené datové sady. Různé vzorce pro rozptyl jsou,

algoritmus pro bfs

Vzorec rozptylu pro seskupená data

Pro seskupená data je vzorec rozptylu diskutován níže,

Vzorový vzorec rozptylu pro seskupená data (σ ² ) = ∑ f(m _i - X) ² /(n-1)

Vzorec rozptylu populace pro seskupená data (str ² ) = ∑ f(m _i - X) ² /n

kde,

F je frekvence každého intervalu

m _i je středem i^čtinterval

X je průměr seskupených dat

Pro seskupená data se průměr vypočítá jako,

Průměr = ∑ (f _i X _i ) / ∑ f _i

Vzorec odchylky pro neseskupená data

Pro neseskupená data je vzorec rozptylu diskutován níže,

Vzorový vzorec odchylky pro neseskupená data (str ² ) = ∑ (x _i - X) ² /(n-1)

Vzorec rozptylu populace pro neseskupená data (str ² ) = ∑ (x _i - X) ² /n

kde X je průměr seskupených dat

Vzorec pro výpočet rozptylu

Vzorec použitý pro výpočet rozptylu je popsán na obrázku níže,

$Vzorec rozptylu$

Jak vypočítat rozptyl?

Obecně rozptyl znamená standardní rozptyl populace. Kroky pro výpočet rozptylu dané sady hodnot jsou:

Krok 1: Vypočítejte průměr pozorování pomocí vzorce (Průměr = součet pozorování/počet pozorování)

Krok 2: Vypočítejte druhou mocninu rozdílů hodnot dat od průměru. (hodnota dat – průměr)²

Krok 3: Vypočítejte průměr druhých mocnin rozdílů daných hodnot, které se nazývají rozptyl souboru dat.

(Rozptyl = součet čtvercových rozdílů / počet pozorování)

Rozptyl a směrodatná odchylka

Rozptyl a Standardní odchylka obě jsou měřítkem centrální tendence, která nám říká, do jaké míry se hodnoty souboru dat odchylují od centrální nebo střední hodnoty souboru dat.

Mezi rozptylem a směrodatnou odchylkou pro jakýkoli daný soubor dat existuje určitý vztah.

Rozptyl = (standardní odchylka) ²

Rozptyl je definován jako druhá mocnina směrodatné odchylky, tj. když vezmeme druhou mocninu směrodatné odchylky pro jakoukoli skupinu dat, získáme rozptyl daného souboru dat. rozptyl je definován pomocí symbolu p ² zatímco p se používá k definování standardní odchylky souboru dat. Rozptyl souboru dat je vyjádřen v jednotkách na druhou, zatímco směrodatná odchylka souboru dat je vyjádřen v jednotce podobné průměru souboru dat.

Další informace: Rozptyl a směrodatná odchylka

Rozptyl binomického rozdělení

Binomické rozdělení je diskrétní rozdělení pravděpodobnosti, které nám říká počet kladných výsledků v binomickém experimentu provedeném nkrát. Výsledek binomického experimentu je 0 nebo 1, tedy buď kladný nebo záporný.

V binomickém experimentu n pokusy a kde je uvedena pravděpodobnost každého pokusu p , pak rozptyl binomického rozdělení je dán pomocí,

p ² = np (1 – p)

kde 'např' je definován jako průměr hodnot binomického rozdělení.

Rozptyl Poissonova rozdělení

Distribuce jedu je definováno jako diskrétní rozdělení pravděpodobnosti, které se používá k definování pravděpodobnosti ‚n‘ počtu událostí vyskytujících se v časovém období ‚x‘. Střední hodnota v Poissonově rozdělení je definována symbolem l.

V Poissonově rozdělení se průměr a rozptyl daného souboru dat rovnají. Rozptyl Poissonova rozdělení je dán pomocí vzorce,

p ² = λ

Rozptyl rovnoměrného rozdělení

Při rovnoměrném rozdělení jsou data rozdělení pravděpodobnosti spojitá. Výsledek těchto experimentů leží v rozmezí mezi specifickou horní hranicí a specifickou dolní hranicí, a proto se tato rozdělení také nazývají obdélníková rozdělení. Pokud je horní hranice nebo maximální hranice b a dolní mez nebo minimální mez je a pak se rozptyl rovnoměrného rozdělení vypočítá pomocí vzorce,

p ² = (1/12) (b – a) ²

Průměr rovnoměrného rozdělení je dán pomocí vzorce,

Průměr = (b + a) / 2

kde,

b je horní mez rovnoměrného rozdělení

A je spodní mez rovnoměrného rozdělení

Variance a kovariance

Rozptyl souboru dat definuje volatilitu všech hodnot souboru dat vzhledem ke střední hodnotě souboru dat. Kovariance nám říká, jak spolu náhodné proměnné souvisí, a říká nám, jak změna jedné proměnné ovlivní změnu ostatních proměnných.

Kovariance může být pozitivní nebo negativní, pozitivní kovariance znamená, že se obě proměnné pohybují stejným směrem vzhledem ke střední hodnotě, zatímco negativní kovariance znamená, že se obě proměnné pohybují opačným směrem vzhledem ke střední hodnotě.

Pro dvě náhodné proměnné x a y, kde x je závislá proměnná a y je nezávislá proměnná, se kovariance vypočítá pomocí vzorce uvedeného na níže přiloženém obrázku.

$Kovarianční vzorec$

Vlastnosti rozptylu

Rozptyl je široce používán v matematice, statistice a dalších odvětvích vědy pro různé účely. Rozptyl má různé vlastnosti, které se široce používají pro řešení různých problémů. Některé ze základních vlastností rozptylu jsou,

Rozptyl souboru dat je nezáporná veličina a nulová hodnota rozptylu znamená, že všechny hodnoty souboru dat jsou stejné.
Vyšší hodnota rozptylu nám říká, že všechny datové hodnoty souboru dat jsou široce rozptýlené, tj. jsou daleko od střední hodnoty souboru dat.
Nižší hodnota rozptylu nám říká, že všechny hodnoty dat souboru dat jsou blízko u sebe, tj. jsou velmi blízko střední hodnoty souboru dat.

Pro jakékoli konstantní „c“

Var(x + c) = Var(x)

kde X je náhodná veličina

Var(cx) = c²

kde X je náhodná veličina

Také, pokud A a b jsou konstantní hodnoty a X je tedy náhodná proměnná,

Var(ax + b) = a²

Pro nezávisle proměnné x₁, X₂, X₃…,X_nvíme, že,

Kde (x₁+ x₂+……+ x_n) = Var(x₁) + Kde(x₂) +……..+Kde(x_n)

Lidé také čtou:

Znamenat

Režim

Rozdíl mezi rozptylem a směrodatnou odchylkou

Příklady na vzorci rozptylu

Příklad 1: Vypočítejte rozptyl dat vzorku: 7, 11, 15, 19, 24.

Řešení:

Máme data 7, 11, 15, 19, 24

Najděte průměr dat.

x̄ = (7 + 11 + 15 + 19 + 24)/5
= 76/5
= 15,2

Pomocí vzorce pro rozptyl dostaneme,
řádek vs sloupec

p²= ∑ (x_i- X)²/(n – 1)
= (67,24 + 17,64 + 0,04 + 14,44 + 77,44)/(5 – 1)
= 176,8/4
= 44,2

Příklad 2: Vypočítejte počet pozorování, pokud je rozptyl dat 12 a součet čtverců rozdílů dat od průměru je 156.

Řešení:

My máme,

(X_i- X)²= 156

p²= 12

Pomocí vzorce pro rozptyl dostaneme,

p²= ∑ (x_i- X)²/n

12 = 156/n

n = 156/12

n = 13

Příklad 3: Vypočítejte rozptyl pro daná data

X_i	F_i
10	1
4	3
6	5
8	1

Řešení:

Průměr (x̄) = ∑(f_iX_i)/∑(f_i)

= (10×1 + 4×3 + 6×5 + 8×1)/(1+3+5+1)
= 60/10 = 6

n = ∑(f_i) = 1+3+5+1 = 10

X_i

F_i

F_iX_i

(X_i- X)

(X_i- X)²

F_i(X_i- X)²

10 1 10 4 16 16

4 3 12 -2 4 12

6 5 30 0 0 0

8 1 8 2 4 8

Nyní,

p ² = (∑ _i ⁿ F _i (X _i - X) ² /n)

= [(16 + 12 + 0 +8)/10]
= 3,6

Rozptyl(σ²) = 3,6

X_i	F_i	F_iX_i	(X_i- X)	(X_i- X)²	F_i(X_i- X)²
10	1	10	4	16	16
4	3	12	-2	4	12
6	5	30	0	0	0
8	1	8	2	4	8

Příklad 4: Najděte rozptyl následující tabulky dat

Třída	Frekvence
0-10	3
10-20	6
20-30	4
30-40	2
40-50	1

Řešení:

Třída

Xi

F_i

f×Xi

Xi – μ

(Xi – μ)2

f×(Xi – μ)2

0-10

5

3

patnáct

-patnáct

225

675

10-20

patnáct

6

90

-5

25

150

20-30

25

4

100
řetězec na znak java

5

25

100

30-40

35

2

70

patnáct

225

450

40-50

Čtyři pět

1

Čtyři pět

25

625

625

Celkový

16

320

2000

Průměr (μ) = ∑(fi xi)/∑(fi)
= 320/16 = 20

p ² = (∑ _i ⁿ F _i (X _i – m) ² /n)

= [(2000)/(16)]
= (125)

Rozptyl daného souboru dat je 125.

Třída	Xi	F_i	f×Xi	Xi – μ	(Xi – μ)2	f×(Xi – μ)2
0-10	5	3	patnáct	-patnáct	225	675
10-20	patnáct	6	90	-5	25	150
20-30	25	4	100 řetězec na znak java	5	25	100
30-40	35	2	70	patnáct	225	450
40-50	Čtyři pět	1	Čtyři pět	25	625	625
Celkový		16	320			2000

Shrnutí – Rozptyl

Rozptyl je statistická míra, která ukazuje, jak moc se hodnoty v souboru dat liší od průměru. Pomáhá nám porozumět šíření nebo rozptylu datových bodů. Existují dva hlavní typy rozptylu: rozptyl populace, který měří, jak se rozprostírají datové body v celé populaci, a rozptyl vzorku, který měří, jak se rozprostírají datové body ve vzorku. Rozptyl se označuje σ² a je druhou mocninou směrodatné odchylky. Chcete-li vypočítat rozptyl, zjistíte průměr dat, odečtete průměr od každého datového bodu, umocníte rozdíly a pak zprůměrujete tyto umocněné rozdíly. Rozptyl je důležitý, protože nám pomáhá porozumět variabilitě v rámci datové sady. Vysoký rozptyl naznačuje, že datové body jsou široce rozprostřeny, zatímco nízký rozptyl naznačuje, že se blíží průměru. Rozptyl je vždy nezáporný, protože zahrnuje kvadraturu rozdílů.

Nejčastější dotazy týkající se odchylky

Co je rozptyl ve statistice?

Rozptyl je definován jako rozptyl hodnot souboru dat vzhledem ke střední hodnotě souboru dat. Rozptyl souboru dat říká, do jaké míry se hodnoty v konkrétním souboru dat rozprostírají od střední hodnoty.

Co je to symbol variance?

Používáme symboly σ², s2 a Var(x) k označení rozptylu datové sady.

Co je to vzorec rozptylu?

Rozptyl souboru dat se vypočítá pomocí vzorce,

p ² = E[( X – m ) ² ]

Co říká Variance?

Rozptyl se používá k nalezení rozsahu šíření dat, tj. říká nám, jak jsou hodnoty v sadě dat rozloženy vzhledem ke střední hodnotě. Pro větší hodnotu rozptylu jsou hodnoty široce rozprostřeny vzhledem ke střední hodnotě, zatímco s ohledem na menší hodnotu rozptylu jsou hodnoty těsně rozprostřeny vzhledem ke střední hodnotě.

Jaký je vztah mezi rozptylem a směrodatnou odchylkou?

Pro daný soubor dat je rozptyl souboru dat druhou mocninou směrodatné odchylky tohoto souboru dat. Tento vztah je vyjádřen jako,

Rozptyl = (standardní odchylka) ²

Jak vypočítáte rozptyl?

Chcete-li vypočítat rozptyl, musíte nejprve najít průměr (průměr) souboru dat. Poté odečtěte průměr od každého datového bodu a výsledek umocněte. Nakonec zprůměrujte tyto čtvercové rozdíly.

Proč je rozptyl důležitý?

Rozptyl je zásadní pro pochopení distribuce dat v rámci datové sady. Pomáhá určit, jak jsou datové body rozloženy od průměrné hodnoty, což ukazuje na variabilitu nebo konzistenci v datech.

Jaký je rozdíl mezi rozptylem a směrodatnou odchylkou?

Zatímco rozptyl i směrodatná odchylka měří rozptyl dat, směrodatná odchylka je druhou odmocninou rozptylu. Směrodatná odchylka je vyjádřena ve stejných jednotkách jako data, takže je lépe interpretovatelná pro indikaci spreadu.

Může být variance negativní?

Ne, rozptyl nemůže být záporný. Protože se počítá jako průměr druhých mocnin rozdílů od průměru, je výsledná hodnota vždy nezáporná.