Rozptyl je naměřená hodnota používaná ke zjištění, jak jsou data rozložena s ohledem na střední nebo průměrnou hodnotu souboru dat. Používá se ke zjištění, jak jsou distribuovaná data rozložena ve vztahu ke střední nebo průměrné hodnotě. Symbol použitý k definování rozptylu je σ2. Je to čtverec standardní odchylky.
Ve statistice se používají dva typy rozptylu,
- Vzorový rozptyl
- Rozptyl populace
Rozptyl populace se používá k určení, jak každý datový bod v konkrétní populaci kolísá nebo je rozprostřen, zatímco rozptyl vzorku se používá k nalezení průměru čtverců odchylek od průměru.
V tomto článku se dozvíme o Rozptyl (vzorek, populace), jejich vzorce, vlastnosti a další podrobně.
Obsah
- Co je variance?
- Typy rozptylu
- Symbol rozptylu
- Příklad rozptylu
- Vzorec rozptylu
- Vzorový vzorec rozptylu
- Vzorec rozptylu populace
- Vzorec rozptylu pro seskupená data
- Vzorec odchylky pro neseskupená data
- Vzorec pro výpočet rozptylu
- Jak vypočítat rozptyl?
- Rozptyl a směrodatná odchylka
- Variance a kovariance
- Vlastnosti rozptylu
- Příklady na vzorci rozptylu
- Shrnutí – Rozptyl
- Nejčastější dotazy týkající se odchylky
Co je variance?
Měříme různé hodnoty dat a tyto hodnoty se používají pro různé účely. Data mohou být zadána ve dvou typech seskupených dat nebo neseskupených (diskrétních) datech. Pokud jsou data uvedena ve formě intervalů tříd, nazývá se seskupená data, zatímco pokud jsou data uvedena ve formě jednoho datového bodu, označuje se jako diskrétní nebo neseskupený datový bod. Rozptyl je mírou rozptylu dat vzhledem ke střední hodnotě dat. Říká nám, jak jsou data rozptýlena v dané datové hodnotě. Můžeme snadno vypočítat rozptyl vzorku a rozptyl populace pro seskupená i neseskupená data.
Definice rozptylu
Rozptyl je statistická míra, která kvantifikuje rozšíření nebo rozptyl sady datových bodů. Udává, jak moc se jednotlivé datové body v datovém souboru liší od průměru (průměru) datového souboru
Typy rozptylu
Rozptyl daných dat můžeme definovat ve dvou typech,
- Rozptyl populace
- Rozptyl vzorku
Nyní se o nich dozvíme podrobně.
Rozptyl populace
Populační rozptyl slouží ke zjištění rozptylu dané populace. Populace je definována jako skupina lidí a všichni lidé v této skupině jsou součástí populace. Vypovídá o tom, jak se populace skupiny liší s ohledem na průměrnou populaci.
Všichni členové skupiny jsou známí jako populace. Když chceme zjistit, jak se každý datový bod v dané populaci liší nebo je rozprostřen, použijeme rozptyl populace. Používá se k určení druhé mocniny vzdálenosti každého datového bodu od průměru populace.
Rozptyl vzorku
Pokud jsou údaje o populaci velmi velké, je obtížné vypočítat rozptyl populace souboru dat. V takovém případě vezmeme vzorek dat z daného souboru dat a najdeme rozptyl tohoto souboru dat, který se nazývá výběrový rozptyl. Při výpočtu průměru vzorku dbáme na to, abychom vypočítali průměr vzorku, tj. průměr souboru dat vzorku, nikoli průměr populace. Výběrový rozptyl můžeme definovat jako průměr druhé mocniny rozdílu mezi datovým bodem vzorku a průměrem vzorku.
Symbol rozptylu
Symbol pro rozptyl je typicky reprezentován řeckým písmenem sigma na druhou (σ²), když se odkazuje na rozptyl populace. Pro rozptyl vzorku se často označuje s².
Příklad rozptylu
Koncept rozptylu můžeme pochopit pomocí níže uvedeného příkladu.
Najděte populační rozptyl dat {4,6,8,10}
Řešení:
Průměr = (4+6+8+10)/4 = 7
4 (4-7)2 9 6 (6-7)2 1 8 (8-7)2 1 10 (10-7)2 9 Rozptyl = (9+1+1+9)/4 = 20/4 = 5
Rozptyl dat je tedy 5
Vzorec rozptylu
Rozptyl pro soubor dat je označen symbolem σ2. Pro údaje o populaci se jeho vzorec rovná součtu čtverců rozdílů datových záznamů od průměru děleného počtem záznamů. Zatímco u ukázkových dat dělíme hodnotu čitatele rozdílem mezi počtem záznamů a jednotou.
Vzorec vzorce rozptylu
Pokud je souborem dat vzorek, vzorec rozptylu je dán,
p 2 = ∑ (x i - X) 2 /(n – 1)
kde,
- X je průměr ukázkové datové sady
- n je celkový počet pozorování
Vzorec rozptylu populace
Pokud máme soubor dat o populaci, vzorec je zapsán jako,
p 2 = ∑ (x i - X) 2 /n
kde,
- X je průměr souboru údajů o populaci
- n je celkový počet pozorování
Můžeme také vypočítat rozptyl pro seskupené a neseskupené datové sady. Různé vzorce pro rozptyl jsou,
algoritmus pro bfs
Vzorec rozptylu pro seskupená data
Pro seskupená data je vzorec rozptylu diskutován níže,
Vzorový vzorec rozptylu pro seskupená data (σ 2 ) = ∑ f(m i - X) 2 /(n-1)
Vzorec rozptylu populace pro seskupená data (str 2 ) = ∑ f(m i - X) 2 /n
kde,
- F je frekvence každého intervalu
- m i je středem ičtinterval
- X je průměr seskupených dat
Pro seskupená data se průměr vypočítá jako,
Průměr = ∑ (f i X i ) / ∑ f i
Vzorec odchylky pro neseskupená data
Pro neseskupená data je vzorec rozptylu diskutován níže,
- Vzorový vzorec odchylky pro neseskupená data (str 2 ) = ∑ (x i - X) 2 /(n-1)
- Vzorec rozptylu populace pro neseskupená data (str 2 ) = ∑ (x i - X) 2 /n
kde X je průměr seskupených dat
Vzorec pro výpočet rozptylu
Vzorec použitý pro výpočet rozptylu je popsán na obrázku níže,

Jak vypočítat rozptyl?
Obecně rozptyl znamená standardní rozptyl populace. Kroky pro výpočet rozptylu dané sady hodnot jsou:
Krok 1: Vypočítejte průměr pozorování pomocí vzorce (Průměr = součet pozorování/počet pozorování)
Krok 2: Vypočítejte druhou mocninu rozdílů hodnot dat od průměru. (hodnota dat – průměr)2
Krok 3: Vypočítejte průměr druhých mocnin rozdílů daných hodnot, které se nazývají rozptyl souboru dat.
(Rozptyl = součet čtvercových rozdílů / počet pozorování)
Rozptyl a směrodatná odchylka
Rozptyl a Standardní odchylka obě jsou měřítkem centrální tendence, která nám říká, do jaké míry se hodnoty souboru dat odchylují od centrální nebo střední hodnoty souboru dat.
Mezi rozptylem a směrodatnou odchylkou pro jakýkoli daný soubor dat existuje určitý vztah.
Rozptyl = (standardní odchylka) 2
Rozptyl je definován jako druhá mocnina směrodatné odchylky, tj. když vezmeme druhou mocninu směrodatné odchylky pro jakoukoli skupinu dat, získáme rozptyl daného souboru dat. rozptyl je definován pomocí symbolu p 2 zatímco p se používá k definování standardní odchylky souboru dat. Rozptyl souboru dat je vyjádřen v jednotkách na druhou, zatímco směrodatná odchylka souboru dat je vyjádřen v jednotce podobné průměru souboru dat.
Další informace: Rozptyl a směrodatná odchylka
Rozptyl binomického rozdělení
Binomické rozdělení je diskrétní rozdělení pravděpodobnosti, které nám říká počet kladných výsledků v binomickém experimentu provedeném nkrát. Výsledek binomického experimentu je 0 nebo 1, tedy buď kladný nebo záporný.
V binomickém experimentu n pokusy a kde je uvedena pravděpodobnost každého pokusu p , pak rozptyl binomického rozdělení je dán pomocí,
p 2 = np (1 – p)
kde 'např' je definován jako průměr hodnot binomického rozdělení.
Rozptyl Poissonova rozdělení
Distribuce jedu je definováno jako diskrétní rozdělení pravděpodobnosti, které se používá k definování pravděpodobnosti ‚n‘ počtu událostí vyskytujících se v časovém období ‚x‘. Střední hodnota v Poissonově rozdělení je definována symbolem l.
V Poissonově rozdělení se průměr a rozptyl daného souboru dat rovnají. Rozptyl Poissonova rozdělení je dán pomocí vzorce,
p 2 = λ
Rozptyl rovnoměrného rozdělení
Při rovnoměrném rozdělení jsou data rozdělení pravděpodobnosti spojitá. Výsledek těchto experimentů leží v rozmezí mezi specifickou horní hranicí a specifickou dolní hranicí, a proto se tato rozdělení také nazývají obdélníková rozdělení. Pokud je horní hranice nebo maximální hranice b a dolní mez nebo minimální mez je a pak se rozptyl rovnoměrného rozdělení vypočítá pomocí vzorce,
p 2 = (1/12) (b – a) 2
Průměr rovnoměrného rozdělení je dán pomocí vzorce,
Průměr = (b + a) / 2
kde,
- b je horní mez rovnoměrného rozdělení
- A je spodní mez rovnoměrného rozdělení
Variance a kovariance
Rozptyl souboru dat definuje volatilitu všech hodnot souboru dat vzhledem ke střední hodnotě souboru dat. Kovariance nám říká, jak spolu náhodné proměnné souvisí, a říká nám, jak změna jedné proměnné ovlivní změnu ostatních proměnných.
Kovariance může být pozitivní nebo negativní, pozitivní kovariance znamená, že se obě proměnné pohybují stejným směrem vzhledem ke střední hodnotě, zatímco negativní kovariance znamená, že se obě proměnné pohybují opačným směrem vzhledem ke střední hodnotě.
Pro dvě náhodné proměnné x a y, kde x je závislá proměnná a y je nezávislá proměnná, se kovariance vypočítá pomocí vzorce uvedeného na níže přiloženém obrázku.

Vlastnosti rozptylu
Rozptyl je široce používán v matematice, statistice a dalších odvětvích vědy pro různé účely. Rozptyl má různé vlastnosti, které se široce používají pro řešení různých problémů. Některé ze základních vlastností rozptylu jsou,
- Rozptyl souboru dat je nezáporná veličina a nulová hodnota rozptylu znamená, že všechny hodnoty souboru dat jsou stejné.
- Vyšší hodnota rozptylu nám říká, že všechny datové hodnoty souboru dat jsou široce rozptýlené, tj. jsou daleko od střední hodnoty souboru dat.
- Nižší hodnota rozptylu nám říká, že všechny hodnoty dat souboru dat jsou blízko u sebe, tj. jsou velmi blízko střední hodnoty souboru dat.
Pro jakékoli konstantní „c“
- Var(x + c) = Var(x)
kde X je náhodná veličina
- Var(cx) = c2
kde X je náhodná veličina
Také, pokud A a b jsou konstantní hodnoty a X je tedy náhodná proměnná,
- Var(ax + b) = a2
Pro nezávisle proměnné x1, X2, X3…,Xnvíme, že,
- Kde (x1+ x2+……+ xn) = Var(x1) + Kde(x2) +……..+Kde(xn)
Lidé také čtou:
- Znamenat
- Režim
- Rozdíl mezi rozptylem a směrodatnou odchylkou
Příklady na vzorci rozptylu
Příklad 1: Vypočítejte rozptyl dat vzorku: 7, 11, 15, 19, 24.
Řešení:
Máme data 7, 11, 15, 19, 24
Najděte průměr dat.
x̄ = (7 + 11 + 15 + 19 + 24)/5
= 76/5
= 15,2Pomocí vzorce pro rozptyl dostaneme,
řádek vs sloupecp2= ∑ (xi- X)2/(n – 1)
= (67,24 + 17,64 + 0,04 + 14,44 + 77,44)/(5 – 1)
= 176,8/4
= 44,2
Příklad 2: Vypočítejte počet pozorování, pokud je rozptyl dat 12 a součet čtverců rozdílů dat od průměru je 156.
Řešení:
My máme,
(Xi- X)2= 156
p2= 12
Pomocí vzorce pro rozptyl dostaneme,
p2= ∑ (xi- X)2/n
12 = 156/n
n = 156/12
n = 13
Příklad 3: Vypočítejte rozptyl pro daná data
| Xi | Fi |
|---|---|
| 10 | 1 |
| 4 | 3 |
| 6 | 5 |
| 8 | 1 |
Řešení:
Průměr (x̄) = ∑(fiXi)/∑(fi)
= (10×1 + 4×3 + 6×5 + 8×1)/(1+3+5+1)
= 60/10 = 6n = ∑(fi) = 1+3+5+1 = 10
Xi
Fi
FiXi
(Xi- X)
(Xi- X)2
Fi(Xi- X)2
10 1 10 4 16 16 4 3 12 -2 4 12 6 5 30 0 0 0 8 1 8 2 4 8 Nyní,
p 2 = (∑ i n F i (X i - X) 2 /n)
= [(16 + 12 + 0 +8)/10]
= 3,6Rozptyl(σ2) = 3,6
Příklad 4: Najděte rozptyl následující tabulky dat
| Třída | Frekvence |
|---|---|
| 0-10 | 3 |
| 10-20 | 6 |
| 20-30 | 4 |
| 30-40 | 2 |
| 40-50 | 1 |
Řešení:
Třída
Xi
Fi
f×Xi
Xi – μ
(Xi – μ)2
f×(Xi – μ)2
0-10
5
3
patnáct
-patnáct
225
675
10-20
patnáct
6
90
-5
25
150
20-30
25
4
100
řetězec na znak java5
25
100
30-40
35
2
70
patnáct
225
450
40-50
Čtyři pět
1
Čtyři pět
25
625
625
Celkový
16
320
2000
Průměr (μ) = ∑(fi xi)/∑(fi)
= 320/16 = 20p 2 = (∑ i n F i (X i – m) 2 /n)
= [(2000)/(16)]
= (125)Rozptyl daného souboru dat je 125.
Shrnutí – Rozptyl
Rozptyl je statistická míra, která ukazuje, jak moc se hodnoty v souboru dat liší od průměru. Pomáhá nám porozumět šíření nebo rozptylu datových bodů. Existují dva hlavní typy rozptylu: rozptyl populace, který měří, jak se rozprostírají datové body v celé populaci, a rozptyl vzorku, který měří, jak se rozprostírají datové body ve vzorku. Rozptyl se označuje σ² a je druhou mocninou směrodatné odchylky. Chcete-li vypočítat rozptyl, zjistíte průměr dat, odečtete průměr od každého datového bodu, umocníte rozdíly a pak zprůměrujete tyto umocněné rozdíly. Rozptyl je důležitý, protože nám pomáhá porozumět variabilitě v rámci datové sady. Vysoký rozptyl naznačuje, že datové body jsou široce rozprostřeny, zatímco nízký rozptyl naznačuje, že se blíží průměru. Rozptyl je vždy nezáporný, protože zahrnuje kvadraturu rozdílů.
Nejčastější dotazy týkající se odchylky
Co je rozptyl ve statistice?
Rozptyl je definován jako rozptyl hodnot souboru dat vzhledem ke střední hodnotě souboru dat. Rozptyl souboru dat říká, do jaké míry se hodnoty v konkrétním souboru dat rozprostírají od střední hodnoty.
Co je to symbol variance?
Používáme symboly σ2, s2 a Var(x) k označení rozptylu datové sady.
Co je to vzorec rozptylu?
Rozptyl souboru dat se vypočítá pomocí vzorce,
p 2 = E[( X – m ) 2 ]
Co říká Variance?
Rozptyl se používá k nalezení rozsahu šíření dat, tj. říká nám, jak jsou hodnoty v sadě dat rozloženy vzhledem ke střední hodnotě. Pro větší hodnotu rozptylu jsou hodnoty široce rozprostřeny vzhledem ke střední hodnotě, zatímco s ohledem na menší hodnotu rozptylu jsou hodnoty těsně rozprostřeny vzhledem ke střední hodnotě.
Jaký je vztah mezi rozptylem a směrodatnou odchylkou?
Pro daný soubor dat je rozptyl souboru dat druhou mocninou směrodatné odchylky tohoto souboru dat. Tento vztah je vyjádřen jako,
Rozptyl = (standardní odchylka) 2
Jak vypočítáte rozptyl?
Chcete-li vypočítat rozptyl, musíte nejprve najít průměr (průměr) souboru dat. Poté odečtěte průměr od každého datového bodu a výsledek umocněte. Nakonec zprůměrujte tyto čtvercové rozdíly.
Proč je rozptyl důležitý?
Rozptyl je zásadní pro pochopení distribuce dat v rámci datové sady. Pomáhá určit, jak jsou datové body rozloženy od průměrné hodnoty, což ukazuje na variabilitu nebo konzistenci v datech.
Jaký je rozdíl mezi rozptylem a směrodatnou odchylkou?
Zatímco rozptyl i směrodatná odchylka měří rozptyl dat, směrodatná odchylka je druhou odmocninou rozptylu. Směrodatná odchylka je vyjádřena ve stejných jednotkách jako data, takže je lépe interpretovatelná pro indikaci spreadu.
Může být variance negativní?
Ne, rozptyl nemůže být záporný. Protože se počítá jako průměr druhých mocnin rozdílů od průměru, je výsledná hodnota vždy nezáporná.