Studovat statistiky? Pak jste pravděpodobně při popisu dat slyšeli frázi „normální rozdělení“. Ale co slovní spojení „vychýlené správně“? Jak vypadá histogram zkosený doprava? A co to způsobuje?
kreslení obdélníku gimp
V tomto článku vám uvedeme příklady histogramů zkosených doprava a vysvětlíme, jak se tyto liší od grafů normálního rozdělení.
Hlavní obrázek: Monika místo /Wikimedia Commons
Co je normální distribuce?
Než vysvětlíme, co to znamená, když jsou data zkreslená správně, zopakujme si definici normálního rozdělení.
Při normální distribuci, dvě nebo více proměnných sdílejí přímý vztah k vytvoření a symetrický datový soubor , na kterém levá polovina zrcadlí pravou polovinu. Tyto grafy se nazývají zvonové křivky díky jejich jasně definovanému zvonovitému tvaru:
npm cache vymazat
Na normálním distribučním grafu průměr (průměr), medián a modus jsou stejné . Všechny tyto body představují střed dat nebo vrchol grafu.
Co znamená Skewed Right?
Zatímco normální rozdělení je jednou z nejběžnějších forem rozdělení, ne všechny soubory dat se řídí touto základní křivkou. Jinými slovy, některé histogramy jsou zkosené doprava nebo doleva .
Při pravoúhlém rozložení (známém také jako „pozitivně zkosené“ rozložení) většina dat spadá na pravou neboli kladnou stranu vrcholu grafu. Tím pádem, histogram se zkresluje tak, že jeho pravá strana (nebo „ocas“) je delší než levá strana.
css tučné
Příklad histogramu zkoseného doprava.
Na pravoúhlém histogramu se průměr, medián a režim liší. V tomto případě je režim nejvyšším bodem histogramu, zatímco medián a průměr spadají napravo od něj (nebo vizuálně napravo od vrcholu). Všimněte si, že střední vůle vždy být napravo od mediánu .
Graf A je zkosený doprava, zatímco graf B je zkosený doleva. U grafů se zkosením doprava se střední hodnota vždy nachází napravo od režimu (tj. od vrcholu). ( Asitgoes /Wikimedia Commons) )
statická funkce v Javě
Tyto vlastnosti to nakonec dělají obtížné přiřadit typickou hodnotu protože na grafu zkoseném doprava není jasný střed. Naproti tomu s normálním rozdělením, protože průměr, medián a režim jsou všechny stejné a jsou středem souboru dat, můžete tuto hodnotu snadno použít k přesnějšímu zobecnění dat.
Co způsobuje pravotočivý histogram?
Data jsou obvykle zkreslena doprava výsledek nižší hranice v sadě dat (zatímco data zkreslená doleva je výsledkem vyšší hranice). Pokud jsou tedy spodní hranice datové sady extrémně nízké vzhledem ke zbytku dat, způsobí to zkreslení dat doprava.
Další příčinou šikmosti je startovací efekty . Pokud má například procedura zpočátku mnoho úspěchů během dlouhého období spouštění, mohlo by to vést k pozitivnímu zkreslení dat. (Naopak, období spouštění s několika počátečními selháními může negativně zkreslit data.)