Krabicový graf je graf, který se používá k zobrazení informací ve formě distribuce vykreslením krabicových grafů pro každý z nich. Toto rozdělení dat je založeno na pěti souborech (minimum, první kvartil, medián, třetí kvartil a maximum).
Boxplots in Programovací jazyk R
Boxplots jsou vytvořeny v R pomocí boxplot() funkce.
Syntax: boxplot(x, data, notch, varwidth, names, main)
Parametry:
x: Tento parametr se nastavuje jako vektor nebo vzorec. data: Tento parametr nastavuje datový rámec. notch: Tento parametr je označení pro horizontální osu. varwidth: Tento parametr je logická hodnota. Nastavte jako true pro vykreslení šířky rámečku úměrné velikosti vzorku. main: Tento parametr je název grafu. names: Tento parametr jsou štítky skupin, které se zobrazí pod každým polem.
Vytvoření datové sady
Abychom pochopili, jak můžeme vytvořit boxplot:
- Používáme datovou sadu mtcars.
- Podívejme se na sloupce mpg a cyl v mtcars.
R
linuxové soubory
input <- mtcars[,>c>(>'mpg'>,>'cyl'>)]> print>(>head>(input))> |
>
>
Výstup:
mpg cyl Mazda RX4 21.0 6 Mazda RX4 Wag 21.0 6 Datsun 710 22.8 4 Hornet 4 Drive 21.4 6 Hornet Sportabout 18.7 8 Valiant 18.1 6>
Vytvoření Boxplotu
Vytvoření grafu Boxplot.
- Vezměte parametry, které jsou nutné k vytvoření boxplotu.
- Nyní nakreslíme graf vztahu mezi mpg a cyl.
R
# Load the dataset> data>(mtcars)> # Create the box plot> boxplot>(disp ~ gear, data = mtcars,> >main =>'Displacement by Gear'>,> >xlab =>'Gear'>,> >ylab =>'Displacement'>)> |
>
>
Výstup:

Krabicový pozemek v R
Boxplot pomocí notch
Chcete-li nakreslit boxplot pomocí zářezu:
- Pomocí Notch můžeme zjistit, jak se mediány různých datových skupin vzájemně shodují.
R
co je rozhraní
# Load the dataset> data>(mtcars)> # Set up plot colors> my_colors <->c>(>'#FFA500'>,>'#008000'>,>'#1E90FF'>,>'#FF1493'>)> # Create the box plot with customized aesthetics> boxplot>(disp ~ gear, data = mtcars,> >main =>'Displacement by Gear'>, xlab =>'Gear'>, ylab =>'Displacement'>,> >col = my_colors, border =>'black'>, notch =>TRUE>, notchwidth = 0.5,> >medcol =>'white'>, whiskcol =>'black'>, boxwex = 0.5, outpch = 19,> >outcol =>'black'>)> # Add a legend> legend>(>'topright'>, legend =>unique>(mtcars$gear),> >fill = my_colors, border =>'black'>, title =>'Gear'>)> |
>
>
Výstup:

Box Plot v R
col: Používá vektor barev (my_colors) ke změně barvy výplně polí.
hranice: Nastaví barvu ohraničení rámečku na černou.
zářez: Pro ilustraci intervalů spolehlivosti je do polí přidán zářez.
šířka zářezu: Spravuje šířku zářezů.
lékař: Udělá barvu střední čáry bílou.
whiskcol: Nastaví barvu vousů na černou pomocí příkazu whiskcol.
boxwex: Upraví šířku polí.
outpch : Nastaví tvary odlehlých hodnot na plné kruhy.
outcol: Změní barvu odlehlých hodnot na černou.
Vícenásobný boxplot
Zde vytváříme několik boxplotů. Jednotlivá data, pro která je vyžadována reprezentace boxplotu, jsou založena na funkci.
R
# Load the dataset> data>(mtcars)> # Define the variables for the box plots> variables <->c>(>'mpg'>,>'disp'>,>'hp'>,>'wt'>)> # Set up the plotting layout> par>(mfrow =>c>(1,>length>(variables)))> # Create the box plots> for>(var>in> variables) {> >boxplot>(>get>(var) ~ gear, data = mtcars,> >main =>paste>(>'Box Plot of'>, var),> >xlab =>'Gear'>,> >ylab = var,> >col =>'skyblue'>,> >border =>'black'>,> >notch =>TRUE>,> >notchwidth = 0.5,> >medcol =>'white'>,> >whiskcol =>'black'>,> >boxwex = 0.5,> >outpch = 19,> >outcol =>'black'>)> }> # Reset the plotting layout> par>(mfrow =>c>(1, 1))> |
>
10 procent ze 60
>
Výstup:

Více krabicových grafů v R
- V tomto kódu začneme seznamem proměnných ve vektoru proměnných, pro které chceme vytvořit krabicové grafy. V tomto příkladu jsem přidal mpg, disp, hp a wt, ale tento seznam můžete změnit, aby vyhovoval vašim potřebám.
- Rozvržení grafu je pak vytvořeno pomocí funkce par a syntaxe mfrow = c(1, délka(proměnné)), která generuje mřížku s jedním řádkem a tolika sloupci, kolik je proměnných ve vektoru proměnných.
- Pomocí funkce boxplot uvnitř smyčky vygenerujeme krabicový graf pro každou proměnnou. Funkce get(var) dynamicky stahuje odpovídající hodnoty sloupců z datové sady. Pomocí daných nastavení změníme vzhled každého krabicového grafu.