logo

Countplot v Pythonu

V tomto článku budeme diskutovat o tom, jak můžeme vytvořit počítání pomocí knihovny seaborn a jak lze různé parametry použít k odvození výsledků z funkcí naší datové sady.

Knihovna Seaborn

Knihovna seaborn je mezi datovými analytiky široce používána, galaxie grafů, které obsahuje, poskytuje nejlepší možnou reprezentaci našich dat.

c# ukázkový kód

Seaborn knihovnu lze importovat do našeho pracovního prostředí pomocí-

 import seaborn as sns 

Pojďme si nyní probrat, proč používáme countplot a jaký význam mají jeho parametry.

Počítadlo

Graf počtu se používá k reprezentaci výskytu (počtů) pozorování přítomných v kategoriální proměnné.

Pro vizuální zobrazení používá koncept sloupcového grafu.

Parametry-

Následující parametry jsou specifikovány, když vytváříme počítací plot, pojďme si o nich udělat krátkou představu-

    x a y-Tento parametr určuje data, na která se odkazujeme pro reprezentaci, a poté sleduje zvýrazněné vzory.barva-Tento parametr určuje barvu, která může našemu pozemku poskytnout dobrý vzhled.paleta-Bere hodnotu palety. Většinou se používá k zobrazení proměnné odstínu.odstín-Tento parametr určuje název sloupce.data-Tento parametr určuje datový rámec, který bychom chtěli použít pro reprezentaci. Data mohou být například pole.vyhnout se-Tento parametr je volitelný a jako vstup přijímá booleovskou hodnotu.nasycení-Tento parametr přijímá plovoucí hodnotu. Když toto specifikujeme, můžeme pozorovat odchylky v intenzitě barev.hue_order-Parametr hue_order přijímá řetězce jako vstup.kwargs-Parametr kwargs určuje mapování klíče a hodnoty.sekera-Parametr ax je volitelný a používá se k převzetí os, na kterých se vytvářejí grafy.orient-Parametr orient je volitelný a říká orientaci grafu, kterou potřebujeme, horizontální nebo vertikální.

Nyní se podívejme, jaké jsou různé způsoby reprezentace našich atributů.

V prvním příkladu vytvoříme countplot pro jednu proměnnou. Použili jsme „tipy“ datové sady, abychom totéž implementovali.

1. Hodnota se počítá pro jednu proměnnou

Příklad -

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(x='sex',data=df) plt.show() 

Výstup:

Countplot v Pythonu

V dalším příkladu použijeme parametr hue a vytvoříme countplot.

převést int na dvojitou javu

Následující program ilustruje totéž -

2. Reprezentace dvou kategoriálních proměnných pomocí parametru odstín

Příklad -

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(x='sex',hue='smoker',data=df) plt.show() 

Výstup:

Countplot v Pythonu

V dalším příkladu budeme uvažovat osu y a vytvoříme horizontální graf počtu.

Následující program ilustruje totéž

3. Vytváření horizontálních grafů

Příklad -

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(y='sex',hue='smoker',data=df) plt.show() 

Výstup:

Countplot v Pythonu

Pojďme se nyní podívat na to, jak mohou barevné palety zlepšit prezentaci našich dat.

V dalším příkladu použijeme parametr 'paleta'.

spojový seznam

Následující program ilustruje totéž

4. Použití barevných palet

Vstup-

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(x='sex', data=df, palette='Set1') plt.show() 

Výstup:

Countplot v Pythonu

V dalším příkladu použijeme parametr color a uvidíme, jak to funguje?

Následující program ilustruje totéž

5. Použití parametru „color“

Příklad -

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'train' df=pd.read_csv('/content/train.csv') #plotting the graph sns.countplot(x='Pclass',hue='Sex', data=df, color='green') plt.show() 

Výstup:

Countplot v Pythonu

Nyní použijeme parametr 'saturation' a uvidíme, jak to ovlivní reprezentaci našich dat.

sčítačka plná sčítačka

Následující program ilustruje totéž

6. Pomocí parametru 'saturace'

Příklad -

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'train' df=pd.read_csv('/content/train.csv') #plotting the graph sns.countplot(x='Pclass',data=df, color='green', saturation=0.1) plt.show() 

Výstup:

Countplot v Pythonu

A nakonec v posledním příkladu použijeme parametry šířka čáry a barva okraje.

    Použití matplotlib.axes.Axes.bar()

Příklad -

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'train' df=pd.read_csv('/content/train.csv') sns.countplot(x='Sex', data=df, color='green', facecolor=(0,0,0,0), linewidth=5, edgecolor=sns.color_palette('BrBG',2)) plt.show() 

Výstup:

Countplot v Pythonu