METODA PANDAS DATAFRAME CORR() - TECHCODEVIEW.COM

pandy dataframe.corr() se používá k nalezení párové korelace všech sloupců v datovém rámci Pandas v Pythonu. Žádný NaN hodnoty jsou automaticky vyloučeny. Chcete-li ignorovat jakékoli nečíselné hodnoty, použijte parametr numeric_only = True. V tomto článku se dozvíme o metodě DataFrame.corr() v Krajta .

řazení java arraylist

Syntaxe metody Pandas DataFrame corr().

Syntax: DataFrame.corr(self, method=’pearson’, min_periods=1, numeric_only = False)

Parametry:

metoda:

pearson: standardní korelační koeficient

kendall: Kendall Tau korelační koeficient

oštěpař: Korelace hodnosti oštěpaře

min_periody : Minimální počet pozorování požadovaný na pár sloupců, aby byl výsledek platný. V současné době je k dispozici pouze pro korelaci pearson a spearman

numeric_only : Zda se má či nemá pracovat pouze s číselnými hodnotami. Ve výchozím nastavení je nastavena na False.

Vrácení: count :y : DataFrame

Metoda korelace dat Pandas corr().

Dobrá korelace závisí na použití, ale lze s jistotou říci, že máte alespoň 0,6 (nebo -0,6), abyste to nazvali dobrou korelací. Jednoduchý příklad, který ukazuje, jak funguje korelace Krajta .

Python3

import> pandas as pd> df>=> {> >'Array_1'>: [>30>,>70>,>100>],> >'Array_2'>: [>65.1>,>49.50>,>30.7>]> }> data>=> pd.DataFrame(df)> print>(data.corr())>

Výstup

 Array_1 Array_2 Array_1 1.000000 -0.990773 Array_2 -0.990773 1.000000>

Vytvoření ukázkového datového rámce

Tisk prvních 10 řádků datového rámce.

Poznámka: Korelace proměnné sama se sebou je 1. Pro odkaz na soubor CSV použitý v kódu klikněte tady

Python3

# importing pandas as pd> import> pandas as pd> # Making data frame from the csv file> df>=> pd.read_csv(>'nba.csv'>)> # Printing the first 10 rows of the data frame for visualization> df[:>10>]>

Výstup

Korelace dat Pandas

Příklady metody Python Pandas DataFrame corr().

Najděte korelaci mezi sloupci pomocí Pearsonovy metody

Zde používáme funkci corr() k nalezení korelace mezi sloupci v datovém rámci pomocí metody ‚Pearson‘. V datovém rámci máme pouze čtyři číselné sloupce. Výstupní Dataframe lze interpretovat jako pro libovolnou buňku, korelace řádkové proměnné s proměnnou sloupce je hodnota buňky. Jak již bylo zmíněno dříve, korelace proměnné sama se sebou je 1. Z toho důvodu jsou všechny hodnoty diagonál 1,00.

Python3

# To find the correlation among> # the columns using pearson method> df.corr(method>=>'pearson'>)>

Výstup

Korelace dat Pandas

Najděte korelaci mezi sloupci pomocí Kendallovy metody

Použijte funkci Pandas df.corr() k nalezení korelace mezi sloupci v datovém rámci pomocí metody „kendall“. Výstupní Dataframe lze interpretovat jako pro libovolnou buňku, korelace řádkové proměnné s proměnnou sloupce je hodnota buňky. Jak již bylo zmíněno dříve, korelace proměnné sama se sebou je 1. Z toho důvodu jsou všechny hodnoty diagonál 1,00.

Python3

# importing pandas as pd> import> pandas as pd> # Making data frame from the csv file> df>=> pd.read_csv(>'nba.csv'>)> # To find the correlation among> # the columns using kendall method> df.corr(method>=>'kendall'>)>

Výstup

dataframe.corr

TechCodeview

Metoda Pandas DataFrame corr().

Syntaxe metody Pandas DataFrame corr().

Metoda korelace dat Pandas corr().

Python3

Vytvoření ukázkového datového rámce

Python3

Příklady metody Python Pandas DataFrame corr().

Najděte korelaci mezi sloupci pomocí Pearsonovy metody

Python3

Najděte korelaci mezi sloupci pomocí Kendallovy metody

Python3