logo

Python | Pandas.apply()

Pandas.apply umožňuje uživatelům předat funkci a aplikovat ji na každou jednotlivou hodnotu řady Pandas. Pro knihovnu pandas je to obrovské vylepšení, protože tato funkce pomáhá segregovat data podle požadovaných podmínek, díky kterým je efektivně využívána v datové vědě a strojovém učení.

Instalace:



Importujte modul Pandas do souboru python pomocí následujících příkazů na terminálu:

pip install pandas>

Ke čtení souboru csv a jeho vtlačení do série pandas se používají následující příkazy:

import pandas as pd s = pd.read_csv('stock.csv', squeeze=True)>

Syntax:



s.apply(func, convert_dtype=True, args=())>

Parametry:

func: .apply převezme funkci a aplikuje ji na všechny hodnoty řady pandas. convert_dtype: Převeďte dtype podle operace funkce. argumenty=(): Další argumenty, které se mají předat funkci místo řady. Typ vrácení: Řada Pandas po použití funkce/provozu.

Příklad č. 1:



Následující příklad předá funkci a zkontroluje hodnotu každého prvku v sérii a podle toho vrátí nízkou, normální nebo vysokou.

PYTHON3




import> pandas as pd> # reading csv> s>=> pd.read_csv('stock.csv', squeeze>=> True>)> # defining function to check price> def> fun(num):> >if> num<>200>:> >return> 'Low'> >elif> num>>=> 200> and> num<>400>:> >return> 'Normal'> >else>:> >return> 'High'> # passing function to apply and storing returned series in new> new>=> s.>apply>(fun)> # printing first 3 element> print>(new.head(>3>))> # printing elements somewhere near the middle of series> print>(new[>1400>], new[>1500>], new[>1600>])> # printing last 3 elements> print>(new.tail(>3>))>

práce na počítači
>

>

Výstup:

Příklad č. 2:

V následujícím příkladu je dočasná anonymní funkce vytvořena v samotném .apply pomocí lambda. Ke každé hodnotě v sérii přidá 5 a vrátí novou řadu.

PYTHON3




import> pandas as pd> s>=> pd.read_csv('stock.csv', squeeze>=> True>)> # adding 5 to each value> new>=> s.>apply>(>lambda> num : num>+> 5>)> # printing first 5 elements of old and new series> print>(s.head(),>' '>, new.head())> # printing last 5 elements of old and new series> print>(>' '>, s.tail(),>' '>, new.tail())>

>

>

Výstup:

0 50.12 1 54.10 2 54.65 3 52.38 4 52.95 Name: Stock Price, dtype: float64   0 55.12 1 59.10 2 59.65 3 57.38 4 57.95 Name: Stock Price, dtype: float64  3007 772.88 3008 771.07 3009 773.18 3010 771.61 3011 782.22 Name: Stock Price, dtype: float64   3007 777.88 3008 776.07 3009 778.18 3010 776.61 3011 787.22 Name: Stock Price, dtype: float64>

Jak bylo pozorováno, nové hodnoty = staré hodnoty + 5