Řada Pandas může být definována jako jednorozměrné pole, které je schopno ukládat různé typy dat. Seznam, n-tici a slovník můžeme snadno převést na série pomocí ' série ' metoda. Označení řádků řad se nazývá index. Řada nemůže obsahovat více sloupců. Má následující parametr:
testování výkonu
Vytvoření série:
Sérii můžeme vytvořit dvěma způsoby:
- Vytvořte prázdnou sérii
- Vytvořte řadu pomocí vstupů.
Vytvořte prázdnou sérii:
V Pandas můžeme snadno vytvořit prázdnou sérii, což znamená, že nebude mít žádnou hodnotu.
Syntaxe, která se používá k vytvoření prázdné řady:
= pandas.Series()
Níže uvedený příklad vytvoří objekt typu Empty Series, který nemá žádné hodnoty a má výchozí datový typ, tj. plovák64 .
Příklad
import pandas as pd x = pd.Series() print (x)
Výstup
Series([], dtype: float64)
Vytvoření série pomocí vstupů:
Série můžeme vytvořit pomocí různých vstupů:
- Pole
- Dict
- Skalární hodnota
Vytváření série z pole:
třída vs objekt v jazyce Java
Před vytvořením řady musíme nejprve importovat nemotorný modul a poté v programu použijte funkci array(). Pokud jsou data ndarray, pak předaný index musí mít stejnou délku.
Pokud nepředáme index, pak standardně index of rozsah(n) se předává, kde n definuje délku pole, tj. [0,1,2,.... rozsah(délka(pole))-1 ].
Příklad
import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a)
Výstup
0 P 1 a 2 n 3 d 4 a 5 s dtype: object
Vytvořte sérii z dict
Můžeme také vytvořit sérii z dict. Pokud je objekt slovníku předán jako vstup a index není zadán, jsou klíče slovníku převzaty v seřazeném pořadí, aby se vytvořil index. .
Pokud je index předán, budou z něj extrahovány hodnoty odpovídající konkrétnímu štítku v indexu slovník .
#import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a)
Výstup
x 0.0 y 1.0 z 2.0 dtype: float64
Vytvořte řadu pomocí skaláru:
faktoriál v c
Pokud vezmeme skalární hodnoty, pak musí být poskytnut index. Skalární hodnota se bude opakovat, aby odpovídala délce indexu.
#import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x)
Výstup
0 4 1 4 2 4 3 4 dtype: int64
Přístup k datům ze série s pozicí:
Jakmile vytvoříte objekt typu Series, můžete přistupovat k jeho indexům, datům a dokonce i jednotlivým prvkům.
K datům v řadě lze přistupovat podobně jako v ndarray.
import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0])
Výstup
1
Atributy objektu řady
Atribut Series je definován jako jakákoli informace související s objektem Series, jako je velikost, datový typ. atd. Níže jsou uvedeny některé atributy, které můžete použít k získání informací o objektu Series:
Atributy | Popis |
---|---|
Série.index | Definuje index řady. |
Série.tvar | Vrací n-tici tvaru dat. |
Řada.dtype | Vrací datový typ dat. |
Série.velikost | Vrací velikost dat. |
Série.prázdná | Pokud je objekt Series prázdný, vrátí hodnotu True, jinak vrátí hodnotu false. |
Řada.hasnans | Pokud existují nějaké hodnoty NaN, vrací True, jinak vrací false. |
Řada.nbytes | Vrací počet bajtů v datech. |
série | Vrátí počet dimenzí v datech. |
Série.velikost položky | Vrací velikost datového typu položky. |
Načítání indexového pole a datového pole objektu řady
Pole indexu a pole dat existujícího objektu Series můžeme načíst pomocí atributů index a hodnoty.
import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values)
Výstup
RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5]
Načítání typů (dtype) a velikosti typu (itemsize)
Atribut dtype s objektem Series můžete použít jako dtype pro načtení datového typu jednotlivého prvku objektu série, můžete použít itemize atribut pro zobrazení počtu bajtů přidělených každé datové položce.
řetězec do pole java
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize)
Výstup
int64 8 float64 8
Načítání tvaru
Tvar objektu Series definuje celkový počet prvků včetně chybějících nebo prázdných hodnot (NaN).
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape)
Výstup
(4,) (3,)
Načítání rozměru, velikosti a počtu bajtů:
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes)
Výstup
1 1 4 3 32 24
Kontrola prázdnoty a přítomnosti NaN
Chcete-li zkontrolovat, zda je objekt Series prázdný, můžete použít prázdný atribut . Podobně, chcete-li zkontrolovat, zda objekt série obsahuje nějaké hodnoty NaN nebo ne, můžete použít hassan atribut.
Příklad
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( ))
Výstup
False False True True False False 4 3 3 3
Funkce řady
V řadě se používají některé následující funkce:
Funkce | Popis |
---|---|
Pandas Series.map() | Namapujte hodnoty ze dvou řad, které mají společný sloupec. |
Pandas Series.std() | Vypočítejte směrodatnou odchylku dané sady čísel, datového rámce, sloupce a řádků. |
Pandas Series.to_frame() | Převeďte objekt série na datový rámec. |
Pandas Series.value_counts() | Vrátí řadu, která obsahuje počty jedinečných hodnot. |