logo

Řada Python Pandas

Řada Pandas může být definována jako jednorozměrné pole, které je schopno ukládat různé typy dat. Seznam, n-tici a slovník můžeme snadno převést na série pomocí ' série ' metoda. Označení řádků řad se nazývá index. Řada nemůže obsahovat více sloupců. Má následující parametr:

testování výkonu
    data:Může to být jakýkoli seznam, slovník nebo skalární hodnota.index:Hodnota indexu by měla být jedinečná a hašovatelná. Musí mít stejnou délku jako data. Pokud nepředáme žádný index, výchozí np.arrange(n) bude použito.dtype:Odkazuje na datový typ řady.kopírovat:Slouží ke kopírování dat.

Vytvoření série:

Sérii můžeme vytvořit dvěma způsoby:

  1. Vytvořte prázdnou sérii
  2. Vytvořte řadu pomocí vstupů.

Vytvořte prázdnou sérii:

V Pandas můžeme snadno vytvořit prázdnou sérii, což znamená, že nebude mít žádnou hodnotu.

Syntaxe, která se používá k vytvoření prázdné řady:

 = pandas.Series() 

Níže uvedený příklad vytvoří objekt typu Empty Series, který nemá žádné hodnoty a má výchozí datový typ, tj. plovák64 .

Příklad

 import pandas as pd x = pd.Series() print (x) 

Výstup

 Series([], dtype: float64) 

Vytvoření série pomocí vstupů:

Série můžeme vytvořit pomocí různých vstupů:

  • Pole
  • Dict
  • Skalární hodnota

Vytváření série z pole:

třída vs objekt v jazyce Java

Před vytvořením řady musíme nejprve importovat nemotorný modul a poté v programu použijte funkci array(). Pokud jsou data ndarray, pak předaný index musí mít stejnou délku.

Pokud nepředáme index, pak standardně index of rozsah(n) se předává, kde n definuje délku pole, tj. [0,1,2,.... rozsah(délka(pole))-1 ].

Příklad

 import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a) 

Výstup

 0 P 1 a 2 n 3 d 4 a 5 s dtype: object 

Vytvořte sérii z dict

Můžeme také vytvořit sérii z dict. Pokud je objekt slovníku předán jako vstup a index není zadán, jsou klíče slovníku převzaty v seřazeném pořadí, aby se vytvořil index. .

Pokud je index předán, budou z něj extrahovány hodnoty odpovídající konkrétnímu štítku v indexu slovník .

 #import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a) 

Výstup

 x 0.0 y 1.0 z 2.0 dtype: float64 

Vytvořte řadu pomocí skaláru:

faktoriál v c

Pokud vezmeme skalární hodnoty, pak musí být poskytnut index. Skalární hodnota se bude opakovat, aby odpovídala délce indexu.

 #import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x) 

Výstup

 0 4 1 4 2 4 3 4 dtype: int64 

Přístup k datům ze série s pozicí:

Jakmile vytvoříte objekt typu Series, můžete přistupovat k jeho indexům, datům a dokonce i jednotlivým prvkům.

K datům v řadě lze přistupovat podobně jako v ndarray.

 import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0]) 

Výstup

 1 

Atributy objektu řady

Atribut Series je definován jako jakákoli informace související s objektem Series, jako je velikost, datový typ. atd. Níže jsou uvedeny některé atributy, které můžete použít k získání informací o objektu Series:

Atributy Popis
Série.index Definuje index řady.
Série.tvar Vrací n-tici tvaru dat.
Řada.dtype Vrací datový typ dat.
Série.velikost Vrací velikost dat.
Série.prázdná Pokud je objekt Series prázdný, vrátí hodnotu True, jinak vrátí hodnotu false.
Řada.hasnans Pokud existují nějaké hodnoty NaN, vrací True, jinak vrací false.
Řada.nbytes Vrací počet bajtů v datech.
série Vrátí počet dimenzí v datech.
Série.velikost položky Vrací velikost datového typu položky.

Načítání indexového pole a datového pole objektu řady

Pole indexu a pole dat existujícího objektu Series můžeme načíst pomocí atributů index a hodnoty.

 import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values) 

Výstup

 RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5] 

Načítání typů (dtype) a velikosti typu (itemsize)

Atribut dtype s objektem Series můžete použít jako dtype pro načtení datového typu jednotlivého prvku objektu série, můžete použít itemize atribut pro zobrazení počtu bajtů přidělených každé datové položce.

řetězec do pole java
 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize) 

Výstup

 int64 8 float64 8 

Načítání tvaru

Tvar objektu Series definuje celkový počet prvků včetně chybějících nebo prázdných hodnot (NaN).

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape) 

Výstup

 (4,) (3,) 

Načítání rozměru, velikosti a počtu bajtů:

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes) 

Výstup

 1 1 4 3 32 24 

Kontrola prázdnoty a přítomnosti NaN

Chcete-li zkontrolovat, zda je objekt Series prázdný, můžete použít prázdný atribut . Podobně, chcete-li zkontrolovat, zda objekt série obsahuje nějaké hodnoty NaN nebo ne, můžete použít hassan atribut.

Příklad

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( )) 

Výstup

 False False True True False False 4 3 3 3 

Funkce řady

V řadě se používají některé následující funkce:

Funkce Popis
Pandas Series.map() Namapujte hodnoty ze dvou řad, které mají společný sloupec.
Pandas Series.std() Vypočítejte směrodatnou odchylku dané sady čísel, datového rámce, sloupce a řádků.
Pandas Series.to_frame() Převeďte objekt série na datový rámec.
Pandas Series.value_counts() Vrátí řadu, která obsahuje počty jedinečných hodnot.