logo

Zřetězení pand

Pandas je schopen kombinovat objekty Series, DataFrame a Panel prostřednictvím různých druhů logiky nastavení pro indexy a funkcionalitu relační algebry.

The spojit() Funkce je zodpovědná za provádění operace zřetězení podél osy v DataFrame.

Syntax:

 pd.concat(objs,axis=0,join='outer',join_axes=None, ignore_index=False) 

Parametry:

    objs:Jde o posloupnost nebo mapování řad nebo objektů DataFrame.
    Pokud předáme diktát v DataFrame, pak setříděné klíče budou použity jako klíčů a hodnoty budou v tomto případě vybrány. Pokud jsou přítomny nějaké objekty, které nejsou objekty, bude vyřazen, pokud nejsou všechny žádné, a v tomto případě a ValueError bude zvýšen.osa:Je to osa, která se má zřetězit.připojit se:Zodpovědný za manipulaci s indexy na jiné ose.join_axes:Seznam objektů indexu. Místo provádění logiky vnitřní nebo vnější sady se specifické indexy používají pro druhou osu (n-1).ignore_index:bool, výchozí hodnota False
    Nepoužívá hodnoty indexu na ose zřetězení, pokud je pravdivá. Výsledná osa bude označena jako 0, ..., n - 1.

Návraty

Série je vrácena, když zřetězíme všechny řady podél osy (osa=0). V případě, že objs obsahuje alespoň jeden DataFrame, vrací DataFrame.

Příklad1:

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data]) 

Výstup

 0 p 1 q 0 r 1 s dtype: object 

Příklad2: Ve výše uvedeném příkladu můžeme resetovat existující index pomocí ignorovat_index parametr. Níže uvedený kód demonstruje fungování ignorovat_index .

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], ignore_index=True) 

Výstup

 0 p 1 q 2 r 3 s dtype: object 

Příklad 3: Můžeme přidat hierarchický index na nejvzdálenější úrovni dat pomocí klíče parametr.

řazení java arraylist
 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data']) 

Výstup

 a_data 0 p 1 q b_data 0 r 1 s dtype: object 

Příklad 4: Indexové klíče můžeme označit pomocí jména parametr. Níže uvedený kód ukazuje fungování parametru names.

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data']) pd.concat([a_data, b_data], keys=['a_data', 'b_data'], names=['Series name', 'Row ID']) 

Výstup

 Series name Row ID a_data 0 p 1 q b_data 0 r 1 s dtype: object 

Zřetězení pomocí append

Metoda append je definována jako užitečná zkratka pro zřetězení Series a DataFrame.

Příklad:

 import pandas as pd one = pd.DataFrame({ 'Name': ['Parker', 'Smith', 'Allen', 'John', 'Parker'], 'subject_id':['sub1','sub2','sub4','sub6','sub5'], 'Marks_scored':[98,90,87,69,78]}, index=[1,2,3,4,5]) two = pd.DataFrame({ 'Name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'], 'subject_id':['sub2','sub4','sub3','sub6','sub5'], 'Marks_scored':[89,80,79,97,88]}, index=[1,2,3,4,5]) print (one.append(two)) 

Výstup

 Name subject_id Marks_scored 1 Parker sub1 98 2 Smith sub2 90 3 Allen sub4 87 4 John sub6 69 5 Parker sub5 78 1 Billy sub2 89 2 Brian sub4 80 3 Bran sub3 79 4 Bryce sub6 97 5 Betty sub5 88