logo

funkce pandas.concat() v Pythonu

Funkce pandas.concat() dělá veškerou těžkou práci provádění operací zřetězení spolu s osou Předměty pandy při provádění volitelné logiky sady (sjednocení nebo průnik) indexů (pokud existují) na ostatních osách.

Syntaxe funkce Pandas concat().

Syntax: concat(objs, osa, spojení, ignorovat_index, klíče, úrovně, názvy, ověřit_integritu, seřadit, kopírovat)

Parametry:



  • obs: Série nebo objekty DataFrame
  • osa: osa zřetězit podél; výchozí = 0
  • připojit se: cesta zpracovávat indexy na jiné ose; výchozí = ‚vnější‘
  • ignore_index: je-li True, nepoužívejte hodnoty indexu podél osy zřetězení; výchozí = False
  • klíče: sekvence pro přidání identifikátoru k indexům výsledků; výchozí = Žádný
  • úrovně: specifické úrovně (jedinečné hodnoty), které se mají použít pro konstrukci MultiIndexu; výchozí = Žádný
  • jména: názvy úrovní ve výsledném hierarchickém indexu; výchozí = Žádný
  • ověřit_integritu: zkontrolujte, zda nová zřetězená osa obsahuje duplikáty; výchozí = False
  • seřadit: seřadit nezřetězenou osu, pokud již není zarovnána, když je spojení „vnější“; výchozí = False
  • kopírovat: pokud je False, nekopírujte data zbytečně; výchozí = True

Vrácení: typ objs (Series of DataFrame)

Zřetězení pomocí pand s příklady

Příklad 1: Zřetězení datových rámců v Pythonu

V tomto příkladu zřetězujeme dvě řady s výchozími parametry pandy .

Python3




# importing the module> import> pandas as pd> # creating the Series> series1>=> pd.Series([>1>,>2>,>3>])> display(>'series1:'>, series1)> series2>=> pd.Series([>'A'>,>'B'>,>'C'>])> display(>'series2:'>, series2)> # concatenating> display(>'After concatenating:'>)> display(pd.concat([series1, series2]))>

>

>

Výstup

Příklad 2: Pandy kombinující dva datové rámce horizontálně s indexem = 1

V tomto příkladu vytvoříme dvě řady Pandas (series1>aseries2>) a poté je zřetězí podél sloupců (osa=1) pomocípd.concat()>. Výsledný DataFrame obsahuje obě řady jako sloupce a vytváří nový DataFrame se dvěma sloupci.

Python3




# importing the module> import> pandas as pd> # creating the Series> series1>=> pd.Series([>1>,>2>,>3>])> display(>'series1:'>, series1)> series2>=> pd.Series([>'A'>,>'B'>,>'C'>])> display(>'series2:'>, series2)> # concatenating> display(>'After concatenating:'>)> display(pd.concat([series1, series2],> >axis>=> 1>))>

java double to string

>

>

Výstup

Příklad 3: Zřetězení 2 datových rámců a přiřazení klíčů

vytvoří dva DataFrames (df1>adf2>) a zřetězí je spolu s klíči přiřazenými každému DataFrame pomocípd.concat()>. Výsledný DataFrame má hierarchický index s klíči ‚key1‘ a ‚key2‘, který rozlišuje původ každé sady dat.

Python3




# importing the module> import> pandas as pd> # creating the DataFrames> df1>=> pd.DataFrame({>'A'>: [>'A0'>,>'A1'>,>'A2'>,>'A3'>],> >'B'>: [>'B0'>,>'B1'>,>'B2'>,>'B3'>]})> display(>'df1:'>, df1)> df2>=> pd.DataFrame({>'A'>: [>'A4'>,>'A5'>,>'A6'>,>'A7'>],> >'B'>: [>'B4'>,>'B5'>,>'B6'>,>'B7'>]})> display(>'df2:'>, df2)> # concatenating> display(>'After concatenating:'>)> display(pd.concat([df1, df2],> >keys>=>[>'key1'>,>'key2'>]))>

>

>

Výstup

Příklad 4: Horizontální zřetězení datových rámců v Pandas s osou = 1

vytvoří dva DataFrames (df1>adf2>) a zřetězí je podél sloupců (osa=1) pomocípd.concat()>. Výsledný DataFrame kombinuje sloupce z oboudf1>adf2>a zarovnejte je vedle sebe .

Python3




# importing the module> import> pandas as pd> # creating the DataFrames> df1>=> pd.DataFrame({>'A'>: [>'A0'>,>'A1'>,>'A2'>,>'A3'>],> >'B'>: [>'B0'>,>'B1'>,>'B2'>,>'B3'>]})> display(>'df1:'>, df1)> df2>=> pd.DataFrame({>'C'>: [>'C0'>,>'C1'>,>'C2'>,>'C3'>],> >'D'>: [>'D0'>,>'D1'>,>'D2'>,>'D3'>]})> display(>'df2:'>, df2)> # concatenating> display(>'After concatenating:'>)> display(pd.concat([df1, df2],> >axis>=> 1>))>

>

>

Výstup

Příklad 5: Zřetězení 2 DataFrames s ignore_index = True

vytvoří dva DataFrames (df1>adf2>) s identickými sloupci a zřetězí je vertikálně pomocípd.concat()>signore_index=True>. Výsledný DataFrame má spojitý index, ignorující původní indexydf1>adf2>.

Python3




# importing the module> import> pandas as pd> # creating the DataFrames> df1>=> pd.DataFrame({>'A'>: [>'A0'>,>'A1'>,>'A2'>,>'A3'>],> >'B'>: [>'B0'>,>'B1'>,>'B2'>,>'B3'>]})> display(>'df1:'>, df1)> df2>=> pd.DataFrame({>'A'>: [>'A4'>,>'A5'>,>'A6'>,>'A7'>],> >'B'>: [>'B4'>,>'B5'>,>'B6'>,>'B7'>]})> display(>'df2:'>, df2)> # concatenating> display(>'After concatenating:'>)> display(pd.concat([df1, df2],> >ignore_index>=> True>))>

>

>

Výstup

Příklad 6: Zřetězení datového rámce se sérií

vytvoří DataFrame (df>) a řada (series>), pak je zřetězí podél sloupců (osa=1) pomocípd.concat()>. Výsledný DataFrame kombinuje sloupce zdf>a Series, zarovnat je vedle sebe. Poznámka: V příkazu zobrazení je překlep (df1>namístodf>).

Python3




# importing the module> import> pandas as pd> # creating the DataFrame> df>=> pd.DataFrame({>'A'>: [>'A0'>,>'A1'>,>'A2'>,>'A3'>],> >'B'>: [>'B0'>,>'B1'>,>'B2'>,>'B3'>]})> display(>'df:'>, df1)> # creating the Series> series>=> pd.Series([>1>,>2>,>3>,>4>])> display(>'series:'>, series)> # concatenating> display(>'After concatenating:'>)> display(pd.concat([df, series],> >axis>=> 1>))>

>

>

Výstup