SLOUČENÍ PAND - NÁVOD NA PANDY

pandy spojit() je definován jako proces spojení dvou datových sad do jedné a zarovnání řádků na základě společných atributů nebo sloupců. Je to vstupní bod pro všechny standardní operace spojení databází mezi objekty DataFrame:

Syntax:

 pd.merge(left, right, how=&apos;inner&apos;, on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=True)

Parametry:

DataFrame nebo pojmenované Series

{'left', 'right', 'uter', 'inner'}, default 'inner'

vlevo, odjet:Používá pouze klíče z levého rámce, podobně jako levé vnější spojení SQL; zachovat pořadí klíčů.že jo:Používá pouze klíče z pravého rámce, podobně jako pravé vnější spojení SQL; zachovat pořadí klíčů.vnější:Používalo spojení klíčů z obou rámců, podobně jako úplné vnější spojení SQL; třídit klíče lexikograficky.vnitřní:Používá průnik klíčů z obou rámců, podobně jako vnitřní spojení SQL; zachovat pořadí levých kláves.

štítek nebo seznam

vlevo_na:

štítek nebo seznam, nebo jako pole

bool, výchozí False

n-tice z (str, str), výchozí ('_x', '_y')

bool, výchozí True

bool nebo str, výchozí False

_spojit

'left_only'pro pozorování, jejichž slučovací klíč se objevuje pouze „vlevo“ v DataFrame, zatímco'right_only'je definován pro pozorování, ve kterých se slučovací klíč objevuje pouze „vpravo“ od DataFrame,'oba'pokud je slučovací klíč pozorování nalezen v obou.

str, nepovinné

'one_to_one' nebo '1:1': Kontroluje, zda jsou slučovací klíče jedinečné v levé i pravé datové sadě.
'one_to_many' nebo '1:m': Kontroluje, zda jsou slučovací klíče jedinečné pouze v levé datové sadě.
'many_to_one' nebo 'm:1': Kontroluje, zda jsou slučovací klíče jedinečné pouze ve správné datové sadě.
'many_to_many' nebo 'm:m': Je povoleno, ale nevede ke kontrole.

Příklad1: Sloučení dvou datových rámců na klíči

 # import the pandas library import pandas as pd left = pd.DataFrame({ &apos;id&apos;:[1,2,3,4], &apos;Name&apos;: [&apos;John&apos;, &apos;Parker&apos;, &apos;Smith&apos;, &apos;Parker&apos;], &apos;subject_id&apos;:[&apos;sub1&apos;,&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub6&apos;]}) right = pd.DataFrame({ &apos;id&apos;:[1,2,3,4], &apos;Name&apos;: [&apos;William&apos;, &apos;Albert&apos;, &apos;Tony&apos;, &apos;Allen&apos;], &apos;subject_id&apos;:[&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub3&apos;,&apos;sub6&apos;]}) print (left) print (right)

Výstup

 id Name subject_id 0 1 John sub1 1 2 Parker sub2 2 3 Smith sub4 3 4 Parker sub6 id Name subject_id 0 1 William sub2 1 2 Albert sub4 2 3 Tony sub3 3 4 Allen sub6

Příklad 2: Sloučení dvou datových rámců na více klíčích:

 import pandas as pd left = pd.DataFrame({ &apos;id&apos;:[1,2,3,4,5], &apos;Name&apos;: [&apos;Alex&apos;, &apos;Amy&apos;, &apos;Allen&apos;, &apos;Alice&apos;, &apos;Ayoung&apos;], &apos;subject_id&apos;:[&apos;sub1&apos;,&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub6&apos;,&apos;sub5&apos;]}) right = pd.DataFrame({ &apos;id&apos;:[1,2,3,4,5], &apos;Name&apos;: [&apos;Billy&apos;, &apos;Brian&apos;, &apos;Bran&apos;, &apos;Bryce&apos;, &apos;Betty&apos;], &apos;subject_id&apos;:[&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub3&apos;,&apos;sub6&apos;,&apos;sub5&apos;]}) print pd.merge(left,right,on=&apos;id&apos;)

Výstup

 id Name_x subject_id_x Name_y subject_id_y 0 1 John sub1 William sub2 1 2 Parker sub2 Albert sub4 2 3 Smith sub4 Tony sub3 3 4 Parker sub6 Allen sub6

TechCodeview

Pandas DataFrame.merge()

Syntax:

Parametry:

Příklad1: Sloučení dvou datových rámců na klíči

Příklad 2: Sloučení dvou datových rámců na více klíčích: