Python je skvělý jazyk pro analýzu dat, především kvůli fantastickému ekosystému balíčků Pythonu zaměřených na data. pandy je jedním z těchto balíčků, který značně usnadňuje import a analýzu dat. Vytvoření a Dataframe Pandas lze dosáhnout mnoha způsoby. Podívejme se, jak můžeme vytvořit Pandas DataFrame ze seznamů.
latexové písmo
Vytváření datových rámců Pandas ze seznamů
Převod seznamů na DataFrames je při analýze dat klíčový, umožňuje vám snadno provádět sofistikované manipulace s daty a analýzy.
Zde probereme různé způsoby, jak vytvořit datový rámec Pandas ze seznamů:
- Vytvořte datový rámec ze seznamu pomocí nástroje Constructer
- Vytvořte DataFrame ze seznamu pomocí Dictionary
- Vytvořit DataFrame ze seznamu pomocí zip()
- Vytvořte DataFrame ze seznamu změnou datového typu
- Vytvořte DataFrame ze seznamu pomocí vícerozměrného seznamu
- Vytvořte DataFrame ze seznamu s názvy indexů a sloupců
Vytvořte datový rámec ze seznamu pomocí nástroje Constructer
Chcete-li převést seznam na Pandas DataFrame, můžete použítpd.DataFrame()>konstruktér. Tato funkce vezme seznam jako vstup a vytvoří DataFrame se stejným počtem řádků a sloupců jako vstupní seznam.
# import pandas as pd import pandas as pd # list of strings lst = ['Geeks', 'For', 'Geeks', 'is', 'portal', 'for', 'Geeks'] # Calling DataFrame constructor on list df = pd.DataFrame(lst) print(df)>
Výstup:
0 0 Geeks 1 For 2 Geeks 3 is 4 portal 5 for 6 Geeks>
Vytvořte DataFrame ze seznamu pomocí Dictionary
Chcete-li použít seznamy ve slovníku k vytvoření Pandas DataFrame, vytvoříme slovník seznamů a poté předáme slovníkpd.DataFrame()>konstruktér. Volitelně můžeme zadat názvy sloupců pro DataFrame předáním seznamu řetězcůcolumns>parametrupd.DataFrame()>konstruktér.
# importing pandas as pd import pandas as pd # list of name, degree, score nme = ['aparna', 'pankaj', 'sudhir', 'Geeku'] deg = ['MBA', 'BCA', 'M.Tech', 'MBA'] scr = [90, 40, 80, 98] # dictionary of lists dict = {'name': nme, 'degree': deg, 'score': scr} df = pd.DataFrame(dict) print(df)> Výstup:
name degree score 0 aparna MBA 90 1 pankaj BCA 40 2 sudhir M.Tech 80 3 Geeku MBA 98>
Vytvořit DataFrame ze seznamu pomocí zip()
Chcete-li vytvořit Pandas DataFrame ze seznamů pomocí zip(). Můžeme také použítzip()>funkce pro spojení více seznamů a vytvoření DataFrame s více sloupci.
Krajta
# import pandas as pd import pandas as pd # list of strings lst = ['Geeks', 'For', 'Geeks', 'is', 'portal', 'for', 'Geeks'] # list of int lst2 = [11, 22, 33, 44, 55, 66, 77] # Calling DataFrame constructor after zipping # both lists, with columns specified df = pd.DataFrame(list(zip(lst, lst2)), columns =['Name', 'val']) print(df)>
Výstup:
Name val 0 Geeks 11 1 For 22 2 Geeks 33 3 is 44 4 portal 55 5 for 66 6 Geeks 77>
Vytvořte DataFrame ze seznamu změnou datového typu
Chcete-li vytvořit Pandas DataFrame pomocí vícerozměrného seznamu se zadanými názvy sloupců a dtypes. Zadáním dtypes můžeme zajistit, že DataFrame je vytvořen se správnými datovými typy.
Krajta import pandas as pd # List1 lst = [['tom', 'reacher', 25], ['krish', 'pete', 30], ['nick', 'wilson', 26], ['juli', 'williams', 22]] # Create DataFrame df = pd.DataFrame(lst, columns=['FName', 'LName', 'Age']) # Convert 'Age' column to float df['Age'] = df['Age'].astype(float) print(df)>
Výstup:
FName LName Age 0 tom reacher 25.0 1 krish pete 30.0 2 nick wilson 26.0 3 juli williams 22.0>
Vytvořte DataFrame ze seznamu pomocí vícerozměrného seznamu
Chcete-li vytvořit DataFrame pomocí vícerozměrného seznamu, můžete použítpd.DataFrame()>konstruktér. Thepd.DataFrame()>konstruktor vezme seznam seznamů jako vstup a vytvoří DataFrame se stejným počtem řádků a sloupců jako vstupní seznam.
# import pandas as pd import pandas as pd # List1 lst = [['tom', 25], ['krish', 30], ['nick', 26], ['juli', 22]] df = pd.DataFrame(lst, columns =['Name', 'Age']) print(df)>
Výstup:
Name Age 0 tom 25 1 krish 30 2 nick 26 3 juli 22>
Vytvořte DataFrame ze seznamu s názvy indexů a sloupců
Chcete-li vytvořit DataFrame pomocí seznamu s názvy indexů a sloupců, můžete použítpd.DataFrame()>konstruktor sindex>acolumns>parametry.
# import pandas as pd import pandas as pd # list of strings lst = ['Geeks', 'For', 'Geeks', 'is', 'portal', 'for', 'Geeks'] # Calling DataFrame constructor on list # with indices and columns specified df = pd.DataFrame(lst, index =['a', 'b', 'c', 'd', 'e', 'f', 'g'], columns =['Names']) print(df)>
Výstup:
Names a Geeks b For c Geeks d is e portal f for g Geeks>