logo

Různé způsoby, jak vytvořit Pandas Dataframe

Pandas DataFrame je 2-rozměrná označovaná datová struktura jako tabulka s řádky a sloupci. Velikost a hodnoty DataFrame jsou proměnlivé, tj. lze je upravit.

DataFrame se většinou používá při analýze dat a manipulaci s nimi. Umožňuje ukládat data v tabulkové formě, jako je databáze SQL, MS Excel nebo Tabulky Google, což usnadňuje provádění aritmetických operací s daty.



Je to nejčastěji používaný objekt Pandy. The Funkce DataFrame(). se používá k vytvoření DataFrame v Pandas. Pandas DataFrame můžete také vytvořit několika způsoby.

Syntaxe Pandas Dataframe().

pandas.DataFrame(data, index, sloupce)

primární klíč a složený klíč v sql

Parametry:

  • data : Je to datová sada, ze které má být vytvořen DataFrame. Může to být seznam, slovník, skalární hodnota, série a pole atd.
  • index : Je volitelné, ve výchozím nastavení index DataFrame začíná od 0 a končí na poslední datové hodnotě (n-1). Explicitně definuje popisek řádku.
  • sloupců : Tento parametr se používá k poskytování názvů sloupců v DataFrame. Pokud není název sloupce ve výchozím nastavení definován, bude mít hodnotu od 0 do n-1.

Vrácení:

  • Objekt DataFrame

Nyní, když jsme diskutovali o funkci DataFrame(), podívejme se na různé způsoby, jak vytvořit DataFrame:



Různé způsoby, jak vytvořit datový rámec v Pythonu

Existuje několik způsobů, jak vytvořit a Dataframe Pandas v Krajta . DataFrame můžete vytvořit pomocí následujících metod:

  • Vytvořte Pandas DataFrame pomocí funkce DataFrame().
  • Vytvořte Pandas DataFrame ze seznamu seznamů
  • Vytvořte Pandas DataFrame ze slovníku ndarray/list
  • Vytvořte Pandas DataFrame ze seznamu slovníků
  • Vytvořte Pandas DataFrame ze slovníku Series
  • Vytvoření DataFrame pomocí funkce zip().
  • Vytvoření DataFrame explicitním prokázáním indexového štítku

Vytvořte prázdný DataFrame pomocí metody DataFrame().

DataFrame v Pythonu lze vytvořit funkcí DataFrame() v Knihovna pand . Stačí zavolat funkci pomocí konstruktoru DataFrame a vytvořit DataFrame.

Příklad : Vytvoření prázdného DataFrame pomocí funkce DataFrame() v Pythonu



Python3




# Importing Pandas to create DataFrame> import> pandas as pd> # Creating Empty DataFrame and Storing it in variable df> df>=> pd.DataFrame()> # Printing Empty DataFrame> print>(df)>

>

>

Výstup:

Empty DataFrame Columns: [] Index: []>

Vytvořte DataFrame ze seznamů seznamů

Chcete-li vytvořit Pandas DataFrame z a seznam seznamů, můžete použít funkci pd.DataFrame(). Tato funkce bere jako vstup seznam seznamů a vytváří DataFrame se stejným počtem řádků a sloupců jako vstupní seznam.

Příklad : Vytváření DataFrame ze seznamů seznamů pomocí metody DataFrame().

Python3




# Import pandas library> import> pandas as pd> # initialize list of lists> data>=> [[>'tom'>,>10>], [>'nick'>,>15>], [>'juli'>,>14>]]> # Create the pandas DataFrame> df>=> pd.DataFrame(data, columns>=>[>'Name'>,>'Age'>])> # print dataframe.> print>(df)>

>

>

Výstup:

 Name Age 0 tom 10 1 nick 15 2 juli 14>

Vytvořte DataFrame ze slovníku ndArray/Lists

Chcete-li vytvořit DataFrame z a slovník z ndarrays /lists, všechna pole musí mít stejnou délku. Pokud je předán index, měl by být index délky roven délce polí.

Pokud není předán žádný index, bude index standardně range(n), kde n je délka pole.

Příklad : Vytvoření DataFrame ze slovníku ndarray/lists

Python3




porovnat s javou
# Python code demonstrate creating> # DataFrame from dict narray / lists> # By default addresses.> import> pandas as pd> # initialize data of lists.> data>=> {>'Name'>: [>'Tom'>,>'nick'>,>'krish'>,>'jack'>],> >'Age'>: [>20>,>21>,>19>,>18>]}> # Create DataFrame> df>=> pd.DataFrame(data)> # Print the output.> print>(df)>

>

>

Výstup:

 Name Age 0 Tom 20 1 nick 21 2 krish 19 3 jack 18>

Poznámka: Při vytváření DataFrame pomocí slovníku budou klíče slovníku ve výchozím nastavení názvy sloupců. Můžeme také poskytnout názvy sloupců explicitně pomocí parametru sloupce.

Vytvořte DataFrame ze seznamu slovníků

Pandas DataFrame lze vytvořit předáním seznamy slovníků jako vstupní data. Ve výchozím nastavení budou klíče slovníku považovány za sloupce.

Python3




převést bajtové pole na řetězec
# Python code demonstrate how to create> # Pandas DataFrame by lists of dicts.> import> pandas as pd> # Initialize data to lists.> data>=> [{>'a'>:>1>,>'b'>:>2>,>'c'>:>3>},> >{>'a'>:>10>,>'b'>:>20>,>'c'>:>30>}]> # Creates DataFrame.> df>=> pd.DataFrame(data)> # Print the data> print>(df)>

>

>

Výstup:

a b c 0 1 2 3 1 10 20 30>

Dalším příkladem je vytvoření Pandas DataFrame předáním seznamů slovníků a řádkové indexy .

Python3




# Python code demonstrate to create> # Pandas DataFrame by passing lists of> # Dictionaries and row indices.> import> pandas as pd> # Initialize data of lists> data>=> [{>'b'>:>2>,>'c'>:>3>}, {>'a'>:>10>,>'b'>:>20>,>'c'>:>30>}]> # Creates pandas DataFrame by passing> # Lists of dictionaries and row index.> df>=> pd.DataFrame(data, index>=>[>'first'>,>'second'>])> # Print the data> print>(df)>

>

>

Výstup:

b c a first 2 3 NaN second 20 30 10.0>

Vytvořte DataFrame ze slovníku Series

Chcete-li vytvořit DataFrame ze slovníku série , lze předat slovník, aby vytvořil DataFrame. Výsledný index je sjednocením všech řad předaných indexovaných.

Příklad: Vytvoření DataFrame ze slovníku řad.

Python3


kdy začíná q2



# Python code demonstrate creating> # Pandas Dataframe from Dicts of series.> import> pandas as pd> # Initialize data to Dicts of series.> d>=> {>'one'>: pd.Series([>10>,>20>,>30>,>40>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>]),> >'two'>: pd.Series([>10>,>20>,>30>,>40>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>])}> # creates Dataframe.> df>=> pd.DataFrame(d)> # print the data.> print>(df)>

>

>

Výstup:

 one two a 10 10 b 20 20 c 30 30 d 40 40>

Vytvořte DataFrame pomocí funkce zip().

Dva seznamy lze sloučit pomocí funkce zip(). . Nyní vytvořte Pandas DataFrame voláním funkce pd.DataFrame().

Příklad: Vytvoření DataFrame pomocí funkce zip().

Python3




# Python program to demonstrate creating> # pandas Dataframe from lists using zip.> import> pandas as pd> # List1> Name>=> [>'tom'>,>'krish'>,>'nick'>,>'juli'>]> # List2> Age>=> [>25>,>30>,>26>,>22>]> # get the list of tuples from two lists.> # and merge them by using zip().> list_of_tuples>=> list>(>zip>(Name, Age))> # Assign data to tuples.> list_of_tuples> # Converting lists of tuples into> # pandas Dataframe.> df>=> pd.DataFrame(list_of_tuples,> >columns>=>[>'Name'>,>'Age'>])> # Print data.> print>(df)>

>

>

Výstup:

 Name Age 0 tom 25 1 krish 30 2 nick 26 3 juli 22>

Vytvořte DataFrame explicitním prokázáním indexového štítku

Chcete-li vytvořit DataFrame explicitním poskytnutím indexového štítku, můžete použít parametr index konstruktoru pd.DataFrame(). Parametr index bere jako vstup seznam indexových štítků a DataFrame použije tyto štítky pro řádky DataFrame.

rozdíl mezi ledem a sněhem

Příklad: Vytvoření DataFrame explicitním prokázáním indexového štítku

Python3




# Python code demonstrate creating> # pandas DataFrame with indexed by> # DataFrame using arrays.> import> pandas as pd> # initialize data of lists.> data>=> {>'Name'>: [>'Tom'>,>'Jack'>,>'nick'>,>'juli'>],> >'marks'>: [>99>,>98>,>95>,>90>]}> # Creates pandas DataFrame.> df>=> pd.DataFrame(data, index>=>[>'rank1'>,> >'rank2'>,> >'rank3'>,> >'rank4'>])> # print the data> print>(df)>

>

>

Výstup:

 Name marks rank1 Tom 99 rank2 Jack 98 rank3 nick 95 rank4 juli 90>

Závěr

Python Pandas DataFrame je podobný tabulce s řádky a sloupci. Jedná se o dvourozměrnou datovou strukturu a je velmi užitečná pro analýzu dat a manipulaci s nimi.

V tomto tutoriálu jsme probrali několik způsobů, jak vytvořit Pandas DataFrame. S tímto tutoriálem budete schopni zvládnout jakýkoli složitý požadavek na vytváření DataFrame.