logo

Jak třídit Pandas DataFrame?

Můžeme provádět třídění v Pandas Dataframe. Tento článek pojednává o tom, jak třídit Pandas DataFrame pomocí různých metod v Krajta .

Třídění datových rámců v Pandas

Vytvoření a Dataframe Pandas pro ukázku, Zde jsme vytvořili datový rámec, ve kterém budeme provádět různé funkce řazení.

Python3






stránky java serveru

# importing pandas library> import> pandas as pd> # creating and initializing a nested list> age_list>=> [[>'Afghanistan'>,>1952>,>8425333>,>'Asia'>],> >[>'Australia'>,>1957>,>9712569>,>'Oceania'>],> >[>'Brazil'>,>1962>,>76039390>,>'Americas'>],> >[>'China'>,>1957>,>637408000>,>'Asia'>],> >[>'France'>,>1957>,>44310863>,>'Europe'>],> >[>'India'>,>1952>,>3.72e>+>08>,>'Asia'>],> >[>'United States'>,>1957>,>171984000>,>'Americas'>]]> # creating a pandas dataframe> df>=> pd.DataFrame(age_list, columns>=>[>'Country'>,>'Year'>,> >'Population'>,>'Continent'>])> df>

>

>

Výstup

Seřadit Pandas DataFrame

Seřadit Pandas DataFrame

Třídění datového rámce Pandas

Aby bylo možné třídit datový rámec v pandách, použijte funkci sort_values() se používá. pandy sort_values() může řadit datový rámec ve vzestupném nebo sestupném pořadí.

Pandas DataFrame řazení ve vzestupném pořadí

Fragment kódu seřadí DataFrame df ve vzestupném pořadí na základě sloupce ‚Země‘. Seřazený datový rámec však neukládá ani nezobrazuje.

Python3




# Sorting by column 'Country'> df.sort_values(by>=>[>'Country'>])>

>

>

Výstup:

Seřadit Pandas DataFrame

Seřadit Pandas DataFrame

Řazení Pandas DataFrame v sestupném pořadí

DataFrame df bude seřazen v sestupném pořadí na základě sloupce Populace, přičemž země s nejvyšším počtem obyvatel se objeví v horní části DataFrame.

statická funkce v Javě

Python3




# Sorting by column 'Population'> df.sort_values(by>=>[>'Population'>], ascending>=>False>)>

>

>

Výstup:

Seřadit Pandas DataFrame

Seřadit Pandas DataFrame

Seřadit Pandas DataFrame na základě vzorkování

Zde třídíme DataFrame (df>) na základě sloupce „Populace“, uspořádání řádků s chybějícími hodnotami ve sloupci „Populace“ tak, aby se zobrazovaly jako první. Thesort_values()>metoda sna_position='first'>argument toho dosahuje upřednostňováním řádků s chybějícími hodnotami na začátku seřazeného DataFrame.

Python3




# Sorting by column 'Population'> # by putting missing values first> df.sort_values(by>=>[>'Population'>], na_position>=>'first'>)>

>

>

Výstup:

Seřadit Pandas DataFrame

Seřadit Pandas DataFrame

Třídění datových rámců podle více sloupců

V tomto příkladu třídíme DataFrame (df>) primárně podle sloupce „Země“ ve vzestupném pořadí a v rámci každé skupiny zemí podle sloupce „Kontinent“. Výsledný DataFrame se seřadí na základě zadaného pořadí sloupců a vytvoří setříděnou datovou sadu.

Python3




# Sorting by columns 'Country' and then 'Continent'> df.sort_values(by>=>[>'Country'>,>'Continent'>])>

>

>

Výstup:

Seřadit Pandas DataFrame

Seřadit Pandas DataFrame

Třídění datových rámců podle sloupců, ale v jiném pořadí

V tomto příkladu třídíme DataFrame (df>) nejprve sloupcem „Země“ v sestupném pořadí a v rámci každé skupiny zemí sloupcem „Kontinent“ ve vzestupném pořadí. Výsledný DataFrame je organizován na základě zadaných kritérií řazení sloupců.

Python3




architektura úlu
# Sorting by columns 'Country' in descending> # order and then 'Continent' in ascending order> df.sort_values(by>=>[>'Country'>,>'Continent'>],> >ascending>=>[>False>,>True>])>

>

>

Výstup:

Seřadit Pandas DataFrame

Seřadit Pandas DataFrame