logo

Způsoby, jak filtrovat Pandas DataFrame podle hodnot sloupců

Filtrování Pandas DataFrame pomocí hodnot sloupců je běžnou operací při běhu s informacemi v Pythonu. K tomu můžete použít různé metody a techniky. Zde je mnoho způsobů, jak odfiltrovat Pandas DataFrame prostřednictvím hodnot sloupců.

V tomto příspěvku uvidíme různé způsoby, jak filtrovat Pandas Dataframe podle hodnot sloupců. Nejprve vytvoříme datový rámec:



Python3








# importing pandas> import> pandas as pd> > # declare a dictionary> record>=> {> >'Name'> : [>'Ankit'>,>'Swapnil'>,>'Aishwarya'>,> >'Priyanka'>,>'Shivangi'>,>'Shaurya'> ],> > >'Age'> : [>22>,>20>,>21>,>19>,>18>,>22>],> > >'Stream'> : [>'Math'>,>'Commerce'>,>'Science'>,> >'Math'>,>'Math'>,>'Science'>],> > >'Percentage'> : [>90>,>90>,>96>,>75>,>70>,>80>] }> > # create a dataframe> dataframe>=> pd.DataFrame(record,> >columns>=> [>'Name'>,>'Age'>,> >'Stream'>,>'Percentage'>])> # show the Dataframe> print>(>'Given Dataframe : '>, dataframe)>

>

>

Výstup:

Datový rámec

Výběr řádků datového rámce Pandas na základě konkrétní hodnoty sloupce pomocí operátorů ‚>‘, ‚=‘, ‚=‘, ‚<=‘, ‚!=‘.

Příklad 1: Výběr všech řádků z daného datového rámce, ve kterých je „Procento“ větší než 75 pomocí [ ] .

Python3




# selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Percentage'>]>>70>]> > print>(>' Result dataframe : '>, rslt_df)>

>

>

Výstup:

výstupní datový rámec

Příklad 2: Výběr všech řádků z daného datového rámce, ve kterých je „Procento“ větší než 70 pomocí místo [ ] .

Python3




# selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Percentage'>]>>70>]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Výstup:

výstupní datový rámec-1

Výběr těch řádků datového rámce Pandas, jejichž hodnota sloupce je přítomna v seznamu pomocí vy() metoda datového rámce.

Příklad 1: Výběr všech řádků z daného datového rámce, ve kterém je přítomen ‚Stream‘, v seznamu možností pomocí [ ] .

Python3




options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Výstup:

výstupní datový rámec-2

Příklad 2: Výběr všech řádků z daného datového rámce, ve kterém je přítomen ‚Stream‘, v seznamu možností pomocí místo [ ] .

Krajta




options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Výstup:

výstupní datový rámec-3

Výběr řádků datového rámce Pandas na základě podmínek více sloupců pomocí operátoru „&“.

Příklad1: Výběrem všech řádků z daného datového rámce, ve kterém se ‚Věk‘ rovná 22 a ‚Stream‘ je přítomen v seznamu možností pomocí [ ] .

Python3




options>=> [>'Commerce'> ,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Výstup:

výstupní datový rámec-4

Příklad 2: Výběrem všech řádků z daného datového rámce, ve kterém se ‚Věk‘ rovná 22 a ‚Stream‘ je přítomen v seznamu možností pomocí místo [ ] .

Python3




připojit databázi java

options>=> [>'Commerce'>,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Výstup:

výstupní datový rámec-5