Pojďme diskutovat o tom, jak vypustit jeden nebo více sloupců v Pandas Dataframe. Chcete-li odstranit sloupec z a Pandas DataFrame nebo Vypuštění jednoho nebo více sloupců v datovém rámci Pandas lze dosáhnout několika způsoby.
Vypusťte jeden nebo více sloupců v datovém rámci Pandas
Existují různé metody pro vypuštění jednoho nebo více sloupců v Pandas Dataframe, diskutujeme o některých obecně používaných metodách pro vypuštění jednoho nebo více sloupců v Pandas Dataframe, které jsou následující:
- Použití metody df.drop().
- Použitím iloc[] Metoda
- Použitím df.ix() metoda
- Použitím df.loc[] Metoda
- Použití iterační metody
- Použitím Dataframe.pop() Metoda
Vytvořte DataFrame
Nejprve vytvoříme jednoduchý Dataframe se slovníkem seznamů, řekněme názvy sloupců A, B, C, D, E . V tomto článku se budeme zabývat 6 různými způsoby odstranění některých sloupců z Pandas DataFrame.
Krajta # Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) df> Výstup :
A B C D E 0 A1 B1 C1 D1 E1 1 A2 B2 C2 D2 E2 2 A3 B3 C3 D3 E3 3 A4 B4 C4 D4 E4 4 A5 B5 C5 D5 E5>
Dataframe Drop Column v Pandas pomocí metody df.drop()
Příklad 1: V tomto příkladu odstraníme konkrétní jednotlivé sloupce, jak používá níže uvedený kód pandy k vytvoření DataFrame ze slovníku a poté odstraní sloupec „A“ pomocídrop>metoda saxis=1>. Je však důležité poznamenat, že původní DataFrame („df“) zůstává nezměněn, pokud neníinplace=True>je použit parametr nebo je výsledek přiřazen zpět k ‚df‘.
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove column name 'A' df.drop(['A'], axis=1)> Výstup :
B C D E 0 B1 C1 D1 E1 1 B2 C2 D2 E2 2 B3 C3 D3 E3 3 B4 C4 D4 E4 4 B5 C5 D5 E5>
Příklad 2: V tomto příkladu odstraňte konkrétní více sloupců, protože níže uvedený kód používá Pandas k vytvoření DataFrame ze slovníku a poté odstraní sloupce „C“ a „D“ pomocídrop>metoda saxis=1>. Pamatujte však, že původní DataFrame (‚df‘) zůstává nezměněn, pokud není výsledek přiřazen zpět neboinplace=True>se používá. Alternativně lze stejnou operaci provést pomocídf.drop(columns=['C', 'D'])>.
Krajta
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove two columns name is 'C' and 'D' df.drop(['C', 'D'], axis=1) # df.drop(columns =['C', 'D'])> Výstup :
A B E 0 A1 B1 E1 1 A2 B2 E2 2 A3 B3 E3 3 A4 B4 E4 4 A5 B5 E5>
Příklad 3: V tomto příkladu Odeberte sloupce na základě indexu sloupců, protože níže uvedený kód vytvoří Pandas DataFrame ze slovníku a odstraní tři sloupce ('A', 'E', 'C') na základě jejich pozic indexu pomocí metody `drop` s ` osa = 1`. Zobrazí se upravený DataFrame a změny se provedou na místě (`inplace=True`).
Krajta # Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove three columns as index base df.drop(df.columns[[0, 4, 2]], axis=1, inplace=True) df> Výstup :
B D 0 B1 D1 1 B2 D2 2 B3 D3 3 B4 D4 4 B5 D5>
Dataframe Drop Columns in Pandas using df.iloc[] Method
V tomto příkladu Odstraňte sloupce mezi konkrétními počátečními a koncovými sloupci, protože níže uvedený kód využívá Pandas k vytvoření DataFrame ze slovníku a poté odstraní všechny sloupce mezi indexy sloupců 1 až 3 pomocídrop>metoda saxis=1>. Změny jsou provedeny na místě (inplace=True>) a zobrazí se upravený DataFrame.
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove all columns between column index 1 to 3 df.drop(df.iloc[:, 1:3], inplace=True, axis=1) df> Výstup:
A D E 0 A1 D1 E1 1 A2 D2 E2 2 A3 D3 E3 3 A4 D4 E4 4 A5 D5 E5>
Pandas Drop sloupce z Dataframe pomocí metody df.ix().
V tomto příkladu Odstraňte sloupce mezi konkrétními názvy sloupců, protože níže uvedený kód pomocí Pandas vytvoří DataFrame ze slovníku a odstraní všechny sloupce mezi názvy sloupců „B“ až „D“ pomocídrop>metoda saxis=1>. Původní DataFrame („df“) však zůstává nezměněn, pokud není výsledek přiřazen zpět neboinplace=True>se používá.
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove all columns between column name 'B' to 'D' df.drop(df.ix[:, 'B':'D'].columns, axis=1)> Výstup :
A E 0 A1 E1 1 A2 E2 2 A3 E3 3 A4 E4 4 A5 E5>
Pandas Drop sloupce z Dataframe pomocí metody df.loc[]
V tomto příkladu přetáhněte sloupce mezi konkrétní názvy sloupců jako níže uvedený kód používá pandy vytvořit DataFrame ze slovníku a poté odstranit všechny sloupce mezi názvy sloupců „B“ a „D“ pomocídrop>metoda saxis=1>. Upravený DataFrame není přiřazen zpět k žádné proměnné a původní DataFrame zůstává nezměněn.
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove all columns between column name 'B' to 'D' df.drop(df.loc[:, 'B':'D'].columns, axis=1)> Výstup :
A E 0 A1 E1 1 A2 E2 2 A3 E3 3 A4 E4 4 A5 E5>
Poznámka: Různé loc() a iloc() jsou iloc() vylučují poslední prvek rozsahu sloupce.
Pandas Drop sloupce z Dataframu pomocí iterativní metody
V tomto příkladu odstraňte sloupce mezi konkrétními názvy sloupců, protože níže uvedený kód vytvoří Pandas DataFrame z a slovník a iteruje jejími sloupci. Pro každý sloupec, pokud je v názvu sloupce uvedeno písmeno „A“, bude tento sloupec z DataFrame odstraněn. Zobrazí se výsledný upravený DataFrame.
Krajta # Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) for col in df.columns: if 'A' in col: del df[col] df> Výstup :
B C D E 0 B1 C1 D1 E1 1 B2 C2 D2 E2 2 B3 C3 D3 E3 3 B4 C4 D4 E4 4 B5 C5 D5 E5>
Dataframe Drop Column v Pandas pomocí metody Dataframe.pop()
V tomto příkladu Odstranění konkrétního sloupce z DataFrame jako kód ukazuje, jak odstranit konkrétní sloupec („B“) z Pandas DataFrame vytvořeného ze slovníku. Používá se pop> a výsledný upravený DataFrame se zobrazí.
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) df.pop('B') df> Výstup:
A C D E 0 A1 C1 D1 E1 1 A2 C2 D2 E2 2 A3 C3 D3 E3 3 A4 C4 D4 E4 4 A5 C5 D5 E5>