Удаление строк и столбцов с помощью Pandas Drop в Python
Pandas drop - это метод, который используется для удаления определенных столбцов или строк из DataFrame. Этот метод имеет несколько аргументов, которые позволяют определять, какие строки или столбцы нужно удалить, и каким образом.
Пример 1: Удаление столбца
Рассмотрим простой пример, где мы имеем DataFrame с именем df, содержащий два столбца - "имя" и "возраст". Для удаления столбца "возраст" мы можем использовать метод drop() следующим образом:
import pandas as pd
# Создание DataFrame
df = pd.DataFrame({
"имя": ["Александр", "Мария", "Николай", "Екатерина"],
"возраст": [25, 30, 21, 28]
})
# Удаление столбца "возраст"
df.drop("возраст", axis=1, inplace=True)
print(df)
В данном примере мы указали аргумент axis = 1, чтобы указать, что мы хотим удалить столбец, а не строку. Аргумент inplace = True указывает на то, что изменения нужно внести в текущем DataFrame.
Пример 2: Удаление строки
Рассмотрим следующий пример, где мы имеем DataFrame с именем df, содержащий две строки - "Александр" и "Мария". Для удаления строки "Мария" мы можем использовать метод drop() следующим образом:
import pandas as pd
# Создание DataFrame
df = pd.DataFrame({
"имя": ["Александр", "Мария"],
"возраст": [25, 30]
})
# Удаление строки "Мария"
df.drop(1, inplace=True)
print(df)
В данном примере мы указали номер строки, которую нужно удалить (индекс 1), а также указали аргумент inplace = True, чтобы изменения были внесены в текущем DataFrame.
Пример 3: Удаление нескольких строк и столбцов
Можно использовать метод drop() для удаления какой-то выборки строк или столбцов. Для этого можно передать список индексов или названий строк или столбцов, которые нужно удалить.
import pandas as pd
# Создание DataFrame
df = pd.DataFrame({
"имя": ["Александр", "Мария", "Николай", "Екатерина"],
"возраст": [25, 30, 21, 28],
"зарплата": [100000, 120000, 90000, 110000]
})
# Удаление столбцов "возраст" и "зарплата"
df.drop(["возраст", "зарплата"], axis=1, inplace=True)
# Удаление строк с индексом 0 и 3
df.drop([0, 3], inplace=True)
print(df)
В данном примере мы указали, что мы хотим удалить столбцы "возраст" и "зарплата", а также строки с индексами 0 и 3.