При анализе данных и манипулировании ими с использованием pandas часто необходимо удалить из DataFrame строки, соответствующие определенным условиям. В этой статье блога мы рассмотрим различные методы удаления строк с определенными условиями в pandas, предоставив примеры кода для каждого подхода. К концу этой статьи в вашем распоряжении будет ряд методов для эффективной фильтрации и удаления строк на основе определенных критериев, что позволит вам эффективно выполнять задачи очистки и предварительной обработки данных.
Метод 1: использование метода drop
Пример кода:
import pandas as pd
# Create a DataFrame
data = {'Name': ['John', 'Alice', 'Bob', 'Jane'],
'Age': [25, 30, 35, 40]}
df = pd.DataFrame(data)
# Delete rows where Age is greater than 30
df = df.drop(df[df['Age'] > 30].index)
print(df)
Метод 2: использование метода query
Пример кода:
import pandas as pd
# Create a DataFrame
data = {'Name': ['John', 'Alice', 'Bob', 'Jane'],
'Age': [25, 30, 35, 40]}
df = pd.DataFrame(data)
# Delete rows where Age is greater than 30
df = df.query('Age <= 30')
print(df)
Метод 3. Использование логического индексирования
Пример кода:
import pandas as pd
# Create a DataFrame
data = {'Name': ['John', 'Alice', 'Bob', 'Jane'],
'Age': [25, 30, 35, 40]}
df = pd.DataFrame(data)
# Delete rows where Age is greater than 30
df = df[~(df['Age'] > 30)]
print(df)
Метод 4: использование метода доступа loc
Пример кода:
import pandas as pd
# Create a DataFrame
data = {'Name': ['John', 'Alice', 'Bob', 'Jane'],
'Age': [25, 30, 35, 40]}
df = pd.DataFrame(data)
# Delete rows where Age is greater than 30
df = df.loc[df['Age'] <= 30]
print(df)
Метод 5: использование метода isin
Пример кода:
import pandas as pd
# Create a DataFrame
data = {'Name': ['John', 'Alice', 'Bob', 'Jane'],
'Age': [25, 30, 35, 40]}
df = pd.DataFrame(data)
# Delete rows where Name is either 'Alice' or 'Bob'
df = df[~df['Name'].isin(['Alice', 'Bob'])]
print(df)
В этой статье мы рассмотрели несколько методов удаления строк с определенными условиями в pandas. Метод drop, метод query, логическое индексирование, метод доступа locи метод isinпредоставляют различные способы достижения та же цель. В зависимости от сложности ваших условий и размера вашего DataFrame вы можете выбрать наиболее подходящий метод для эффективной фильтрации и удаления строк. Освоив эти методы, вы приобретете необходимые навыки для эффективного выполнения задач очистки и предварительной обработки данных с помощью панд.