Освоение фильтрации данных в Pandas: подробное руководство с примерами кода

Фильтрация данных — важнейшая задача анализа данных. Pandas, мощная библиотека Python, предоставляет несколько методов для фильтрации строк в DataFrame. В этой статье мы рассмотрим различные методы и примеры кода, которые помогут вам освоить фильтрацию данных в Pandas. Независимо от того, являетесь ли вы новичком или опытным аналитиком данных, это подробное руководство улучшит ваше понимание предмета.

  1. Логическое индексирование.
    Логическое индексирование позволяет фильтровать строки на основе условия. Вот пример:
import pandas as pd
# Create a DataFrame
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, 35, 40],
        'Salary': [50000, 60000, 70000, 80000]}
df = pd.DataFrame(data)
# Filter rows with age greater than 30
filtered_df = df[df['Age'] > 30]
print(filtered_df)
  1. Операторы сравнения.
    Вы можете использовать такие операторы сравнения, как <, >, <=, >=., ==и !=для фильтрации строк. Вот пример:
# Filter rows with a salary less than or equal to 60000
filtered_df = df[df['Salary'] <= 60000]
print(filtered_df)
    Метод

  1. isin():
    Метод isin()позволяет фильтровать строки на основе нескольких значений в столбце. Вот пример:
# Filter rows with names 'Bob' and 'Charlie'
filtered_df = df[df['Name'].isin(['Bob', 'Charlie'])]
print(filtered_df)
  1. Строковые методы.
    Pandas предоставляет различные строковые методы для фильтрации строк на основе строковых условий. Вот пример:
# Filter rows with names starting with 'A'
filtered_df = df[df['Name'].str.startswith('A')]
print(filtered_df)
  1. Метод запроса.
    Метод query()обеспечивает краткий способ фильтрации строк с помощью строки запроса. Вот пример:
# Filter rows with age greater than 30 and salary less than 80000
filtered_df = df.query('Age > 30 and Salary < 80000')
print(filtered_df)

В этой статье мы рассмотрели несколько методов фильтрации строк в Pandas, включая логическое индексирование, операторы сравнения, метод isin(), строковые методы и метод query().. Используя эти методы, вы можете эффективно извлечь желаемое подмножество данных из DataFrame. Продолжайте практиковаться и изучать эти методы, чтобы стать опытным аналитиком данных.

Не забудьте учитывать конкретные требования вашего анализа и соответственно выбирать наиболее подходящий метод фильтрации. Благодаря мощным возможностям Pandas вы можете уверенно решать задачи фильтрации данных в своих проектах анализа данных.

Ссылки: