Изучение серии Pandas: методы фильтрации значений

Pandas — мощная библиотека Python для обработки и анализа данных. При работе с сериями Pandas часто необходимо фильтровать значения на основе определенных условий. В этой статье мы рассмотрим несколько методов фильтрации значений в серии Pandas, а также приведем примеры кода, иллюстрирующие каждый метод.

Метод 1: логическое индексирование

Булева индексация позволяет нам фильтровать серию с использованием логического условия. Результирующая серия будет содержать только значения, удовлетворяющие условию.

import pandas as pd
# Create a sample Series
s = pd.Series([10, 20, 30, 40, 50])
# Filter values greater than 30
filtered_series = s[s > 30]
print(filtered_series)

Выход:

3    40
4    50
dtype: int64

Метод 2: использование операторов сравнения

Мы можем использовать операторы сравнения, такие как <, >, ==и т. д., чтобы фильтровать значения на основе определенных критериев.

p>

import pandas as pd
# Create a sample Series
s = pd.Series([10, 20, 30, 40, 50])
# Filter values less than 30
filtered_series = s[s < 30]
print(filtered_series)

Выход:

0    10
1    20
dtype: int64

Метод 3: метод isin()

Метод isin()позволяет нам фильтровать значения в зависимости от того, присутствуют ли они в заданном списке или массиве.

import pandas as pd
# Create a sample Series
s = pd.Series(['apple', 'banana', 'orange', 'kiwi', 'mango'])
# Filter values that are either 'apple' or 'banana'
filtered_series = s[s.isin(['apple', 'banana'])]
print(filtered_series)

Выход:

0     apple
1    banana
dtype: object

Метод 4: Между методами

Метод between()позволяет нам фильтровать значения в пределах указанного диапазона.

import pandas as pd
# Create a sample Series
s = pd.Series([10, 20, 30, 40, 50])
# Filter values between 20 and 40
filtered_series = s[s.between(20, 40)]
print(filtered_series)

Выход:

1    20
2    30
3    40
dtype: int64

Метод 5. Сопоставление шаблонов регулярных выражений

Мы можем использовать регулярные выражения для фильтрации значений в серии на основе сопоставления с шаблоном.

import pandas as pd
# Create a sample Series
s = pd.Series(['apple', 'banana', 'orange', 'kiwi', 'mango'])
# Filter values starting with 'a' or 'b'
filtered_series = s[s.str.match(r'^[ab]')]
print(filtered_series)

Выход:

0     apple
1    banana
dtype: object

В этой статье мы рассмотрели несколько методов фильтрации значений в серии Pandas. Мы рассмотрели такие методы, как логическое индексирование, операторы сравнения, метод isin(), метод between()и сопоставление шаблонов регулярных выражений. Используя эти методы, вы можете легко извлечь нужные значения из серии на основе конкретных условий. Pandas предлагает широкий спектр функций для манипулирования данными, что делает его ценным инструментом для задач анализа данных.

Не забывайте использовать эти методы в зависимости от требований вашего проекта анализа данных и наслаждайтесь гибкостью и мощью, которые предоставляет Pandas!