Pandas — невероятно мощная библиотека манипулирования данными на Python, предоставляющая широкий спектр функций и методов для работы с табличными данными. Одним из ключевых аспектов манипулирования данными является выполнение действий над столбцами внутри DataFrame. В этой статье мы рассмотрим различные методы в Pandas, которые позволяют эффективно выполнять операции над столбцами, упрощая задачи по обработке данных.
- Доступ к столбцам.
Прежде чем мы углубимся в различные операции, давайте быстро рассмотрим, как получить доступ к столбцам в DataFrame Pandas. Чтобы получить доступ к определенному столбцу, вы можете просто использовать квадратные скобки или точку.
# Using square bracket notation
df['column_name']
# Using dot notation
df.column_name
- Основные арифметические операции:
Pandas позволяет выполнять основные арифметические операции над столбцами. Вы можете складывать, вычитать, умножать и делить столбцы с числовыми данными. Давайте рассмотрим несколько примеров:
# Adding two columns and storing the result in a new column
df['sum'] = df['column1'] + df['column2']
# Subtracting one column from another
df['difference'] = df['column1'] - df['column2']
# Multiplying two columns
df['product'] = df['column1'] * df['column2']
# Dividing one column by another
df['ratio'] = df['column1'] / df['column2']
- Операции со строками.
Если у вас есть столбцы со строковыми данными, Pandas предлагает богатый набор операций со строками, которые вы можете применять для управления значениями столбцов. Вот несколько примеров:
# Converting a column to uppercase
df['column'] = df['column'].str.upper()
# Extracting a substring from a column
df['new_column'] = df['column'].str.extract(r'(\d+)')
# Removing leading and trailing whitespaces from a column
df['column'] = df['column'].str.strip()
# Replacing a specific substring in a column
df['column'] = df['column'].str.replace('old_value', 'new_value')
- Функции агрегирования.
Pandas предоставляет широкий спектр функций агрегирования, которые позволяют суммировать данные столбцов. Вы можете рассчитать сумму, среднее, медиану, минимум, максимум и многие другие статистические данные. Вот несколько примеров:
# Computing the sum of a column
sum_value = df['column'].sum()
# Calculating the mean of a column
mean_value = df['column'].mean()
# Finding the minimum value in a column
min_value = df['column'].min()
# Determining the maximum value in a column
max_value = df['column'].max()
# Counting the number of non-null values in a column
count = df['column'].count()
Pandas предоставляет множество методов для выполнения действий над столбцами внутри DataFrame. Освоив эти операции, вы сможете эффективно манипулировать и преобразовывать свои данные. Будь то базовые арифметические вычисления, манипуляции со строками или функции агрегирования, Pandas поможет вам. Итак, используйте возможности Pandas и усовершенствуйте свои навыки манипулирования данными!