Фреймы данных — это важная структура данных в мире анализа и манипулирования данными. Они обеспечивают удобный способ организации и работы с табличными данными. В этой статье мы рассмотрим различные методы формирования фрейма данных с использованием разговорного языка и попутно предоставим примеры кода. Итак, давайте углубимся и станем мастерами манипулирования данными!
- Выбор столбцов.
Одним из первых шагов в формировании кадра данных является выбор конкретных интересующих столбцов. Этого можно добиться следующими методами:
# Method 1: Using column names
df['column_name']
# Example: df['age']
# Method 2: Using dot notation
df.column_name
# Example: df.age
# Method 3: Selecting multiple columns
df[['column1', 'column2']]
# Example: df[['name', 'age']]
- Фильтрация строк.
Чтобы сосредоточиться на определенных подмножествах данных, крайне важно фильтровать строки. Вот несколько способов сделать это:
# Method 1: Using conditional statements
df[df['column_name'] > 10]
# Example: df[df['age'] > 18]
# Method 2: Using the query() function
df.query('column_name > 10')
# Example: df.query('age > 18')
# Method 3: Combining multiple conditions
df[(df['column1'] > 10) & (df['column2'] == 'value')]
# Example: df[(df['age'] > 18) & (df['gender'] == 'Female')]
- Добавление и удаление столбцов.
Иногда нам необходимо добавить или удалить столбцы из фрейма данных. Вот как это можно сделать:
# Method 1: Adding a column
df['new_column'] = values
# Example: df['income'] = [50000, 60000, 70000]
# Method 2: Removing a column
df.drop('column_name', axis=1, inplace=True)
# Example: df.drop('income', axis=1, inplace=True)
- Обработка недостающих данных.
Обработка недостающих данных — распространенная проблема при анализе данных. Вот несколько способов решить эту проблему:
# Method 1: Dropping missing values
df.dropna()
# Example: df.dropna()
# Method 2: Filling missing values with a specific value
df.fillna(value)
# Example: df.fillna(0)
# Method 3: Interpolating missing values
df.interpolate()
# Example: df.interpolate()
- Сортировка и изменение порядка.
Чтобы изменить порядок строк или отсортировать фрейм данных, вы можете использовать следующие методы:
# Method 1: Sorting by a column
df.sort_values('column_name', ascending=False)
# Example: df.sort_values('age', ascending=False)
# Method 2: Reordering columns
df = df.reindex(columns=['column2', 'column1'])
# Example: df = df.reindex(columns=['age', 'name'])
В этой статье мы рассмотрели несколько методов формирования фрейма данных, включая выбор столбцов, фильтрацию строк, добавление и удаление столбцов, обработку отсутствующих данных, а также сортировку и изменение порядка. Освоив эти методы, вы будете хорошо подготовлены к эффективному манипулированию данными и извлечению ценной информации. Удачного формирования данных!