Pandas — это мощная библиотека для обработки и анализа данных на Python, широко используемая учеными и аналитиками данных. Он предоставляет эффективные структуры данных и функции для обработки и обработки структурированных данных. В этой статье мы рассмотрим подробную шпаргалку основных методов Pandas, сопровождаемую примерами кода.
- Структуры данных:
1.1. Серия:
Создание серии:
import pandas as pd
data = [1, 2, 3, 4, 5]
series = pd.Series(data)
Доступ к элементам серии:
print(series[0]) # Output: 1
1.2. DataFrame:
Создание DataFrame:
data = {'Name': ['John', 'Jane', 'Sam'],
'Age': [25, 30, 35],
'Country': ['USA', 'Canada', 'UK']}
df = pd.DataFrame(data)
Доступ к столбцам в DataFrame:
print(df['Name']) # Output: John, Jane, Sam
- Манипулирование данными:
2.1. Фильтрация данных:
filtered_df = df[df['Age'] > 30]
2.2. Сортировка данных:
sorted_df = df.sort_values('Age')
2.3. Добавление нового столбца:
df['Salary'] = [50000, 60000, 70000]
2.4. Переименование столбцов:
df.rename(columns={'Name': 'Full Name'}, inplace=True)
2.5. Удаление повторяющихся строк:
df.drop_duplicates(inplace=True)
- Анализ данных:
3.1. Описательная статистика:
print(df.describe())
3.2. Группировка и агрегирование данных:
grouped_df = df.groupby('Country').mean()
3.3. Обработка пропущенных значений:
df.dropna() # Drop rows with missing values
df.fillna(0) # Fill missing values with 0
- Визуализация данных:
4.1. Линейный график:
df.plot(x='Year', y='Sales', kind='line')
4.2. Барный график:
df.plot(x='Country', y='Population', kind='bar')
4.3. Точечная диаграмма:
df.plot(x='Age', y='Income', kind='scatter')
В этой подробной шпаргалке Pandas описаны основные методы манипулирования, анализа и визуализации данных. Используя эти методы, вы можете эффективно обрабатывать структурированные данные с помощью Pandas в Python. Независимо от того, являетесь ли вы новичком или опытным специалистом по данным, эта шпаргалка послужит вам удобным справочником в вашем путешествии по анализу данных.
Не забудьте добавить эту шпаргалку в закладки для быстрого доступа, когда вам понадобится работать с Pandas!