Подробная шпаргалка по Pandas: основные методы и примеры

Pandas — это мощная библиотека для обработки и анализа данных на Python, широко используемая учеными и аналитиками данных. Он предоставляет эффективные структуры данных и функции для обработки и обработки структурированных данных. В этой статье мы рассмотрим подробную шпаргалку основных методов Pandas, сопровождаемую примерами кода.

  1. Структуры данных:

1.1. Серия:
Создание серии:

import pandas as pd
data = [1, 2, 3, 4, 5]
series = pd.Series(data)

Доступ к элементам серии:

print(series[0])  # Output: 1

1.2. DataFrame:
Создание DataFrame:

data = {'Name': ['John', 'Jane', 'Sam'],
        'Age': [25, 30, 35],
        'Country': ['USA', 'Canada', 'UK']}
df = pd.DataFrame(data)

Доступ к столбцам в DataFrame:

print(df['Name'])  # Output: John, Jane, Sam
  1. Манипулирование данными:

2.1. Фильтрация данных:

filtered_df = df[df['Age'] > 30]

2.2. Сортировка данных:

sorted_df = df.sort_values('Age')

2.3. Добавление нового столбца:

df['Salary'] = [50000, 60000, 70000]

2.4. Переименование столбцов:

df.rename(columns={'Name': 'Full Name'}, inplace=True)

2.5. Удаление повторяющихся строк:

df.drop_duplicates(inplace=True)
  1. Анализ данных:

3.1. Описательная статистика:

print(df.describe())

3.2. Группировка и агрегирование данных:

grouped_df = df.groupby('Country').mean()

3.3. Обработка пропущенных значений:

df.dropna()  # Drop rows with missing values
df.fillna(0)  # Fill missing values with 0
  1. Визуализация данных:

4.1. Линейный график:

df.plot(x='Year', y='Sales', kind='line')

4.2. Барный график:

df.plot(x='Country', y='Population', kind='bar')

4.3. Точечная диаграмма:

df.plot(x='Age', y='Income', kind='scatter')

В этой подробной шпаргалке Pandas описаны основные методы манипулирования, анализа и визуализации данных. Используя эти методы, вы можете эффективно обрабатывать структурированные данные с помощью Pandas в Python. Независимо от того, являетесь ли вы новичком или опытным специалистом по данным, эта шпаргалка послужит вам удобным справочником в вашем путешествии по анализу данных.

Не забудьте добавить эту шпаргалку в закладки для быстрого доступа, когда вам понадобится работать с Pandas!