Комплексное руководство по созданию индекса Pandas: методы и примеры

Pandas — мощная библиотека Python, широко используемая для анализа и обработки данных. Одним из фундаментальных компонентов DataFrame Pandas является индекс, который обеспечивает ссылку на строки на основе меток. В этой статье блога мы рассмотрим различные методы создания индекса Pandas, сопровождаемые примерами кода. Независимо от того, новичок вы или опытный специалист по данным, это подробное руководство поможет вам понять различные способы настройки индекса DataFrame.

Метод 1: использование индекса по умолчанию.
По умолчанию, когда вы создаете DataFrame без указания индекса, Pandas назначает числовой индекс, начиная с 0. Вот пример:

import pandas as pd
data = {'Name': ['John', 'Emily', 'Michael'],
        'Age': [25, 30, 35],
        'City': ['New York', 'London', 'Paris']}
df = pd.DataFrame(data)
print(df)

Выход:

   Name  Age      City
0  John   25  New York
1  Emily  30    London
2  Michael 35    Paris

Метод 2: установка столбца в качестве индекса
Вы можете выбрать конкретный столбец, который будет служить индексом, с помощью метода set_index(). Вот пример:

df = df.set_index('Name')
print(df)

Выход:

        Age      City
Name                 
John     25  New York
Emily    30    London
Michael  35    Paris

Метод 3: установка диапазона значений в качестве индекса
Класс RangeIndexпозволяет создать индекс с диапазоном значений. Вот пример:

df.index = pd.RangeIndex(start=10, stop=13)
print(df)

Выход:

        Age      City
10     25  New York
11     30    London
12     35    Paris

Метод 4. Использование пользовательского списка в качестве индекса.
Вы можете установить собственный список в качестве индекса, используя класс Index. Вот пример:

custom_index = pd.Index(['A', 'B', 'C'], name='Index')
df.index = custom_index
print(df)

Выход:

       Age      City
Index                 
A       25  New York
B       30    London
C       35    Paris

Метод 5. Создание иерархического индекса.
Если вашим данным требуется многоуровневый индекс, вы можете создать иерархический индекс, используя класс MultiIndex. Вот пример:

data = {'Name': ['John', 'John', 'Emily', 'Emily', 'Michael', 'Michael'],
        'Year': [2019, 2020, 2019, 2020, 2019, 2020],
        'Value': [10, 15, 20, 25, 30, 35]}
df = pd.DataFrame(data)
df.set_index(['Name', 'Year'], inplace=True)
print(df)

Выход:

            Value
Name    Year       
John    2019    10
        2020    15
Emily   2019    20
        2020    25
Michael 2019    30
        2020    35

В этой статье мы рассмотрели несколько методов создания индексов Pandas. Вы узнали, как использовать индекс по умолчанию, устанавливать столбец в качестве индекса, создавать индекс диапазона, устанавливать в качестве индекса пользовательский список и создавать иерархические индексы. Понимая эти методы, вы сможете эффективно управлять своими данными и манипулировать ими с помощью Pandas. Поэкспериментируйте с этими методами, чтобы расширить возможности анализа данных и получить больший контроль над индексами DataFrame.

Не забудьте оптимизировать публикацию в блоге, добавив релевантные ключевые слова и метатеги, чтобы улучшить ее видимость в поисковых системах.