Комплексное руководство по изменению имен столбцов в Pandas: методы и примеры

При анализе данных манипулирование именами столбцов — распространенная задача. Pandas, мощная библиотека манипулирования данными на Python, предлагает несколько способов легкого изменения имен столбцов. В этой статье мы рассмотрим различные методы с примерами кода, которые помогут вам понять и эффективно применять эти методы.

Метод 1: переименование столбцов с помощью функции rename()
Функция rename()в pandas позволяет изменять имена столбцов, предоставляя объект, подобный словарю, который отображает старые имена столбцов на новые.

import pandas as pd
# Create a sample DataFrame
data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)
# Rename columns using rename()
df.rename(columns={'A': 'New_A', 'B': 'New_B'}, inplace=True)
# Display the updated DataFrame
print(df)

Метод 2. Непосредственное присвоение имен новым столбцам
Вы можете напрямую назначить новый список имен столбцов атрибуту columnsDataFrame.

import pandas as pd
# Create a sample DataFrame
data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)
# Assign new column names
df.columns = ['New_A', 'New_B']
# Display the updated DataFrame
print(df)

Метод 3: использование функции set_axis()
Функция set_axis()позволяет изменять имена столбцов, напрямую указав новые имена.

import pandas as pd
# Create a sample DataFrame
data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)
# Change column names using set_axis()
new_column_names = ['New_A', 'New_B']
df.set_axis(new_column_names, axis='columns', inplace=True)
# Display the updated DataFrame
print(df)

Метод 4. Применение методов преобразования строк
Вы можете использовать методы преобразования строк, такие как str.replace()или регулярные выражения, для выборочного изменения имен столбцов.

import pandas as pd
# Create a sample DataFrame
data = {'A_B_C': [1, 2, 3], 'D_E_F': [4, 5, 6]}
df = pd.DataFrame(data)
# Change column names using string transformation
df.columns = df.columns.str.replace('_', '-')
# Display the updated DataFrame
print(df)

В этой статье мы рассмотрели несколько способов изменения имен столбцов в Pandas. Используя функцию rename(), напрямую присваивая имена новым столбцам, используя функцию set_axis()или применяя методы преобразования строк, вы можете легко изменить имена столбцов в соответствии с вашими конкретными требованиями. Понимание этих методов позволит вам выполнять эффективные задачи анализа данных и манипулирования ими с помощью Pandas.