DataFrames — это фундаментальная структура данных в библиотеке Python pandas, предназначенная для манипулирования и анализа данных. Добавление DataFrames позволяет нам объединять несколько наборов данных по вертикали, расширяя существующие данные новыми строками. В этой статье мы рассмотрим различные методы добавления DataFrames в Python, а также примеры кода.
Метод 1: использование функции add()
Функция add() в pandas позволяет просто объединять DataFrames. Он принимает другой DataFrame в качестве аргумента и добавляет его к текущему DataFrame, возвращая новый DataFrame с объединенными данными.
import pandas as pd
# Create the initial DataFrame
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': ['a', 'b', 'c']})
# Create the DataFrame to append
df2 = pd.DataFrame({'A': [4, 5, 6], 'B': ['d', 'e', 'f']})
# Append df2 to df1
df_appended = df1.append(df2)
print(df_appended)
Метод 2: использование функции concat()
Функция concat() в pandas позволяет более гибко объединять DataFrames. Он может объединять несколько кадров данных вдоль указанной оси, обеспечивая объединение как по строкам, так и по столбцам.
import pandas as pd
# Create the initial DataFrame
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': ['a', 'b', 'c']})
# Create the DataFrame to concatenate
df2 = pd.DataFrame({'A': [4, 5, 6], 'B': ['d', 'e', 'f']})
# Concatenate df1 and df2 vertically
df_concatenated = pd.concat([df1, df2])
print(df_concatenated)
Метод 3: использование метода доступа loc
Аксессор loc в pandas позволяет напрямую присваивать значения определенным строкам и столбцам в DataFrame. Используя loc для назначения нового DataFrame определенному индексу, мы можем добавить DataFrame.
import pandas as pd
# Create the initial DataFrame
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': ['a', 'b', 'c']})
# Create the DataFrame to append
df2 = pd.DataFrame({'A': [4, 5, 6], 'B': ['d', 'e', 'f']})
# Append df2 to df1 using loc
df1.loc[len(df1)] = df2.iloc[0]
print(df1)
Метод 4: использование функции merge()
Функция merge() в pandas позволяет объединять DataFrames на основе общего столбца или индекса. Объединив DataFrame с пустым DataFrame, мы можем добавить данные.
import pandas as pd
# Create the initial DataFrame
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': ['a', 'b', 'c']})
# Create the DataFrame to append
df2 = pd.DataFrame({'A': [4, 5, 6], 'B': ['d', 'e', 'f']})
# Append df2 to df1 using merge
df_appended = pd.merge(df1, pd.DataFrame(columns=df1.columns))
df_appended = df_appended.append(df2)
print(df_appended)
Метод 5: использование функции join()
Функция join() в pandas позволяет комбинировать фреймы данных на основе их индексов. Объединив DataFrame с пустым DataFrame, мы можем добавить данные.
import pandas as pd
# Create the initial DataFrame
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': ['a', 'b', 'c']})
# Create the DataFrame to append
df2 = pd.DataFrame({'A': [4, 5, 6], 'B': ['d', 'e', 'f']})
# Append df2 to df1 using join
df_appended = df1.join(pd.DataFrame(columns=df1.columns))
df_appended = df_appended.append(df2)
print(df_appended)
Добавление DataFrames — распространенная операция при анализе и манипулировании данными. В этой статье мы рассмотрели несколько методов добавления DataFrames в Python с использованием библиотеки pandas. Используя такие функции, как add(), concat(), loc accessor, merge() и join(), вы можете легко комбинировать DataFrames в соответствии с вашими конкретными требованиями. Понимание этих методов позволит вам эффективно решать задачи объединения данных в ваших проектах анализа данных.
Не забудьте выбрать подходящий метод в зависимости от вашего конкретного случая использования. Имея в своем распоряжении эти методы, вы можете уверенно манипулировать и добавлять фреймы данных в Python, оптимизируя рабочие процессы анализа данных.