Простые способы объединения файлов CSV с использованием Pandas в Python

В этой статье блога мы рассмотрим различные методы объединения файлов CSV в Python с использованием мощной библиотеки Pandas. Независимо от того, являетесь ли вы новичком или опытным аналитиком данных, эти простые в реализации методы помогут вам объединить несколько файлов CSV в единый набор данных. Итак, возьмите свой любимый редактор кода и приступайте!

Метод 1: использование функции Pandas concat()
Один из самых простых способов объединения файлов CSV — использование функции concat(), предоставляемой Pandas. Эта функция позволяет объединить несколько кадров данных вдоль указанной оси.

import pandas as pd
# Read CSV files
df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')
# Merge CSV files using concat()
merged_df = pd.concat([df1, df2])
# Save merged DataFrame to a new CSV file
merged_df.to_csv('merged_files.csv', index=False)

Метод 2: использование функции Append() Pandas.
Еще один удобный метод — использование функции append(), которая добавляет строки одного DataFrame к другому. Этот подход полезен, когда вам нужно объединить большое количество CSV-файлов.

import pandas as pd
# Read CSV files
df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')
# Merge CSV files using append()
merged_df = df1.append(df2)
# Save merged DataFrame to a new CSV file
merged_df.to_csv('merged_files.csv', index=False)

Метод 3: использование функции Pandas merge()
Если ваши CSV-файлы имеют общий столбец, вы можете использовать функцию merge()для выполнения слияния в стиле базы данных. Этот метод особенно полезен, когда вам нужно объединить файлы на основе совпадающих значений в определенном столбце.

import pandas as pd
# Read CSV files
df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')
# Merge CSV files using merge()
merged_df = pd.merge(df1, df2, on='common_column')
# Save merged DataFrame to a new CSV file
merged_df.to_csv('merged_files.csv', index=False)

Метод 4: использование функции Pandas join()
Функция join()в Pandas позволяет объединять файлы CSV на основе индекса DataFrame или определенного столбца. Это полезно, если вы хотите объединить файлы с разными именами столбцов.

import pandas as pd
# Read CSV files
df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')
# Merge CSV files using join()
merged_df = df1.join(df2.set_index('index_column'), on='common_column')
# Save merged DataFrame to a new CSV file
merged_df.to_csv('merged_files.csv', index=False)

В этой статье мы рассмотрели несколько методов объединения файлов CSV с использованием библиотеки Pandas в Python. Мы рассмотрели функции concat(), append(), merge()и join(), каждая из которых обеспечивает гибкость и удобство для различных сценариев слияния.. Используя эти методы, вы можете эффективно объединить несколько файлов CSV и оптимизировать рабочий процесс анализа данных. Приятного кодирования!