Полное руководство: чтение нескольких файлов CSV в отдельные фреймы данных в Python

В этой статье блога мы рассмотрим различные методы чтения нескольких файлов CSV в отдельные DataFrame с помощью Python. Независимо от того, работаете ли вы с большими наборами данных или вам необходимо анализировать несколько файлов одновременно, эти методы помогут вам эффективно обрабатывать ваши данные. Давайте погрузимся!

Метод 1: использование цикла For
Один простой подход — перебирать список файлов CSV и читать каждый файл в отдельный DataFrame. Вот пример:

import pandas as pd
import glob
csv_files = glob.glob("*.csv")  # Get a list of all CSV files in the current directory
dfs = []  # List to store the DataFrames
for file in csv_files:
    df = pd.read_csv(file)
    dfs.append(df)

Метод 2. Создание словаря фреймов данных
Если вы предпочитаете организовывать фреймы данных в словаре, вы можете использовать следующий метод:

import pandas as pd
import glob
csv_files = glob.glob("*.csv")  # Get a list of all CSV files in the current directory
dfs = {}  # Dictionary to store the DataFrames
for file in csv_files:
    df = pd.read_csv(file)
    dfs[file] = df

Метод 3: использование понимания списка
Для более краткого подхода вы можете использовать понимание списка для чтения файлов CSV в список DataFrames:

import pandas as pd
import glob
csv_files = glob.glob("*.csv")  # Get a list of all CSV files in the current directory
dfs = [pd.read_csv(file) for file in csv_files]

Метод 4: функция Pandas concat()
Если вы хотите объединить все файлы CSV в один DataFrame, вы можете использовать функцию concat()из pandas:

import pandas as pd
import glob
csv_files = glob.glob("*.csv")  # Get a list of all CSV files in the current directory
dfs = [pd.read_csv(file) for file in csv_files]
combined_df = pd.concat(dfs, ignore_index=True)

Метод 5: использование Pandas read_csv() с разными именами
Если вы предпочитаете иметь отдельные имена DataFrame для каждого CSV-файла, вы можете использовать комбинацию pandas read_csv()и именования динамических переменных:

import pandas as pd
import glob
csv_files = glob.glob("*.csv")  # Get a list of all CSV files in the current directory
for i, file in enumerate(csv_files):
    vars()["df_" + str(i)] = pd.read_csv(file)

В этой статье мы рассмотрели несколько методов чтения нескольких файлов CSV в отдельные фреймы данных в Python. Предпочитаете ли вы использовать циклы, словари, генераторы списков или функции pandas, у вас есть несколько вариантов на выбор в зависимости от ваших конкретных требований. Используя эти методы, вы можете эффективно обрабатывать большие наборы данных и с легкостью выполнять задачи анализа данных.