В этой статье блога мы рассмотрим различные методы чтения нескольких файлов CSV в отдельные DataFrame с помощью Python. Независимо от того, работаете ли вы с большими наборами данных или вам необходимо анализировать несколько файлов одновременно, эти методы помогут вам эффективно обрабатывать ваши данные. Давайте погрузимся!
Метод 1: использование цикла For
Один простой подход — перебирать список файлов CSV и читать каждый файл в отдельный DataFrame. Вот пример:
import pandas as pd
import glob
csv_files = glob.glob("*.csv") # Get a list of all CSV files in the current directory
dfs = [] # List to store the DataFrames
for file in csv_files:
df = pd.read_csv(file)
dfs.append(df)
Метод 2. Создание словаря фреймов данных
Если вы предпочитаете организовывать фреймы данных в словаре, вы можете использовать следующий метод:
import pandas as pd
import glob
csv_files = glob.glob("*.csv") # Get a list of all CSV files in the current directory
dfs = {} # Dictionary to store the DataFrames
for file in csv_files:
df = pd.read_csv(file)
dfs[file] = df
Метод 3: использование понимания списка
Для более краткого подхода вы можете использовать понимание списка для чтения файлов CSV в список DataFrames:
import pandas as pd
import glob
csv_files = glob.glob("*.csv") # Get a list of all CSV files in the current directory
dfs = [pd.read_csv(file) for file in csv_files]
Метод 4: функция Pandas concat()
Если вы хотите объединить все файлы CSV в один DataFrame, вы можете использовать функцию concat()
из pandas:
import pandas as pd
import glob
csv_files = glob.glob("*.csv") # Get a list of all CSV files in the current directory
dfs = [pd.read_csv(file) for file in csv_files]
combined_df = pd.concat(dfs, ignore_index=True)
Метод 5: использование Pandas read_csv() с разными именами
Если вы предпочитаете иметь отдельные имена DataFrame для каждого CSV-файла, вы можете использовать комбинацию pandas read_csv()
и именования динамических переменных:
import pandas as pd
import glob
csv_files = glob.glob("*.csv") # Get a list of all CSV files in the current directory
for i, file in enumerate(csv_files):
vars()["df_" + str(i)] = pd.read_csv(file)
В этой статье мы рассмотрели несколько методов чтения нескольких файлов CSV в отдельные фреймы данных в Python. Предпочитаете ли вы использовать циклы, словари, генераторы списков или функции pandas, у вас есть несколько вариантов на выбор в зависимости от ваших конкретных требований. Используя эти методы, вы можете эффективно обрабатывать большие наборы данных и с легкостью выполнять задачи анализа данных.