Удобное руководство: чтение нескольких файлов Excel в папке с помощью Pandas

В современном мире, управляемом данными, обработка нескольких файлов Excel — обычная задача для аналитиков данных и ученых. Популярная библиотека Python для обработки данных Pandas предоставляет несколько удобных методов для легкого чтения и обработки файлов Excel. В этом сообщении блога мы рассмотрим несколько методов использования Pandas для чтения каждого файла Excel в папке. Итак, давайте углубимся и найдем лучший подход для ваших конкретных потребностей!

Метод 1: использование модуля osи Pandas.
Первый метод предполагает использование модуля osдля перебора файлов в папке и Pandas для чтения каждого из них. Файл Excel. Вот пример фрагмента кода:

import os
import pandas as pd
folder_path = 'path/to/folder'
files = os.listdir(folder_path)
excel_files = [file for file in files if file.endswith('.xlsx')]
dataframes = []
for file in excel_files:
    file_path = os.path.join(folder_path, file)
    df = pd.read_excel(file_path)
    dataframes.append(df)
# Now you have a list of dataframes, each representing an Excel file in the folder

Метод 2: использование модуля globи Pandas
Модуль globобеспечивает более удобный способ получения путей к файлам на основе шаблонов. Вот пример фрагмента кода для чтения каждого файла Excel в папке с помощью globи Pandas:

import glob
import pandas as pd
folder_path = 'path/to/folder'
excel_files = glob.glob(folder_path + '/*.xlsx')
dataframes = []
for file_path in excel_files:
    df = pd.read_excel(file_path)
    dataframes.append(df)
# You now have a list of dataframes, each representing an Excel file in the folder

Метод 3: чтение файлов Excel в словарь
Если вы предпочитаете получать доступ к фреймам данных, используя имена файлов в качестве ключей, вы можете сохранить их в словаре. Вот пример фрагмента кода:

import os
import pandas as pd
folder_path = 'path/to/folder'
files = os.listdir(folder_path)
excel_files = [file for file in files if file.endswith('.xlsx')]
dataframes = {}
for file in excel_files:
    file_path = os.path.join(folder_path, file)
    df = pd.read_excel(file_path)
    dataframes[file] = df
# You now have a dictionary where keys are file names and values are corresponding dataframes

В этой статье мы рассмотрели три метода использования Pandas для чтения каждого файла Excel в папке. Используя возможности Pandas и Python для обработки файлов, вы можете эффективно обрабатывать и анализировать данные из нескольких файлов Excel. Независимо от того, решите ли вы перебирать файлы с помощью модуля os, использовать модуль globили хранить кадры данных в словаре, Pandas предоставляет гибкие решения, соответствующие вашим конкретным потребностям. Так что вперед, используйте эти методы и раскройте весь потенциал своих проектов по анализу данных!