Эффективные способы чтения нескольких файлов Excel с использованием Glob в Python

Чтение нескольких файлов Excel в Python может быть распространенной задачей при работе с анализом или обработкой данных. Модуль globв Python предоставляет удобный способ получения имен файлов, соответствующих заданному шаблону. В этой статье мы рассмотрим различные методы чтения всех файлов Excel в каталоге с помощью globи продемонстрируем примеры кода.

Метод 1: использование модуля globи библиотеки pandas

import glob
import pandas as pd
def read_excel_files(directory):
    file_pattern = directory + '/*.xlsx'  # Specify the file extension or pattern
    excel_files = glob.glob(file_pattern)
    dataframes = []

    for file in excel_files:
        df = pd.read_excel(file)
        dataframes.append(df)

    return dataframes
# Usage
excel_directory = 'path/to/directory'  # Set the path to the directory containing Excel files
dfs = read_excel_files(excel_directory)

Метод 2. Использование модуля osи библиотеки pandas

import os
import pandas as pd
def read_excel_files(directory):
    excel_files = [file for file in os.listdir(directory) if file.endswith('.xlsx')]
    dataframes = []

    for file in excel_files:
        file_path = os.path.join(directory, file)
        df = pd.read_excel(file_path)
        dataframes.append(df)

    return dataframes
# Usage
excel_directory = 'path/to/directory'  # Set the path to the directory containing Excel files
dfs = read_excel_files(excel_directory)

Метод 3. Использование модуля pathlibи библиотеки pandas

from pathlib import Path
import pandas as pd
def read_excel_files(directory):
    path = Path(directory)
    excel_files = path.glob('*.xlsx')
    dataframes = []

    for file in excel_files:
        df = pd.read_excel(file)
        dataframes.append(df)

    return dataframes
# Usage
excel_directory = 'path/to/directory'  # Set the path to the directory containing Excel files
dfs = read_excel_files(excel_directory)

Метод 4. Использование модуля fnmatchи библиотеки pandas

import fnmatch
import os
import pandas as pd
def read_excel_files(directory):
    excel_files = fnmatch.filter(os.listdir(directory), '*.xlsx')
    dataframes = []

    for file in excel_files:
        file_path = os.path.join(directory, file)
        df = pd.read_excel(file_path)
        dataframes.append(df)

    return dataframes
# Usage
excel_directory = 'path/to/directory'  # Set the path to the directory containing Excel files
dfs = read_excel_files(excel_directory)

В этой статье мы рассмотрели несколько методов чтения всех файлов Excel в каталоге с помощью модуля globв Python. Мы рассмотрели различные подходы, используя glob, os, pathlibи fnmatch, а также примеры кода для каждого метода. Эти методы обеспечивают гибкость и простоту работы с несколькими файлами Excel, повышая эффективность анализа и обработки данных.

Не забудьте установить необходимые библиотеки (pandas, glob, fnmatch), если вы еще этого не сделали, и настройте пути к файлам в соответствии с ними. в вашу конкретную структуру каталогов. С помощью этих методов вы можете легко читать данные Excel и манипулировать ими на Python, что позволяет эффективно выполнять различные задачи анализа данных.