Чтение нескольких файлов Excel в Python может быть распространенной задачей при работе с анализом или обработкой данных. Модуль glob
в Python предоставляет удобный способ получения имен файлов, соответствующих заданному шаблону. В этой статье мы рассмотрим различные методы чтения всех файлов Excel в каталоге с помощью glob
и продемонстрируем примеры кода.
Метод 1: использование модуля glob
и библиотеки pandas
import glob
import pandas as pd
def read_excel_files(directory):
file_pattern = directory + '/*.xlsx' # Specify the file extension or pattern
excel_files = glob.glob(file_pattern)
dataframes = []
for file in excel_files:
df = pd.read_excel(file)
dataframes.append(df)
return dataframes
# Usage
excel_directory = 'path/to/directory' # Set the path to the directory containing Excel files
dfs = read_excel_files(excel_directory)
Метод 2. Использование модуля os
и библиотеки pandas
import os
import pandas as pd
def read_excel_files(directory):
excel_files = [file for file in os.listdir(directory) if file.endswith('.xlsx')]
dataframes = []
for file in excel_files:
file_path = os.path.join(directory, file)
df = pd.read_excel(file_path)
dataframes.append(df)
return dataframes
# Usage
excel_directory = 'path/to/directory' # Set the path to the directory containing Excel files
dfs = read_excel_files(excel_directory)
Метод 3. Использование модуля pathlib
и библиотеки pandas
from pathlib import Path
import pandas as pd
def read_excel_files(directory):
path = Path(directory)
excel_files = path.glob('*.xlsx')
dataframes = []
for file in excel_files:
df = pd.read_excel(file)
dataframes.append(df)
return dataframes
# Usage
excel_directory = 'path/to/directory' # Set the path to the directory containing Excel files
dfs = read_excel_files(excel_directory)
Метод 4. Использование модуля fnmatch
и библиотеки pandas
import fnmatch
import os
import pandas as pd
def read_excel_files(directory):
excel_files = fnmatch.filter(os.listdir(directory), '*.xlsx')
dataframes = []
for file in excel_files:
file_path = os.path.join(directory, file)
df = pd.read_excel(file_path)
dataframes.append(df)
return dataframes
# Usage
excel_directory = 'path/to/directory' # Set the path to the directory containing Excel files
dfs = read_excel_files(excel_directory)
В этой статье мы рассмотрели несколько методов чтения всех файлов Excel в каталоге с помощью модуля glob
в Python. Мы рассмотрели различные подходы, используя glob
, os
, pathlib
и fnmatch
, а также примеры кода для каждого метода. Эти методы обеспечивают гибкость и простоту работы с несколькими файлами Excel, повышая эффективность анализа и обработки данных.
Не забудьте установить необходимые библиотеки (pandas
, glob
, fnmatch
), если вы еще этого не сделали, и настройте пути к файлам в соответствии с ними. в вашу конкретную структуру каталогов. С помощью этих методов вы можете легко читать данные Excel и манипулировать ими на Python, что позволяет эффективно выполнять различные задачи анализа данных.