Полное руководство по чтению файлов XLSX в Python: несколько методов, объясненных примерами кода

Чтение файлов XLSX — распространенная задача при обработке и анализе данных с использованием Python. Файлы XLSX широко используются для хранения табличных данных, а Python предоставляет несколько библиотек и методов для чтения и извлечения данных из этих файлов. В этой статье блога мы рассмотрим несколько методов чтения файлов XLSX на Python, а также приведем примеры кода для каждого метода.

Метод 1: использование библиотеки Pandas
Pandas — это мощная библиотека манипулирования данными на Python. Он предоставляет простой в использовании интерфейс для чтения файлов XLSX.

import pandas as pd
# Read the XLSX file
df = pd.read_excel('file.xlsx')
# Print the DataFrame
print(df)

Метод 2: использование библиотеки Openpyxl
Openpyxl — популярная библиотека для работы с файлами Excel в Python. Его можно использовать для чтения файлов XLSX и извлечения данных.

from openpyxl import load_workbook
# Load the XLSX file
wb = load_workbook('file.xlsx')
# Select the active sheet
sheet = wb.active
# Iterate over rows and columns
for row in sheet.iter_rows():
    for cell in row:
        # Access cell values
        print(cell.value)

Метод 3: использование библиотеки Xlrd
Xlrd — еще одна библиотека для чтения данных из файлов Excel. Он поддерживает старые форматы файлов XLS, а также XLSX.

import xlrd
# Open the XLSX file
wb = xlrd.open_workbook('file.xlsx')
# Select the first sheet
sheet = wb.sheet_by_index(0)
# Iterate over rows and columns
for row in range(sheet.nrows):
    for col in range(sheet.ncols):
        # Access cell values
        print(sheet.cell_value(row, col))

Метод 4. Использование библиотеки Tablib
Tablib – это универсальная библиотека, поддерживающая чтение и управление табличными данными в различных форматах, включая XLSX.

import tablib
# Load the XLSX file
data = tablib.Dataset().load(open('file.xlsx').read())
# Access data rows
for row in data:
    # Access cell values
    print(row)

В этой статье мы рассмотрели несколько методов чтения файлов XLSX в Python. Мы рассмотрели использование таких библиотек, как Pandas, Openpyxl, Xlrd и Tablib, и предоставили примеры кода для каждого метода. В зависимости от ваших конкретных требований и сложности ваших данных вы можете выбрать метод, который лучше всего соответствует вашим потребностям. Имея в своем распоряжении эти методы, вы можете легко читать и извлекать данные из файлов XLSX с помощью Python, что позволяет эффективно выполнять различные задачи по обработке данных.