Как найти HTML-файлы в каталоге с помощью регулярных выражений в Python

Чтобы найти все HTML-файлы в текущем каталоге с помощью регулярных выражений Python, вы можете использовать модули osи re. Вот пример использования разных методов:

Метод 1: использование os.listdir()и re.match():

import os
import re
html_files = []
pattern = r'^[\w-]+\.(html|htm)$'
for file in os.listdir('.'):
    if re.match(pattern, file, re.IGNORECASE):
        html_files.append(file)
print(html_files)

Метод 2: использование os.scandir()и re.search():

import os
import re
html_files = []
pattern = r'.*\.(html|htm)$'
for entry in os.scandir('.'):
    if entry.is_file() and re.search(pattern, entry.name, re.IGNORECASE):
        html_files.append(entry.name)
print(html_files)

Метод 3. Использование понимания списка:

import os
import re
pattern = r'.*\.(html|htm)$'
html_files = [file for file in os.listdir('.') if re.search(pattern, file, re.IGNORECASE)]
print(html_files)

Эти методы используют регулярные выражения для сопоставления имен файлов, заканчивающихся на .htmlили .htm, без учета регистра. Полученные имена HTML-файлов сохраняются в списке html_files.