Чтобы найти все HTML-файлы в текущем каталоге с помощью регулярных выражений Python, вы можете использовать модули osи re. Вот пример использования разных методов:
Метод 1: использование os.listdir()и re.match():
import os
import re
html_files = []
pattern = r'^[\w-]+\.(html|htm)$'
for file in os.listdir('.'):
if re.match(pattern, file, re.IGNORECASE):
html_files.append(file)
print(html_files)
Метод 2: использование os.scandir()и re.search():
import os
import re
html_files = []
pattern = r'.*\.(html|htm)$'
for entry in os.scandir('.'):
if entry.is_file() and re.search(pattern, entry.name, re.IGNORECASE):
html_files.append(entry.name)
print(html_files)
Метод 3. Использование понимания списка:
import os
import re
pattern = r'.*\.(html|htm)$'
html_files = [file for file in os.listdir('.') if re.search(pattern, file, re.IGNORECASE)]
print(html_files)
Эти методы используют регулярные выражения для сопоставления имен файлов, заканчивающихся на .htmlили .htm, без учета регистра. Полученные имена HTML-файлов сохраняются в списке html_files.