Методы использования регулярных выражений для поиска тегов HTML

  1. Использование <.*?>

  2. Использование шаблона <(.*?)>: этот шаблон фиксирует имя тега внутри группы, что позволяет извлекать определенные имена тегов из HTML.

  3. Использование <\w+>

  4. Использование шаблона <[^>]+>: этот шаблон соответствует тегам HTML, которые не содержат в себе символ угловой скобки “>”.

Вот пример на Python, демонстрирующий использование регулярных выражений для поиска HTML-тегов:

import re
html = "<html><body><h1>Title</h1><p>Paragraph</p></body></html>"
tags = re.findall(r'<.*?>', html)
print(tags)

Выход:

['<html>', '<body>', '<h1>', '</h1>', '<p>', '</p>', '</body>', '</html>']