Как отменить экранирование HTML-объектов в Python: методы и примеры

Чтобы отменить экранирование HTML-объектов в Python, вы можете использовать несколько методов. Вот несколько подходов, которые вы можете использовать:

  1. Использование модуля html:

    import html
    html_string = "<div>Hello, world!</div>"
    unescaped_string = html.unescape(html_string)
    print(unescaped_string)  # Output: <div>Hello, world!</div>
  2. Использование библиотеки beautifulsoup4:

    from bs4 import BeautifulSoup
    html_string = "&lt;div&gt;Hello, world!&lt;/div&gt;"
    soup = BeautifulSoup(html_string, 'html.parser')
    unescaped_string = soup.get_text()
    print(unescaped_string)  # Output: <div>Hello, world!</div>
  3. Использование модуля reи регулярных выражений:

    import re
    html_string = "&lt;div&gt;Hello, world!&lt;/div&gt;"
    unescaped_string = re.sub(r"&[a-zA-Z0-9#]+;", lambda m: html.unescape(m.group(0)), html_string)
    print(unescaped_string)  # Output: <div>Hello, world!</div>