Чтобы отменить экранирование HTML-объектов в Python, вы можете использовать несколько методов. Вот несколько подходов, которые вы можете использовать:
-
Использование модуля
html:import html html_string = "<div>Hello, world!</div>" unescaped_string = html.unescape(html_string) print(unescaped_string) # Output: <div>Hello, world!</div> -
Использование библиотеки
beautifulsoup4:from bs4 import BeautifulSoup html_string = "<div>Hello, world!</div>" soup = BeautifulSoup(html_string, 'html.parser') unescaped_string = soup.get_text() print(unescaped_string) # Output: <div>Hello, world!</div> -
Использование модуля
reи регулярных выражений:import re html_string = "<div>Hello, world!</div>" unescaped_string = re.sub(r"&[a-zA-Z0-9#]+;", lambda m: html.unescape(m.group(0)), html_string) print(unescaped_string) # Output: <div>Hello, world!</div>