Вот скрипт Python, который преобразует объект HTML в строку, заменяя теги символами новой строки:
from bs4 import BeautifulSoup
def html_to_string(html):
soup = BeautifulSoup(html, 'html.parser')
text = soup.get_text(separator='\n')
return text
# Example usage
html = '<p>This is a paragraph.<br>Here is another line.</p>'
result = html_to_string(html)
print(result)
Этот скрипт использует библиотеку BeautifulSoup, которая является популярным инструментом для анализа и навигации по документам HTML или XML. Он создает объект BeautifulSoup из входного HTML-кода, а затем использует метод get_text()для извлечения текстового содержимого. Аргумент separator='\n'гарантирует, что теги будут заменены символами новой строки.