В области обработки естественного языка (НЛП) тематическое моделирование – популярный метод, используемый для выявления скрытых тематических структур в коллекции документов. Одним из мощных инструментов для визуализации тематических моделей является PyLDAvis, библиотека Python, которая обеспечивает интерактивную визуализацию для изучения тем, распределения слов и отношений между темами документа. В этой статье блога мы рассмотрим различные методы экспорта визуализаций PyLDAvis в HTML, что позволит вам с легкостью делиться и встраивать свои тематические модели.
Методы экспорта PyLDAvis в HTML:
Метод 1: использование функции «save_html».
Самый простой способ экспортировать PyLDAvis в HTML — использовать встроенную функцию save_html. Эта функция позволяет напрямую сохранить визуализацию в виде HTML-файла. Вот пример:
import pyLDAvis
import pyLDAvis.gensim
from gensim.models import LdaModel
# Generate your LDA model
# Create the PyLDAvis visualization
vis_data = pyLDAvis.gensim.prepare(lda_model, corpus, dictionary)
# Save the visualization as HTML
pyLDAvis.save_html(vis_data, 'output.html')
Метод 2: сохранение PyLDAvis в формате HTML с использованием Matplotlib
Если вы предпочитаете больше контроля над визуальными аспектами экспортируемого HTML, вы можете использовать Matplotlib для сохранения рисунка PyLDAvis в виде изображения, а затем встроить его в файл HTML. Вот пример:
import matplotlib.pyplot as plt
import io
import base64
# Generate your LDA model
# Create the PyLDAvis visualization
vis_data = pyLDAvis.gensim.prepare(lda_model, corpus, dictionary)
# Convert the visualization to a PNG image
fig = pyLDAvis.display(vis_data)
buffer = io.BytesIO()
plt.savefig(buffer, format='png')
buffer.seek(0)
data = base64.b64encode(buffer.read()).decode()
# Generate the HTML code with the embedded image
html_code = f'<img src="data:image/png;base64,{data}">'
# Save the HTML code to a file
with open('output.html', 'w') as f:
f.write(html_code)
Метод 3: экспорт PyLDAvis в HTML с помощью Flask
Если вы работаете над веб-приложением или хотите динамически обслуживать визуализацию PyLDAvis, вы можете использовать веб-инфраструктуру Flask для создания HTML-страниц «на лету». Вот пример:
from flask import Flask, render_template_string
app = Flask(__name__)
# Generate your LDA model
# Create the PyLDAvis visualization
vis_data = pyLDAvis.gensim.prepare(lda_model, corpus, dictionary)
# Define a Flask route to serve the visualization
@app.route('/')
def index():
return render_template_string(
'<!DOCTYPE html><html><head><title>PyLDAvis Visualization</title></head><body>'
'{{ vis_data.html }}'
'</body></html>',
vis_data=vis_data.to_dict()
)
if __name__ == '__main__':
app.run()
В этой статье мы рассмотрели различные методы экспорта визуализаций PyLDAvis в HTML. Независимо от того, предпочитаете ли вы простой экспорт файлов, встраивание визуализации в виде изображения или ее динамическое использование с помощью Flask, теперь у вас есть ряд возможностей поделиться своими тематическими моделями с другими. Поэкспериментируйте с этими методами и выберите тот, который лучше всего соответствует вашим потребностям, чтобы создавать увлекательные интерактивные HTML-визуализации ваших тематических моделей.