Матрицы неточностей — важный инструмент для оценки эффективности моделей классификации. Они предоставляют ценную информацию о точности, точности, полноте и рейтинге F1 прогнозов модели. В этой статье мы рассмотрим различные методы визуализации матриц путаницы с помощью Python, а также примеры кода. Эти визуализации помогают лучше понять эффективность модели и определить области, требующие улучшения.
Метод 1: использование Matplotlib
Matplotlib — популярная библиотека визуализации данных на Python. Мы можем создать график матрицы путаницы, используя функцию imshow(), чтобы отобразить матрицу в виде тепловой карты, а затем добавить метки и цветовые аннотации.
import matplotlib.pyplot as plt
import numpy as np
def plot_confusion_matrix(cm, classes):
plt.imshow(cm, interpolation='nearest', cmap=plt.cm.Blues)
plt.title('Confusion Matrix')
plt.colorbar()
tick_marks = np.arange(len(classes))
plt.xticks(tick_marks, classes, rotation=45)
plt.yticks(tick_marks, classes)
thresh = cm.max() / 2
for i, j in itertools.product(range(cm.shape[0]), range(cm.shape[1])):
plt.text(j, i, format(cm[i, j], 'd'),
horizontalalignment="center",
color="white" if cm[i, j] > thresh else "black")
plt.ylabel('True label')
plt.xlabel('Predicted label')
plt.tight_layout()
plt.show()
Метод 2: использование Seaborn
Seaborn — еще одна мощная библиотека для визуализации данных на Python. Он предоставляет высокоуровневый интерфейс для создания привлекательной и информативной статистической графики. Мы можем использовать функцию heatmap()от Seaborn для построения матрицы путаницы.
import seaborn as sns
def plot_confusion_matrix(cm, classes):
sns.heatmap(cm, annot=True, cmap='Blues', fmt='d')
plt.title('Confusion Matrix')
plt.xlabel('Predicted label')
plt.ylabel('True label')
plt.show()
Метод 3: использование Plotly
Plotly — это универсальная библиотека, позволяющая создавать интерактивные и легко настраиваемые визуализации. Мы можем использовать функцию heatmap()из Plotly, чтобы создать интерактивный график матрицы путаницы.
import plotly.graph_objects as go
def plot_confusion_matrix(cm, classes):
fig = go.Figure(data=go.Heatmap(z=cm, colorscale='Blues'))
fig.update_layout(title='Confusion Matrix',
xaxis_title='Predicted label',
yaxis_title='True label')
fig.show()
Визуализация матриц путаницы с помощью Python обеспечивает четкое и краткое представление эффективности модели классификации. В этой статье мы рассмотрели три популярных метода построения матриц путаницы: использование Matplotlib, Seaborn и Plotly. Каждый метод имеет свои преимущества, что позволяет вам выбрать тот, который лучше всего соответствует вашим потребностям. Включив эти визуализации в процесс оценки модели, вы сможете глубже понять сильные и слабые стороны ваших моделей классификации.