Комплексное руководство по визуализации матрицы путаницы в Python: методы и примеры кода

Матрицы неточностей — важный инструмент для оценки эффективности моделей классификации. Они предоставляют ценную информацию о точности, точности, полноте и рейтинге F1 прогнозов модели. В этой статье мы рассмотрим различные методы визуализации матриц путаницы с помощью Python, а также примеры кода. Эти визуализации помогают лучше понять эффективность модели и определить области, требующие улучшения.

Метод 1: использование Matplotlib
Matplotlib — популярная библиотека визуализации данных на Python. Мы можем создать график матрицы путаницы, используя функцию imshow(), чтобы отобразить матрицу в виде тепловой карты, а затем добавить метки и цветовые аннотации.

import matplotlib.pyplot as plt
import numpy as np
def plot_confusion_matrix(cm, classes):
    plt.imshow(cm, interpolation='nearest', cmap=plt.cm.Blues)
    plt.title('Confusion Matrix')
    plt.colorbar()
    tick_marks = np.arange(len(classes))
    plt.xticks(tick_marks, classes, rotation=45)
    plt.yticks(tick_marks, classes)
    thresh = cm.max() / 2
    for i, j in itertools.product(range(cm.shape[0]), range(cm.shape[1])):
        plt.text(j, i, format(cm[i, j], 'd'),
                 horizontalalignment="center",
                 color="white" if cm[i, j] > thresh else "black")
    plt.ylabel('True label')
    plt.xlabel('Predicted label')
    plt.tight_layout()
    plt.show()

Метод 2: использование Seaborn
Seaborn — еще одна мощная библиотека для визуализации данных на Python. Он предоставляет высокоуровневый интерфейс для создания привлекательной и информативной статистической графики. Мы можем использовать функцию heatmap()от Seaborn для построения матрицы путаницы.

import seaborn as sns
def plot_confusion_matrix(cm, classes):
    sns.heatmap(cm, annot=True, cmap='Blues', fmt='d')
    plt.title('Confusion Matrix')
    plt.xlabel('Predicted label')
    plt.ylabel('True label')
    plt.show()

Метод 3: использование Plotly
Plotly — это универсальная библиотека, позволяющая создавать интерактивные и легко настраиваемые визуализации. Мы можем использовать функцию heatmap()из Plotly, чтобы создать интерактивный график матрицы путаницы.

import plotly.graph_objects as go
def plot_confusion_matrix(cm, classes):
    fig = go.Figure(data=go.Heatmap(z=cm, colorscale='Blues'))
    fig.update_layout(title='Confusion Matrix',
                      xaxis_title='Predicted label',
                      yaxis_title='True label')
    fig.show()

Визуализация матриц путаницы с помощью Python обеспечивает четкое и краткое представление эффективности модели классификации. В этой статье мы рассмотрели три популярных метода построения матриц путаницы: использование Matplotlib, Seaborn и Plotly. Каждый метод имеет свои преимущества, что позволяет вам выбрать тот, который лучше всего соответствует вашим потребностям. Включив эти визуализации в процесс оценки модели, вы сможете глубже понять сильные и слабые стороны ваших моделей классификации.