Методы создания матрицы путаницы из двух столбцов в Pandas DataFrame

Чтобы создать матрицу путаницы из двух столбцов в Pandas DataFrame, вы можете использовать библиотеку scikit-learn, которая предоставляет удобные функции для задач машинного обучения. Вот несколько методов с примерами кода:

Метод 1: использование функции confusion_matrixиз scikit-learn

from sklearn.metrics import confusion_matrix
# Assuming your DataFrame has two columns: 'actual' and 'predicted'
actual = df['actual']
predicted = df['predicted']
# Compute the confusion matrix
cm = confusion_matrix(actual, predicted)
print(cm)

Метод 2: использование функции crosstabиз Pandas

import pandas as pd
# Assuming your DataFrame has two columns: 'actual' and 'predicted'
actual = df['actual']
predicted = df['predicted']
# Compute the confusion matrix using crosstab
cm = pd.crosstab(actual, predicted)
print(cm)

Метод 3: вычисление матрицы путаницы вручную

import numpy as np
# Assuming your DataFrame has two columns: 'actual' and 'predicted'
actual = df['actual']
predicted = df['predicted']
# Get unique labels
labels = np.unique(np.concatenate((actual, predicted)))
# Initialize confusion matrix with zeros
cm = np.zeros((len(labels), len(labels)), dtype=int)
# Update the confusion matrix
for a, p in zip(actual, predicted):
    cm[a, p] += 1
print(cm)