Чтобы создать матрицу путаницы из двух столбцов в Pandas DataFrame, вы можете использовать библиотеку scikit-learn, которая предоставляет удобные функции для задач машинного обучения. Вот несколько методов с примерами кода:
Метод 1: использование функции confusion_matrix
из scikit-learn
from sklearn.metrics import confusion_matrix
# Assuming your DataFrame has two columns: 'actual' and 'predicted'
actual = df['actual']
predicted = df['predicted']
# Compute the confusion matrix
cm = confusion_matrix(actual, predicted)
print(cm)
Метод 2: использование функции crosstab
из Pandas
import pandas as pd
# Assuming your DataFrame has two columns: 'actual' and 'predicted'
actual = df['actual']
predicted = df['predicted']
# Compute the confusion matrix using crosstab
cm = pd.crosstab(actual, predicted)
print(cm)
Метод 3: вычисление матрицы путаницы вручную
import numpy as np
# Assuming your DataFrame has two columns: 'actual' and 'predicted'
actual = df['actual']
predicted = df['predicted']
# Get unique labels
labels = np.unique(np.concatenate((actual, predicted)))
# Initialize confusion matrix with zeros
cm = np.zeros((len(labels), len(labels)), dtype=int)
# Update the confusion matrix
for a, p in zip(actual, predicted):
cm[a, p] += 1
print(cm)