Методы оценки моделей машинного обучения: от точности к ROC-кривым - Fcodenotes

Вот несколько методов, которые обычно используются для оценки моделей машинного обучения:

Точность: измеряет долю правильно предсказанных меток или классов по сравнению с общим количеством прогнозов.
Точность: оценивается процент истинно положительных прогнозов среди всех положительных прогнозов. Это полезно, когда целью является минимизация ложных срабатываний.
Напомним: этот показатель измеряет процент истинно положительных прогнозов среди всех реальных положительных случаев. Это полезно, когда цель состоит в том, чтобы свести к минимуму ложноотрицательные результаты.
Оценка F1: это гармоническое среднее значение точности и полноты, обеспечивающее единый показатель, уравновешивающий оба показателя.
Матрица неточностей: это таблица, в которой прогнозируемые результаты сопоставлены с фактическими результатами, показаны истинные положительные, истинно отрицательные, ложноположительные и ложноотрицательные результаты.
Перекрестная проверка. Этот метод включает в себя разделение набора данных на несколько подмножеств, обучение модели на некоторых подмножествах и ее оценку на оставшихся подмножествах. Затем результаты усредняются для получения более надежной оценки.
Кривая ROC и AUC: кривая рабочих характеристик приемника (ROC) отображает долю истинно положительных результатов в сравнении с частотой ложных срабатываний при различных пороговых значениях классификации. Площадь под кривой (AUC) суммирует общую эффективность модели.
Среднеквадратическая ошибка (MSE): измеряется среднеквадратическая разница между прогнозируемыми и фактическими значениями. Он обычно используется в задачах регрессии.
Средняя абсолютная ошибка (MAE): рассчитывается средняя абсолютная разница между прогнозируемыми и фактическими значениями, обеспечивая более интерпретируемый показатель, чем MSE.
R-квадрат (R²): указывает долю дисперсии зависимой переменной, которую можно предсказать на основе независимых переменных. Он обычно используется в задачах регрессии.