Вот несколько методов, которые обычно используются для оценки моделей машинного обучения:
-
Точность: измеряет долю правильно предсказанных меток или классов по сравнению с общим количеством прогнозов.
-
Точность: оценивается процент истинно положительных прогнозов среди всех положительных прогнозов. Это полезно, когда целью является минимизация ложных срабатываний.
-
Напомним: этот показатель измеряет процент истинно положительных прогнозов среди всех реальных положительных случаев. Это полезно, когда цель состоит в том, чтобы свести к минимуму ложноотрицательные результаты.
-
Оценка F1: это гармоническое среднее значение точности и полноты, обеспечивающее единый показатель, уравновешивающий оба показателя.
-
Матрица неточностей: это таблица, в которой прогнозируемые результаты сопоставлены с фактическими результатами, показаны истинные положительные, истинно отрицательные, ложноположительные и ложноотрицательные результаты.
-
Перекрестная проверка. Этот метод включает в себя разделение набора данных на несколько подмножеств, обучение модели на некоторых подмножествах и ее оценку на оставшихся подмножествах. Затем результаты усредняются для получения более надежной оценки.
-
Кривая ROC и AUC: кривая рабочих характеристик приемника (ROC) отображает долю истинно положительных результатов в сравнении с частотой ложных срабатываний при различных пороговых значениях классификации. Площадь под кривой (AUC) суммирует общую эффективность модели.
-
Среднеквадратическая ошибка (MSE): измеряется среднеквадратическая разница между прогнозируемыми и фактическими значениями. Он обычно используется в задачах регрессии.
-
Средняя абсолютная ошибка (MAE): рассчитывается средняя абсолютная разница между прогнозируемыми и фактическими значениями, обеспечивая более интерпретируемый показатель, чем MSE.
-
R-квадрат (R²): указывает долю дисперсии зависимой переменной, которую можно предсказать на основе независимых переменных. Он обычно используется в задачах регрессии.