Комплексное руководство по расчету RMSE, MAE, MSE и R-квадрата вручную в R

В задачах анализа данных и машинного обучения важно оценивать эффективность прогнозных моделей. Одним из распространенных способов оценки точности модели является расчет различных показателей, таких как среднеквадратическая ошибка (RMSE), средняя абсолютная ошибка (MAE), среднеквадратическая ошибка (MSE) и R-квадрат (R²). В этой статье блога мы рассмотрим различные методы расчета этих показателей вручную в R, а также приведем примеры кода, иллюстрирующие их реализацию.

Метод 1: расчет RMSE
RMSE измеряет среднее расстояние между прогнозируемыми значениями и фактическими значениями. Вот как вы можете рассчитать его вручную:

actual <- c(3, 5, 7, 9)  # Actual values
predicted <- c(2.5, 5.1, 6.8, 8.9)  # Predicted values
rmse <- sqrt(mean((predicted - actual)^2))

Метод 2: расчет MAE
MAE представляет собой среднюю абсолютную разницу между прогнозируемыми и фактическими значениями. Вот пример того, как вычислить его вручную:

mae <- mean(abs(predicted - actual))

Метод 3: расчет MSE
MSE измеряет среднеквадратическую разницу между прогнозируемыми и фактическими значениями. Вот расчет вручную:

mse <- mean((predicted - actual)^2)

Метод 4: расчет R-квадрата (R²)
R-квадрат определяет долю дисперсии зависимой переменной, которую можно предсказать по независимой переменной(ям). Вот ручной способ расчета R-квадрата:

ss_total <- sum((actual - mean(actual))^2)  # Total sum of squares
ss_residual <- sum((actual - predicted)^2)  # Residual sum of squares
r_squared <- 1 - (ss_residual / ss_total)

В этой статье мы рассмотрели несколько методов ручного расчета общих показателей оценки, таких как RMSE, MAE, MSE и R-квадрат в R. Поняв эти расчеты, вы сможете глубже понять эффективность своих прогнозных моделей. Не забывайте использовать эти показатели для эффективной оценки и сравнения различных моделей.