Вменение — это процесс замены отсутствующих или неполных данных оценочными значениями. В R существует несколько методов вменения. Вот некоторые из них, которые часто используются:
-
Вменение среднего значения: этот метод заменяет пропущенные значения средним значением доступных значений для этой переменной.
-
Медианное вменение. Подобно вменению среднего значения, этот метод заменяет пропущенные значения медианой доступных значений.
-
Вменение режима: Вменение режима заменяет отсутствующие значения модой (наиболее часто встречающееся значение) доступных значений.
-
Перенос последнего наблюдения вперед (LOCF): LOCF вменяет отсутствующие значения путем переноса последнего наблюдаемого значения в наборе данных.
-
Множественное вменение. Этот метод предполагает создание нескольких наборов вмененных данных, в которых пропущенные значения заменяются правдоподобными значениями на основе статистических моделей. Затем эти наборы данных анализируются, а результаты объединяются для учета неопределенности, вносимой вменением.
-
Вменение K-ближайших соседей (KNN): Вменение KNN оценивает недостающие значения, находя K ближайших соседей на основе других переменных и используя их значения для вменения недостающих данных.
-
Вменение регрессии. Этот метод использует модели регрессии для прогнозирования пропущенных значений на основе взаимосвязи между целевой переменной и другими переменными в наборе данных.
-
Вменение случайного леса. Вменение случайного леса использует алгоритм случайного леса для вменения пропущенных значений путем их прогнозирования на основе других переменных.
-
Алгоритм максимизации ожидания (EM). Алгоритм EM представляет собой итеративный метод, который оценивает пропущенные значения путем максимизации вероятности наблюдаемых данных. Он обычно используется для вменения пропущенных значений в многомерных нормальных распределениях.
-
Множественное вменение «горячей колоды». Этот метод вменяет пропущенные значения путем сопоставления записей с похожими наблюдаемыми значениями и случайного выбора одной из совпадающих записей для получения вмененных значений.