Методы вменения ближайших соседей: методы заполнения недостающих данных - Fcodenotes

Вот несколько методов, связанных с вменением ближайших соседей:

Вменение k-ближайших соседей (k-NN). Этот метод вменяет отсутствующие значения, находя k ближайших соседей к точке данных с отсутствующим значением, а затем беря среднее значение или большинство голосов этих соседей. чтобы оценить недостающее значение.
Весовое вменение k-NN: аналогично вменению k-NN, но вместо простого среднего значения или голосования большинства k ближайших соседей взвешиваются на основе их близости к точке данных с отсутствующим значением. Ближайшие соседи имеют больший вес в процессе вменения.
Горячее вменение колоды. В этом методе недостающие значения вставляются путем случайного выбора значения из аналогичной точки данных в наборе данных. Выбор обычно основан на сходстве других переменных или функций.
Холодное вменение: похоже на вменение в горячем виде, но вместо выбора значения из набора данных значение берется из внешнего источника, например из отдельного набора данных или справочной таблицы.
Множественное вменение. Этот подход предполагает создание множественных вменений с использованием вменения ближайших соседей или других методов, а затем анализ результатов на основе этих множественных вмененных наборов данных. Он учитывает неопределенность, связанную с вменением пропущенных значений.
Завершение матрицы. Вменение ближайших соседей также можно использовать в задачах завершения матрицы, целью которых является заполнение пропущенных значений в матрице. Различные алгоритмы завершения матрицы, такие как разложение по сингулярным значениям (SVD) или методы факторизации матрицы, могут включать вменение ближайших соседей для оценки пропущенных значений.