Методы вменения ближайших соседей: методы заполнения недостающих данных

Вот несколько методов, связанных с вменением ближайших соседей:

  1. Вменение k-ближайших соседей (k-NN). Этот метод вменяет отсутствующие значения, находя k ближайших соседей к точке данных с отсутствующим значением, а затем беря среднее значение или большинство голосов этих соседей. чтобы оценить недостающее значение.

  2. Весовое вменение k-NN: аналогично вменению k-NN, но вместо простого среднего значения или голосования большинства k ближайших соседей взвешиваются на основе их близости к точке данных с отсутствующим значением. Ближайшие соседи имеют больший вес в процессе вменения.

  3. Горячее вменение колоды. В этом методе недостающие значения вставляются путем случайного выбора значения из аналогичной точки данных в наборе данных. Выбор обычно основан на сходстве других переменных или функций.

  4. Холодное вменение: похоже на вменение в горячем виде, но вместо выбора значения из набора данных значение берется из внешнего источника, например из отдельного набора данных или справочной таблицы.

  5. Множественное вменение. Этот подход предполагает создание множественных вменений с использованием вменения ближайших соседей или других методов, а затем анализ результатов на основе этих множественных вмененных наборов данных. Он учитывает неопределенность, связанную с вменением пропущенных значений.

  6. Завершение матрицы. Вменение ближайших соседей также можно использовать в задачах завершения матрицы, целью которых является заполнение пропущенных значений в матрице. Различные алгоритмы завершения матрицы, такие как разложение по сингулярным значениям (SVD) или методы факторизации матрицы, могут включать вменение ближайших соседей для оценки пропущенных значений.