Чтобы удалить выбросы с помощью медианного значения и метода ограничения, вы можете выполнить следующие действия:
-
Вычислить медианное значение. Найдите медиану набора данных, которая является средним значением, когда данные расположены в порядке возрастания или убывания.
-
Определите межквартильный размах (IQR): IQR является мерой статистической дисперсии и рассчитывается как разница между первым квартилем (Q1) и третьим квартилем (Q3). Он представляет собой диапазон, в пределах которого находится большинство точек данных.
-
Определите выбросы: любая точка данных, которая находится ниже Q1 – 1,5 IQR или выше Q3 + 1,5IQR, считается выбросом.
-
Замените выбросы медианным значением. Замените выбросы рассчитанным медианным значением. Этот подход гарантирует, что экстремальные значения будут заменены более репрезентативным показателем из набора данных.
-
Ограничить значения. Альтернативно вы можете ограничить выбросы, установив пороговое значение. Все значения ниже нижнего порога или выше верхнего порога будут заменены ближайшим допустимым значением. В этом случае в качестве ограничения можно использовать медианное значение.
Используя эти шаги, вы можете эффективно удалить выбросы, заменив их медианным значением или ограничив их.