Под «Масштабированием данных» подразумевается процесс корректировки или преобразования данных в определенный диапазон или формат. Существует несколько методов, обычно используемых для масштабирования данных, в том числе:
- 
Масштабирование мин-макс (нормализация). Этот метод масштабирует данные до фиксированного диапазона, обычно от 0 до 1. Он вычитает минимальное значение из каждой точки данных, а затем делит его на разницу между максимальное и минимальное значения. 
- 
Стандартизация (нормализация Z-показателя): стандартизация преобразует данные так, чтобы они имели среднее значение 0 и стандартное отклонение 1. Среднее значение вычитается из каждой точки данных и делится на стандартное отклонение. 
- 
Надежное масштабирование. Надежное масштабирование похоже на мин-максное масштабирование, но вместо минимального и максимального значений использует медиану и межквартильный диапазон. Этот метод менее чувствителен к выбросам. 
- 
Преобразование журнала. Преобразование журнала полезно при работе с данными, имеющими широкий диапазон значений и смещенными вправо. Логарифмирование данных может сжать диапазон и сделать его более управляемым. 
- 
Масштабирование единичного вектора. Масштабирование единичного вектора, также известное как нормализация, масштабирует каждую точку данных до длины 1. Оно включает деление каждой точки данных на евклидову норму вектора данных. 
- 
Десятичное масштабирование. Десятичное масштабирование предполагает деление каждой точки данных на степень 10, чтобы привести ее в указанный диапазон. Например, деление на 10^k масштабирует данные до k десятичных знаков. 
- 
Максимальное абсолютное масштабирование. При максимальном абсолютном масштабировании данные масштабируются путем деления каждой точки данных на максимальное абсолютное значение в наборе данных. Этот метод сохраняет знак данных. 
- 
Преобразование ранга. Преобразование ранга заменяет каждую точку данных ее рангом или процентилем в наборе данных. Этот метод полезен при работе с данными, которые не соответствуют нормальному распределению, или при наличии выбросов.