Общие методы преобразования данных в Scikit-Learn с примерами кода

Фрагмент кода «fit(x).transform(x.astype(float))» написан на Python и связан с преобразованием данных с использованием библиотеки машинного обучения, такой как scikit-learn. Кажется, это предполагает подгонку объекта-трансформера к данным «x», а затем преобразование данных после преобразования их в тип данных с плавающей запятой.

Вот некоторые распространенные методы, связанные с преобразованием данных в scikit-learn, с примерами кода:

  1. StandardScaler:
    Этот метод масштабирует объекты так, чтобы они имели нулевое среднее значение и единичную дисперсию.

    from sklearn.preprocessing import StandardScaler
    
    scaler = StandardScaler()
    x_transformed = scaler.fit_transform(x.astype(float))
  2. MinMaxScaler:
    Этот метод масштабирует объекты до заданного диапазона (по умолчанию — [0, 1]).

    from sklearn.preprocessing import MinMaxScaler
    
    scaler = MinMaxScaler()
    x_transformed = scaler.fit_transform(x.astype(float))
  3. RobustScaler:
    Этот метод масштабирует функции с использованием статистики, устойчивой к выбросам.

    from sklearn.preprocessing import RobustScaler
    
    scaler = RobustScaler()
    x_transformed = scaler.fit_transform(x.astype(float))
  4. OneHotEncoder:
    Этот метод кодирует категориальные целочисленные функции как горячие векторы.

    from sklearn.preprocessing import OneHotEncoder
    
    encoder = OneHotEncoder()
    x_transformed = encoder.fit_transform(x.astype(float))
  5. LabelEncoder:
    Этот метод преобразует категориальные метки в целые числа.

    from sklearn.preprocessing import LabelEncoder
    
    encoder = LabelEncoder()
    x_transformed = encoder.fit_transform(x.astype(float))