Методы нормализации кадра данных Pandas: мин-макс, Z-оценка, десятичное масштабирование, логарифмическое преобразование, единичный вектор

Чтобы нормализовать DataFrame pandas, вы можете использовать различные методы. Вот несколько часто используемых подходов:

  1. Нормализация мин-макс:

    from sklearn.preprocessing import MinMaxScaler
    scaler = MinMaxScaler()
    normalized_df = pd.DataFrame(scaler.fit_transform(df), columns=df.columns)
  2. Нормализация Z-показателя:

    from sklearn.preprocessing import StandardScaler
    scaler = StandardScaler()
    normalized_df = pd.DataFrame(scaler.fit_transform(df), columns=df.columns)
  3. Десятичное масштабирование:

    normalized_df = df / (10  np.ceil(np.log10(df.abs().max())))
  4. Преобразование журнала:

    normalized_df = np.log1p(df)
  5. Преобразование единичного вектора:

    from sklearn.preprocessing import Normalizer
    scaler = Normalizer()
    normalized_df = pd.DataFrame(scaler.fit_transform(df), columns=df.columns)

Эти методы предоставляют различные способы нормализации вашего DataFrame в зависимости от конкретных требований ваших данных. Выберите тот, который лучше всего соответствует вашим потребностям.