Методы удаления повторяющихся столбцов из DataFrame в Python

Чтобы удалить несколько одинаковых столбцов из фрейма данных, вы можете использовать различные методы. Вот несколько подходов, которые вы можете рассмотреть:

  1. Метод 1: использование Pandas

    import pandas as pd
    # Create a dataframe
    df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9], 'D': [10, 11, 12], 'E': [13, 14, 15]})
    # Remove duplicate columns
    df = df.loc[:, ~df.columns.duplicated()]
    # Print the modified dataframe
    print(df)
  2. Метод 2: использование NumPy

    import numpy as np
    # Create a dataframe
    df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9], 'D': [10, 11, 12], 'E': [13, 14, 15]})
    # Convert dataframe to NumPy array and extract unique columns
    _, idx = np.unique(df.values, axis=1, return_index=True)
    df = df.iloc[:, idx]
    # Print the modified dataframe
    print(df)
  3. Метод 3: использование набора

    # Create a dataframe
    df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9], 'D': [10, 11, 12], 'E': [13, 14, 15]})
    # Convert dataframe to a set of tuples and extract unique columns
    unique_cols = set(tuple(col) for col in df.values.T)
    df = df.loc[:, [tuple(col) in unique_cols for col in df.values.T]]
    # Print the modified dataframe
    print(df)

Эти методы удалят повторяющиеся столбцы из кадра данных. Выберите метод, который лучше всего соответствует вашим требованиям.