Используйте df.columns.difference в Python для сравнения DataFrame

Метод df.columns.differenceиспользуется для поиска столбцов в DataFrame, которые присутствуют в одном DataFrame, но отсутствуют в другом. Он возвращает заданную разницу столбцов.

Вот несколько методов, которые можно использовать с df.columns.difference:

  1. Нахождение разных столбцов между двумя кадрами данных:

    diff_columns = df1.columns.difference(df2.columns)

    Это вернет список столбцов, которые присутствуют в df1, но отсутствуют в df2.

  2. Проверка наличия в двух DataFrame разных столбцов:

    has_diff_columns = not df1.columns.difference(df2.columns).empty

    Это вернет логическое значение, указывающее, есть ли какие-либо разные столбцы между двумя кадрами данных.

  3. Фильтрация DataFrame на основе разных столбцов:

    filtered_df = df[df.columns.difference(differing_columns)]

    Это создаст новый DataFrame filtered_df, который будет содержать только столбцы, присутствующие в исходном DataFrame df, но не в differing_columns.

  4. Получение общих столбцов между двумя DataFrame:

    common_columns = df1.columns.intersection(df2.columns)

    Это вернет список столбцов, общих для df1и df2.