Получение кортежей уникальных строк в Pandas - Fcodenotes

drop_duulates(): этот метод позволяет удалять повторяющиеся строки из DataFrame, сохраняя только уникальные строки.

Пример:

unique_rows = df.drop_duplicates()

drop_duulates(subset): вы можете указать определенные столбцы (подмножество), которые следует учитывать при выявлении повторяющихся строк.

Пример:

unique_rows = df.drop_duplicates(subset=['col1', 'col2'])

duulated(): этот метод возвращает логическую серию, указывающую, какие строки являются дубликатами.

Пример:

duplicates = df.duplicated()

groupby(). Этот метод можно использовать для группировки DataFrame по определенным столбцам, а затем выбирать первую строку каждой группы для получения уникальных строк.

Пример:

unique_rows = df.groupby(['col1', 'col2']).first().reset_index()

unique(): эта функция возвращает массив уникальных значений из серии, что может быть полезно при работе с одним столбцом.

Пример:

unique_values = df['column'].unique()