Получение кортежей уникальных строк в Pandas

  1. drop_duulates(): этот метод позволяет удалять повторяющиеся строки из DataFrame, сохраняя только уникальные строки.

Пример:

unique_rows = df.drop_duplicates()
  1. drop_duulates(subset): вы можете указать определенные столбцы (подмножество), которые следует учитывать при выявлении повторяющихся строк.

Пример:

unique_rows = df.drop_duplicates(subset=['col1', 'col2'])
  1. duulated(): этот метод возвращает логическую серию, указывающую, какие строки являются дубликатами.

Пример:

duplicates = df.duplicated()
  1. groupby(). Этот метод можно использовать для группировки DataFrame по определенным столбцам, а затем выбирать первую строку каждой группы для получения уникальных строк.

Пример:

unique_rows = df.groupby(['col1', 'col2']).first().reset_index()
  1. unique(): эта функция возвращает массив уникальных значений из серии, что может быть полезно при работе с одним столбцом.

Пример:

unique_values = df['column'].unique()