drop_duulates(): этот метод позволяет удалять повторяющиеся строки из DataFrame, сохраняя только уникальные строки.
Пример:
unique_rows = df.drop_duplicates()
drop_duulates(subset): вы можете указать определенные столбцы (подмножество), которые следует учитывать при выявлении повторяющихся строк.
Пример:
unique_rows = df.drop_duplicates(subset=['col1', 'col2'])
duulated(): этот метод возвращает логическую серию, указывающую, какие строки являются дубликатами.
Пример:
duplicates = df.duplicated()
groupby(). Этот метод можно использовать для группировки DataFrame по определенным столбцам, а затем выбирать первую строку каждой группы для получения уникальных строк.
Пример:
unique_rows = df.groupby(['col1', 'col2']).first().reset_index()
unique(): эта функция возвращает массив уникальных значений из серии, что может быть полезно при работе с одним столбцом.
Пример:
unique_values = df['column'].unique()