Чтобы вернуть первое появление дубликатов в DataFrame pandas, вы можете использовать различные методы. Вот несколько подходов с примерами кода:
Метод 1: использование метода дублированного
и логического индексирования
import pandas as pd
# Create a sample DataFrame
df = pd.DataFrame({'A': [1, 2, 3, 3, 4, 5, 6, 6, 7]})
# Find the first occurrence of duplicates
duplicates = df[df.duplicated(keep='first')]
# Output the first occurrence of duplicates
print(duplicates)
Метод 2: использование метода drop_duplications
с параметром keep
, установленным в значение 'first'
import pandas as pd
# Create a sample DataFrame
df = pd.DataFrame({'A': [1, 2, 3, 3, 4, 5, 6, 6, 7]})
# Find the first occurrence of duplicates
duplicates = df.drop_duplicates(keep='first')
# Output the first occurrence of duplicates
print(duplicates)
Метод 3: использование метода дублированный
с параметром keep
, установленным в значение 'first'
и параметром subset
указать столбцы
import pandas as pd
# Create a sample DataFrame
df = pd.DataFrame({'A': [1, 2, 3, 3, 4, 5, 6, 6, 7],
'B': ['a', 'b', 'c', 'c', 'd', 'e', 'f', 'f', 'g']})
# Find the first occurrence of duplicates based on column 'A'
duplicates = df[df.duplicated(subset='A', keep='first')]
# Output the first occurrence of duplicates
print(duplicates)
Эти методы вернут первое появление дубликатов в DataFrame на основе указанных столбцов. Настройте код в соответствии с вашей конкретной структурой DataFrame и именами столбцов.