как найти дубликаты pandas
3 года назад
Arthur Cheremisin
Ответы
1
Чтобы найти дубликаты в датафрейме pandas, можно использовать методо duplicated() или функцией drop_duplicates().
Метод duplicated() позволяет найти все строки, которые повторяются в данных. Метод возвращает серию булевых значений, где True указывает на дубликаты:
Функция drop_duplicates() позволяет удалить все дубликаты из данных. По умолчанию оставляет первое вхождение строки. Но это поведение можно изменить с помощью параметра keep='last' и оставить последнее вхождение:
Также можно указать столбцы, по которым нужно искать дубликаты, с помощью параметра subset=['col1', 'col2'].
год назад
Maksim Litvinov




.png)
