drop_duplicates()
데이터프레임.drop_duplicates(subset=열이름, keep='first', inplace=False, ignore_index=False)
형태로 사용한다
subset은 중복을 확인할 열 이름을 지정한다
만약 지정하지 않으면 모든 열을 검사해 하나라도 중복이 되면 해당 열을 제거한다
keep옵션은 first와 last를 지정해 중복된 값 중 첫번째를 남길지 마지막을 남길지 정할 수 있다
기본값은 first다
ignore_index는 인덱스를 무시하고 0,1,2형태의 인덱스로 사용할지 정하는 옵션이다
기본적으로 False이며 특수한 경우를 제외하고는 쓸 일이 없다
'파이썬 > 판다스, 넘파이' 카테고리의 다른 글
파이썬 기초 판다스 데이터 프레임 날짜 사이 조회하기 (0) | 2023.08.28 |
---|---|
파이썬 기초 판다스 데이터 프레임 합치기-concat(), merge() (1) | 2023.08.27 |
파이썬 기초 판다스 데이터 프레임 범주화 하기 -cut(), qcut() (0) | 2023.08.27 |
파이썬 기초 판다스 데이터 프레임 가변수화 -get_dummies (0) | 2023.08.27 |
파이썬 기초 판다스 데이터 프레임 값 조회하기 .loc[] (0) | 2023.08.21 |