본문 바로가기
파이썬

파이썬 기초 판다스 데이터 프레임 결측치 찾기, 제거하기, 채우기

by 큰고양2 2023. 8. 27.

결측치 찾기

결측치는

데이터프레임.isnull() 을 사용하면 결측치는 True, 유효값은 False로 확인 할 수 있다

isnull() 대신, isna()를 사용해도 된다

 

데이터프레임.notnull()을 사용하면 유효값은 True 결측치는 False로 반환된다

notnull 대신, notna를 사용해도 된다

 

수를 확인하고 싶다면

데이터프레임.isna().sum()을 사용하자

 

결측치 제거

데이터프레임.dropna(axis= , inplace= , subset= )

매소드로 결측치가 들어있는 열이나 행을 삭제 할 수 있다

axis는 기본적으로 0이다

열을 지우고싶다면 1을 입력하자

subset으로 기준 열을 정할 수 있다

 

 

결측치 채우기

결측치는

데이터프레임.fillna('채울값', inplace = )

를 사용해 채울 수 있다 채울 값을 직접 지정해도 되지만

채울 값의 자리에 method='ffill' 을 사용하면 앞의 값으로 결측치를 채우고

method='bfill' 을 사용하면 뒤의 값으로 결측치를 채운다

ex)  dt['a'].fillna(method='ffill', inplace=True)

 

fillna 이외에도

interpolate()를 사용해 결측치를 채울 수 있다

만약 앞 뒤 값의 중간 값으로 결측치를 채우고 싶다면

 

ex)

dt['a'].interpolate(method='linear')

을 사용하면 된다