본문 바로가기
파이썬/pyplot, seaborn

파이썬 기초 pyplot,seaborn - boxplot 그리기와 이해

by 큰고양2 2023. 9. 2.

boxplot 이해하기

box 플롯은 box와 수염, 이상치로 구성이 되어있다

box 내부의 선은 중앙값(q2) 을 의미하며

좌 우 변은 q1(25%) , q3(75%)를 의미한다

사분위 수를 그래프로 확인한다고 생각하면 편하다

중앙값이 평균이 아니라는 점을 주의하자

 

상자의 길이는 q1에서 q3까지의 길이로 이를 IQR이라고 한다

수염은 q1  - 1.5 IQR , q3  + 1.5 IQR  의 범위에서

최솟값과 최댓값의 위치를 그려준다

수염을 초과해 나와있는 그림들은

범위를 초과한 값들로 이상치로 분류되어 따로 그림이 그려진다

 

+이상치라고 무조건 배제하고 보지말고 이상치가 어떻게 나온 값인지 분석을 하고 버릴지 판단하는게 좋다

plt.boxplot()

plt.boxplot(조회할 열, vert= True)

코드를 사용해 plyplot boxplot을 그릴 수 있다

vert옵션은 기본적으로 True 이며 True는 수직, False는 수평으로 그려준다

 

plt로 boxplot을 그릴 때 주의해야 하는 점은 열에 결측치가 있으면 안된다는 점이다

 

 

예시)

plt.boxplot(data['MonthlyIncome'],vert=True)
plt.show()

plt.boxplot(data['MonthlyIncome'],vert=False)
plt.show()

 

sns.boxplot()

sns.boxplot( x = or y =  조회할 열)

형식으로 쓴다

x로 입력하면 가로로 그리고 y로 입력하면 세로로 그린다