boxplot 이해하기
box 플롯은 box와 수염, 이상치로 구성이 되어있다
box 내부의 선은 중앙값(q2) 을 의미하며
좌 우 변은 q1(25%) , q3(75%)를 의미한다
사분위 수를 그래프로 확인한다고 생각하면 편하다
중앙값이 평균이 아니라는 점을 주의하자
상자의 길이는 q1에서 q3까지의 길이로 이를 IQR이라고 한다
수염은 q1 - 1.5 IQR , q3 + 1.5 IQR 의 범위에서
최솟값과 최댓값의 위치를 그려준다
수염을 초과해 나와있는 그림들은
범위를 초과한 값들로 이상치로 분류되어 따로 그림이 그려진다
+이상치라고 무조건 배제하고 보지말고 이상치가 어떻게 나온 값인지 분석을 하고 버릴지 판단하는게 좋다
plt.boxplot()
plt.boxplot(조회할 열, vert= True)
코드를 사용해 plyplot boxplot을 그릴 수 있다
vert옵션은 기본적으로 True 이며 True는 수직, False는 수평으로 그려준다
plt로 boxplot을 그릴 때 주의해야 하는 점은 열에 결측치가 있으면 안된다는 점이다
예시)
plt.boxplot(data['MonthlyIncome'],vert=True)
plt.show()
plt.boxplot(data['MonthlyIncome'],vert=False)
plt.show()
sns.boxplot()
sns.boxplot( x = or y = 조회할 열)
형식으로 쓴다
x로 입력하면 가로로 그리고 y로 입력하면 세로로 그린다
'파이썬 > pyplot, seaborn' 카테고리의 다른 글
파이썬 기초 seaborn으로 숫자형 변수 산점도 한 번에 보기-pairplot (0) | 2023.09.02 |
---|---|
파이썬 pyplot, seaborn 산점도 그리기 - scatter,scatterplot,regplot (0) | 2023.09.02 |
파이썬 기초 Seaborn 으로 밀도함수 그리기=sns.kdeplot() (0) | 2023.09.02 |
파이썬 기초 pyplot과 seaborn으로 히스토그램 그리기 (0) | 2023.09.02 |
파이썬 기초 pyplot,seaborn - bar() , countplot() 막대그래프 (1) | 2023.08.29 |