spst.pearsonr()
import scipy.stats as spst
로 scipy.stats를 임포트를 해준다
spst.pearsonr( 데이터1 , 데이터2 )
형태로 해당 숫자형 데이터들의 상관계수와 p-value를 구할 수 있다
해당 함수를 사용하면 튜플형태로 (상관계수, p-value)가 반환된다
ex)
spst.pearsonr(air['Temp'], air['Ozone'])
출력 : PearsonRResult(statistic=0.6833717861490114, pvalue=2.197769800200284e-22)
데이터프레임.corr()
데이터 프레임.corr() 매소드를 사용하면 해당 데이터프레임의 숫자형 변수끼리의
상관계수를 한 번에 구할 수 있다
ex)
air.corr()
sns.heatmap으로 시각화하기
sns.heatmap(데이터프레임.corr(),
annot = True, # 숫자(상관계수) 표기 여부
fmt = '.2f', # 숫자 포멧 : 소수점 표기 정하기
cmap = 'Reds', # 칼라맵
vmin = -1, vmax = 1) # 값의 최소, 최대값
으로 시각화가 가능하다
각 옵션들은 원하는 대로 조정해도 된다
ex)
sns.heatmap(air.corr(),
annot = True,
fmt = '.2f',
cmap = 'Reds',
vmin = -1, vmax = 1)
plt.show()
'파이썬 > scipy , 이변량분석' 카테고리의 다른 글
파이썬 기초 mosaic 를 사용한 범주대 범주 비교 그래프-mosaic() (0) | 2023.09.02 |
---|---|
파이썬 기초 scipy.stats 카이제곱검정 - chi2_contingency() feat.교차표 (0) | 2023.09.02 |
파이썬 기초 pandas 범주끼리 비교 교차표-crosstab() (2) | 2023.09.02 |
파이썬 기초 scipy.stats 3개이상의 범주에 대한 anova구하기-spst.f_oneway() (0) | 2023.09.02 |
파이썬 기초scipy.stats 2개 범주기준 숫자 t통계량과 p-value 구하기-spst.ttest_ind() (0) | 2023.09.02 |