spst.ttest_ind()
spst.ttest_ind()를 사용하기 위해서는
먼저 loc를 사용해 해당 범주별 숫자 데이터를 분리해야한다
*주의할점은 데이터에 NaN이 있으면 안된다!!!!
ex)
성별 별로 운임요금의 상관관계를 확인
male = titanic.loc[titanic['Sex']=='male']['Fare']
female = titanic.loc[titanic['Sex']=='female']['Fare']
이후 분리한 데이터를
spst.ttest_ind(데이터1, 데이터2)로 넣으면 t-test의 t 통계량과 p-value를 알 수 있다
여기서 결과값은 튜플 형태로 t통계량, p-value 순서로 출력된다
male = titanic.loc[titanic['Sex']=='male']['Fare']
female = titanic.loc[titanic['Sex']=='female']['Fare']
spst.ttest_ind(male,female)
'파이썬 > scipy , 이변량분석' 카테고리의 다른 글
파이썬 기초 mosaic 를 사용한 범주대 범주 비교 그래프-mosaic() (0) | 2023.09.02 |
---|---|
파이썬 기초 scipy.stats 카이제곱검정 - chi2_contingency() feat.교차표 (0) | 2023.09.02 |
파이썬 기초 pandas 범주끼리 비교 교차표-crosstab() (2) | 2023.09.02 |
파이썬 기초 scipy.stats 3개이상의 범주에 대한 anova구하기-spst.f_oneway() (0) | 2023.09.02 |
파이썬 기초 scipy.stats 상관계수와 p-value 구하기-pearsonr(),corr() 및 시각화 (0) | 2023.09.02 |