본문 바로가기
파이썬/scipy , 이변량분석

파이썬 기초scipy.stats 2개 범주기준 숫자 t통계량과 p-value 구하기-spst.ttest_ind()

by 큰고양2 2023. 9. 2.

spst.ttest_ind()

spst.ttest_ind()를 사용하기 위해서는

먼저 loc를 사용해 해당 범주별 숫자 데이터를 분리해야한다

 

*주의할점은 데이터에 NaN이 있으면 안된다!!!!

ex)

성별 별로 운임요금의 상관관계를 확인

male = titanic.loc[titanic['Sex']=='male']['Fare']
female = titanic.loc[titanic['Sex']=='female']['Fare']

이후 분리한 데이터를

spst.ttest_ind(데이터1, 데이터2)로 넣으면 t-test의 t 통계량과 p-value를 알 수 있다

여기서 결과값은 튜플 형태로 t통계량, p-value 순서로 출력된다

male = titanic.loc[titanic['Sex']=='male']['Fare']
female = titanic.loc[titanic['Sex']=='female']['Fare']

spst.ttest_ind(male,female)