본문 바로가기
파이썬/머신러닝-지도학습

파이썬 머신러닝 지도학습 - 모델의 성능 예측 k분할 교차 검증(K-Fold Cross Validation)

by 큰고양2 2023. 9. 17.

K-Fold Cross Validation

데이터를 k 개로 나누고 평가에 한 번, 학습에 k-1번 사용하면서

총 k번의 성능 검증을 한다

 

 

사용 방법

 

임포트

from sklearn.model_selection import cross_val_score

코드로 임포트를 한 다음

아무 모델이나 하나를 선언한다

ex) 

from sklearn.linear_model import LogisticRegression
model = LogisticRegression()

검증하기

cv_score = cross_val_score(model, x_train, y_train, cv=, scoring =)

코드를 사용해 k 분할 교차 검증을 시행한다

cv=에는 2 이상의 원하는 분할 개수를 적어주면 된다 

scoring = 은 성능평가의 지표로 기본적으로 회귀 -r2  분류-accuracy이다

기본 지표 말고 다른 지표를 사용하고 싶다면 적어주면 된다

 

확인하기

print(cv_score)
print(cv_score.mean())

코드로 평균을 확인 할 수 있다

 

 

주의

k 분할 교차 검증을 했다고 모델이 학습된건 아니다

값을 예측하기 위해서는 따로 모델을 학습시켜야한다는걸 기억하자