K-Fold Cross Validation
데이터를 k 개로 나누고 평가에 한 번, 학습에 k-1번 사용하면서
총 k번의 성능 검증을 한다
사용 방법
임포트
from sklearn.model_selection import cross_val_score
코드로 임포트를 한 다음
아무 모델이나 하나를 선언한다
ex)
from sklearn.linear_model import LogisticRegression
model = LogisticRegression()
검증하기
cv_score = cross_val_score(model, x_train, y_train, cv=, scoring =)
코드를 사용해 k 분할 교차 검증을 시행한다
cv=에는 2 이상의 원하는 분할 개수를 적어주면 된다
scoring = 은 성능평가의 지표로 기본적으로 회귀 -r2 분류-accuracy이다
기본 지표 말고 다른 지표를 사용하고 싶다면 적어주면 된다
확인하기
print(cv_score)
print(cv_score.mean())
코드로 평균을 확인 할 수 있다
주의
k 분할 교차 검증을 했다고 모델이 학습된건 아니다
값을 예측하기 위해서는 따로 모델을 학습시켜야한다는걸 기억하자
'파이썬 > 머신러닝-지도학습' 카테고리의 다른 글
파이썬 머신러닝 데이터 정규화 (0) | 2023.09.21 |
---|---|
파이썬 머신러닝 지도학습 - 하이퍼파라미터 튜닝 (grid search, random search) (0) | 2023.09.17 |
파이썬 머신러닝 지도학습 - 앙상블 - XGBoost (분류, 회귀) (0) | 2023.09.17 |
파이썬 머신러닝 지도학습 - 앙상블 -Random forest(랜덤 포레스트) (분류, 회귀) (0) | 2023.09.17 |
파이썬 머신러닝 지도학습 - 앙상블 (0) | 2023.09.16 |