본문 바로가기
머신러닝 지도학습 - 분류모델 성능 평가 데이터의 이해 - sklearn.metrics 평가도구 accuracy_score recall_score precision_score classification_report confusion_matrix confusion matrix(혼동 행렬) 분류모델의 성능 평가에 대해 이해하려면 먼저 confusion matrix 에 대해 이해해야 한다 ex) 다음 그림은 confusion metrix를 나타낸 그림으로 y축은 실제 값, x축은 예측값을 의미한다 각각의 값을 설명하자면 TN(True Negative) = 음성을 음성으로 잘 예측한 것 FN(False Negative) = 음성을 양성으로 잘못 예측한 것 FP(False Positive) = 양성을 음성으로 잘못 예측한 것 TP(True Positive) = 양성을 양성으로 잘 예측한 것이다 co.. 2023. 9. 16.
머신러닝 지도학습 - 회귀모델 성능 평가 데이터의 이해-sklearn.metrics 평가도구 mean_absolute_error mean_absolute_percentage_error mean_squared_error root_mean_squared_error r2_score mean_absolute_error(MAE) 예측값과 실제 값의 차이(오차)의 절대값의 평균 MAE = (1/n) * Σ|yᵢ - ŷᵢ| mean_absolute_percentage_error(MAPE) 실제 값에 대한 예측 오차 절대값의 비율의 평균 MAPE = (100/n) * Σ (|yᵢ - ŷᵢ| / yᵢ) mean_squared_error(MSE) 예측값과 실제값의 차이의 제곱의 평균 MSE = (1/n) * Σ(yᵢ - ŷᵢ)² root_mean_squared_error(RMSE) 예측값과 실제값의 차이.. 2023. 9. 16.
머신러닝 지도학습 - 회귀와 분류, 분석도구 회귀(Regression) 이미 결과값이 있는 데이터를 사용하여 연관성을 찾아 연속적인 숫자를 예측해 내는 것 ex) 집값 분석도구 평가도구 LinearRegression KNeighborsRegressor DecisionTreeRegressor RandomForestRegressor XGBRegressor mean_absolute_error mean_squared_error root mean_squared_error mean_absolute_percentage_error r2_score 분류(Classification) 이미 결과값이 있는 데이터를 사용하여 범주의 값을 예측하는 것 ex)합격, 불합격 분석 도구 분석도구 평가도구 DecisionTreeClassifier KNeighborsClassifi.. 2023. 9. 16.
파이썬 머신러닝 선형회귀 및 평가 sklearn - LinearRegression 1. 데이터 분리 머신러닝을 위해서는 기본적으로 타겟 데이터와 변수들을 분리해야한다 x = data.drop(target, axis=1) y = data[target] 코드로 변수 x와 y에 각각 변수 데이터와 타겟 데이터를 넣어주었다 여기서 target은 데이터프레임에서 결과값의 인덱스명이다 다음으로 학습에 사용할 데이터를 분리한다 from sklearn.model_selection import train_test_split x_train, x_test, y_train, y_test = train_test_split(x,y,test_size=0.3 ,random_state=1 , stratify= ) train_test_split을 임포트하고 x,y 데이터와, 해당 데이터에서 이후 테스트에 사용할 데이.. 2023. 9. 11.