- 학습 방법에 따른 분류
- 과제에 따른 분류
- 용어
모델링 코드 구조
<aside>
✅ import → 모델 선언 → 모델 학습 → 예측 → 성능 평가
</aside>
기본 알고리즘
|
Classification |
Regression |
Model |
* DecisionTreeClassifier |
|
- KNeighborClassifier
- LogisticRegression
- RandomForestClassifier
- XGBClassifier | * LinearRegression
- KNeighborRegressor
- DecisionTreeRegressor
- RandomForestRegressor
- XGBRegressor |
| Evaluation | * accuracy_score
- recall_score
- precision_score
- classification_report
- confusion_matrix | * mean_absolute_error
- mean_squared_error
- root mean_squared_error
- mean_absolute_percentage_error
*r2_score |
- Linear Regression
- K-Nearest Neighbor (KNN)
- Decision Tree
- Logistic Regression
K-Fold Cross Validation
- 검증을 거치고 최종 평가를 수행하자! → 무작위 분할
- 모든 데이터가 평가에 한번, 학습에 k-1번 사용 (k≥2)
- k개의 분할(fold)에 대한 성능 예측 → 평균과 표준편차 계산 → 일반화 성능
- 단, 많은 시간이 소요됨
- 모델 선언 후 cross_val_score() 사용, cv (default : 5)