-
전처리, 모델링, 평가, 모델해석에 관한
-
모든 R code를 jupyter notebook을 활용하여 시각화
-
데이터전처리와 EDA
-
Regression과 Classification 동시 진행
-
Regression 경우 penalty model과 일반 linear Regression model 실험
-
Classification 경우 mulinomial Logistic Regression, SVM, RF 실험
-
최종적으로, 주어진 데이터는 Regression 보다 Classification에 적합하다고 판단
-
따라서, Classification model 들 튜닝
- classification model 중 성능이 가장 좋은 randomforest에 대한 튜닝과 평가
- 최종 튜닝된 Best_model(RF)에 대한 결과 해석