“Section2”
- 데이터를 훈련/검증/테스트 데이터로 나누는 이유
- 테스트 데이터를 왜 한 번만 사용하는지
- 과적합은 어떻게 해결?극복할 수 있는지
- 훈련/검증/테스트 데이터를 나누기 전에 정규화/표준화를 하면 안 되는 이유
- 시계열 데이터를 나눌 때 주의할 점이 있다면?
- 왜 random forest에서 decision tree보다 과적합이 발생할 가능성이 낮은지
- 정밀도(precision)를 중시해야 하는 경우와 재현율(recall)을 중시해야 하는 경우는 각각 어떤 경우인지
- 제 1종 오류와 제 2종 오류는 각각 어떤 경우인지
- 교차 검증을 사용하는 이유
- 배깅 모델과 부스팅 모델의 차이점