- model-agnostic?
- 학습에 사용된 모델이 무엇인지 상관없이 독립적으로 모델을 해석할 수 있다는 의미. 즉, 학습에 사용되는 모델과 설명에 사용되는 모델을 분리하는 것
서로 관련이 있는 모든 특성들에 대한 전역적인(Global) 설명
- Feature Importances
- Drop-Column Importances
- Permutaton Importances
타겟과 관련이 있는 개별 특성들에 대한 전역적인 설명
개별 관측치에 대한 지역적인(local) 설명
모델 복잡도와 해석의 관계
- 단순한 모델 -> 이해하기 쉽지만 성능이 부족
- 예: 선형 모델은 회귀계수(coefficients)를 이용해 변수와 타겟 관계를 해석 가능
- 복잡한 모델(예: 앙상블 모델)-> 이해하기 어렵지만 성능이 좋음
- 예: 랜덤포레스트, 부스팅은 쉽게 특성중요도(feature importance) 값을 얻을 수 있긴 하지만, 이것을 통해서 우리가 알 수 있는 것은 어떤 특성들이 모델의 성능에 중요하다, 많이 쓰인다는 정보 뿐이다. 특성의 값에 따라서 타겟값이 증가/감소하느냐와 같은 어떻게 영향을 미치는지에 대한 정보를 알 수 없음
PDP(Partial Dependence Plots, 부분의존도 그림)
- 관심있는 특성들이 타겟에 어떻게 영향을 주는지 쉽게 파악할 수 있음