AI 모델 개발: 시각화 기반 – Partial Dependence Plot
ㅁ 시각화 기반
ㅇ 정의:
머신러닝 모델에서 특정 변수(또는 변수 조합)가 예측 결과에 미치는 평균적인 영향을 시각적으로 표현하는 그래프 기법. 다른 변수들의 값은 평균 또는 고정 값으로 두고 관심 변수의 변화에 따른 예측값 변화를 관찰.
ㅇ 특징:
– 변수와 예측값 간의 전반적인 관계 파악 가능
– 비선형 관계나 상호작용 일부 확인 가능
– 모델의 복잡도와 무관하게 적용 가능
– 계산 시 다른 변수의 분포를 고려하지 않아 해석상 주의 필요
ㅇ 적합한 경우:
– 개별 변수의 영향 방향(양/음)과 크기를 파악하고자 할 때
– 비즈니스 의사결정에서 변수의 변화가 결과에 미치는 평균 효과를 설명해야 할 때
– 모델이 블랙박스일 경우 전반적인 변수 영향도를 시각적으로 제시할 때
ㅇ 시험 함정:
– ‘PDP는 개별 관측치의 예측 변화만 보여준다’ → X (평균적인 효과를 보여줌)
– ‘PDP는 변수 간 상호작용을 완벽하게 반영한다’ → X (부분적으로만 가능)
– ‘PDP는 모델 종류와 무관하게 사용할 수 있다’ → O
ㅇ 시험 대비 “패턴 보기” 예시:
– “PDP는 특정 변수의 변화에 따른 예측값 변화를 다른 변수들의 평균값을 기준으로 보여준다” → O
– “PDP는 모든 변수의 상호작용을 완벽히 시각화한다” → X
– “PDP는 회귀모델에만 적용 가능하다” → X
ㅁ 추가 학습 내용
Partial Dependence Plot(PDP)은 하나 또는 여러 변수에 대한 모델의 예측 반응을 평균적으로 보여주는 도구이다. 단변수 PDP는 한 변수의 변화에 따른 평균 예측 변화를 시각화하며, 다변수 PDP는 두 개 이상의 변수 조합에 따른 예측 변화를 나타내어 변수 간 상호작용을 일부 파악할 수 있다. 그러나 다변수 PDP는 해석이 복잡해지고, 데이터 분포가 불균형하거나 변수 간 상관관계가 강한 경우 왜곡된 결과를 초래할 수 있다. PDP는 평균 효과만 반영하므로 개별 관측치 수준의 차이를 확인하기 어렵고, 변수 간 상관관계를 무시할 가능성이 있다. 이를 보완하기 위해 Individual Conditional Expectation(ICE) 플롯을 함께 사용하면 각 관측치별 예측 변화 패턴을 확인할 수 있어 보다 세밀한 해석이 가능하다. 실제 적용 시에는 변수 스케일링 여부, 범주형 변수 처리 방식 등 데이터 전처리와 해석상의 주의사항을 고려해야 한다.