AI: 설명 가능 AI(XAI) – SHAP Interaction Values
ㅁ 설명 가능 AI(XAI)
ㅇ 정의:
머신러닝 모델의 예측 결과에 대해 각 입력 특성이 얼마나 기여했는지, 그리고 특성 간 상호작용이 예측에 어떤 영향을 미쳤는지를 설명하는 기법.
ㅇ 특징:
– SHAP(Shapley Additive Explanations)의 확장 개념으로, 두 개 이상의 특성이 함께 작용할 때의 기여도를 계산.
– 게임이론 기반으로, 모든 가능한 특성 조합을 고려하여 기여도를 분배.
– 모델 불문(트리, 딥러닝, 선형모델 등) 적용 가능.
ㅇ 적합한 경우:
– 단일 특성 영향뿐 아니라 특성 간 상호작용까지 분석해야 하는 경우.
– 비즈니스 의사결정에서 복합 요인 분석이 필요한 경우.
ㅇ 시험 함정:
– SHAP 값과 SHAP Interaction Values를 혼동하는 문제.
– Interaction Values는 항상 두 특성 간 상호작용만 계산한다고 오해.
– 모든 모델에서 계산 비용이 동일하다고 착각.
ㅇ 시험 대비 “패턴 보기” 예시:
O: “SHAP Interaction Values는 SHAP 값을 확장하여 특성 간 상호작용 효과를 설명한다.”
X: “SHAP Interaction Values는 단일 특성의 영향만을 설명한다.”
================================
1. SHAP Interaction Values
ㅇ 정의:
SHAP 값의 확장으로, 각 특성 쌍이 모델 예측에 미치는 상호작용 기여도를 정량화하는 방법.
ㅇ 특징:
– Shapley 값 계산 과정에서 특성 쌍의 기여도를 분리.
– 대각선(자기 자신) 값은 순수한 SHAP 값, 비대각선 값은 상호작용 효과.
– 시각화 시 상호작용 매트릭스로 표현 가능.
ㅇ 적합한 경우:
– 두 변수의 결합 효과를 이해해야 하는 모델 해석 상황.
– 마케팅, 금융 리스크 분석 등 다차원 요인 분석.
ㅇ 시험 함정:
– SHAP Interaction Values를 계산할 때 모든 가능한 특성 조합을 고려해야 하므로 계산량이 늘어난다는 점을 간과.
– 비선형 모델에서만 의미 있다고 오해.
ㅇ 시험 대비 “패턴 보기” 예시:
O: “SHAP Interaction Values는 특성 간 상호작용 효과를 수치화하여 모델 해석을 돕는다.”
X: “SHAP Interaction Values는 계산량이 SHAP 값과 동일하다.”
ㅁ 추가 학습 내용
SHAP Interaction Values를 이해하기 위해서는 먼저 Shapley 값의 기본 개념을 정확히 알아야 한다. Shapley 값은 모든 가능한 특성 순열 조합에서 각 특성이 기여한 평균 값을 계산하는 방식이다.
Interaction Values에서 대각선 요소는 해당 특성의 순수한 기여도를 나타내며, 비대각선 요소는 두 특성 간의 상호작용 기여도를 나타낸다.
계산 복잡도는 O(M^2)로, 특성 수가 많아질수록 연산량이 크게 증가한다. 트리 기반 모델의 경우 TreeSHAP을 사용하면 효율적으로 계산할 수 있다.
해석 시에는 heatmap, dependence plot 등의 시각화 도구를 활용하며, 상호작용 효과가 중요한 사례로는 두 약물의 병용 효과 분석, 두 마케팅 채널의 시너지 효과 분석 등이 있다.