AI 모델 개발: 규칙 기반 – Decision Tree Surrogate
ㅁ 규칙 기반
ㅇ 정의:
복잡한 블랙박스 모델의 예측 과정을 이해하기 위해, 해당 모델의 입력과 출력을 기반으로 의사결정나무(Decision Tree)를 학습시켜 대체(서로게이트) 모델로 사용하는 방법.
ㅇ 특징:
– 원래 모델의 내부 파라미터를 직접 해석하지 않고, 입력-출력 관계를 모사.
– 시각적으로 규칙을 표현할 수 있어 해석이 용이.
– 원래 모델과의 예측 일치도가 높을수록 설명력 신뢰도가 높음.
ㅇ 적합한 경우:
– 복잡한 앙상블 모델이나 딥러닝 모델의 의사결정 과정을 설명할 때.
– 규제 산업(금융, 의료)에서 모델 설명이 필수적인 경우.
ㅇ 시험 함정:
– Surrogate 모델의 규칙이 원래 모델의 실제 내부 로직과 동일하다고 오해하기 쉬움.
– 예측 일치도가 낮으면 설명의 신뢰성이 떨어짐.
ㅇ 시험 대비 “패턴 보기” 예시:
O: “Decision Tree Surrogate는 블랙박스 모델의 입력-출력 관계를 모사하여 규칙 기반 설명을 제공한다.”
X: “Decision Tree Surrogate는 원래 모델의 내부 파라미터를 직접 분석하여 규칙을 생성한다.”
ㅁ 추가 학습 내용
Surrogate 모델의 성능 평가는 Fidelity 지표로 측정하며, 이는 원래 모델과의 예측 일치도를 의미하고 정확도(Accuracy)와 혼동해서는 안 된다. Surrogate 모델은 전역 설명(Global Explanation)에 해당하며, 전체 데이터 분포에 대한 모델의 전반적인 의사결정 경향을 보여준다. 학습 데이터의 샘플링 방법에 따라 Surrogate 모델이 도출하는 규칙이 달라질 수 있으므로 데이터의 대표성이 중요하다. 시험에서는 Surrogate 모델과 Local Explanation(LIME, SHAP 등)의 차이를 묻는 문제가 자주 출제된다. 규칙 기반 Surrogate 모델은 해석 가능성을 높이지만, 복잡한 모델의 모든 비선형 관계를 완벽하게 반영하지는 못한다.