성능 모니터링: Anomaly Detection with Explainability

ㅁ 성능 모니터링

ㅇ 정의:
성능 모니터링은 시스템의 성능을 지속적으로 추적하고 분석하여 문제를 사전에 발견하고 해결하는 과정이다.

ㅇ 특징:
– 실시간 데이터 수집 및 분석.
– 성능 저하를 조기에 감지 가능.
– 시스템 안정성을 유지하고 사용자 경험을 개선.

ㅇ 적합한 경우:
– 대규모 시스템 운영 시 성능 저하를 예방하고자 할 때.
– 실시간 데이터 처리 및 분석이 필요한 경우.
– 운영 중 문제 발생 시 빠른 대응이 필요한 경우.

ㅇ 시험 함정:
– 성능 모니터링 도구의 정확성과 신뢰성을 과대평가하거나 과소평가할 수 있음.
– 모니터링 대상의 범위를 명확히 정의하지 않아 시험에서 혼란을 초래할 수 있음.

ㅇ 시험 대비 “패턴 보기” 예시:
1. 성능 모니터링은 시스템의 성능을 개선하기 위한 사후 조치이다. (X)
2. 성능 모니터링은 실시간 데이터 분석을 통해 문제를 조기에 발견할 수 있다. (O)

========================

1. Anomaly Detection with Explainability

ㅇ 정의:
Anomaly Detection with Explainability는 시스템에서 비정상적인 패턴을 탐지하고, 탐지 결과를 인간이 이해할 수 있도록 설명하는 기술이다.

ㅇ 특징:
– 데이터의 정상/비정상 여부를 판별.
– 탐지된 이상치에 대한 명확한 설명 제공.
– 머신러닝 및 딥러닝 모델 활용 가능.

ㅇ 적합한 경우:
– 이상 탐지 결과를 비전문가도 이해해야 하는 경우.
– 시스템의 복잡한 데이터 패턴 분석이 필요한 경우.
– 비정상적인 이벤트를 조기에 탐지하고 대응해야 할 때.

ㅇ 시험 함정:
– 설명 가능성(explainability)을 간과하고 단순히 탐지 결과만을 강조할 수 있음.
– 이상 탐지 모델의 정확도와 설명 가능성 간의 균형을 놓칠 수 있음.

ㅇ 시험 대비 “패턴 보기” 예시:
1. Anomaly Detection with Explainability는 이상 탐지 결과를 인간이 이해할 수 있도록 설명하는 데 초점을 맞춘다. (O)
2. Anomaly Detection with Explainability는 복잡한 데이터 패턴을 단순히 시각화하는 기술이다. (X)

========================

ㅁ 추가 학습 내용

학습 노트 정리:

1. **SHAP (Shapley Additive Explanations)**
– SHAP는 모델의 예측을 설명하기 위해 각 특성(feature)이 결과에 기여하는 정도를 계산하는 방법이다.
– 게임 이론의 Shapley 값을 기반으로 하며, 각 특성의 중요도를 공정하게 분배하는 방식으로 작동한다.
– 모델의 복잡성에 관계없이 적용 가능하며, 예측 결과를 보다 직관적으로 이해할 수 있도록 돕는다.
– SHAP의 주요 장점은 특정 데이터 포인트에 대한 모델의 결정 과정을 상세히 설명할 수 있다는 점이다.

2. **LIME (Local Interpretable Model-agnostic Explanations)**
– LIME은 모델에 상관없이 개별 예측을 설명하는 데 초점을 맞춘 기법이다.
– 특정 데이터 포인트의 주변에서 간단한 선형 모델을 학습하여 복잡한 모델의 동작을 해석한다.
– 모델 불가지론적 접근 방식으로, 다양한 모델에 적용 가능하며, 지역적으로 데이터의 특성을 설명한다.
– LIME은 모델의 전체 구조를 이해하기보다는 개별 예측 결과를 해석하는 데 유용하다.

3. **이상 탐지 모델의 성능 평가 기준**
– **Precision (정밀도)**: 모델이 탐지한 이상치 중 실제로 이상치인 비율을 나타낸다.
계산식: TP / (TP + FP)
– **Recall (재현율)**: 실제 이상치 중 모델이 올바르게 탐지한 비율을 나타낸다.
계산식: TP / (TP + FN)
– **F1-score**: Precision과 Recall의 조화 평균으로, 두 지표 간 균형을 평가한다.
계산식: 2 * (Precision * Recall) / (Precision + Recall)
– **ROC-AUC (Receiver Operating Characteristic – Area Under Curve)**:
모델의 분류 성능을 평가하는 지표로, TPR(민감도)과 FPR(위양성률) 간의 관계를 나타내는 곡선 아래 면적을 측정한다.
AUC 값이 1에 가까울수록 모델의 분류 성능이 우수함을 의미한다.

이 내용을 바탕으로 시험 대비를 강화하세요.

답글 남기기

Your email address will not be published. Required fields are marked *.

*
*