AI: 편향 및 공정성 – Measurement Error
ㅁ 편향 및 공정성
ㅇ 정의:
데이터 수집, 측정, 기록 과정에서 발생하는 부정확성으로 인해 실제 값과 관측 값이 차이가 나는 현상.
ㅇ 특징:
– 센서 오작동, 설문 응답 오류, 데이터 입력 실수 등 다양한 원인으로 발생.
– 체계적 오류(Systematic Error)와 무작위 오류(Random Error)로 구분 가능.
– AI 모델 학습 시 데이터 품질 저하로 이어져 예측 성능 및 공정성에 영향을 미침.
ㅇ 적합한 경우:
– 데이터 전처리 과정에서 오류 검출 및 보정 필요성을 설명할 때.
– 모델 성능 저하 원인을 분석할 때.
ㅇ 시험 함정:
– Sampling Bias와 혼동하기 쉬움: Measurement Error는 측정 과정의 오류, Sampling Bias는 표본 추출 과정의 왜곡.
– 무작위 오류는 평균적으로 상쇄될 수 있으나, 체계적 오류는 그렇지 않음.
ㅇ 시험 대비 “패턴 보기” 예시:
O: “센서의 지속적 오차로 인해 데이터가 실제보다 항상 높게 측정되는 경우는 Measurement Error의 예이다.”
X: “특정 집단이 과소 대표되는 표본 추출 오류는 Measurement Error이다.”
ㅁ 추가 학습 내용
Measurement Error는 AI 공정성 문제의 중요한 원인 중 하나로, 의료 AI, 금융 신용평가, 범죄 예측 모델 등에서 잘못된 측정이 특정 집단에 불리하게 작용할 수 있다. 시험에서는 측정 도구의 정확도, 데이터 수집 프로토콜, 라벨링 오류 등을 구체적으로 묻는 경우가 많다.
Measurement Error에는 체계적 오류(Systematic Error)와 무작위 오류(Random Error)가 있으며, 체계적 오류는 일정한 방향으로 발생하는 편향된 오류이고, 무작위 오류는 예측 불가능하게 발생하는 변동성 있는 오류이다.
교정 방법으로는 캘리브레이션을 통한 측정 도구 보정, 데이터 정제를 통한 오류 데이터 제거, 라벨 검증을 통한 정답 데이터 품질 향상이 있다.
Measurement Error는 Bias-Variance Tradeoff에 영향을 미치며, 오류가 크면 편향과 분산 모두에 부정적 영향을 줄 수 있다. 이를 보정하기 위해 Error-in-Variables 모델과 같은 통계적 기법을 활용할 수 있다.