AI: 편향 및 공정성 – Sampling Frame Bias

ㅁ 편향 및 공정성

ㅇ 정의:
모집단을 대표하지 못하는 표본 추출 틀(Sampling Frame)에서 발생하는 편향으로, 표본이 특정 집단에 과도하게 치우치거나 누락되는 현상.

ㅇ 특징:
– 표본 추출 대상 목록이 불완전하거나 특정 그룹이 과대/과소 대표됨
– 데이터 수집 단계에서 이미 발생하므로 사후 보정이 어려움
– 전화 설문, 온라인 설문 등에서 특정 인구 집단이 배제될 수 있음

ㅇ 적합한 경우:
– 사전 설계 단계에서 모집단과 표본 프레임이 일치하도록 검증할 때
– 표본 프레임의 범위와 한계를 명확히 정의할 필요가 있는 조사 설계

ㅇ 시험 함정:
– 단순히 표본 수가 적어서 발생하는 오류와 혼동하는 경우 (이는 표본 오차)
– 표본 추출 방법이 무작위라도 프레임 자체가 편향되면 문제가 발생함

ㅇ 시험 대비 “패턴 보기” 예시:
O: “전화번호부를 이용해 설문조사를 했더니 휴대전화만 사용하는 젊은 층이 배제되었다”
X: “표본 수가 적어서 통계적 유의성이 낮아졌다”

ㅁ 추가 학습 내용

Sampling Frame Bias는 Selection Bias의 하위 개념으로, 모집단의 정의와 표본 프레임이 일치하지 않을 때 발생한다.
Coverage Error와 혼용될 수 있으나, 두 용어는 구분해야 한다. Coverage Error는 모집단 일부가 표본 프레임에서 빠지는 전반적 오류를 의미하며, Sampling Frame Bias는 이러한 누락이 특정 방향으로 편향을 유발하는 경우를 말한다.
Sampling Frame Bias를 완화하기 위해 층화추출(Stratified Sampling), 가중치 조정(Weighting Adjustment), 다중 프레임 표본추출(Multiple Frame Sampling) 등의 방법이 활용된다.
빅데이터 환경에서는 온라인 데이터 수집 시 특정 플랫폼 사용자만 포함되는 경우가 많아 Sampling Frame Bias의 위험이 높다.
시험에서는 표본 추출이 무작위로 이루어졌더라도 표본 프레임이 제한적이면 편향이 발생할 수 있다는 점을 강조하는 문제가 자주 출제된다.

답글 남기기

Your email address will not be published. Required fields are marked *.

*
*