데이터: 샘플링 기법 – 계층적 샘플링

ㅁ 샘플링 기법

ㅇ 정의:
모집단을 동질적인 하위 집단(계층)으로 나눈 후, 각 계층에서 표본을 추출하는 방법으로, 모집단 내 중요한 특성이 계층별로 다를 때 대표성을 높이기 위해 사용.

ㅇ 특징:
– 각 계층은 내부적으로 동질, 계층 간에는 이질적임.
– 비례할당(각 계층의 크기에 비례하여 표본 추출)과 동일할당(각 계층에서 동일 수 추출) 방식이 있음.
– 표본의 대표성을 높이고 추정의 분산을 줄임.

ㅇ 적합한 경우:
– 모집단이 서로 다른 특성을 가진 하위 집단으로 구성되어 있고, 각 집단의 특성을 모두 반영해야 하는 경우.
– 예: 전국 여론조사에서 지역별, 성별, 연령별 비율을 반영하고자 할 때.

ㅇ 시험 함정:
– 단순 무작위 추출과 혼동하기 쉬움.
– 계층 구분 기준이 명확하지 않으면 오히려 편향 발생 가능.
– 비례할당과 동일할당의 차이를 묻는 문제에서 비율 계산 실수 유도.

ㅇ 시험 대비 “패턴 보기” 예시:
– (O) 모집단을 성별, 연령별로 나누어 각 그룹에서 무작위 추출하는 방법이다.
– (X) 모집단 전체에서 무작위로 표본을 추출하는 방법이다.
– (O) 계층 간 이질성, 계층 내 동질성을 전제로 한다.
– (X) 계층 간 동질성, 계층 내 이질성을 전제로 한다.

ㅁ 추가 학습 내용

계층적 샘플링에서 계층을 구분할 때는 분석 목적과 직접적으로 관련 있는 변수, 그리고 분산이 큰 변수를 우선적으로 고려해야 한다.
비례할당 방식에서는 각 계층의 표본 수를 (계층 크기 / 모집단 크기) × 전체 표본 수 공식으로 계산한다.
동일할당 방식에서는 각 계층에서 동일한 표본 수를 추출한다.
층화를 마친 후 각 계층 내 표본 추출 방법으로는 단순 무작위 추출 또는 체계적 추출을 적용할 수 있다.

답글 남기기

Your email address will not be published. Required fields are marked *.

*
*