데이터: 샘플링 기법
ㅁ 샘플링 기법
1. 비례할당 표본추출
ㅇ 정의:
모집단을 여러 계층으로 나눈 후 각 계층의 크기에 비례하여 표본을 추출하는 방식.
ㅇ 특징:
– 각 계층의 비율이 모집단과 동일하게 유지됨
– 표본 대표성이 높음
– 표본 오차를 줄일 수 있음
ㅇ 적합한 경우:
– 계층별 구성 비율이 중요한 경우
– 전체 모집단의 비율을 그대로 반영해야 하는 조사
ㅇ 시험 함정:
– 비례할당과 비비례할당 혼동
– 단순 무작위 추출과의 차이 구분
ㅇ 시험 대비 “패턴 보기” 예시:
O: “모집단의 계층 비율을 그대로 반영하여 표본을 추출한다”
X: “모든 계층에서 동일한 수의 표본을 추출한다”
================
2. 다단계 클러스터 샘플링
ㅇ 정의:
모집단을 1차 클러스터로 나누고, 무작위로 일부 클러스터를 선택한 뒤, 선택된 클러스터 내부에서 다시 표본을 추출하는 방식.
ㅇ 특징:
– 대규모 모집단 조사에 유리
– 조사 비용과 시간이 절감됨
– 표본 오차가 다소 증가할 수 있음
ㅇ 적합한 경우:
– 전국 단위 조사처럼 모집단이 광범위한 경우
– 행정구역 등으로 자연스럽게 구분되는 경우
ㅇ 시험 함정:
– 단일 단계 클러스터 샘플링과 혼동
– 계층적 샘플링과의 차이 혼동
ㅇ 시험 대비 “패턴 보기” 예시:
O: “1차로 클러스터를 무작위로 선택하고, 2차로 해당 클러스터 내에서 표본을 추출한다”
X: “모든 클러스터에서 동일 수의 표본을 추출한다”
================
3. 계층적 샘플링
ㅇ 정의:
모집단을 동질적인 하위 집단(계층)으로 나누고, 각 계층에서 무작위로 표본을 추출하는 방식.
ㅇ 특징:
– 각 계층 내 변동성은 작고, 계층 간 변동성은 큼
– 표본 추출의 효율성이 높음
ㅇ 적합한 경우:
– 계층별 특성이 뚜렷한 경우
– 특정 계층의 표본 확보가 중요한 경우
ㅇ 시험 함정:
– 클러스터 샘플링과 혼동
– 계층 내 이질성을 가정하는 오류
ㅇ 시험 대비 “패턴 보기” 예시:
O: “계층 내 동질성을 높이고 계층 간 이질성을 확보한다”
X: “계층 내 이질성을 최대화한다”
================
4. 온라인 설문조사 샘플링
ㅇ 정의:
인터넷 기반 플랫폼을 활용하여 표본을 모집하는 방식.
ㅇ 특징:
– 빠르고 저비용
– 특정 연령·관심사 집단에 편중 가능성
– 응답률 관리가 어려움
ㅇ 적합한 경우:
– 시간과 비용 제약이 큰 경우
– 특정 온라인 커뮤니티나 SNS 이용자 대상 조사
ㅇ 시험 함정:
– 표본 대표성 문제 간과
– 무작위 표본추출로 오해
ㅇ 시험 대비 “패턴 보기” 예시:
O: “빠르고 저비용으로 표본을 모집할 수 있다”
X: “모집단 전체를 무작위로 대표한다”
ㅁ 추가 학습 내용
비례할당 표본추출과 비비례할당 표본추출의 차이를 명확히 이해하고, 각각의 예시를 통해 구체적으로 구분할 수 있도록 학습한다.
다단계 클러스터 샘플링에서는 각 단계별 표본추출 방법(예: 단순 무작위추출, 계통추출 등)을 단계별로 구체적으로 이해한다.
계층적 샘플링에서는 층화 변수를 선택하는 기준과 층 내 표본 크기를 결정하는 방법(비례할당, 비비례할당)을 정확히 숙지한다.
온라인 설문조사 샘플링에서는 발생할 수 있는 편향의 유형(자기선택편향, 커버리지 편향 등)을 파악하고, 각 편향을 완화할 수 있는 방법을 함께 학습한다.