모델/시스템 최적화: 개인화 분석
ㅁ 개인화 분석
1. Federated Analytics
ㅇ 정의:
여러 클라이언트(사용자 단말)에서 생성된 데이터를 중앙 서버로 직접 전송하지 않고, 각 클라이언트에서 로컬로 분석을 수행한 뒤 통계적 요약 정보만을 서버에 전송하여 전체 분석을 수행하는 방식.
ㅇ 특징:
– 개인 데이터의 원본은 로컬에 남겨 개인정보 유출 위험을 감소시킴.
– 모델 학습이 아니라 통계 분석이나 지표 산출에 초점.
– 네트워크 사용량 절감 및 분산 환경에서의 확장성 용이.
ㅇ 적합한 경우:
– 개인정보 보호 규제가 엄격한 환경에서 사용자 행동 분석.
– 의료, 금융 등 민감 데이터 분석.
ㅇ 시험 함정:
– Federated Learning과 혼동하기 쉬움(학습 vs 분석 구분 필요).
– 데이터 원본이 서버로 전송된다고 오해 유도.
ㅇ 시험 대비 “패턴 보기” 예시:
O: “원본 데이터는 클라이언트에 남기고 요약 통계만 서버로 전송한다.”
X: “모델 학습을 위해 모든 로컬 데이터를 서버로 모은다.”
2. Private Aggregation Protocol
ㅇ 정의:
여러 참여자의 데이터를 암호화된 상태로 집계하여, 개별 데이터는 노출하지 않고 전체 합계나 평균 등의 집계 결과만을 얻는 프로토콜.
ㅇ 특징:
– 암호학적 기법(예: 안전 다자 계산, 동형 암호) 사용.
– 중앙 서버나 제3자도 개별 데이터 복호화 불가.
– 집계 결과만 노출되므로 프라이버시 보장.
ㅇ 적합한 경우:
– 민감한 데이터의 집계 통계 산출.
– 분산 환경에서 신뢰할 수 없는 서버를 통한 데이터 집계.
ㅇ 시험 함정:
– 암호화를 하지 않는 단순 집계와 혼동.
– 집계 과정에서 일부 데이터가 노출된다고 잘못 기술하는 문장에 주의.
ㅇ 시험 대비 “패턴 보기” 예시:
O: “개별 데이터는 암호화된 상태로 집계되어 서버도 내용을 알 수 없다.”
X: “집계 과정에서 개별 데이터가 복호화되어 서버에 전달된다.”
ㅁ 추가 학습 내용
학습 정리
1. Federated Analytics
– 개인정보를 중앙 서버로 전송하지 않고, 분산된 데이터에서 통계 분석을 수행하는 기법
– 주 목적: 통계 분석
– Federated Learning과 구분: Federated Learning은 모델 학습이 목적임
2. Private Aggregation Protocol
– 분산된 데이터의 집계 결과만을 안전하게 수집하는 프로토콜
– 핵심 기술:
• 안전 다자 계산(Secure Multi-Party Computation)
• 동형 암호(Homomorphic Encryption)
• 차등 프라이버시(Differential Privacy)
– 목적: 개별 데이터 노출 없이 집계 결과만 확보
3. 법규 준수와의 연계
– GDPR, CCPA 등 개인정보 보호법 준수를 지원
– 데이터 최소화, 익명화, 가명화와 결합하여 법적 요구 충족
4. 성능적 고려사항
– 네트워크 지연(latency) 절감
– 통신 비용 절감 효과
시험 대비 체크리스트
– Federated Analytics와 Federated Learning의 목적과 차이를 설명할 수 있는가?
– Private Aggregation Protocol의 정의와 동작 원리를 이해하고 있는가?
– 안전 다자 계산, 동형 암호, 차등 프라이버시 각각의 개념과 Private Aggregation Protocol에서의 역할을 설명할 수 있는가?
– 이러한 기술들이 GDPR, CCPA 준수와 어떻게 연결되는지 설명할 수 있는가?
– Federated Analytics와 Private Aggregation Protocol이 네트워크 지연 및 통신 비용 절감에 어떤 영향을 미치는지 설명할 수 있는가?