AI: 연합학습/프라이버시
ㅁ 연합학습/프라이버시
ㅇ 정의:
여러 참여자가 데이터 원본을 공유하지 않고도 협력하여 모델을 학습하거나 분석 결과를 도출하는 기술 및 방법론.
ㅇ 특징:
데이터 프라이버시 보호, 법규 준수, 분산 환경 적용 가능.
ㅇ 적합한 경우:
개인정보 보호가 중요한 의료, 금융, IoT 환경 등.
ㅇ 시험 함정:
프라이버시 보호 기법이 성능 저하를 유발할 수 있다는 점 간과.
ㅇ 시험 대비 “패턴 보기” 예시:
O: 원본 데이터를 공유하지 않고도 모델 학습 가능
X: 모든 참여자가 원본 데이터를 중앙 서버에 업로드
================================
1. Differential Privacy
ㅇ 정의:
데이터 분석 시 개별 데이터의 기여를 식별할 수 없도록 통계적 노이즈를 추가하여 프라이버시를 보장하는 기법.
ㅇ 특징:
노이즈 수준(ε, 프라이버시 예산)에 따라 정확도와 프라이버시 보호 수준이 트레이드오프 관계.
ㅇ 적합한 경우:
통계 데이터 공개, 위치 데이터 분석, 대규모 설문 데이터 처리.
ㅇ 시험 함정:
ε 값이 작을수록 프라이버시 보호는 강하지만 유용성이 떨어진다는 점을 혼동.
ㅇ 시험 대비 “패턴 보기” 예시:
O: ε 값이 작을수록 프라이버시 보호가 강하다
X: ε 값이 클수록 프라이버시 보호가 강하다
================================
2. Secure Multi-Party Computation
ㅇ 정의:
서로 신뢰하지 않는 여러 당사자가 각자의 입력값을 노출하지 않고 연산 결과만을 공유하는 암호화 기반 계산 기법.
ㅇ 특징:
비밀분산(secret sharing), 암호화 연산, 프로토콜 복잡도 높음.
ㅇ 적합한 경우:
경쟁사 간 공동 데이터 분석, 민감 정보 기반 협력 연산.
ㅇ 시험 함정:
모든 참여자가 연산 과정에서 입력값을 알 수 있다고 오해.
ㅇ 시험 대비 “패턴 보기” 예시:
O: 각 참여자는 자신의 입력값을 노출하지 않는다
X: 연산 과정에서 모든 입력값이 공개된다
================================
3. Homomorphic Encryption
ㅇ 정의:
암호화된 상태에서 연산을 수행하고, 복호화 시 평문 연산 결과와 동일한 값을 얻을 수 있는 암호 기법.
ㅇ 특징:
완전동형(FHE), 부분동형(PHE) 등 유형 존재, 계산량이 많아 성능 부담.
ㅇ 적합한 경우:
클라우드 환경에서 민감 데이터 연산, 외부 연산 위탁.
ㅇ 시험 함정:
암호화된 데이터는 연산이 불가능하다고 단정하는 오류.
ㅇ 시험 대비 “패턴 보기” 예시:
O: 암호화된 데이터 상태에서도 연산이 가능하다
X: 암호화된 데이터는 연산이 불가능하다
================================
4. Federated Averaging
ㅇ 정의:
연합학습에서 각 클라이언트가 로컬 모델을 학습한 후, 서버가 이를 평균하여 글로벌 모델을 갱신하는 알고리즘.
ㅇ 특징:
통신 효율성 향상, 데이터 비유출, 각 클라이언트의 데이터 분포 차이에 민감.
ㅇ 적합한 경우:
모바일 기기, IoT 센서 등 분산 환경에서의 모델 학습.
ㅇ 시험 함정:
모든 클라이언트 데이터가 동일 분포라고 가정하는 오류.
ㅇ 시험 대비 “패턴 보기” 예시:
O: 로컬 모델 파라미터를 평균하여 글로벌 모델을 업데이트한다
X: 로컬 데이터를 서버로 전송하여 직접 학습한다
ㅁ 추가 학습 내용
Differential Privacy에서는 Laplace 메커니즘, Gaussian 메커니즘 등 노이즈 추가 방식과 프라이버시 예산(ε) 관리 기법을 학습하는 것이 중요하다.
Secure Multi-Party Computation에서는 Yao의 가비지 서킷, Shamir의 비밀분산 알고리즘 등 구체적인 프로토콜의 특성을 이해해야 한다.
Homomorphic Encryption은 완전동형암호(FHE)와 부분동형암호(PHE)의 차이를 구분하고, 대표적인 구현 라이브러리인 HElib, SEAL 등의 특징을 숙지해야 한다.
Federated Averaging에서는 비동기 업데이트, 클라이언트 샘플링, 데이터 비독립·비동일분포(Non-IID) 처리 전략이 핵심 포인트다.
연합학습 전반에서는 Differential Privacy와의 결합 사용 시 장단점을 파악하고, 통신 효율화를 위한 압축, 양자화 기법도 함께 이해하는 것이 좋다.