AI: 연합학습 및 프라이버시

ㅁ 연합학습 및 프라이버시

1. Differential Privacy

ㅇ 정의:
개인의 데이터가 포함된 통계 결과를 공개하더라도 개별 사용자의 정보가 노출되지 않도록 노이즈를 추가하는 프라이버시 보호 기법.

ㅇ 특징:
데이터 분석 결과에 무작위 노이즈를 주입하여 재식별 위험을 수학적으로 제한.
ε(엡실론) 값으로 프라이버시 손실 수준을 제어.

ㅇ 적합한 경우:
대규모 인구 통계 분석, 위치 데이터 분석 등 민감 정보 보호가 필요한 통계 처리.

ㅇ 시험 함정:
노이즈 추가가 항상 데이터 품질을 보존하는 것은 아님.
ε 값이 작을수록 프라이버시는 강하지만 분석 정확도는 낮아짐.

ㅇ 시험 대비 “패턴 보기” 예시:
O: “ε 값이 작을수록 프라이버시 보호 수준이 높아진다.”
X: “Differential Privacy는 원본 데이터를 암호화하여 보호한다.”

================================

2. Secure Multi-Party Computation

ㅇ 정의:
여러 참여자가 자신의 입력 데이터를 공개하지 않고도 공동으로 연산 결과를 계산할 수 있는 암호 기술.

ㅇ 특징:
각 참여자는 암호화된 형태로 데이터를 제공하며, 결과만 복호화.
통신량과 계산 복잡도가 높음.

ㅇ 적합한 경우:
금융 기관 간 신용평가, 병원 간 의료 데이터 분석 등 민감 데이터 협력 분석.

ㅇ 시험 함정:
모든 참여자가 동일한 키를 공유한다고 오해할 수 있음.
실제로는 분산된 키 또는 비밀분할 기법 사용.

ㅇ 시험 대비 “패턴 보기” 예시:
O: “Secure Multi-Party Computation은 원본 데이터 노출 없이 연산이 가능하다.”
X: “모든 참여자가 동일한 비밀키를 공유하여 연산한다.”

================================

3. Homomorphic Encryption

ㅇ 정의:
암호화된 데이터 상태에서 연산을 수행하고, 복호화 시 평문 연산 결과와 동일한 값을 얻을 수 있는 암호 기술.

ㅇ 특징:
완전동형(Full)과 부분동형(Partial)으로 구분.
데이터 복호화 없이 분석 가능하지만, 계산 비용이 매우 높음.

ㅇ 적합한 경우:
클라우드 환경에서 민감 데이터 분석, 의료 데이터 처리.

ㅇ 시험 함정:
모든 동형암호가 모든 연산을 지원한다고 착각하기 쉬움.
부분동형은 특정 연산(덧셈 또는 곱셈)만 지원.

ㅇ 시험 대비 “패턴 보기” 예시:
O: “동형암호를 사용하면 암호화된 상태에서 연산이 가능하다.”
X: “부분동형암호는 덧셈과 곱셈을 모두 지원한다.”

================================

4. Federated Averaging

ㅇ 정의:
연합학습에서 각 클라이언트가 로컬 데이터를 기반으로 학습한 모델 파라미터를 중앙 서버에서 평균하여 글로벌 모델을 업데이트하는 알고리즘.

ㅇ 특징:
데이터는 로컬에 남기고 모델 파라미터만 전송.
통신 비용 절감을 위해 여러 로컬 업데이트 후 전송 가능.

ㅇ 적합한 경우:
스마트폰 키보드 입력 예측, IoT 기기 데이터 기반 모델 학습.

ㅇ 시험 함정:
데이터가 중앙 서버로 전송된다고 오해하기 쉬움.
실제로는 원본 데이터는 전송되지 않음.

ㅇ 시험 대비 “패턴 보기” 예시:
O: “Federated Averaging은 로컬 모델 파라미터를 평균하여 글로벌 모델을 만든다.”
X: “Federated Averaging은 로컬 데이터를 중앙 서버로 전송하여 학습한다.”

ㅁ 추가 학습 내용

Differential Privacy
– Laplace Mechanism, Gaussian Mechanism 등 구체적인 노이즈 생성 방법 학습
– ε-δ 차분 프라이버시 개념 이해

Secure Multi-Party Computation
– Garbled Circuits, Secret Sharing, Oblivious Transfer 등의 구현 기법 학습
– 보안 가정(예: half honest majority) 이해

Homomorphic Encryption
– 대표적인 알고리즘: Paillier, BGV, CKKS
– 각 알고리즘의 연산 지원 범위 파악
– 성능 최적화 기법 숙지

Federated Averaging
– 비동기식 업데이트 방식 이해
– 클라이언트 샘플링 전략 학습
– 통신 효율화 기법: 압축, 양자화
– 데이터 비독립성(Non-IID) 문제 해결 방법 학습

최신 글