AI 시스템 구축: 분산 전략 – Homomorphic Encryption
ㅁ 분산 전략
ㅇ 정의:
– Homomorphic Encryption(동형암호)은 암호화된 상태에서 데이터 연산이 가능하도록 하는 암호 기술로, 복호화 없이도 연산 결과를 얻을 수 있음.
ㅇ 특징:
– 데이터 프라이버시를 유지하면서도 연산 가능.
– 연산 과정에서 원본 데이터가 노출되지 않음.
– 완전동형암호(FHE), 부분동형암호(PHE) 등으로 구분.
– 연산 속도가 일반 연산 대비 매우 느리고, 계산 자원이 많이 소모됨.
ㅇ 적합한 경우:
– 민감한 의료 데이터, 금융 데이터 분석.
– 연합 학습에서 중앙 서버가 개별 클라이언트의 원본 데이터에 접근하지 않고 모델 업데이트를 처리해야 하는 경우.
– 클라우드 환경에서 데이터 소유자가 데이터를 암호화한 채로 연산을 맡기는 경우.
ㅇ 시험 함정:
– 동형암호는 데이터 전송 시 암호화하는 것과 다르며, 암호화된 상태에서 연산이 가능하다는 점이 핵심.
– 완전동형암호(FHE)는 덧셈과 곱셈 모두 지원, 부분동형암호(PHE)는 한 종류만 지원.
– 속도나 자원 소모에 대한 단점이 출제될 수 있음.
ㅇ 시험 대비 “패턴 보기” 예시:
– (O) 동형암호는 복호화 없이 암호화된 데이터에 대해 연산이 가능하다.
– (O) 완전동형암호는 덧셈과 곱셈 연산을 모두 지원한다.
– (X) 동형암호는 반드시 복호화 후 연산을 수행해야 한다.
– (X) 동형암호는 속도가 일반 연산보다 빠르다.
ㅁ 추가 학습 내용
Homomorphic Encryption(HE)의 보안 강도는 키 길이와 암호화 스킴에 따라 달라진다. 실제 서비스 적용 시에는 연산량과 지연 시간 문제로 인해 부분동형암호(PHE)나 준동형암호(SHE)를 혼합 사용하기도 한다.
시험에서는 HE와 Secure Multi-Party Computation(SMPC), Differential Privacy(DP)의 차이점을 묻는 문제가 자주 출제된다.
HE는 데이터가 암호화된 상태에서 직접 연산이 가능하다.
SMPC는 데이터를 여러 부분으로 분할하여 각 참여자가 일부만 가지고 연산을 수행한다.
DP는 원본 데이터에 통계적 노이즈를 추가하여 개인정보를 보호한다.
HE는 주로 덧셈과 곱셈 연산 지원 여부에 따라 구분되며, 이를 묻는 문제도 자주 나온다.