생성 모델: 프로세스 및 특징
ㅁ 프로세스 및 특징
ㅇ 정의:
확산 모델에서 데이터에 점진적으로 노이즈를 추가하고, 이를 제거하여 원본 데이터를 복원하는 과정 전반을 의미함.
ㅇ 특징:
– 순방향(Forward)과 역방향(Backward) 두 단계로 구성됨
– Forward는 데이터 파괴, Backward는 데이터 생성 과정
– 수학적으로 확률적 마코프 체인 기반으로 모델링됨
ㅇ 적합한 경우:
– 이미지, 오디오 등 연속 데이터 생성
– 데이터 분포 학습이 필요한 생성 작업
ㅇ 시험 함정:
– Forward와 Backward의 개념을 혼동
– 노이즈 추가와 제거의 방향성을 반대로 이해
ㅇ 시험 대비 “패턴 보기” 예시:
O: Forward Process는 데이터에 점진적으로 노이즈를 추가하는 과정이다.
X: Backward Process는 원본 데이터에 노이즈를 추가하는 과정이다.
================================
1. Forward Process
ㅇ 정의:
원본 데이터에 점진적으로 가우시안 노이즈를 추가하여 완전한 노이즈 상태로 만드는 과정.
ㅇ 특징:
– 단계별로 노이즈 비율이 증가
– 데이터의 구조적 정보가 점차 소실됨
– 예측 불가능한 방향으로 데이터가 변형됨
ㅇ 적합한 경우:
– 모델 학습 시 데이터 분포 파괴를 통한 역방향 학습 준비
ㅇ 시험 함정:
– Forward를 데이터 생성 과정으로 잘못 이해
– 노이즈가 한 번에 추가된다고 오해
ㅇ 시험 대비 “패턴 보기” 예시:
O: Forward Process는 점진적으로 노이즈를 추가하는 단계이다.
X: Forward Process는 노이즈를 제거하는 단계이다.
================================
2. Backward Process
ㅇ 정의:
완전한 노이즈 상태에서 점진적으로 노이즈를 제거해 원본 데이터로 복원하는 과정.
ㅇ 특징:
– 단계별로 노이즈를 줄이며 데이터 구조를 복원
– 학습된 확률 모델을 사용하여 각 단계 예측
ㅇ 적합한 경우:
– 이미지 생성, 음성 복원 등 데이터 생성 작업
ㅇ 시험 함정:
– Backward를 데이터 파괴 과정으로 혼동
– 노이즈 제거 순서를 잘못 이해
ㅇ 시험 대비 “패턴 보기” 예시:
O: Backward Process는 노이즈를 제거하며 데이터를 복원한다.
X: Backward Process는 데이터에 노이즈를 추가한다.
================================
3. 노이즈 추가 및 제거
ㅇ 정의:
확산 모델에서 데이터에 점진적으로 노이즈를 추가하고, 이를 제거하는 일련의 연산 과정.
ㅇ 특징:
– Forward는 노이즈 추가, Backward는 노이즈 제거
– 노이즈 분포는 주로 가우시안 분포 사용
– 단계별 확률적 변환을 통해 데이터 상태 변화
ㅇ 적합한 경우:
– 생성 모델 학습 시 데이터 분포 학습
– 데이터 복원 및 생성 품질 향상
ㅇ 시험 함정:
– 노이즈 추가와 제거의 순서 혼동
– 노이즈 분포의 종류를 잘못 기억
ㅇ 시험 대비 “패턴 보기” 예시:
O: 확산 모델은 Forward에서 노이즈를 추가하고 Backward에서 제거한다.
X: 확산 모델은 Forward에서 노이즈를 제거하고 Backward에서 추가한다.
ㅁ 추가 학습 내용
Forward/Backward Process는 확률적 생성 모델에서 데이터에 점진적으로 노이즈를 추가하고 제거하는 과정을 의미한다.
Forward 과정은 q(x_t | x_{t-1}) = N(x_t; sqrt(1-β_t) x_{t-1}, β_t I)로 정의되며, 이는 t-1 시점의 데이터에 가우시안 노이즈를 추가하는 마코프 체인 형태이다. β_t는 각 단계에서 추가되는 노이즈의 크기를 결정하며, β 스케줄(선형, 코사인 등)에 따라 최종 생성 품질이 달라진다.
Backward 과정은 p_θ(x_{t-1} | x_t)로 근사하며, Forward에서 추가된 노이즈를 제거하는 방향으로 진행된다. 이 과정에서 mean과 variance를 추정하는데, mean은 원본 데이터 복원을 위한 중심값 역할을 하고, variance는 샘플링 시의 불확실성을 반영한다.
DDPM(Denoising Diffusion Probabilistic Models)은 확률적 방식으로 노이즈를 제거하며, 많은 샘플링 스텝이 필요하다. 반면 DDIM(Denoising Diffusion Implicit Models)은 비확률적 경로를 허용하여 더 적은 스텝으로 샘플링이 가능하며 속도가 빠르다.
시험에서는 Forward와 Backward의 시간 방향, 가우시안 노이즈 분포 사용, 마코프 체인 특성, β 스케줄의 영향, DDPM과 DDIM의 차이점, 그리고 노이즈 추가·제거 과정에서 mean과 variance 추정의 역할을 구분하는 것이 중요하다.