데이터 전처리: 생성 기법 – Diffusion Synthesis

ㅁ 생성 기법

1. Diffusion Synthesis

ㅇ 정의:
확률적 잡음을 점진적으로 제거하며 데이터(이미지, 오디오, 텍스트 등)를 생성하는 확산 기반 합성 기법으로, 순방향 과정에서 데이터에 점점 잡음을 추가하고 역방향 과정에서 잡음을 제거하며 원본 데이터 분포를 학습함.

ㅇ 특징:
– 고품질, 고해상도 데이터 생성 가능
– GAN 대비 학습 안정성이 높음
– 생성 과정이 단계적이며 계산량이 많음
– 다양한 조건부 생성(텍스트-이미지 등)에 활용 가능

ㅇ 적합한 경우:
– 고해상도 이미지 합성
– 데이터 다양성이 중요한 합성 작업
– 노이즈 제거, 초해상도 복원 등 복원형 태스크

ㅇ 시험 함정:
– GAN과 비교 시 학습 안정성과 생성 속도 차이를 혼동
– 순방향/역방향 과정의 개념을 반대로 이해하는 경우
– 확산 모델이 항상 빠르다고 오해하는 경우 (실제는 느림)

ㅇ 시험 대비 “패턴 보기” 예시:
O: “Diffusion Synthesis는 순방향 과정에서 잡음을 추가하고, 역방향 과정에서 이를 제거하며 데이터를 생성한다.”
X: “Diffusion Synthesis는 잡음을 한 번에 제거하여 빠르게 데이터를 생성한다.”

ㅁ 추가 학습 내용

Diffusion Synthesis는 Denoising Diffusion Probabilistic Models(DDPM) 계열 기법으로, Variance Schedule(β 값 조정)이 성능에 큰 영향을 미친다.
시험에서는 Forward Process(데이터에서 노이즈로 변환)와 Reverse Process(노이즈에서 데이터로 복원) 단계의 수와 계산 복잡도를 묻는 경우가 있다.
Classifier-Free Guidance, Latent Diffusion Model(LDM)과 같은 변형 기법은 조건부 생성 문제에서 유리하게 작용한다.
또한 GAN, VAE와 비교할 때 모드 붕괴, 학습 안정성, 생성 속도, 품질 측면의 차이를 표로 정리해두면 시험 대비에 효과적이다.

답글 남기기

Your email address will not be published. Required fields are marked *.

*
*