알고리즘·논문: 최신 모델 – Diffusion Models

ㅁ 최신 모델

1. Diffusion Models

ㅇ 정의:
확률적 노이즈를 점진적으로 제거하여 데이터를 생성하는 확률 기반 생성모델로, 이미지·음성·영상 생성에 활용됨. 학습 시에는 데이터에 점진적으로 노이즈를 추가하고, 생성 시에는 이를 반대로 제거하는 과정을 거침.

ㅇ 특징:
– GAN 대비 학습 안정성이 높고 모드 붕괴(mode collapse)가 적음
– 고해상도·고품질 샘플 생성 가능
– 샘플링 속도가 느림(여러 스텝 필요)
– U-Net, Transformer 등 다양한 신경망 구조와 결합 가능

ㅇ 적합한 경우:
– 고품질 이미지 생성이 필요한 경우
– 예술·디자인 분야의 창작물 생성
– 데이터 증강, 초해상도, 인페인팅 등 응용

ㅇ 시험 함정:
– GAN과 비교 시 장단점 혼동
– Variational Autoencoder(VAE)와의 차이점에서 확률적 샘플링 방식 혼동
– 샘플링 속도 관련 문장(빠르다/느리다) 반대로 출제 가능

ㅇ 시험 대비 “패턴 보기” 예시:
O: Diffusion Models는 점진적으로 노이즈를 제거하여 데이터를 생성한다.
X: Diffusion Models는 한 번의 샘플링으로 이미지를 생성한다.
O: GAN 대비 학습이 안정적이며 모드 붕괴가 적다.
X: Diffusion Models는 학습이 불안정하고 모드 붕괴가 심하다.

ㅁ 추가 학습 내용

Diffusion Models의 주요 변형에는 DDPM(Denoising Diffusion Probabilistic Models), DDIM(Denoising Diffusion Implicit Models), Latent Diffusion Models(LDM)이 있다.
DDIM은 샘플링 속도를 개선한 모델이며, LDM은 잠재공간에서 연산을 수행하여 메모리 사용량과 연산량을 줄인다.
Stable Diffusion은 LDM 기반의 대표적인 오픈소스 모델로, 텍스트-투-이미지 생성 분야에서 널리 사용된다.

시험에서는 다음 내용이 자주 출제된다.
– 순방향 과정(forward process)과 역방향 과정(reverse process)의 개념
– 베타 스케줄링(beta scheduling)
– U-Net 구조와 Diffusion Model의 결합 이유
– 다른 생성 모델(GAN, VAE)과 비교했을 때의 장단점

답글 남기기

Your email address will not be published. Required fields are marked *.

*
*