알고리즘·논문: 최신 모델 – GANs
ㅁ 최신 모델
ㅇ 정의:
생성적 적대 신경망(Generative Adversarial Networks, GANs)은 생성자(Generator)와 판별자(Discriminator) 두 개의 신경망이 경쟁적으로 학습하여 데이터와 유사한 새로운 데이터를 생성하는 딥러닝 모델이다.
ㅇ 특징:
– 생성자는 가짜 데이터를 만들어내고, 판별자는 입력이 진짜인지 가짜인지 구분한다.
– 두 네트워크가 동시에 학습되며, 생성자는 판별자를 속이도록, 판별자는 생성자를 구별하도록 발전한다.
– 이미지 생성, 스타일 변환, 데이터 증강 등 다양한 분야에 활용된다.
– 학습이 불안정하거나 모드 붕괴(Mode Collapse)가 발생할 수 있다.
ㅇ 적합한 경우:
– 대량의 학습 데이터가 있고, 새로운 샘플을 생성해야 하는 경우
– 이미지, 오디오, 영상 등 고차원 데이터 생성
– 데이터 증강을 통한 모델 성능 향상
ㅇ 시험 함정:
– GANs는 지도학습이 아닌 비지도 또는 준지도 학습 성격을 띤다.
– 생성자와 판별자는 동시에 학습되며, 한쪽만 학습시키는 구조가 아님.
– GANs는 확률 분포를 명시적으로 모델링하지 않는다.
ㅇ 시험 대비 “패턴 보기” 예시:
O: “GANs는 생성자와 판별자가 경쟁적으로 학습하는 구조이다.”
O: “GANs는 이미지 생성에 활용될 수 있다.”
X: “GANs는 생성자만 학습시키고 판별자는 고정한다.”
X: “GANs는 항상 안정적으로 수렴한다.”
ㅁ 추가 학습 내용
GANs 주요 변형 모델 및 특징 정리
1. CGAN (Conditional GAN)
– 조건부 생성 모델로, 클래스 레이블이나 특정 조건을 입력에 추가하여 원하는 속성을 가진 데이터를 생성
– 입력에 조건 벡터를 함께 제공하여 제어 가능한 생성 가능
2. DCGAN (Deep Convolutional GAN)
– 합성곱 신경망(CNN) 구조를 활용하여 이미지 생성 성능 향상
– 전통적인 GAN의 완전연결층 대신 합성곱·전치합성곱 계층 사용
– 배치 정규화와 ReLU/Leaky ReLU 활성화로 학습 안정성 향상
3. WGAN (Wasserstein GAN)
– Wasserstein 거리(지구 이동 거리)를 기반으로 한 손실 함수 사용
– 학습 안정성 향상, 모드 붕괴 완화
– 판별자를 크리틱(critic)으로 변경하여 확률 대신 점수 출력
– 가중치 클리핑 또는 이후 개선된 WGAN-GP에서 그래디언트 페널티 사용
4. StyleGAN
– 스타일 기반 생성 네트워크로, 잠재 벡터를 스타일로 변환하여 다양한 수준의 이미지 속성 제어
– 고해상도, 사실적인 이미지 생성 가능
– 스타일 혼합, 점진적 성장 기법 활용
모드 붕괴 방지 기법
– 미니배치 디스크리미네이션: 판별기가 배치 내 샘플 간의 다양성을 고려하도록 함
– 피처 매칭: 생성기가 판별기 중간 계층의 특징 분포를 맞추도록 유도
학습 안정화 기법
– 스펙트럴 정규화: 판별기의 가중치 스펙트럼 노름을 제한하여 안정성 확보
– 레이블 스무딩: 진짜/가짜 라벨을 0과 1이 아닌 부드러운 값으로 설정하여 과도한 확신 방지
GAN 학습 불안정성 원인
– 생성자와 판별자의 학습 불균형
– 그래디언트 소실 또는 폭주
– 모드 붕괴로 인한 다양성 상실
다른 생성 모델과 비교
– VAE: 확률적 인코더-디코더 구조, 잠재 공간의 명확한 해석 가능, 생성물의 선명도는 GAN보다 낮음
– Diffusion Model: 점진적 노이즈 제거 과정으로 고품질 이미지 생성, 학습 안정성 높지만 생성 속도 느림