AI: 주요 문제 – Mode Collapse

ㅁ 주요 문제

ㅇ 정의:
GAN 학습 과정에서 생성기가 소수의 패턴만 반복적으로 생성하여 다양한 데이터 분포를 재현하지 못하는 현상.

ㅇ 특징:
– 출력 다양성이 떨어지고, 비슷하거나 동일한 샘플이 반복 생성됨.
– 판별기는 일부 패턴에만 익숙해져 다른 패턴 구분 능력이 떨어짐.
– 학습이 불안정하게 수렴하거나 특정 모드에 고착됨.

ㅇ 적합한 경우:
– 적합한 경우가 아니라, 피해야 할 문제 상황.
– 데이터 다양성이 중요한 이미지 생성, 음성 합성 등에서 특히 치명적.

ㅇ 시험 함정:
– Mode Collapse는 데이터 불균형 문제와 혼동하기 쉬움.
– ‘모드 붕괴가 발생하면 데이터의 분포를 더 잘 학습한다’는 문장은 틀림.
– ‘모드 붕괴는 생성기 구조 변경 없이도 해결 가능하다’ → 반드시 맞는 말은 아님.

ㅇ 시험 대비 “패턴 보기” 예시:
– (O) Mode Collapse는 생성 모델의 다양성 저하와 관련이 있다.
– (O) Mode Collapse는 GAN 학습 불안정성의 한 형태이다.
– (X) Mode Collapse는 데이터의 모든 모드를 고르게 학습하는 현상이다.
– (X) Mode Collapse는 판별기의 성능 향상으로 쉽게 해결된다.

ㅁ 추가 학습 내용

Mode Collapse 방지 주요 기법 정리
– Minibatch Discrimination: 배치 내 샘플 간의 차이를 비교하여 생성기가 다양한 출력을 생성하도록 유도하는 방법
– Unrolled GAN: 판별기의 파라미터 업데이트를 여러 단계 예측(Unroll)하여 생성기가 판별기의 향후 반응까지 고려하도록 학습시키는 방법
– Feature Matching: 판별기의 중간 계층에서 추출한 특징 통계를 생성기 학습 목표로 사용하여 다양성을 확보하는 방법
– Wasserstein GAN(WGAN): Wasserstein 거리(지구 이동 거리)를 사용하여 학습 안정성을 높이고 Mode Collapse를 완화하는 방법

Mode Collapse와 유사 개념 비교
– Mode Collapse: 생성기가 소수의 패턴만 반복적으로 생성하여 출력 다양성이 부족해지는 현상
– Overfitting: 모델이 학습 데이터에 과도하게 맞춰져 새로운 데이터에 대한 일반화 성능이 떨어지는 현상
– Vanishing Gradient: 역전파 과정에서 기울기가 0에 가까워져 학습이 거의 진행되지 않는 현상

사례
– 얼굴 이미지 생성에서 동일한 표정이나 각도만 반복적으로 생성되는 경우는 Mode Collapse의 대표적인 예

답글 남기기

Your email address will not be published. Required fields are marked *.

*
*