AI: 주요 문제
ㅁ 주요 문제
ㅇ 정의:
GAN 학습 과정에서 자주 발생하는 대표적인 문제와 구성 요소를 의미하며, 생성 품질 저하나 학습 불안정성의 원인이 됨.
ㅇ 특징:
– 생성자와 판별자의 경쟁적 학습 구조에서 발생
– 데이터 다양성 감소, 학습 불안정, 과적합 등으로 이어질 수 있음
ㅇ 적합한 경우:
– GAN 구조 및 동작 원리를 이해하고 문제 해결 방안을 모색할 때
ㅇ 시험 함정:
– 주요 문제와 구성 요소를 혼동
– 문제의 원인과 해결책을 구분하지 못함
ㅇ 시험 대비 “패턴 보기” 예시:
O: “Mode Collapse는 생성된 샘플의 다양성이 현저히 줄어드는 현상이다.”
X: “판별자는 데이터 다양성을 유지하는 역할을 한다.”
================================
1. Mode Collapse
ㅇ 정의:
생성자가 소수의 패턴만 반복적으로 생성하여 다양성이 사라지는 현상
ㅇ 특징:
– 특정 클래스 또는 형태만 생성
– 학습이 진행되어도 새로운 패턴이 나타나지 않음
ㅇ 적합한 경우:
– GAN의 학습 안정성을 평가하거나 개선 기법 적용 시
ㅇ 시험 함정:
– 단순한 저품질 이미지 생성과 혼동
– 데이터셋 크기 부족과 동일시
ㅇ 시험 대비 “패턴 보기” 예시:
O: “Mode Collapse는 GAN에서 한정된 패턴만 생성되는 문제이다.”
X: “Mode Collapse는 판별자가 과적합된 상태를 의미한다.”
================================
2. 판별자(Discriminator)
ㅇ 정의:
GAN에서 입력이 실제 데이터인지 생성된 데이터인지 구별하는 신경망
ㅇ 특징:
– 이진 분류기 역할 수행
– 생성자와 경쟁적으로 학습
– 지나치게 강하면 생성자 학습이 어려워짐
ㅇ 적합한 경우:
– 생성 모델의 품질 평가
– 학습 초기 안정화
ㅇ 시험 함정:
– 판별자가 강할수록 항상 좋은 성능이라고 오해
– 생성자와의 학습 균형 필요성을 간과
ㅇ 시험 대비 “패턴 보기” 예시:
O: “판별자는 GAN에서 진짜와 가짜 데이터를 구분한다.”
X: “판별자는 GAN에서 새로운 데이터를 생성한다.”
================================
3. Generator
ㅇ 정의:
GAN에서 무작위 벡터를 입력받아 실제 데이터와 유사한 데이터를 생성하는 신경망
ㅇ 특징:
– 판별자를 속이는 방향으로 학습
– 데이터의 분포를 학습하여 다양한 샘플 생성
ㅇ 적합한 경우:
– 새로운 이미지, 오디오, 텍스트 생성
– 데이터 증강
ㅇ 시험 함정:
– 생성자가 판별자의 역할도 수행한다고 오해
– 입력이 항상 실제 데이터라고 착각
ㅇ 시험 대비 “패턴 보기” 예시:
O: “생성자는 무작위 벡터를 기반으로 데이터를 만든다.”
X: “생성자는 입력 데이터를 분류하는 역할을 한다.”
ㅁ 추가 학습 내용
Mode Collapse 해결 방법에는 미니배치 판별(minibatch discrimination), 다양한 입력 노이즈 사용, 학습률 조정 등이 있다. 판별자와 생성자의 학습 균형이 중요하며, 판별자가 너무 강하면 생성자가 학습할 기회를 잃고, 너무 약하면 생성자가 쉽게 속여 학습이 무의미해진다. 생성자(G) 학습에서는 잠재공간(latent space)의 구조 이해가 필요하며, 입력 노이즈의 분포(정규분포, 균등분포 등)가 생성 품질에 영향을 준다. 시험에서는 GAN의 손실 함수 형태, 판별자와 생성자의 동시 학습 메커니즘, Mode Collapse와 Overfitting의 차이 등이 자주 출제된다.