AI: 주요 문제 – 판별자(Discriminator)
ㅁ 주요 문제
1. 판별자(Discriminator)
ㅇ 정의:
생성모델(GAN)에서 입력된 데이터가 실제(real) 데이터인지 생성(fake) 데이터인지를 구분하는 신경망 모델로, 생성자와 경쟁 관계를 형성하며 학습함.
ㅇ 특징:
– 이진 분류(binary classification) 구조를 가짐.
– 학습 초기에 생성자가 만든 데이터 품질이 낮아 판별자가 쉽게 구분함.
– 학습이 진행되면서 생성자의 품질이 향상되면 판별자의 난이도도 높아짐.
– 과도하게 강한 판별자는 생성자의 학습을 방해할 수 있음.
ㅇ 적합한 경우:
– 생성 데이터의 품질 평가가 필요한 경우.
– 데이터 진위 여부 판단이 명확히 가능한 경우.
ㅇ 시험 함정:
– 판별자가 생성 데이터를 ‘만드는’ 역할이라고 혼동하는 경우 (X)
– 판별자는 학습 시 생성자와 동시에 업데이트됨 (O)
– 판별자가 완벽해질수록 GAN 학습이 항상 잘된다고 생각하는 경우 (X)
ㅇ 시험 대비 “패턴 보기” 예시:
– “판별자는 GAN에서 생성자의 출력을 평가하는 역할을 한다.” (O)
– “판별자는 생성 데이터를 생성하는 모듈이다.” (X)
– “GAN 학습에서 판별자는 생성자와 경쟁하며 동시에 발전한다.” (O)
– “판별자가 강할수록 항상 생성자의 품질이 좋아진다.” (X)
ㅁ 추가 학습 내용
판별자의 손실 함수는 일반적으로 이진 크로스 엔트로피(Binary Cross-Entropy)를 사용하지만, Wasserstein GAN(WGAN)에서는 지구 거리(Earth Mover’s Distance)를 기반으로 한 손실 함수를 사용한다.
판별자의 학습 안정성을 높이기 위해 레이블 스무딩(Label Smoothing), 드롭아웃(Dropout), 스펙트럴 정규화(Spectral Normalization) 등의 기법이 활용된다.
시험에서는 판별자와 생성자의 학습 비율, 업데이트 횟수의 차이, 그리고 판별자의 과적합(overfitting) 문제를 자주 물어볼 수 있다.