AI 시스템 구축: 학습 구조 – Reptile

ㅁ 학습 구조

ㅇ 정의:
메타러닝에서 사용되는 모델 최적화 기법 중 하나로, 여러 작업(Task)에서 학습한 후 모델 파라미터를 일반화된 초기값으로 조정하여 새로운 작업에 빠르게 적응할 수 있도록 하는 알고리즘.

ㅇ 특징:
– MAML과 달리 2계 도함수(Second-order derivatives)를 계산하지 않아 계산량이 적음.
– 각 작업에서 여러 스텝의 SGD를 수행한 후, 초기 파라미터를 해당 결과 방향으로 이동시킴.
– 단순 구조로 구현이 용이하고 대규모 데이터셋에도 적용 가능.

ㅇ 적합한 경우:
– 다양한 작업에 빠르게 적응해야 하는 Few-shot Learning 상황.
– 계산 자원이 제한적이어서 MAML보다 가벼운 메타러닝 기법이 필요한 경우.
– 온라인 학습 환경에서 빠른 파라미터 업데이트가 필요한 경우.

ㅇ 시험 함정:
– MAML과의 차이에서 ‘2계 도함수를 사용한다’라고 하면 오답 (Reptile은 사용하지 않음).
– Reptile이 Gradient-free 방식이라고 혼동하는 경우 (SGD 기반이므로 Gradient 사용).
– 단일 작업 학습에 특화된 기법으로 오해하는 경우 (다중 작업 기반).

ㅇ 시험 대비 “패턴 보기” 예시:
O: “Reptile은 MAML보다 계산량이 적고, 2계 도함수를 계산하지 않는다.”
X: “Reptile은 Gradient를 사용하지 않는 메타러닝 기법이다.”
X: “Reptile은 단일 작업 학습에 최적화된 알고리즘이다.”

ㅁ 추가 학습 내용

Reptile은 MAML에 비해 구현이 간단하고 연산량이 적지만 성능은 약간 떨어질 수 있다.
Reptile은 각 Task에서 여러 번의 SGD 스텝을 수행한 후 초기 파라미터를 업데이트하는 방식으로 동작하며, ‘First-order’ 메타러닝 기법에 속한다.
메타 테스트 단계에서 추가 학습 없이 바로 예측한다는 설명은 틀리며, 실제로는 새로운 Task에 대해 몇 스텝의 학습을 수행한다.
Reptile은 Online Meta-Learning 시나리오에 적합하다.
Inner loop는 각 Task 내에서 파라미터를 학습하는 과정이고, Outer loop는 여러 Task를 통해 초기 파라미터를 업데이트하는 과정이다.

답글 남기기

Your email address will not be published. Required fields are marked *.

*
*