데이터 전처리: 스마트 증강 – RandAugment

ㅁ 스마트 증강

ㅇ 정의:

데이터 증강 기법 중 하나로, 여러 가지 증강 변환을 무작위로 조합하여 적용하되, 변환의 종류와 강도를 간단한 파라미터로 제어하는 방식.

ㅇ 특징:

– 기존 AutoAugment처럼 복잡한 정책 탐색 없이, 변환 개수(N)와 강도(M) 두 개의 파라미터로 제어 가능
– 이미지 분류, 객체 탐지 등 다양한 비전 작업에 적용 가능
– 학습 데이터 다양성을 높여 과적합 방지
– 구현이 간단하고 연산량이 비교적 적음

ㅇ 적합한 경우:

– 데이터셋이 작아 과적합 위험이 높은 경우
– 증강 정책을 빠르게 적용해야 하는 경우
– 다양한 변환 효과를 실험적으로 적용해보고 싶은 경우

ㅇ 시험 함정:

– AutoAugment와 혼동: AutoAugment는 탐색 기반, RandAugment는 고정 파라미터 기반
– N, M 파라미터 의미를 반대로 기억하는 경우 (N=적용 변환 개수, M=강도)
– 모든 변환이 항상 좋은 성능을 내는 것은 아님

ㅇ 시험 대비 “패턴 보기” 예시:

– RandAugment는 복잡한 탐색 알고리즘을 사용한다 (X)
– RandAugment는 N과 M 두 파라미터로 증강을 제어한다 (O)
– RandAugment는 데이터 다양성을 높여 과적합을 줄일 수 있다 (O)
– N은 변환 강도를 의미한다 (X)

================================

1. RandAugment

ㅇ 정의:

이미지 데이터 증강에서 변환의 종류와 강도를 단순화하여 무작위 조합으로 적용하는 기법. 변환 개수(N)와 강도(M)만 설정하면 다양한 증강 효과를 얻을 수 있음.

ㅇ 특징:

– 사전 탐색 없이 빠르게 적용 가능
– 다양한 변환(회전, 색상 변화, 잘라내기 등)을 무작위로 선택
– 일관된 파라미터 설정으로 재현성 확보

ㅇ 적합한 경우:

– 모델 학습 속도를 유지하면서 데이터 다양성을 높이고 싶은 경우
– 하이퍼파라미터 튜닝 시간을 줄이고 싶은 경우

ㅇ 시험 함정:

– 변환 개수 N과 강도 M의 정의를 혼동
– AutoAugment와 동일하게 생각하는 오류

ㅇ 시험 대비 “패턴 보기” 예시:

– RandAugment는 변환 개수와 강도를 모두 자동 탐색한다 (X)
– RandAugment는 변환 개수 N과 강도 M을 수동 설정한다 (O)
– RandAugment는 다양한 변환을 무작위로 적용한다 (O)
– RandAugment는 항상 성능 향상을 보장한다 (X)

ㅁ 추가 학습 내용

RandAugment 동작 절차
1. 사전에 정의된 변환(augmentation) 목록을 준비한다.
2. 목록에서 N개의 변환을 무작위로 선택한다.
3. 선택된 각 변환에 동일한 강도 M을 적용한다.

변환 강도 M의 특징
– M 값이 높을수록 이미지 변형 정도가 커진다.
– 지나치게 높은 M 값은 학습 성능에 부정적인 영향을 줄 수 있으므로 적절한 값 설정이 중요하다.

적용 범위
– 주로 이미지 데이터에 사용된다.
– 텍스트, 오디오 데이터에도 해당 도메인에 맞는 변환을 정의하여 적용할 수 있다.

시험 대비 포인트
– AutoAugment, TrivialAugment 등 다른 데이터 증강 기법과의 차이점을 비교할 수 있어야 한다.
– 각 기법의 특징을 표로 정리해두면 비교 문제에 효과적으로 대비할 수 있다.

답글 남기기

Your email address will not be published. Required fields are marked *.

*
*