데이터 전처리: 스마트 증강 – CutMix

ㅁ 스마트 증강

1. CutMix

ㅇ 정의:
이미지 데이터 증강 기법 중 하나로, 두 개의 이미지를 잘라서 일부 영역을 서로 섞어 새로운 학습 이미지를 생성하고, 라벨 또한 해당 비율에 맞게 혼합하는 방법.

ㅇ 특징:
– 이미지의 일부만 교체하므로 원본의 구조적 정보를 보존하면서도 새로운 시각적 패턴을 생성함.
– 단순한 픽셀 혼합이 아니라 공간적 위치 정보도 함께 변형.
– 모델의 일반화 성능 향상과 과적합 방지에 효과적.
– Mixup 대비 객체 위치 정보가 유지됨.

ㅇ 적합한 경우:
– 객체 탐지·분류에서 데이터 다양성이 부족할 때.
– 이미지에 여러 객체가 존재하거나 배경 다양성이 필요한 경우.
– 소규모 데이터셋에서 강인한 모델을 만들고자 할 때.

ㅇ 시험 함정:
– CutMix는 항상 랜덤 위치에 이미지를 붙이는 것이 아니라 사각형 영역을 잘라 붙이는 방식임.
– 라벨 혼합 비율은 잘라낸 영역의 면적 비율에 따라 결정됨.
– Mixup과 혼동 유발: Mixup은 픽셀 단위 선형 혼합, CutMix는 영역 단위 혼합.

ㅇ 시험 대비 “패턴 보기” 예시:
– O: “CutMix는 두 이미지를 일부 영역 단위로 합성하고, 라벨은 영역 비율에 따라 혼합한다.”
– X: “CutMix는 두 이미지를 픽셀 단위로 선형 혼합하여 새로운 이미지를 만든다.”

ㅁ 추가 학습 내용

CutMix는 이미지 데이터 증강 기법 중 하나로, 두 이미지를 결합할 때 한 이미지의 일부 영역을 잘라 다른 이미지에 붙이고, 라벨도 잘라낸 영역의 비율에 따라 혼합한다. 라벨 혼합 공식은 y = λy_A + (1-λ)y_B이며, λ는 잘라낸 영역이 차지하는 비율을 의미한다. 원본 논문에서는 이 방법을 사용해 이미지 분류 성능이 향상되었으며, 객체 탐지와 세그멘테이션 작업에도 응용 가능함을 보였다. CutMix는 잘라내는 영역의 크기와 위치를 랜덤하게 설정하는 것이 특징이다. 시험에서는 Mixup, Cutout, CutMix의 차이 비교, 라벨 혼합 비율 계산, CutMix의 장단점 서술 등이 출제될 수 있다.

답글 남기기

Your email address will not be published. Required fields are marked *.

*
*