모델: 의미론적 분할/증강 – Random Erasing
ㅁ 의미론적 분할/증강
ㅇ 정의:
이미지의 일부 영역을 무작위로 선택하여 픽셀 값을 지우거나 다른 값으로 대체하는 데이터 증강 기법으로, 모델이 특정 영역이나 패턴에 과도하게 의존하지 않도록 학습을 돕는다.
ㅇ 특징:
– 입력 이미지의 임의 사각형 영역을 마스킹 처리
– 마스킹 영역의 크기, 위치, 색상은 랜덤하게 결정
– 과적합 방지 및 일반화 성능 향상에 효과적
– 의료 영상에서는 병변 위치에 대한 편향을 줄이는 데 활용
ㅇ 적합한 경우:
– 데이터셋 크기가 작아 과적합 위험이 높은 경우
– 병변이나 특정 구조의 위치가 일정하지 않은 의료 영상 학습
– 다양한 노이즈 환경에 강인한 모델이 필요한 경우
ㅇ 시험 함정:
– Random Erasing은 이미지 전체를 지우는 것이 아니라 일부 영역만 지운다(O)
– 항상 같은 위치를 지우는 방식이다(X)
– 데이터 증강 시 원본 이미지의 의미를 완전히 상실시킨다(X)
– 의료 영상에서는 무조건 성능 향상을 보장한다(X)
ㅇ 시험 대비 “패턴 보기” 예시:
– “Random Erasing은 이미지 일부 영역을 무작위로 제거하여 모델이 특정 패턴에 의존하는 것을 방지한다.” (O)
– “Random Erasing은 모든 픽셀을 무작위로 섞어 새로운 이미지를 만든다.” (X)
– “Random Erasing은 항상 동일한 위치를 제거하는 고정 마스킹 방식이다.” (X)
ㅁ 추가 학습 내용
Random Erasing은 Cutout과 유사하게 이미지의 일부 영역을 제거하는 데이터 증강 기법이지만, 제거된 영역을 고정 값(예: 0, 평균값) 또는 무작위 값으로 채울 수 있으며, 제거 영역의 크기와 비율을 하이퍼파라미터로 조절할 수 있어 더 유연하다.
시험에서는 CutMix, Mixup 등 다른 증강 기법과의 차이를 구분하는 문제가 자주 출제되므로, 각 기법의 이미지 변형 방식과 라벨 처리 방식을 비교해 정리해두는 것이 중요하다.
Random Erasing을 의료 영상에 적용할 경우, 병변이 제거되면 학습이 왜곡될 수 있으므로 제거 영역의 크기와 위치를 병변 주변이 아닌 곳으로 제한하는 전략을 함께 고려해야 한다.