모델: 의미론적 분할/증강
ㅁ 의미론적 분할/증강
1. Random Erasing
ㅇ 정의:
– 학습 이미지의 임의 위치에 직사각형 영역을 선택하여 픽셀 값을 무작위로 지우거나 대체하는 데이터 증강 기법.
ㅇ 특징:
– 모델이 특정 위치나 패턴에 과적합되는 것을 방지.
– 노이즈와 가려짐에 강인한 모델 학습 가능.
ㅇ 적합한 경우:
– 의료 영상에서 병변 일부가 가려지거나 누락될 수 있는 상황을 대비.
ㅇ 시험 함정:
– ‘전체 이미지를 무작위로 삭제’로 설명하면 오답.
ㅇ 시험 대비 “패턴 보기” 예시:
– O: “이미지 일부 영역을 무작위로 제거하여 일반화 성능 향상”
– X: “이미지 전체를 무작위로 삭제하여 데이터 크기를 줄임”
2. Gaussian Blur
ㅇ 정의:
– 가우시안 커널을 사용하여 이미지를 흐리게 만드는 필터링 기법.
ㅇ 특징:
– 고주파 노이즈 제거, 경계 완화.
– 다양한 스케일의 가우시안 커널 적용 가능.
ㅇ 적합한 경우:
– 영상의 노이즈를 줄이고, 모델이 세부 잡음에 과적합되는 것을 방지.
ㅇ 시험 함정:
– ‘샤프닝’과 혼동 유발.
ㅇ 시험 대비 “패턴 보기” 예시:
– O: “가우시안 분포 기반 필터로 이미지를 부드럽게 처리”
– X: “가우시안 블러는 이미지의 경계를 날카롭게 함”
3. Brightness Adjustment
ㅇ 정의:
– 이미지의 전체 밝기를 일정 비율로 조정하는 데이터 증강 기법.
ㅇ 특징:
– 조명 조건 변화에 대한 모델의 강인성 향상.
ㅇ 적합한 경우:
– 의료 영상 촬영 환경의 밝기 차이를 보완.
ㅇ 시험 함정:
– 대비(Contrast) 조정과 혼동.
ㅇ 시험 대비 “패턴 보기” 예시:
– O: “영상의 전반적인 밝기를 변경하여 다양한 조명 조건을 시뮬레이션”
– X: “밝기 조정은 픽셀 간 대비를 변경하는 것과 동일함”
4. Random Rotation
ㅇ 정의:
– 이미지를 임의의 각도로 회전시키는 데이터 증강 방법.
ㅇ 특징:
– 회전 불변성 학습 가능.
– 각도 범위를 제한하여 원본 의미를 유지.
ㅇ 적합한 경우:
– 의료 영상의 촬영 각도 변화를 모델이 견디도록 함.
ㅇ 시험 함정:
– ‘이미지를 반드시 90도 단위로만 회전’으로 오해.
ㅇ 시험 대비 “패턴 보기” 예시:
– O: “임의 각도로 회전시켜 다양한 시점의 데이터를 확보”
– X: “랜덤 로테이션은 항상 90도의 배수로만 회전함”
5. Mixup
ㅇ 정의:
– 두 개 이상의 이미지를 픽셀 단위로 가중합하여 새로운 학습 샘플을 생성하는 기법.
ㅇ 특징:
– 라벨도 동일 비율로 혼합.
– 경계가 모호한 데이터 생성으로 과적합 방지.
ㅇ 적합한 경우:
– 데이터 수가 적거나 클래스 간 경계가 애매한 경우.
ㅇ 시험 함정:
– 단순한 이미지 합성과 혼동.
ㅇ 시험 대비 “패턴 보기” 예시:
– O: “두 이미지와 라벨을 비율로 혼합하여 새로운 학습 데이터 생성”
– X: “Mixup은 이미지를 무작위로 이어붙이는 방식”
ㅁ 추가 학습 내용
의미론적 분할 및 데이터 증강 분야에서는 CutMix, Elastic Transform, Color Jitter, Histogram Equalization 등의 기법이 자주 사용되며 시험에 출제될 수 있다.
의료 영상의 경우, 증강 과정에서 병변의 형태가 왜곡되지 않도록 주의해야 하며, 진단에 필요한 특징을 훼손하지 않는 범위에서 적용해야 한다.
증강 기법의 목적은 다음과 같다.
– 일반화 성능 향상
– 과적합 방지
– 데이터 다양성 확보
증강 기법의 부작용은 다음과 같다.
– 중요한 특징 손실
– 학습 난이도 증가
비교형 문제 대비가 필요한 주요 쌍은 다음과 같다.
– Mixup vs CutMix
– Random Erasing vs Dropout
– Gaussian Blur vs Median Filter