데이터 전처리: 이미지 증강 – 플립
ㅁ 이미지 증강
ㅇ 정의:
이미지 증강은 기존의 이미지 데이터를 변형하여 데이터셋의 다양성을 인위적으로 높이는 기법으로, 모델의 일반화 성능을 향상시키기 위해 사용됨.
ㅇ 특징:
– 원본 데이터의 의미를 유지하면서 다양한 변형을 적용
– 과적합 방지에 효과적
– 학습 데이터 수집 비용 절감 가능
ㅇ 적합한 경우:
– 이미지 데이터가 부족하거나 클래스 불균형이 심한 경우
– 모델이 특정 방향, 위치, 조명에 과도하게 의존하는 경우
ㅇ 시험 함정:
– 증강 방법이 원본 의미를 훼손할 수 있는 경우(예: 숫자 뒤집기)
– 모든 이미지에 동일한 증강을 적용하면 오히려 성능 저하 가능
ㅇ 시험 대비 “패턴 보기” 예시:
O: “이미지 증강은 과적합 방지에 도움을 준다.”
X: “이미지 증강은 원본 데이터의 의미를 반드시 변경한다.”
================================
1. 플립
ㅇ 정의:
플립은 이미지를 좌우 또는 상하로 뒤집는 데이터 증강 기법으로, 객체의 방향성에 대한 모델의 편향을 줄이는 데 사용됨.
ㅇ 특징:
– 좌우 플립은 사람 얼굴, 동물 등 좌우 대칭성이 있는 데이터에 효과적
– 상하 플립은 위아래 방향성이 중요한 데이터에는 부적합
– 계산 비용이 낮고 구현이 간단함
ㅇ 적합한 경우:
– 풍경, 자연물, 일부 물체 인식에서 방향성이 크게 중요하지 않은 경우
– 좌우 대칭성이 있는 객체 데이터셋
ㅇ 시험 함정:
– 방향성이 중요한 이미지(예: 교통 표지판, 숫자, 문자)에 무분별하게 적용 시 성능 저하
– 상하 플립은 인물 사진에서 부자연스러운 결과를 초래할 수 있음
ㅇ 시험 대비 “패턴 보기” 예시:
O: “좌우 플립은 얼굴 인식 데이터 증강에 자주 사용된다.”
X: “상하 플립은 모든 이미지 데이터에서 항상 성능을 향상시킨다.”
ㅁ 추가 학습 내용
시험 대비를 위해 플립 외에도 회전(rotation), 크롭(cropping), 색상 조정(color jitter), 스케일 변환(scaling) 등의 데이터 증강 기법을 함께 학습하는 것이 중요하다.
플립 적용 시에는 데이터의 방향성이 중요한 경우 주의해야 하며, 좌우 플립과 상하 플립의 차이를 구분할 수 있어야 한다.
플립은 합성곱 신경망(CNN)에서 데이터 다양성을 확보하고 모델의 일반화 성능을 향상시키는 데 기여한다.
또한 데이터 증강은 학습 데이터 분포의 분산을 증가시키고 과적합을 억제하는 통계적 의미를 가진다.