ㅁ 텍스트 증강 ㅇ 정의: 텍스트 데이터의 다양성을 높이기 위해 기존 문장에 무작위로 단어를 삽입하는 기법. 주로 데이터 부족 문제를 완화하고 모델의 일반화 성능을 향상시키기 위해 사용됨. ㅇ 특징: – 원본 의미를 크게 훼손하지 않는 범위에서 단어를 추가 – 삽입 단어는 주로 동의어 사전, 빈도 기반 단어 리스트, 또는 사전 학습된 임베딩에서 선택 – 간단하고
ㅁ 텍스트 증강 ㅇ 정의: 텍스트 데이터의 다양성을 확보하고 모델의 일반화 성능을 향상시키기 위해 원본 문장의 일부 단어를 의미가 같은 동의어로 치환하는 기법. ㅇ 특징: – 데이터 수집에 비용이 많이 들거나 데이터 편향이 있는 경우 효과적임. – 간단한 규칙 기반 또는 워드 임베딩/언어모델 기반으로 구현 가능. – 문맥에 맞지 않는 동의어 선택 시 오히려 데이터
ㅁ 텍스트 증강 ㅇ 정의: 텍스트 데이터를 다양한 방법으로 변형하여 학습 데이터의 다양성과 일반화 성능을 높이는 기법. 문장 구조, 단어, 의미를 유지하거나 변형하여 새로운 학습 샘플을 생성. ㅇ 특징: – 데이터 불균형 해소 및 과적합 방지에 효과적 – 자연어 처리(NLP) 모델의 성능 개선 – 의미 보존과 문법적 자연스러움이 중요 ㅇ 적합한 경우: – 학습 데이터가
ㅁ 이미지 증강 ㅇ 정의: 이미지 데이터의 다양성을 늘리기 위해 기존 이미지를 변형하거나 새로운 이미지를 생성하는 기법으로, 모델의 일반화 성능을 향상시키기 위해 사용됨. ㅇ 특징: – 회전, 이동, 크기 조절, 색상 변화 등의 전통적 변환 기법과 딥러닝 기반 생성 모델을 활용한 증강 기법이 존재함. – 데이터 부족 문제를 완화하고 오버피팅을 방지함. ㅇ 적합한 경우: –
ㅁ 이미지 증강 1. 밝기/대비 조절 ㅇ 정의: 이미지의 픽셀 값 분포를 변경하여 전체적인 밝기나 명암 대비를 조정하는 기법으로, 데이터 다양성을 확보하고 모델의 조명 변화에 대한 일반화 성능을 높인다. ㅇ 특징: – 밝기 조절은 모든 픽셀 값에 일정한 값을 더하거나 빼는 방식으로 수행됨. – 대비 조절은 픽셀 값의 분산을 확대 또는 축소하여 명암 차이를 조절.
ㅁ 이미지 증강 ㅇ 정의: 이미지 증강은 기존의 이미지 데이터를 변형하여 데이터셋의 다양성을 인위적으로 높이는 기법으로, 모델의 일반화 성능을 향상시키기 위해 사용됨. ㅇ 특징: – 원본 데이터의 의미를 유지하면서 다양한 변형을 적용 – 과적합 방지에 효과적 – 학습 데이터 수집 비용 절감 가능 ㅇ 적합한 경우: – 이미지 데이터가 부족하거나 클래스 불균형이 심한 경우 –
ㅁ 이미지 증강 1. 이동 ㅇ 정의: 이미지를 상하좌우로 일정 픽셀만큼 평행 이동시켜 새로운 학습 데이터를 생성하는 기법. 원본 이미지의 객체 위치를 변화시켜 모델이 위치 변화에 강건하도록 학습시킨다. ㅇ 특징: – 픽셀 단위 또는 비율 단위로 이동 가능. – 이동 후 빈 공간은 보통 0(검정), 평균값, 또는 가장 가까운 픽셀 값으로 채움. – 객체의 형태는
ㅁ 이미지 증강 ㅇ 정의: 이미지 증강은 원본 이미지를 다양한 변환 기법을 통해 변형하여 데이터셋의 다양성을 인위적으로 증가시키는 기법이다. ㅇ 특징: – 데이터 부족 문제를 완화하고 과적합(overfitting)을 방지한다. – 모델의 일반화 성능을 향상시킨다. – 변환 시 원본 데이터의 의미를 훼손하지 않는 것이 중요하다. ㅇ 적합한 경우: – 이미지 데이터가 적어 학습 데이터 확보가 어려운 경우
ㅁ 이미지 처리 ㅇ 정의: 이미지 처리에서 노이즈 제거는 촬영 환경, 센서 한계, 전송 과정 등에서 발생한 불필요한 픽셀 값 변동(잡음)을 최소화하여 원본 이미지의 품질을 향상시키는 과정. ㅇ 특징: – 노이즈 유형에 따라 처리 기법이 다름(가우시안 노이즈, 소금-후추 노이즈 등) – 주파수 영역 필터링(푸리에 변환 기반) 또는 공간 영역 필터링(블러, 미디언 필터 등) 사용 –
ㅁ 이미지 처리 ㅇ 정의: 이미지 데이터에서 색상 공간을 변경하거나 채널을 변환하여 분석, 시각화, 모델 입력 등에 적합하게 만드는 과정. ㅇ 특징: – RGB, HSV, Grayscale 등 다양한 색상 공간 변환 가능 – 채널별로 분리/합성 가능 – OpenCV, Pillow 등 라이브러리에서 간단히 구현 가능 – 색상 정보 보존 여부에 따라 데이터 용량 및 처리 속도에