ㅁ 대표 기법 ㅇ 정의: 준지도 학습에서 사용되는 방법으로, 모델이 동일한 입력에 대해 일관된 출력 값을 생성하도록 학습시키는 기법이다. ㅇ 특징: – 데이터의 변형(예: 이미지 회전, 밝기 조정)을 통해 입력 데이터의 다양성을 증가시키고, 변형된 데이터에 대해 동일한 예측을 요구한다. – 라벨이 없는 데이터에서 모델의 일반화 능력을 향상시키는 데 도움을 준다. – 데이터의 불확실성을 줄이고 안정성을
ㅁ 대표 기법 ㅇ 정의: 준지도 학습에서 대표적인 기법으로, 초기 모델이 예측한 레이블을 신뢰 가능한 데이터로 간주하여 학습에 사용하는 방법. ㅇ 특징: 초기 모델의 품질에 따라 성능이 크게 좌우되며, 초기 레이블의 신뢰도가 낮으면 학습이 왜곡될 위험이 있음. ㅇ 적합한 경우: 라벨링된 데이터가 제한적이고, 비라벨링된 데이터가 충분히 많은 경우. ㅇ 시험 함정: Pseudo Labeling은 항상 정확한
ㅁ 주요 기법 ㅇ 정의: 비지도 학습에서 데이터를 효율적으로 표현하기 위해 입력 데이터를 압축하고 복원하는 신경망 구조. ㅇ 특징: – 입력 데이터와 출력 데이터가 동일하게 설정됨. – 데이터의 잠재 공간 표현(latent space)을 학습하여 특징을 추출. – 과적합 방지를 위해 드롭아웃(dropout)이나 정규화 기법을 사용. ㅇ 적합한 경우: – 데이터의 노이즈 제거. – 차원 축소 및 데이터
ㅁ 주요 기법 ㅇ 정의: 비지도 학습에서 고차원의 데이터를 저차원으로 시각화하는 데 사용되는 기법으로, 데이터 간의 유사성을 보존하는 데 중점을 둔다. ㅇ 특징: – 고차원의 데이터 분포를 2차원 또는 3차원으로 표현 가능. – 데이터 간 거리 및 관계를 시각적으로 이해하기 쉬움. – 대규모 데이터셋에 적용하기에는 계산량이 많아 성능 저하 가능성 존재. ㅇ 적합한 경우: –
ㅁ 주요 기법 ㅇ 정의: 비지도 학습에서 데이터를 저차원 공간으로 변환하여 주요 패턴을 추출하는 기법. 데이터의 분산을 최대화하는 방향으로 축을 설정. ㅇ 특징: – 데이터의 차원을 축소하여 시각화 및 분석에 유용. – 주성분을 선택하여 데이터의 주요 정보를 보존. – 선형 변환 기반으로 작동하며, 입력 데이터의 스케일에 민감. ㅇ 적합한 경우: – 데이터의 차원이 높아 분석이
ㅁ 주요 기법 ㅇ 정의: 비지도 학습의 한 기법으로, 데이터의 유사성을 기반으로 그룹을 형성하여 데이터의 구조를 파악하는 방법. ㅇ 특징: – 라벨이 없는 데이터에서 패턴을 찾음. – 데이터의 분포 및 군집 구조를 시각적으로 이해 가능. – 결과는 초기 조건과 알고리즘 선택에 따라 달라질 수 있음. ㅇ 적합한 경우: – 데이터의 숨겨진 패턴을 발견하고자 할 때.
ㅁ 처리 기술 ㅇ 정의: 시계열 데이터에서 시간에 따라 발생하는 장기적인 증가 또는 감소 추세를 제거하여 데이터의 변동성을 분석하거나 예측 모델을 구축하는 데 사용되는 기법. ㅇ 특징: – 데이터의 순환적 패턴과 계절성을 분석하기 위해 필수적. – 이동 평균, 회귀 분석 등의 방법이 주로 사용됨. – 트렌드 제거 후 잔차 분석을 통해 데이터의 패턴을 확인 가능.
ㅁ 처리 기술 ㅇ 정의: 시계열 데이터를 분석하기 위해 데이터를 분해하거나 합성하는 기술로, 주로 데이터의 패턴을 파악하고 예측 모델링에 활용. ㅇ 특징: 시계열 데이터의 트렌드, 계절성, 잔차를 분리하거나 합성하여 데이터의 구조를 명확히 이해할 수 있음. ㅇ 적합한 경우: 데이터의 주기적 패턴을 분석하거나, 데이터의 특정 구성 요소를 제거한 상태에서 분석을 진행할 경우. ㅇ 시험 함정: 분해와
ㅁ 처리 기술 ㅇ 정의: 시계열 데이터를 주파수 영역으로 변환하여 주파수 성분을 분석하는 기법. ㅇ 특징: 시간 영역의 데이터를 주파수 영역으로 변환하여 패턴이나 주기성을 분석할 수 있다. 계산 효율성이 높고 대규모 데이터에도 적합하다. ㅇ 적합한 경우: 주파수 기반 분석이 필요한 경우, 예를 들어 음성 신호 분석, 진동 데이터 분석 등. ㅇ 시험 함정: FFT 변환이
ㅁ 처리 기술 ㅇ 정의: 시계열 데이터의 결측값을 채우거나 불규칙한 데이터를 규칙적으로 변환하기 위해 사용하는 기법. ㅇ 특징: – 주로 시간 축을 기준으로 데이터의 연속성을 유지하기 위해 사용됨. – 데이터의 패턴을 분석하여 결측값을 예측하거나 보완함. – 다양한 보간 방법(선형 보간, 다항식 보간 등)이 존재. ㅇ 적합한 경우: – 센서 고장으로 인해 일부 데이터가 누락된 경우.