주요 기법: t-SNE

ㅁ 주요 기법 ㅇ 정의: 비지도 학습에서 고차원의 데이터를 저차원으로 시각화하는 데 사용되는 기법으로, 데이터 간의 유사성을 보존하는 데 중점을 둔다. ㅇ 특징: – 고차원의 데이터 분포를 2차원 또는 3차원으로 표현 가능. – 데이터 간 거리 및 관계를 시각적으로 이해하기 쉬움. – 대규모 데이터셋에 적용하기에는 계산량이 많아 성능 저하 가능성 존재. ㅇ 적합한 경우: –

주요 기법: PCA

ㅁ 주요 기법 ㅇ 정의: 비지도 학습에서 데이터를 저차원 공간으로 변환하여 주요 패턴을 추출하는 기법. 데이터의 분산을 최대화하는 방향으로 축을 설정. ㅇ 특징: – 데이터의 차원을 축소하여 시각화 및 분석에 유용. – 주성분을 선택하여 데이터의 주요 정보를 보존. – 선형 변환 기반으로 작동하며, 입력 데이터의 스케일에 민감. ㅇ 적합한 경우: – 데이터의 차원이 높아 분석이

주요 기법: 클러스터링

ㅁ 주요 기법 ㅇ 정의: 비지도 학습의 한 기법으로, 데이터의 유사성을 기반으로 그룹을 형성하여 데이터의 구조를 파악하는 방법. ㅇ 특징: – 라벨이 없는 데이터에서 패턴을 찾음. – 데이터의 분포 및 군집 구조를 시각적으로 이해 가능. – 결과는 초기 조건과 알고리즘 선택에 따라 달라질 수 있음. ㅇ 적합한 경우: – 데이터의 숨겨진 패턴을 발견하고자 할 때.

처리 기술: 트렌드 제거

ㅁ 처리 기술 ㅇ 정의: 시계열 데이터에서 시간에 따라 발생하는 장기적인 증가 또는 감소 추세를 제거하여 데이터의 변동성을 분석하거나 예측 모델을 구축하는 데 사용되는 기법. ㅇ 특징: – 데이터의 순환적 패턴과 계절성을 분석하기 위해 필수적. – 이동 평균, 회귀 분석 등의 방법이 주로 사용됨. – 트렌드 제거 후 잔차 분석을 통해 데이터의 패턴을 확인 가능.

처리 기술: 분해/합성

ㅁ 처리 기술 ㅇ 정의: 시계열 데이터를 분석하기 위해 데이터를 분해하거나 합성하는 기술로, 주로 데이터의 패턴을 파악하고 예측 모델링에 활용. ㅇ 특징: 시계열 데이터의 트렌드, 계절성, 잔차를 분리하거나 합성하여 데이터의 구조를 명확히 이해할 수 있음. ㅇ 적합한 경우: 데이터의 주기적 패턴을 분석하거나, 데이터의 특정 구성 요소를 제거한 상태에서 분석을 진행할 경우. ㅇ 시험 함정: 분해와

처리 기술: FFT 변환

ㅁ 처리 기술 ㅇ 정의: 시계열 데이터를 주파수 영역으로 변환하여 주파수 성분을 분석하는 기법. ㅇ 특징: 시간 영역의 데이터를 주파수 영역으로 변환하여 패턴이나 주기성을 분석할 수 있다. 계산 효율성이 높고 대규모 데이터에도 적합하다. ㅇ 적합한 경우: 주파수 기반 분석이 필요한 경우, 예를 들어 음성 신호 분석, 진동 데이터 분석 등. ㅇ 시험 함정: FFT 변환이

처리 기술: 기상 보간

ㅁ 처리 기술 ㅇ 정의: 시계열 데이터의 결측값을 채우거나 불규칙한 데이터를 규칙적으로 변환하기 위해 사용하는 기법. ㅇ 특징: – 주로 시간 축을 기준으로 데이터의 연속성을 유지하기 위해 사용됨. – 데이터의 패턴을 분석하여 결측값을 예측하거나 보완함. – 다양한 보간 방법(선형 보간, 다항식 보간 등)이 존재. ㅇ 적합한 경우: – 센서 고장으로 인해 일부 데이터가 누락된 경우.

보안 전략: 익명화

ㅁ 보안 전략 ㅇ 정의: 데이터의 기밀성과 무결성을 보장하기 위해 데이터를 보호하거나 민감 정보를 숨기는 기술 및 방법론. ㅇ 특징: – 데이터 보호를 위한 다양한 기술과 정책이 포함됨. – 데이터의 민감도를 분석하여 적합한 보안 방식을 적용. ㅇ 적합한 경우: – 데이터 유출 방지가 필요한 경우. – 개인정보 및 민감 정보 처리 시. ㅇ 시험 함정:

보안 전략: Differential Privacy

ㅁ 보안 전략 ㅇ 정의: 데이터 분석 과정에서 개인 정보를 보호하기 위해 다양한 기술과 방법을 적용하는 전략. ㅇ 특징: – 데이터 유출 방지와 개인 정보 보호를 목표로 함. – 암호화, 익명화, 접근 제어 등 여러 기술을 포함. – 데이터의 유용성을 최대한 유지하면서 보안을 강화. ㅇ 적합한 경우: – 민감한 데이터(예: 의료 기록, 금융 정보)를 처리할

동기화 기법: 이벤트 기반 동기화

ㅁ 동기화 기법 ㅇ 정의: 데이터 동기화 기법은 여러 시스템 간 데이터 일관성을 유지하기 위해 데이터를 동기화하는 방법을 의미한다. ㅇ 특징: – 실시간 데이터 반영이 가능하다. – 데이터 일관성과 신뢰성을 보장한다. – 구현 방식에 따라 성능과 복잡성이 달라질 수 있다. ㅇ 적합한 경우: – 여러 시스템 간 데이터 일관성이 중요한 경우. – 실시간 데이터 업데이트가