데이터 전처리: 처리 기술 – 분해/합성

ㅁ 처리 기술

ㅇ 정의:
시계열 데이터를 추세(Trend), 계절성(Seasonality), 불규칙성(Residual) 등 구성 요소로 분리하거나, 분리된 요소를 다시 합성하여 원래의 시계열을 재구성하는 기법.

ㅇ 특징:
– 분해는 시계열 패턴 분석과 예측 모델 성능 향상에 유용함.
– 합성은 분해된 요소를 조합하여 미래 값을 추정하거나 시뮬레이션에 활용.
– 가법 모델(Additive)과 승법 모델(Multiplicative) 방식이 있음.

ㅇ 적합한 경우:
– 계절성과 추세가 뚜렷한 시계열 데이터 분석.
– 외부 요인 제거 후 순수한 패턴 파악 필요 시.
– 예측 전 데이터 전처리 단계에서 노이즈 제거.

ㅇ 시험 함정:
– 가법/승법 모델 선택 기준을 혼동하는 경우.
– 분해 후 잔차를 무시하거나 잘못 해석하는 경우.
– 분해와 필터링을 혼동하는 경우.

ㅇ 시험 대비 “패턴 보기” 예시:
O: “시계열 분해는 데이터의 추세, 계절성, 불규칙성을 분리하여 분석한다.”
X: “시계열 합성은 새로운 데이터 패턴을 생성하는 무작위 기법이다.”

================================

ㅁ 추가 학습 내용

STL(Seasonal-Trend decomposition using Loess), Classical Decomposition, X-11, X-12-ARIMA 등 구체적인 시계열 분해 기법을 이해해야 한다.
가법 모델은 추세, 계절성, 불규칙 성분이 단순 합으로 표현되는 경우에 사용하며, 승법 모델은 계절성과 추세가 곱셈 관계일 때 적용한다.
분해 후 잔차가 백색잡음 형태인지 확인하는 것은 모델의 타당성을 검증하는 핵심 과정이다.
합성 과정에서는 분해 시 제거된 이상치나 결측치 처리 방식이 최종 결과에 영향을 미칠 수 있으므로 주의가 필요하다.

답글 남기기

Your email address will not be published. Required fields are marked *.

*
*