시계열: ARIMA

ㅁ 시계열

ㅇ 정의:
시간의 흐름에 따라 관측된 데이터를 분석하고 예측하는 통계적 방법론.

ㅇ 특징:
– 시간 순서에 따른 데이터의 패턴 및 변화를 분석.
– 계절성, 추세, 불규칙성을 포함한 구성 요소를 식별 가능.

ㅇ 적합한 경우:
– 주식 시장, 기후 변화, 경제 지표 등 시간에 따라 변화하는 데이터를 다룰 때.

ㅇ 시험 함정:
– 계절성과 추세를 혼동하거나, 데이터의 불규칙성을 과소평가하는 경우.

ㅇ 시험 대비 “패턴 보기” 예시:
– O: 시계열 데이터는 시간 순서에 따라 관측된 데이터를 분석한다.
– X: 시계열 데이터는 시간 순서와 무관한 데이터를 분석한다.

================================

1. ARIMA

ㅇ 정의:
ARIMA는 자기회귀(AR), 차분(I), 이동평균(MA)을 결합하여 시계열 데이터를 분석하고 예측하는 모델.

ㅇ 특징:
– 비정상 시계열 데이터를 정상 시계열로 변환하여 분석 가능.
– 데이터의 자기상관성과 이동평균을 동시에 고려.

ㅇ 적합한 경우:
– 계절성이 없고, 데이터가 비정상성을 띄는 경우.
– 과거 데이터로부터 미래 값을 예측하려는 경우.

ㅇ 시험 함정:
– AR, I, MA의 적절한 차수를 선택하지 못하거나, 과적합 문제를 간과하는 경우.

ㅇ 시험 대비 “패턴 보기” 예시:
– O: ARIMA 모델은 비정상 시계열 데이터를 차분하여 정상 시계열로 변환한다.
– X: ARIMA 모델은 정상 시계열 데이터에서만 작동한다.

================================

ㅁ 추가 학습 내용

ARIMA 모델에서 차수(p, d, q)를 선택하는 방법은 다음과 같습니다:

1. 차분(d) 결정:
– 원시 데이터가 정상성을 만족하지 않으면 차분을 통해 정상성을 확보해야 합니다. 정상성을 확인하는 방법으로는 ADF(단위근 검정) 테스트를 사용하거나, 시계열 데이터의 추세를 시각적으로 분석할 수 있습니다.
– 차분 횟수(d)는 데이터가 정상성을 만족할 때까지 반복적으로 수행하며, 일반적으로 d는 0, 1, 2 중 하나로 설정됩니다.

2. 자기회귀 차수(p)와 이동평균 차수(q) 결정:
– ACF(자기상관 함수)와 PACF(부분 자기상관 함수)를 사용하여 p와 q를 결정합니다.
– ACF는 시계열 데이터의 현재 값과 과거 값 간의 상관성을 보여주며, 이동평균(q)의 차수를 결정하는 데 유용합니다.
– PACF는 현재 값과 특정 시점의 과거 값 간의 직접적인 상관성을 보여주며, 자기회귀(p)의 차수를 결정하는 데 유용합니다.
– 그래프에서 ACF가 특정 시점에서 급격히 감소하거나 PACF가 특정 시점에서 끊어지는 패턴을 관찰하여 p와 q를 설정합니다.

SARIMA(계절형 ARIMA) 모델에 대한 이해:
– SARIMA는 ARIMA 모델에 계절성 요소를 추가한 모델로, 계절성 패턴이 있는 시계열 데이터를 분석할 때 사용됩니다.
– SARIMA 모델의 차수는 (p, d, q)와 계절성 차수(P, D, Q, m)로 구성됩니다.
– P, D, Q는 계절 주기의 자기회귀, 차분, 이동평균 차수를 나타냅니다.
– m은 계절 주기를 나타내며, 예를 들어 월별 데이터의 경우 m=12로 설정합니다.
– 계절성 차수(P, D, Q)는 계절성 패턴을 제거하기 위해 설정되며, 이를 결정하기 위해 계절성을 제거한 후 ACF와 PACF를 분석합니다.

시험 대비를 위해 ARIMA와 SARIMA 모델의 차수 선택 과정, ACF와 PACF의 해석 방법, 그리고 계절성 데이터 처리 과정에 대해 충분히 연습하고 다양한 사례를 통해 이해를 심화하는 것이 중요합니다.

답글 남기기

Your email address will not be published. Required fields are marked *.

*
*