시계열: Prophet
ㅁ 시계열
ㅇ 정의:
시계열은 시간에 따라 관측된 데이터를 분석하고 미래를 예측하는 기법으로, 주로 경제, 기상, 금융 등의 분야에서 활용된다.
ㅇ 특징:
시간 순서에 따른 데이터의 패턴을 분석하며, 계절성, 추세, 불규칙성을 포함한 다양한 구성 요소를 다룬다.
ㅇ 적합한 경우:
시간에 따른 데이터 패턴을 이해하거나 예측이 필요한 경우, 예를 들어 주식 시장 예측, 날씨 예보, 판매량 분석 등.
ㅇ 시험 함정:
– 시계열 데이터를 단순히 독립적인 데이터로 간주하여 분석할 경우.
– 계절성과 추세를 분리하지 않고 모델링하는 경우.
ㅇ 시험 대비 “패턴 보기” 예시:
– 시계열 데이터는 시간 의존성을 가지지 않는다. (X)
– 시계열 분석은 계절성과 추세를 포함한 데이터를 분석하는 데 적합하다. (O)
================================
1. Prophet
ㅇ 정의:
Prophet은 Facebook에서 개발한 시계열 예측 모델로, 추세와 계절성을 자동으로 감지하고 처리할 수 있는 사용자 친화적인 도구이다.
ㅇ 특징:
– 비선형 추세를 모델링할 수 있으며, 계절성과 변동성을 자동으로 처리.
– 이상치와 결측치에 강건하며, 사용자 정의 가능한 계절성 추가 가능.
ㅇ 적합한 경우:
– 데이터의 계절성과 추세를 명확히 파악하고 싶을 때.
– 결측치나 이상치가 포함된 데이터의 예측이 필요할 때.
ㅇ 시험 함정:
– Prophet이 모든 시계열 데이터에 적합하다고 가정하는 경우.
– 모델의 기본 설정만 사용하여 최적화를 고려하지 않는 경우.
ㅇ 시험 대비 “패턴 보기” 예시:
– Prophet은 계절성과 추세를 자동으로 감지하지 못한다. (X)
– Prophet은 결측치와 이상치가 포함된 데이터에도 강건하다. (O)
ㅁ 추가 학습 내용
Prophet의 활용 사례를 학습하기 위해 소셜 미디어 트래픽 예측, 전력 수요 예측, 웹사이트 방문자 수 예측과 같은 구체적인 예제를 살펴보는 것이 좋습니다. 이를 통해 Prophet이 다양한 시간 기반 데이터에 어떻게 적용되는지 이해할 수 있습니다. 각 사례에서 Prophet의 입력 데이터 형식과 사전 처리 방법, 결과 해석 방법을 확인하면 실전에서 활용 능력을 높일 수 있습니다.
또한, Prophet의 주요 하이퍼파라미터에 대해 학습하는 것이 중요합니다.
1. changepoint_prior_scale: 이 값은 추세의 변화점에 대한 민감도를 조정합니다. 값이 크면 모델이 변화점에 더 민감하게 반응하여 추세의 변화를 더 많이 반영하지만, 과적합의 위험이 있습니다. 값이 작으면 변화에 덜 민감해져 더 부드러운 추세를 생성합니다.
2. seasonality_prior_scale: 이 값은 계절성의 강도를 조정합니다. 값이 크면 계절성 패턴이 더 뚜렷하게 반영되고, 값이 작으면 계절성의 영향을 줄이는 방향으로 작용합니다.
이 두 하이퍼파라미터는 예측 결과에 직접적인 영향을 미치므로, 다양한 값을 실험하며 결과가 어떻게 달라지는지 비교해보는 것이 좋습니다. 이 과정에서 모델의 적합성과 과적합의 균형을 이해하는 데 도움이 될 것입니다.