AI 모델 개발: 시스템 구축 – 슬라이딩 윈도우

ㅁ 시스템 구축

ㅇ 정의:
일정 기간 또는 데이터 양을 기준으로 최신 데이터만을 사용하여 모델을 지속적으로 학습시키는 기법. 오래된 데이터는 버리고 새로운 데이터로 교체하여 모델의 최신성을 유지함.

ㅇ 특징:
– 메모리와 저장소 사용량을 일정하게 유지 가능
– 데이터 분포 변화(Concept Drift)에 빠르게 대응 가능
– 윈도우 크기 설정이 성능에 큰 영향을 미침

ㅇ 적합한 경우:
– 데이터가 시간에 따라 빠르게 변화하는 실시간 분석 환경
– 금융 거래 이상 탐지, 실시간 추천 시스템 등

ㅇ 시험 함정:
– ‘슬라이딩 윈도우’는 모든 과거 데이터를 누적 학습하는 방식이 아님 (X)
– 윈도우 크기를 크게 하면 항상 성능이 좋아진다고 단정할 수 없음 (X)

ㅇ 시험 대비 “패턴 보기” 예시:
– 슬라이딩 윈도우는 고정된 크기의 데이터 집합을 유지하며 학습한다 (O)
– 슬라이딩 윈도우는 과거 모든 데이터를 저장하여 학습한다 (X)
– 윈도우 크기가 작을수록 최신 데이터 반영 속도가 빠르다 (O)

ㅁ 추가 학습 내용

슬라이딩 윈도우 기법에서는 윈도우 크기(Window Size)와 이동 간격(Step Size)이 핵심 하이퍼파라미터이며, 설정 방식에 따라 모델의 반응 속도와 안정성이 달라진다. 윈도우 내 데이터 샘플링 방식(예: 균등 샘플링, 중요도 기반 샘플링) 또한 성능에 영향을 준다. 시험에서는 슬라이딩 윈도우와 점진적 학습(Incremental Learning), 배치 학습(Batch Learning)의 차이를 묻거나 Concept Drift 대응 전략의 하나로서의 역할을 물을 수 있다. 또한 메모리 제약 환경에서의 구현 방법과 데이터 스트림 처리 프레임워크(예: Apache Flink, Spark Streaming)에서의 적용 사례도 숙지해야 한다.

답글 남기기

Your email address will not be published. Required fields are marked *.

*
*