AI 시스템 구축: 웹 배포 및 서버리스 – 배치 처리
ㅁ 웹 배포 및 서버리스
ㅇ 정의:
대규모 데이터나 작업을 일정한 주기 또는 특정 시점에 모아서 한 번에 처리하는 방식의 배포 또는 실행 전략.
ㅇ 특징:
– 실시간성이 낮고, 대량의 데이터를 한꺼번에 처리 가능
– 주로 야간이나 비사용 시간대에 실행하여 시스템 부하를 줄임
– 스케줄러(Cron, Airflow 등)와 함께 사용되는 경우가 많음
ㅇ 적합한 경우:
– 하루 단위, 주 단위 보고서 생성
– 로그 데이터 집계 및 분석
– 대규모 백업, 데이터 마이그레이션
ㅇ 시험 함정:
– 배치 처리와 스트리밍 처리의 구분 혼동
– 서버리스 환경에서도 배치 처리가 가능하다는 점을 간과
– 배치 처리 = 오래 걸리는 작업이라는 단순화된 이해
ㅇ 시험 대비 “패턴 보기” 예시:
O: “매일 새벽 3시에 전날 거래 데이터를 집계하는 작업은 배치 처리에 해당한다.”
X: “배치 처리는 반드시 실시간 처리를 포함한다.”
ㅁ 추가 학습 내용
배치 처리의 구성 요소는 입력 데이터 소스, 처리 로직, 출력(저장소 또는 보고서) 구조로 나뉜다.
서버리스 환경에서의 배치 처리 구현 예로는 AWS Lambda와 EventBridge(스케줄러) 조합, GCP Cloud Functions와 Cloud Scheduler 조합이 있다.
배치 처리의 장점은 자원 효율성과 단순한 아키텍처이며, 단점은 지연 시간과 오류 발생 시 복구 지연이다.
스트리밍 처리와 비교할 때 주요 포인트는 처리 주기, 지연 허용 여부, 데이터 양의 변동성이다.
시험에서는 배치 처리를 실시간 모니터링과 혼동시키는 함정 문장이 자주 출제된다.