AI 시스템 구축: AIOps – 자동 스케일링
ㅁ AIOps
ㅇ 정의:
인공지능(AI)과 머신러닝(ML)을 활용하여 IT 운영 데이터를 분석하고, 문제를 사전에 감지·예측하며, 자동화된 대응을 수행하는 운영 방식.
ㅇ 특징:
– 로그, 메트릭, 이벤트 데이터를 실시간 분석
– 이상 징후 감지 및 원인 분석 자동화
– 운영 자동화 및 효율성 극대화
ㅇ 적합한 경우:
– 대규모 IT 인프라 운영 환경
– 복잡한 이벤트와 경고가 빈번한 시스템
ㅇ 시험 함정:
– 단순 모니터링 도구와 혼동
– AI/ML 기반의 예측·자동화 기능 여부 확인 필요
ㅇ 시험 대비 “패턴 보기” 예시:
O: “AI/ML 기반으로 로그와 메트릭을 분석하여 자동 대응을 수행한다.”
X: “단순히 서버 상태를 수동으로 점검한다.”
================================
1. 자동 스케일링
ㅇ 정의:
시스템 부하 변화에 따라 서버나 컨테이너 등의 리소스 수를 자동으로 조정하는 기능.
ㅇ 특징:
– 수요 증가 시 리소스 자동 확장(Scale-out)
– 수요 감소 시 리소스 자동 축소(Scale-in)
– 클라우드 환경에서 주로 사용
– 사전 정의된 정책 또는 AI 기반 예측으로 동작
ㅇ 적합한 경우:
– 트래픽 변동이 심한 웹 서비스
– 비용 최적화와 성능 보장이 모두 필요한 환경
ㅇ 시험 함정:
– 수평 확장(Scale-out)과 수직 확장(Scale-up) 혼동
– 자동 스케일링이 항상 즉각적인 반응을 보장하는 것은 아님
ㅇ 시험 대비 “패턴 보기” 예시:
O: “트래픽 증가 시 서버 인스턴스를 자동으로 추가한다.”
X: “트래픽 감소 시에도 항상 동일한 서버 수를 유지한다.”
ㅁ 추가 학습 내용
자동 스케일링에서 수평 확장(Scale-out)은 동일 사양의 인스턴스를 여러 대 추가하는 방식이며, 수직 확장(Scale-up)은 기존 인스턴스의 CPU, 메모리 등 사양을 업그레이드하는 방식이다.
자동 스케일링 정책에는 임계값 기반(Threshold-based), 예약 기반(Scheduled), 예측 기반(Predictive) 방식이 있다.
예측 기반 방식은 AIOps의 AI/ML 기능과 결합되어 미래 부하를 예측하고 선제적으로 리소스를 조정하는 것이 특징이다.
시험에서는 AWS Auto Scaling, Azure VM Scale Sets, GCP Autoscaler 등 클라우드 서비스별 구현 차이를 비교하는 문제나, 응답 지연 원인이 스케일링 지연인지 설정 오류인지 구분하는 문제가 출제될 수 있다.