AI 시스템 구축: 자동화 기법

ㅁ 자동화 기법

ㅇ 정의:
반복적이거나 예측 가능한 운영 작업을 자동으로 수행하여 효율과 안정성을 높이는 기술 집합.

ㅇ 특징:
– 사람 개입 최소화
– 오류 감지 및 대응 자동화
– 리소스 사용 최적화
– 이벤트 기반 동작 가능

ㅇ 적합한 경우:
– 대규모 분산 시스템 운영
– 실시간 대응이 필요한 서비스
– 운영 인력 부족 상황

ㅇ 시험 함정:
– 자동화 기법이 항상 비용 절감을 보장하는 것은 아님
– 모든 장애 상황을 자동으로 복구할 수 없음을 간과

ㅇ 시험 대비 “패턴 보기” 예시:
O: “자동화 기법은 반복 작업을 자동 수행하여 운영 효율을 높인다.”
X: “자동화 기법은 모든 장애를 100% 복구할 수 있다.”

================================

1. Self-healing

ㅇ 정의:
시스템이 장애나 오류를 스스로 감지하고 자동으로 복구하는 기능.

ㅇ 특징:
– 장애 탐지 모듈 내장
– 자동화된 복구 절차 실행
– 서비스 중단 최소화

ㅇ 적합한 경우:
– 무중단 서비스 요구 환경
– 장애 대응 속도가 중요한 금융/통신 서비스

ㅇ 시험 함정:
– Self-healing이 모든 복구를 보장하는 것은 아님
– 외부 의존성 장애에는 한계 존재

ㅇ 시험 대비 “패턴 보기” 예시:
O: “Self-healing은 장애 발생 시 자동 복구를 수행한다.”
X: “Self-healing은 외부 서비스 장애도 완벽히 복구한다.”

================================

2. 자가조정

ㅇ 정의:
시스템이 성능 지표나 환경 변화에 따라 스스로 파라미터나 동작 방식을 조정하는 기능.

ㅇ 특징:
– 실시간 모니터링 기반
– 사전 정의된 규칙 또는 머신러닝 모델 사용
– 성능 최적화 목적

ㅇ 적합한 경우:
– 트래픽 변동이 심한 서비스
– 자원 사용 효율성이 중요한 환경

ㅇ 시험 함정:
– 자가조정이 항상 최적의 결과를 보장하지 않음
– 잘못된 규칙 설정 시 성능 저하 가능

ㅇ 시험 대비 “패턴 보기” 예시:
O: “자가조정은 환경 변화에 따라 시스템 동작을 자동 변경한다.”
X: “자가조정은 초기 설정 후 모니터링이 불필요하다.”

================================

3. Auto Scaling

ㅇ 정의:
시스템 부하에 따라 컴퓨팅 리소스를 자동으로 증감하는 기능.

ㅇ 특징:
– 수평/수직 확장 모두 가능
– 클라우드 환경에서 주로 사용
– 사전 설정된 임계치 기반 동작

ㅇ 적합한 경우:
– 트래픽 변동이 심한 웹 서비스
– 비용 효율적 리소스 운영 필요 시

ㅇ 시험 함정:
– Auto Scaling 반응 속도 지연 가능성 간과
– 잘못된 임계치 설정 시 과도한 리소스 사용

ㅇ 시험 대비 “패턴 보기” 예시:
O: “Auto Scaling은 부하에 따라 서버 수를 자동 조절한다.”
X: “Auto Scaling은 항상 즉시 리소스를 확장한다.”

================================

4. 이벤트 기반 Task Trigger

ㅇ 정의:
특정 이벤트 발생 시 사전에 정의된 작업을 자동 실행하는 기능.

ㅇ 특징:
– 이벤트 감지 시스템 필요
– 실시간 처리 가능
– 다양한 이벤트 소스 연계 가능

ㅇ 적합한 경우:
– 데이터 수집/처리 자동화
– 알림/경고 시스템 구현

ㅇ 시험 함정:
– 이벤트 누락 시 작업 미수행 가능성
– 과도한 이벤트 발생 시 시스템 부하 증가

ㅇ 시험 대비 “패턴 보기” 예시:
O: “이벤트 기반 Task Trigger는 특정 이벤트 발생 시 작업을 자동 수행한다.”
X: “이벤트 기반 Task Trigger는 모든 상황에서 즉시 실행된다.”

ㅁ 추가 학습 내용

[정리]
자동화 기법 학습 시 각 기법의 한계와 보완책을 함께 이해해야 함.
– Self-healing: 상태 복구 범위 파악, 복구 불가능한 외부 장애에 대한 처리 전략 필요
– 자가조정(Auto-tuning): 피드백 루프 설계 방법, 안정성 확보 방안 숙지
– Auto Scaling: Scale-in/Scale-out 정책 이해, 예측 기반 스케일링(Predictive Scaling) 개념 학습
– 이벤트 기반 Task Trigger: 이벤트 필터링 기법, 우선순위 처리 방법 이해
– 하이브리드 운영 시나리오: 여러 자동화 기법을 결합한 운영 방식 분석
– 장애 시뮬레이션 테스트 절차: 장애 상황 재현, 대응 절차 검증 방법 숙지

[시험 대비 체크리스트]
1. Self-healing의 상태 복구 범위와 복구 불가능 사례를 설명할 수 있는가?
2. 외부 장애 발생 시의 처리 전략을 제시할 수 있는가?
3. 자가조정의 피드백 루프 설계 요소와 안정성 확보 방법을 설명할 수 있는가?
4. Auto Scaling의 Scale-in과 Scale-out 정책 차이를 구분할 수 있는가?
5. 예측 기반 스케일링(Predictive Scaling)의 개념과 장단점을 설명할 수 있는가?
6. 이벤트 기반 Task Trigger에서 이벤트 필터링과 우선순위 처리 기법을 예시와 함께 설명할 수 있는가?
7. 여러 자동화 기법을 결합한 하이브리드 운영 시나리오를 설계하거나 분석할 수 있는가?
8. 장애 시뮬레이션 테스트 절차와 목적을 설명할 수 있는가?

답글 남기기

Your email address will not be published. Required fields are marked *.

*
*