AI 시스템 구축: 웹 배포 및 서버리스

ㅁ 웹 배포 및 서버리스

1. 웹 UI

ㅇ 정의:
웹 브라우저를 통해 AI 모델의 결과를 시각적으로 제공하고, 사용자가 직접 입력·설정을 할 수 있는 인터페이스.

ㅇ 특징:
– HTML/CSS/JavaScript 기반으로 구현
– 실시간 상호작용 가능
– 모델 호출은 백엔드 API를 통해 수행

ㅇ 적합한 경우:
– 사용자가 직접 결과를 확인하고 조작해야 하는 경우
– 대시보드, 시각화 서비스

ㅇ 시험 함정:
– 웹 UI 자체가 모델을 실행하는 것이 아님 → 백엔드 연동 필요
– 단순 프론트엔드와 서버리스 혼동

ㅇ 시험 대비 “패턴 보기” 예시:
O: “웹 UI는 사용자가 모델 결과를 직관적으로 확인할 수 있게 한다.”
X: “웹 UI는 모델을 직접 학습시킨다.”

2. 서버리스 모델 서빙

ㅇ 정의:
서버 인프라를 직접 관리하지 않고 클라우드 함수(Function as a Service)로 모델 예측 서비스를 제공하는 방식.

ㅇ 특징:
– 사용한 만큼 과금
– 자동 확장
– 짧은 실행 시간 제약

ㅇ 적합한 경우:
– 요청량 변동이 큰 서비스
– 간헐적 호출

ㅇ 시험 함정:
– 장기 실행 작업에는 부적합
– 상태 유지 불가

ㅇ 시험 대비 “패턴 보기” 예시:
O: “서버리스 서빙은 인프라 관리 부담을 줄인다.”
X: “서버리스 서빙은 항상 장기 연산에 적합하다.”

3. REST API

ㅇ 정의:
HTTP 프로토콜을 기반으로 클라이언트-서버 간 데이터 교환을 표준화한 인터페이스.

ㅇ 특징:
– GET, POST, PUT, DELETE 메서드 활용
– JSON 등 경량 데이터 포맷
– Stateless

ㅇ 적합한 경우:
– 다양한 플랫폼에서 모델 호출 필요
– 모바일/웹/서버 통합

ㅇ 시험 함정:
– REST API는 반드시 JSON만 사용한다는 오해 (XML 등 가능)
– 상태 저장 필요 시 REST 부적합

ㅇ 시험 대비 “패턴 보기” 예시:
O: “REST API는 HTTP 기반으로 플랫폼 간 연동이 쉽다.”
X: “REST API는 상태를 유지하는 것이 기본이다.”

4. 배치 처리

ㅇ 정의:
일정량의 데이터를 모아 한 번에 처리하는 방식.

ㅇ 특징:
– 처리 효율 높음
– 실시간성 낮음
– 예약 실행 가능

ㅇ 적합한 경우:
– 대규모 데이터 분석
– 주기적 리포트 생성

ㅇ 시험 함정:
– 배치 처리가 항상 실시간보다 빠르다고 착각
– 실시간 알림 서비스에는 부적합

ㅇ 시험 대비 “패턴 보기” 예시:
O: “배치 처리는 대량 데이터 처리에 효율적이다.”
X: “배치 처리는 항상 실시간 처리를 대체할 수 있다.”

5. 온라인 추론

ㅇ 정의:
입력 데이터가 들어올 때마다 즉시 모델 예측을 수행하는 방식.

ㅇ 특징:
– 낮은 지연 시간
– 요청 단위 처리
– 실시간 서비스 필수 요소

ㅇ 적합한 경우:
– 챗봇, 추천 시스템
– 실시간 감지 서비스

ㅇ 시험 함정:
– 온라인 추론이 항상 배치보다 비용이 적다고 오해
– 부하 급증 시 성능 저하 가능성 간과

ㅇ 시험 대비 “패턴 보기” 예시:
O: “온라인 추론은 실시간 응답이 필요한 서비스에 적합하다.”
X: “온라인 추론은 항상 배치 처리보다 저렴하다.”

ㅁ 추가 학습 내용

학습 정리

1. 웹 UI와 REST API
– 웹 UI: 사용자가 브라우저를 통해 시각적으로 상호작용하는 인터페이스
– REST API: HTTP 기반으로 클라이언트와 서버 간 데이터 교환을 위한 규약
– 상호작용 구조: 웹 UI는 REST API를 호출하여 서버로부터 데이터를 가져오거나 전송, REST API는 비즈니스 로직과 데이터 처리를 담당

2. 서버리스 모델 서빙
– 콜드 스타트 지연: 서버리스 함수가 처음 호출될 때 초기화로 인한 응답 지연
– 메모리 제한: 함수 실행 시 사용 가능한 메모리의 한계
– 실행 시간 제한: 함수가 동작할 수 있는 최대 시간 제한

3. REST API 설계 주요 개념
– Rate Limiting: 일정 시간 동안 허용되는 요청 수를 제한하여 서버 과부하 방지
– 인증 방식: OAuth2, JWT(JSON Web Token) 등 보안과 권한 부여를 위한 표준 방식

4. 배치 처리와 온라인 추론의 하이브리드 구조
– 마이크로배치: 짧은 시간 단위로 데이터를 모아 배치 처리
– 스트리밍 처리: 실시간으로 데이터 처리

5. 클라우드 환경에서의 성능 최적화 요소
– 로드 밸런싱: 트래픽을 여러 서버로 분산
– 캐싱 전략: 자주 사용하는 데이터를 미리 저장하여 응답 속도 향상
– CDN(Content Delivery Network) 연계: 전 세계에 분산된 서버를 통해 콘텐츠를 빠르게 전달

시험 대비 체크리스트

– 웹 UI와 REST API의 정의와 차이점을 설명할 수 있는가?
– 웹 UI와 REST API의 상호작용 구조를 그림 없이도 구두로 설명할 수 있는가?
– 서버리스 환경에서 콜드 스타트 지연, 메모리 제한, 실행 시간 제한의 의미와 영향도를 이해했는가?
– REST API 설계 시 Rate Limiting의 목적과 구현 방법을 알고 있는가?
– OAuth2와 JWT의 차이와 사용 사례를 설명할 수 있는가?
– 배치 처리, 온라인 추론, 마이크로배치, 스트리밍 처리의 개념과 차이를 구분할 수 있는가?
– 클라우드 환경에서 로드 밸런싱, 캐싱 전략, CDN의 역할과 장점을 설명할 수 있는가?

답글 남기기

Your email address will not be published. Required fields are marked *.

*
*