ㅁ 멀티모달 AI ㅇ 정의: 서로 다른 형태(Modalities)의 데이터를 동시에 이해하고 처리하는 인공지능 기술로, 예를 들어 이미지+텍스트, 비디오+오디오 등 복합 입력을 기반으로 인식·추론·생성 작업을 수행하는 AI 모델. ㅇ 특징: – 다양한 데이터 소스를 결합하여 더 높은 이해력과 추론 능력을 제공 – 사전학습(Pretraining)과 미세조정(Finetuning) 구조를 자주 사용 – Cross-Attention, Transformer 기반 구조 채택이 일반적 – 대규모
ㅁ 대규모 언어모델 ㅇ 정의: 대규모 언어모델(LLM, Large Language Model)은 수십억~수천억 개의 매개변수를 가진 딥러닝 기반 자연어 처리 모델로, 방대한 텍스트 데이터를 학습하여 인간과 유사한 언어 이해·생성을 수행하는 인공지능 기술. ㅇ 특징: – 사전학습(Pre-training)과 미세조정(Fine-tuning) 단계를 거침 – 인과형(autoregressive) 또는 양방향(transformer 기반) 구조 사용 – 다양한 자연어 처리 태스크에 범용 적용 가능 – 계산 자원과
ㅁ 분산 학습 ㅇ 정의: 여러 대의 컴퓨팅 자원을 활용하여 대규모 AI 모델 학습 속도를 높이거나 메모리 한계를 극복하기 위해 학습 데이터를 나누어 병렬 처리하는 기술. ㅇ 특징: – GPU/TPU 등 여러 장비를 네트워크로 연결 – 데이터 병렬(모델 복제) / 모델 병렬(모델 분할) / 하이브리드 방식 존재 – 통신 오버헤드와 동기화 방식이 성능에 영향 –
ㅁ 서빙 최적화 ㅇ 정의: AI 모델을 실제 서비스 환경에서 빠르고 효율적으로 동작시키기 위해 모델 변환, 경량화, 하드웨어 최적화 등을 수행하는 기술. ㅇ 특징: – 추론 속도 향상과 메모리 사용량 감소가 목적 – GPU, CPU, NPU 등 다양한 하드웨어에 맞춰 변환 가능 – 모델 정확도와 성능 사이에서 균형 조정 필요 ㅇ 적합한 경우: – 대규모
ㅁ 시스템 최적화 ㅇ 정의: AI 모델 및 시스템의 연산, 메모리, 전송 효율을 높여 처리 속도와 자원 사용량을 최적화하는 기술 집합. ㅇ 특징: 모델 크기 축소, 연산 효율 향상, 지연(latency) 감소, 하드웨어 자원 활용 극대화 등의 방법을 포함. ㅇ 적합한 경우: 실시간 추론 서비스, 모바일·엣지 디바이스 배포, 대규모 트래픽 처리 환경. ㅇ 시험 함정: 단순히
ㅁ 로그 및 알림 ㅇ 정의: – 시스템 및 애플리케이션에서 발생하는 로그 데이터를 수집·저장·분석하고, 특정 조건 충족 시 알림(Notification)을 제공하는 기술·도구 집합. ㅇ 특징: – 실시간 모니터링 가능 – 다양한 데이터 소스 연동 – 알림 조건 및 대시보드 커스터마이징 – 오픈소스와 클라우드 기반 서비스 모두 존재 ㅇ 적합한 경우: – 장애 발생 시 신속한 원인
ㅁ 자동화 ㅇ 정의: – 반복적이고 표준화된 작업을 사람의 개입 없이 자동으로 수행하는 프로세스 – AI 시스템 구축에서는 코드 배포, 모델 학습, 데이터 전처리, 배포 후 모니터링 등을 자동화하여 효율성, 안정성, 신속성을 확보 ㅇ 특징: – 작업 속도 향상 및 인적 오류 감소 – 표준화된 파이프라인 제공 – 변경 사항의 신속한 반영 가능 – 도구
ㅁ 모델 모니터링 ㅇ 정의: – 운영 환경에서 배포된 AI/ML 모델의 입력 데이터, 예측 결과, 성능 지표 등을 지속적으로 관찰하고 이상 징후를 조기에 감지하는 활동. ㅇ 특징: – 데이터 분포, 모델 예측 결과, 성능 지표의 변화 추적 – 실시간 또는 배치 기반 모니터링 가능 – 데이터 드리프트, Concept Drift, 성능 저하 등 다양한 원인 탐지
ㅁ 도구 ㅇ 정의: 머신러닝(ML) 모델의 학습, 배포, 모니터링 등을 자동화하고 효율적으로 관리하기 위해 사용하는 소프트웨어 프레임워크 또는 플랫폼. 데이터 파이프라인 구축, 모델 실험 관리, 워크플로우 스케줄링 등을 지원함. ㅇ 특징: – 복잡한 ML 워크플로우를 시각화 및 자동화 가능 – 재현성과 확장성이 높음 – 다양한 인프라(Kubernetes, 클라우드, 온프레미스) 지원 – 모델 버전 관리 및 실험
ㅁ 배포 전략 ㅇ 정의: 모델 학습이 완료된 후, 실제 서비스 환경에 모델 예측 기능을 적용하는 방식과 절차를 의미함. 배포 전략은 예측 요청 처리 방식, 성능, 안정성, 리스크 관리 수준에 따라 다양한 접근이 존재함. ㅇ 특징: – 시스템 부하, 응답 지연 허용 범위, 데이터 처리 주기 등에 따라 전략을 선택 – 운영 환경의 안정성과 실험적