모델 최적화: 경량화

ㅁ 경량화 ㅇ 정의: 모델의 메모리 사용량과 연산량을 줄여 배포 및 추론 속도를 향상시키는 최적화 기법들의 집합. ㅇ 특징: – 정확도 손실을 최소화하면서 모델 크기와 연산량을 줄임 – 하드웨어 특성에 맞춘 최적화 가능 – 다양한 기법을 조합하여 사용 가능 ㅇ 적합한 경우: – 모바일, 엣지 디바이스처럼 연산 자원이 제한된 환경 – 실시간 추론이 필요한 서비스

AI 시스템 구축: 전처리 확대

ㅁ 전처리 확대 ㅇ 정의: 텍스트, 이미지, 스캔 문서 등 다양한 비정형 데이터를 AI 모델 학습이나 분석에 적합하도록 가공하는 사전 처리 범위를 확장하는 것을 의미함. ㅇ 특징: – OCR, 문서 파서, 메타데이터 추출, 데이터 변환 API 등 다양한 기술을 결합하여 처리 – 데이터 품질 향상과 모델 성능 개선에 직결됨 – 처리 속도, 정확도, 확장성이 중요

AI 시스템 구축: AutoML/자동화

ㅁ AutoML/자동화 1. AutoML ㅇ 정의: – 데이터 전처리, 모델 선택, 하이퍼파라미터 튜닝, 성능 평가를 자동화하여 최소한의 인적 개입으로 최적의 모델을 생성하는 기술. ㅇ 특징: – 비전문가도 모델 개발 가능 – 다양한 알고리즘 후보를 자동 탐색 – 반복적인 실험 과정 단축 – GUI 기반 툴과 API 제공 ㅇ 적합한 경우: – 데이터 사이언스 인력이 부족한

AI 시스템 구축: 기술

ㅁ 기술 1. Federated Learning ㅇ 정의: – 데이터가 각 클라이언트(디바이스, 기관)에 분산되어 있는 상태에서 원본 데이터를 중앙 서버로 모으지 않고, 각 클라이언트에서 학습한 모델 파라미터(가중치)만 중앙 서버로 전송하여 통합 학습하는 방식. ㅇ 특징: – 데이터 프라이버시 보호 강화. – 통신량은 모델 파라미터 전송에 한정. – 중앙 서버에서 모델 집계(Aggregation) 수행. – 클라이언트 간 데이터

AI 시스템 구축: 효율화

ㅁ 효율화 ㅇ 정의: AI 시스템을 설계·운영할 때 에너지 사용량과 자원 소모를 최소화하여 환경 영향을 줄이는 접근 방식. ㅇ 특징: – 연산 효율을 높이는 알고리즘 적용 – 하드웨어 자원 사용 최적화 – 탄소 배출량 모니터링 및 감축 목표 설정 ㅇ 적합한 경우: – 대규모 AI 모델 운영 시 전력 비용 절감 필요 – ESG 경영

AI 시스템 구축: 하드웨어/응용

ㅁ 하드웨어/응용 1. Edge TPU ㅇ 정의: – 구글이 개발한 저전력 고속 머신러닝 추론 전용 ASIC으로, 엣지 디바이스에서 TensorFlow Lite 모델을 효율적으로 실행하기 위해 설계됨. ㅇ 특징: – 초당 수십억 번의 연산 가능 (TOPS 단위) – 전력 소모가 수백 mW 수준으로 낮음 – 클라우드 의존도를 줄이고 지연 시간 최소화 ㅇ 적합한 경우: – 실시간 이미지

AI 모델 개발: 불확실성 추정

ㅁ 불확실성 추정 ㅇ 정의: – 모델의 예측 결과에 대한 신뢰도나 불확실성을 정량적으로 측정하는 기법. – 확률 분포를 통해 예측값의 변동성을 파악. ㅇ 특징: – 단일 값 예측보다 예측 분포를 제공. – 의사결정 과정에서 위험 관리에 활용. ㅇ 적합한 경우: – 의료 진단, 자율주행 등 오판 비용이 큰 분야. – 데이터 부족 또는 분포 변화

AI 모델 개발: 최신 이슈

ㅁ 최신 이슈 1. Instruction-tuning ㅇ 정의: – 대규모 언어 모델(LLM)에 특정 지시문(Instruction)에 맞게 응답하도록 추가 학습시키는 기법. – 모델이 프롬프트를 이해하고 특정 작업 지시를 따를 수 있도록 지도학습 데이터로 미세 조정. ㅇ 특징: – 기존 사전학습 모델에 비해 사용자 지시에 대한 응답 정확도가 높음. – 다양한 작업을 하나의 모델에서 수행 가능. – 데이터셋 품질과

AI 모델 개발: 프롬프트 설계

ㅁ 프롬프트 설계 ㅇ 정의: 사용자가 AI 모델에 원하는 작업을 수행하도록 지시하는 입력 문장을 구조적으로 설계하는 과정. ㅇ 특징: – 모델의 출력 품질과 정확도에 직접적인 영향을 미침 – 문맥, 예시, 지시문 등의 요소를 포함하여 설계 – 다양한 기법(Zero-shot, Few-shot, Chain-of-Thought 등)을 활용 ㅇ 적합한 경우: – 모델의 성능을 최대화하고 특정 작업에 맞춘 답변을 유도할 때

AI 모델 개발: 대표 기법

ㅁ 대표 기법 1. 클러스터링 ㅇ 정의: – 데이터의 유사도나 거리 기반으로 비슷한 데이터들을 그룹(클러스터)으로 묶는 기법. ㅇ 특징: – 사전 레이블 없이 데이터 패턴을 발견. – K-means, DBSCAN, 계층적 군집 등 다양한 알고리즘 존재. – 거리 계산 방식(유클리드, 맨해튼 등)에 따라 결과가 달라짐. ㅇ 적합한 경우: – 고객 세분화, 이상치 탐지, 문서 주제 분류