AI 모델 개발: 기법 – Self-consistency

ㅁ 기법 ㅇ 정의: 여러 개의 추론 경로를 생성한 후, 그 결과를 비교하여 가장 일관성이 높은 답을 선택하는 추론 최적화 기법. 주로 LLM(대규모 언어 모델)에서 복잡한 문제 해결 시 사용됨. ㅇ 특징: – 단일 추론 경로 의존 대신 다수의 reasoning chain을 생성 – 확률적으로 다양한 답변을 생성하고, 다수결 또는 통계적 방법으로 최종 답 결정 –

AI 모델 개발: 기법 – Test-time Compute

ㅁ 기법 ㅇ 정의: 모델이 학습을 마친 후, 실제 추론 시점에서 추가 연산 자원(CPU/GPU 메모리, 연산량)을 활용하여 예측 성능을 향상시키는 방법. ㅇ 특징: – 학습 단계가 아닌 추론 단계에서만 추가 연산을 투입. – 동일한 모델 파라미터를 사용하더라도 추론 시 연산량을 늘려 성능 개선 가능. – 예: 다중 샘플링, 앙상블, 빔 서치 확장, iterative refinement. ㅇ

AI 모델 개발: 변화와 유형 – ReAct

ㅁ 변화와 유형 1. ReAct ㅇ 정의: ReAct는 Reasoning(추론)과 Acting(행동)을 결합한 에이전트 AI 접근 방식으로, LLM이 단순히 답변을 생성하는 것을 넘어 외부 도구 호출, 정보 검색, 계산 등을 수행하며 단계별로 사고 과정을 명시적으로 기록하는 방법이다. ㅇ 특징: – 추론 과정과 행동 단계를 번갈아 수행하며 기록 – 외부 API, 데이터베이스, 계산기 등과 연동 가능 – 복잡한

AI 모델 개발: 변화와 유형 – Self-Refine

ㅁ 변화와 유형 ㅇ 정의: 스스로 자신의 출력을 점검하고 수정하는 과정을 반복하여 성능을 향상시키는 에이전트 AI 기법. 초기 출력 후 피드백 루프를 통해 오류를 줄이고 품질을 개선함. ㅇ 특징: – 출력물에 대한 자기 평가(Self-critique)와 수정(Self-revision) 절차 포함 – 외부 피드백 없이도 내부 메커니즘으로 개선 가능 – 반복 횟수와 평가 기준 설계가 성능에 큰 영향 ㅇ

AI 모델 개발: 변화와 유형 – Reflexion

ㅁ 변화와 유형 1. Reflexion ㅇ 정의: AI 에이전트가 스스로의 과거 실행 기록과 피드백을 바탕으로 성능을 개선하는 자기 반성(Self-reflection) 기반 학습 기법. 주로 LLM(대규모 언어 모델) 기반 에이전트에서 의사결정 품질 향상을 위해 사용됨. ㅇ 특징: – 과거 실패 사례를 메모리에 기록하고, 이를 분석하여 다음 시도에서 오류를 줄임. – 외부 평가자(critic) 또는 자체 평가 모듈을 통해

AI 모델 개발: 변화와 유형 – Parallel Agents

ㅁ 변화와 유형 ㅇ 정의: 여러 개의 에이전트가 동시에 병렬로 동작하여 작업을 수행하는 방식으로, 각 에이전트는 독립적으로 입력을 처리하고 결과를 생성한 뒤 최종적으로 통합하는 구조. ㅇ 특징: – 처리 속도 향상: 병렬 처리를 통해 전체 작업 시간을 단축. – 독립성: 각 에이전트가 서로 영향을 받지 않고 개별적으로 동작. – 자원 분배: 각 에이전트에 필요한 자원을

AI 모델 개발: 핵심 개념 – Hallucination

ㅁ 핵심 개념 ㅇ 정의: 대규모 언어모델이 실제 사실이나 데이터에 기반하지 않고 그럴듯하게 보이는 잘못된 정보나 비논리적인 응답을 생성하는 현상. ㅇ 특징: – 모델이 학습 데이터의 한계, 불완전한 맥락 이해, 확률적 생성 특성으로 인해 발생. – 출력 내용이 자신감 있게 표현되지만 사실 검증 시 오류가 발견됨. – 전문 분야, 드문 사실, 최신 정보일수록 발생 빈도가

AI 모델 개발: 핵심 개념 – 파운데이션 모델

ㅁ 핵심 개념 ㅇ 정의: 대규모 데이터셋을 기반으로 사전 학습(pre-training)되어 다양한 다운스트림 작업에 적응할 수 있는 범용 인공지능 모델. 예를 들어 GPT, BERT, CLIP 등이 해당. ㅇ 특징: – 대규모 파라미터(수억~수천억 개)와 방대한 데이터로 학습 – 전이학습(Transfer Learning) 기반으로 다양한 태스크에 재활용 가능 – 멀티모달 지원 가능(텍스트, 이미지 등) – 사전 학습 후 파인튜닝 또는

AI 모델 개발: 핵심 개념 – LLM

ㅁ 핵심 개념 1. LLM ㅇ 정의: 대규모 언어모델(Large Language Model, LLM)은 대량의 텍스트 데이터를 학습하여 인간과 유사한 자연어 이해 및 생성 능력을 갖춘 인공지능 모델로, 주로 Transformer 아키텍처를 기반으로 한다. ㅇ 특징: – 수십억~수천억 개의 파라미터를 보유하여 복잡한 언어 패턴을 학습 가능 – 사전학습(Pre-training)과 미세조정(Fine-tuning) 과정을 거쳐 다양한 도메인에 적용 가능 – 질의응답, 번역,

AI 모델 개발: 성능 추적 – 드리프트 모니터링

ㅁ 성능 추적 ㅇ 정의: 모델이 운영 환경에서 지속적으로 예측 성능을 유지하고 있는지 확인하기 위해 데이터 분포 변화나 예측 결과 변화를 추적하는 활동. ㅇ 특징: – 입력 데이터 분포, 레이블 분포, 예측 결과의 통계적 특성을 주기적으로 수집 및 분석. – 데이터 드리프트, 개념 드리프트 등을 탐지하여 모델 재학습 시점을 판단. – 실시간 또는 배치 기반으로