알고리즘·논문: 최신 기법 – Retrieval-Augmented Generation (RAG)
ㅁ 최신 기법
1. Retrieval-Augmented Generation (RAG)
ㅇ 정의:
외부 지식 베이스나 문서 저장소에서 관련 정보를 검색(Retrieval)하여, 이를 기반으로 생성(Generation) 모델이 답변을 생성하는 자연어 처리 기법.
ㅇ 특징:
– 사전 학습된 언어 모델의 한계를 보완하여 최신 정보나 도메인 특화 지식을 활용 가능
– 검색 단계와 생성 단계를 결합하여 사실성(Factuality) 향상
– 검색 품질에 따라 최종 응답 품질이 크게 좌우됨
ㅇ 적합한 경우:
– 사전 학습 데이터에 포함되지 않은 최신 정보가 필요한 경우
– 특정 도메인(법률, 의학 등)에서 정확하고 근거 기반의 답변이 필요한 경우
– 대규모 문서 집합을 바탕으로 질의응답(QA) 서비스 구현 시
ㅇ 시험 함정:
– RAG는 항상 최신 정보를 제공한다고 단정하면 오답 (검색 인덱스가 최신이 아닐 수 있음)
– RAG는 모든 생성형 모델에 자동 적용되는 기능이 아님
– 검색 단계 없이도 RAG가 가능하다는 설명은 틀림
ㅇ 시험 대비 “패턴 보기” 예시:
O: “RAG는 검색과 생성 단계를 결합하여 언어 모델의 사실성을 높인다.”
O: “RAG는 외부 지식 베이스를 활용해 사전 학습 데이터의 한계를 보완한다.”
X: “RAG는 검색 없이도 외부 지식을 자동으로 포함한다.”
X: “RAG는 항상 최신 정보를 제공한다.”
ㅁ 추가 학습 내용
RAG의 핵심 구성 요소는 Retriever(정보 검색기)와 Generator(생성기)이다.
Retriever는 BM25, DPR(Dense Passage Retrieval), ColBERT 등 다양한 검색 알고리즘을 사용할 수 있으며, Generator는 주로 Transformer 기반의 대형 언어 모델이 사용된다.
RAG의 성능은 검색 단계의 정밀도(Precision)와 재현율(Recall)에 크게 의존하며, 잘못된 문서가 검색되면 생성 결과도 부정확해질 수 있다.
시험에서는 RAG와 단순 Open-domain QA의 차이, RAG와 Fine-tuning의 차이점을 묻는 문제가 자주 출제될 수 있다.
또한 Retrieval 단계에서의 인덱싱 방식(역색인, 벡터 인덱스), 임베딩 모델 선택, Latency 최적화 방법 등이 심화 문제로 나올 수 있다.