AI 모델 개발: 검색 생성 융합 – GAR
ㅁ 검색 생성 융합
ㅇ 정의:
GAR(Generation-Augmented Retrieval)은 대규모 언어모델(LLM)의 생성 능력과 정보 검색(Retrieval) 기능을 결합하여, 외부 지식 기반에서 관련 정보를 검색한 뒤 이를 생성 과정에 반영하는 접근 방식이다.
ㅇ 특징:
– 검색 단계에서 최신성·정확성이 높은 데이터를 확보하여 생성 결과의 신뢰성을 높임.
– LLM의 한계인 지식 컷오프 문제를 완화.
– 검색된 문서를 프롬프트에 포함시켜 모델이 참고하도록 함.
– 검색-생성 과정이 순차적 또는 반복적으로 수행될 수 있음.
ㅇ 적합한 경우:
– 빠르게 변하는 도메인(예: 시사, 금융, 법률)에서 최신 정보가 필요한 경우.
– LLM이 학습하지 않은 영역의 질문에 답변해야 하는 경우.
– 정확성과 근거 제시가 중요한 QA 시스템.
ㅇ 시험 함정:
– 단순히 검색과 생성 기능을 나열하는 것과 GAR의 통합 구조를 혼동.
– RAG(Retrieval-Augmented Generation)와 GAR의 용어 혼용에 주의.
– 검색 없이 생성만 하는 경우를 GAR로 오인.
ㅇ 시험 대비 “패턴 보기” 예시:
– O: “GAR는 검색된 외부 지식을 생성 과정에 통합하여 최신성 있는 답변을 생성한다.”
– X: “GAR는 검색 기능 없이 LLM의 생성 능력만 활용한다.”
– O: “GAR는 지식 컷오프 문제를 완화할 수 있다.”
– X: “GAR는 외부 지식이 필요 없는 경우에만 사용된다.”
ㅁ 추가 학습 내용
GAR는 RAG와 유사하지만 구현 방식에서 차이가 있다. GAR는 생성 과정 중간에 반복적으로 검색을 수행하여 답변 품질을 점진적으로 향상시키는 구조를 가질 수 있다. 또한 검색된 문서를 단순히 삽입하는 것이 아니라 요약하거나 정제한 후 생성 단계에 반영하는 방식을 포함할 수 있다. 시험에서는 검색-생성 순환 구조, 지식 갱신 주기, 프롬프트 엔지니어링 기법 등이 추가로 출제될 수 있다. 따라서 검색 전략(키워드 기반 검색과 시맨틱 검색), 결과 랭킹 알고리즘(BM25, DPR), 하이브리드 검색 방식 등에 대한 이해가 필요하다.