AI 모델 개발: 변화와 유형 – Reflexion
ㅁ 변화와 유형
1. Reflexion
ㅇ 정의:
AI 에이전트가 스스로의 과거 실행 기록과 피드백을 바탕으로 성능을 개선하는 자기 반성(Self-reflection) 기반 학습 기법. 주로 LLM(대규모 언어 모델) 기반 에이전트에서 의사결정 품질 향상을 위해 사용됨.
ㅇ 특징:
– 과거 실패 사례를 메모리에 기록하고, 이를 분석하여 다음 시도에서 오류를 줄임.
– 외부 평가자(critic) 또는 자체 평가 모듈을 통해 개선 방향을 도출.
– 단순 반복 학습과 달리, 메타인지적 접근을 통해 효율적인 개선 가능.
– 프롬프트 엔지니어링과 결합 시 성능 향상 폭이 큼.
ㅇ 적합한 경우:
– 복잡한 문제 해결에서 오류 원인을 스스로 분석할 필요가 있는 경우.
– 장기적인 작업 계획에서 누적된 시행착오를 줄이고자 할 때.
– 자동화된 문제 해결 에이전트의 지속적 성능 개선이 필요한 환경.
ㅇ 시험 함정:
– 단순한 피드백 루프와 혼동하기 쉬움.
– Reinforcement Learning(강화학습)과 동일시하는 오류.
– Reflexion은 반드시 ‘과거 실행에 대한 자기 분석’을 포함해야 함.
ㅇ 시험 대비 “패턴 보기” 예시:
O: “Reflexion 기법은 AI가 과거 실행 결과를 분석하여 향후 의사결정 품질을 향상시키는 방법이다.”
X: “Reflexion은 외부 데이터셋을 재학습하여 모델 가중치를 업데이트하는 전통적인 학습 방식이다.”
ㅁ 추가 학습 내용
Reflexion은 2023년 이후 LLM 기반 에이전트 연구에서 주목받는 기법으로, 자기 비평(Self-critique)과 계획 재구성(Plan revision)을 통해 성능을 향상시키는 사례가 많다. 시험에서는 Reflexion과 ReAct(Reason+Act) 프레임워크의 차이를 구분하는 문제가 출제될 수 있다. Reflexion은 메모리 관리 전략과 함께 설명되는 경우가 많으며, 단기 메모리(short-term memory)와 장기 메모리(long-term memory)를 어떻게 활용하는지가 성능에 영향을 준다. 구현 시에는 LLM의 출력 로그를 분석하여 실패 패턴을 식별하고, 이를 프롬프트 조정이나 계획 재수립에 반영하는 것이 핵심이다.