AI 모델 개발: 프롬프트 설계
ㅁ 프롬프트 설계
ㅇ 정의:
사용자가 AI 모델에 원하는 작업을 수행하도록 지시하는 입력 문장을 구조적으로 설계하는 과정.
ㅇ 특징:
– 모델의 출력 품질과 정확도에 직접적인 영향을 미침
– 문맥, 예시, 지시문 등의 요소를 포함하여 설계
– 다양한 기법(Zero-shot, Few-shot, Chain-of-Thought 등)을 활용
ㅇ 적합한 경우:
– 모델의 성능을 최대화하고 특정 작업에 맞춘 답변을 유도할 때
ㅇ 시험 함정:
– 프롬프트 기법 간 차이를 혼동
– 기법의 적용 예시를 잘못 이해
ㅇ 시험 대비 “패턴 보기” 예시:
O: “모델이 사전 학습 지식만으로 답변하도록 하는 기법은 Zero-shot이다.”
X: “Few-shot은 예시 없이 모델이 답변하는 방식이다.”
================================
1. Zero-shot
ㅇ 정의:
사전 예시 없이, 순수한 지시문만으로 모델이 답변하도록 하는 프롬프트 기법.
ㅇ 특징:
– 모델의 사전 학습 지식에 전적으로 의존
– 간단하고 빠르게 적용 가능
– 복잡한 맥락 이해가 필요한 경우 정확도 한계 존재
ㅇ 적합한 경우:
– 간단한 질의응답, 사실 기반 질문
– 빠른 프로토타이핑
ㅇ 시험 함정:
– Few-shot과 혼동하여 예시 포함 여부를 잘못 판단
ㅇ 시험 대비 “패턴 보기” 예시:
O: “예시 없이 모델이 작업을 수행하는 프롬프트 기법은 Zero-shot이다.”
X: “Zero-shot은 반드시 예시 데이터를 포함해야 한다.”
================================
2. Few-shot
ㅇ 정의:
모델에 작업 수행 예시를 몇 개 제공하여, 유사한 방식으로 답변을 유도하는 프롬프트 기법.
ㅇ 특징:
– 예시를 통해 모델의 출력 형식과 논리를 유도
– 예시 개수에 따라 성능이 달라질 수 있음
– 데이터 준비 부담이 있음
ㅇ 적합한 경우:
– 특정 형식의 출력이 필요한 경우
– 복잡한 규칙을 모델이 학습해야 하는 경우
ㅇ 시험 함정:
– Zero-shot과 예시 포함 여부를 혼동
ㅇ 시험 대비 “패턴 보기” 예시:
O: “Few-shot은 몇 개의 예시를 포함하여 모델의 응답을 유도한다.”
X: “Few-shot은 예시 없이 모델이 답변하는 방식이다.”
================================
3. Chain-of-Thought
ㅇ 정의:
모델이 문제를 해결하는 과정을 단계별로 설명하게 하여 최종 답변을 도출하는 프롬프트 기법.
ㅇ 특징:
– 중간 추론 과정을 명시적으로 생성
– 복잡한 문제 해결, 수학적 계산, 논리적 추론에 유리
– 출력 길이가 길어질 수 있음
ㅇ 적합한 경우:
– 수학 문제, 논리 퍼즐, 복잡한 의사결정 문제
ㅇ 시험 함정:
– 단순히 답만 요구하는 경우와 혼동
– ‘단계별 사고’ 지시문을 생략하면 효과가 줄어듦
ㅇ 시험 대비 “패턴 보기” 예시:
O: “Chain-of-Thought는 모델이 단계별 reasoning을 통해 답을 도출하도록 한다.”
X: “Chain-of-Thought는 예시 없이 답을 도출하는 Zero-shot 기법이다.”
================================
4. Prompt Injection
ㅇ 정의:
악의적이거나 의도치 않은 지시를 프롬프트에 삽입하여 모델의 동작을 변경하거나 보안 취약점을 유발하는 공격 기법.
ㅇ 특징:
– 모델이 원래 의도와 다른 행동을 하도록 유도
– 데이터 유출, 보안 위협 가능
– 사용자 입력 검증 미비 시 발생
ㅇ 적합한 경우:
– (공격 기법이므로) 보안 테스트, 취약점 점검 시 활용
ㅇ 시험 함정:
– 정상적인 프롬프트 설계 기법과 혼동
– 보안 위협 여부를 간과
ㅇ 시험 대비 “패턴 보기” 예시:
O: “Prompt Injection은 악의적 지시를 삽입해 모델의 동작을 변경하는 공격이다.”
X: “Prompt Injection은 모델의 정확도를 높이기 위한 프롬프트 설계 기법이다.”
ㅁ 추가 학습 내용
추가 학습 정리
1. Zero-shot과 Few-shot의 경계
– 예시가 하나라도 포함되면 Few-shot으로 분류됨.
– 예시가 전혀 없는 경우가 Zero-shot.
2. Chain-of-Thought(CoT)와 Self-Consistency 비교
– Chain-of-Thought: 단계별 추론 과정을 명시적으로 생성하여 답을 도출.
– Self-Consistency: 여러 개의 Chain-of-Thought 출력을 생성한 뒤, 다수결 방식으로 최종 답을 선택.
3. Prompt Injection 대응 방안
– 입력 필터링
– 명령어 화이트리스트 사용
– 모델 출력 검증
4. 프롬프트 설계 평가 지표
– 정확도
– 일관성
– 유연성
5. Few-shot에서 예시 순서의 영향
– 예시 순서가 모델 출력에 영향을 미치는 Priming 효과 존재.
6. Chain-of-Thought의 보안 위험
– 중간 추론 과정에서 민감한 정보가 노출될 가능성 있음.
7. 시험 대비 포인트
– 각 기법별 정의와 적용 예시를 정확히 매칭할 수 있어야 함.
– 주요 키워드: 예시 포함 여부(Zero-shot vs Few-shot), 단계별 추론(CoT), 보안 위협, Priming 효과.