AI 모델 개발: 프롬프트 설계
ㅁ 프롬프트 설계
1. Zero-shot
ㅇ 정의:
사전 예시 없이 모델에 질문이나 명령을 주어 바로 답변을 생성하게 하는 프롬프트 기법.
ㅇ 특징:
– 학습 시 포함된 일반 지식을 활용.
– 빠르고 간단하지만, 복잡한 문제에서는 정확도가 낮을 수 있음.
ㅇ 적합한 경우:
– 단순 질의응답.
– 분류 기준이 명확한 경우.
ㅇ 시험 함정:
– 예시 없이도 고성능을 보장한다고 오해.
– 훈련 데이터에 없는 패턴에서는 성능 저하.
ㅇ 시험 대비 “패턴 보기” 예시:
O: “Zero-shot은 예시 없이도 사전 학습 지식을 활용해 답변한다.”
X: “Zero-shot은 항상 Few-shot보다 성능이 높다.”
================================
2. Few-shot
ㅇ 정의:
모델에 소수의 예시를 함께 제공하여 문제 해결 방식을 유도하는 프롬프트 기법.
ㅇ 특징:
– 예시를 통해 문맥과 패턴을 학습.
– 예시 수와 품질이 성능에 직접 영향.
ㅇ 적합한 경우:
– 복잡한 분류 작업.
– 특정 형식의 출력이 필요한 경우.
ㅇ 시험 함정:
– 예시 수가 많을수록 무조건 성능이 향상된다고 착각.
– 예시가 부적절하면 오히려 성능 저하.
ㅇ 시험 대비 “패턴 보기” 예시:
O: “Few-shot은 소수의 예시를 통해 모델의 응답 패턴을 유도한다.”
X: “Few-shot은 예시 없이 답변하는 방식이다.”
================================
3. Chain-of-Thought
ㅇ 정의:
모델이 문제 해결 과정을 단계별로 서술하도록 유도하는 프롬프트 기법.
ㅇ 특징:
– 중간 추론 과정을 명시적으로 생성.
– 복잡한 수리, 논리 문제에서 효과적.
ㅇ 적합한 경우:
– 수학 문제 풀이.
– 다단계 논리 추론.
ㅇ 시험 함정:
– 항상 정답률이 향상된다고 단정.
– 불필요하게 길어진 출력으로 인해 혼동.
ㅇ 시험 대비 “패턴 보기” 예시:
O: “Chain-of-Thought는 중간 추론 단계를 노출시켜 복잡한 문제 해결을 돕는다.”
X: “Chain-of-Thought는 반드시 예시 없이만 사용된다.”
================================
4. Prompt Injection
ㅇ 정의:
의도적으로 악의적 또는 의도치 않은 명령을 프롬프트에 삽입하여 모델의 동작을 변경하는 공격 기법.
ㅇ 특징:
– 보안 취약점을 악용.
– 모델이 원래 지침을 무시하게 만들 수 있음.
ㅇ 적합한 경우:
– (공격 관점) 보안 취약점 테스트.
– (방어 관점) 프롬프트 필터링 및 검증.
ㅇ 시험 함정:
– 단순 오타나 문법 오류와 혼동.
– Prompt Injection이 항상 악의적이라고만 생각.
ㅇ 시험 대비 “패턴 보기” 예시:
O: “Prompt Injection은 모델의 원래 지침을 우회하도록 설계된 입력이다.”
X: “Prompt Injection은 모델 성능 향상을 위해 예시를 추가하는 기법이다.”
ㅁ 추가 학습 내용
정리된 학습 내용:
1. Zero-shot과 Few-shot 비교
– Zero-shot: 예시 없이 작업 수행
– Few-shot: 소수의 예시 제공 후 작업 수행
– 작업 난이도와 예시 품질이 성능에 직접적인 영향
– 난이도가 높을수록 적절한 예시 제공이 중요
– 예시 품질이 낮으면 오히려 성능 저하 가능
2. Chain-of-Thought와 Self-consistency
– Chain-of-Thought: 단계별 추론 과정을 명시적으로 유도
– Self-consistency: 여러 번의 추론 결과를 생성 후 다수결 또는 확률 기반으로 최종 답안 결정
– 복잡한 문제에서 정확도 향상에 효과적
3. Prompt Injection 방어 기법
– 입력 검증(Input validation): 악성 명령이나 의도치 않은 요청 차단
– 출력 필터링(Output filtering): 민감 정보나 위험한 내용 제거
– 맥락 제한(Context bounding): 모델이 접근할 수 있는 정보 범위 제한
4. 샘플링 파라미터 조정
– Temperature: 값이 높을수록 창의적·다양한 응답, 낮을수록 결정적·일관된 응답
– Top-p (nucleus sampling): 확률 누적합이 p 이하인 토큰만 후보로 사용
– 두 파라미터의 조합이 응답의 다양성과 품질에 영향
5. 프롬프트 포맷에 따른 응답 차이
– 질문형: 정보 검색 및 구체적 답변 유도
– 지시문형: 작업 수행 지시 및 절차적 응답 유도
– 역할 부여형: 특정 인물·전문가 역할로 응답 스타일 변화
시험 대비 체크리스트:
– Zero-shot과 Few-shot의 정의와 차이 설명 가능 여부
– 작업 난이도와 예시 품질이 성능에 미치는 영향 사례 제시 가능 여부
– Chain-of-Thought와 Self-consistency의 개념과 적용 방법 설명 가능 여부
– Prompt Injection의 개념과 방어 전략 3가지 이상 나열 가능 여부
– Temperature와 Top-p의 의미, 조절 시 결과 변화 예시 설명 가능 여부
– 프롬프트 포맷별 특징과 응답 차이 구체적으로 설명 가능 여부