세부 이슈: Hallucination Detection

ㅁ 세부 이슈 ㅇ 정의: LLM(대규모 언어 모델)이 실제로 존재하지 않는 정보나 사실을 생성하는 문제를 탐지하고 방지하는 과정. ㅇ 특징: – LLM의 출력이 신뢰성을 갖추지 못할 경우 발생. – 데이터셋의 편향, 학습 과정의 한계로 인해 발생 가능. – 사용자 신뢰도 저하와 잘못된 정보 확산의 주요 원인. ㅇ 적합한 경우: – 의료, 법률 등 높은 정확도가

세부 이슈: Alignment

ㅁ 세부 이슈 ㅇ 정의: 대규모 언어 모델(LLM)이 사용자 의도와 윤리적 기준에 부합하도록 조정하는 과정 또는 상태. ㅇ 특징: – 모델이 생성하는 응답이 사용자 의도에 맞지 않거나 유해한 결과를 초래할 수 있음. – 인간 피드백 기반 강화 학습(RLHF)와 같은 기법을 통해 조정 가능. – 윤리적 문제, 편향성 제거, 안전성 확보가 주요 목표. ㅇ 적합한 경우:

세부 이슈: RLHF

ㅁ 세부 이슈 ㅇ 정의: 대규모 언어 모델(LLM)을 특정 작업에 맞도록 미세 조정하는 과정에서 인간 피드백을 활용한 강화 학습(RLHF)을 적용하는 주요 이슈를 다룸. ㅇ 특징: – 인간의 피드백 데이터를 기반으로 모델 출력을 평가하고 보상을 제공하여 학습. – 모델의 성능 향상과 윤리적 문제 해결에 기여. – 보상 설계와 피드백 품질이 학습 결과에 큰 영향을 미침. ㅇ

세부 이슈: Instruction-tuning

ㅁ 세부 이슈 ㅇ 정의: LLM(대규모 언어 모델)에서 특정 작업에 대한 성능을 향상시키기 위해 주어진 지침에 따라 모델을 미세 조정하는 과정. ㅇ 특징: – 사전 학습된 모델에 추가 데이터를 제공하여 특정 작업에 맞게 조정. – 일반적인 텍스트 생성보다 특정 작업에 대한 정확도가 높아짐. – 데이터의 품질과 양에 따라 성능이 크게 좌우됨. ㅇ 적합한 경우: –

프롬프트 설계: Prompt Injection

ㅁ 프롬프트 설계 ㅇ 정의: 사용자가 AI 모델과 상호작용하기 위해 입력하는 명령어 또는 질문을 설계하는 과정. ㅇ 특징: – 명확하고 구체적인 지침 제공. – 모델의 출력 품질에 직접적인 영향을 미침. – 다양한 입력 시나리오에 대한 고려 필요. ㅇ 적합한 경우: – 특정한 답변을 유도해야 할 때. – 사용자 경험을 최적화하려는 경우. ㅇ 시험 함정: –

프롬프트 설계: Chain-of-Thought

ㅁ 프롬프트 설계 ㅇ 정의: – 프롬프트 설계는 AI 모델이 사용자 입력에 대해 적절한 응답을 생성할 수 있도록 입력 구조를 설계하는 과정이다. ㅇ 특징: – 사용자의 요구를 명확히 반영해야 하며, 모델의 성능을 극대화하기 위한 최적화가 필요하다. – 다양한 입력 조건에 대해 일관된 결과를 도출할 수 있도록 설계된다. ㅇ 적합한 경우: – 복잡한 문제를 단계적으로 해결해야

프롬프트 설계: Few-shot

ㅁ 프롬프트 설계 ㅇ 정의: 프롬프트 설계는 AI 모델이 사용자 요청에 적합한 응답을 생성할 수 있도록 입력 텍스트를 구성하는 과정이다. 이 과정은 모델의 성능을 극대화하고 원하는 결과를 얻기 위해 중요하다. ㅇ 특징: – 명확하고 간결한 문구를 사용하여 모델이 혼란 없이 이해할 수 있도록 한다. – 다양한 사례를 포함하여 모델이 더 많은 정보를 학습하도록 유도한다. –

프롬프트 설계: Zero-shot

ㅁ 프롬프트 설계 ㅇ 정의: – 프롬프트 설계는 AI 모델이 주어진 입력에 대해 원하는 출력을 생성하도록 입력 형식을 구성하는 과정. ㅇ 특징: – AI 모델의 성능은 프롬프트의 질에 따라 크게 달라질 수 있음. – 특정 문제에 대해 최소한의 정보만 제공하거나, 추가적인 맥락을 포함하여 모델의 응답을 조정 가능. ㅇ 적합한 경우: – 명확한 질문이나 지시가 필요한

대표 기법: Noisy Student

ㅁ 대표 기법 ㅇ 정의: 준지도 학습에서 레이블이 부족한 데이터를 활용하기 위해 사용하는 방법으로, 학생-교사 모델을 활용하여 데이터를 증폭하고 노이즈를 추가해 학습 성능을 개선하는 기법. ㅇ 특징: – 교사 모델과 학생 모델의 반복적인 학습 구조를 가짐. – 노이즈 추가를 통해 모델의 일반화 성능을 향상시킴. – 레이블이 없는 데이터와 레이블이 있는 데이터를 모두 활용 가능. ㅇ

대표 기법: MixMatch

ㅁ 대표 기법 ㅇ 정의: 준지도 학습에서 라벨이 없는 데이터를 효과적으로 활용하기 위해, 라벨이 있는 데이터와 혼합하여 학습하는 기법. ㅇ 특징: – 라벨이 없는 데이터에 대해 가상의 라벨을 생성하여 활용. – 데이터 증강(Data Augmentation)을 통해 학습 데이터의 다양성을 확보. – 정규화를 통해 모델의 일반화 성능을 향상시킴. ㅇ 적합한 경우: – 라벨링된 데이터가 부족한 상황에서 모델의