ㅁ PEFT/강화 ㅇ 정의: – PEFT(Parametric Efficient Fine-Tuning)는 사전 학습된 언어 모델을 효율적으로 미세 조정하기 위한 기법이며, 강화 학습은 모델의 성능을 특정 목표에 맞게 최적화하는 방법을 의미함. ㅇ 특징: – PEFT는 대규모 모델의 모든 파라미터를 업데이트하지 않고 일부 파라미터만 조정하여 효율성을 극대화함. – 강화 학습은 보상 신호를 기반으로 모델이 학습하며, 주로 행동의 최적화를 목표로 함.