시퀀스 처리:
ㅁ 시퀀스 처리
ㅇ 정의:
– 시퀀스 데이터(문장, 시간 시계열 등)를 처리하는 작업으로, 입력 데이터의 순서와 구조를 유지하며 모델 학습 및 예측을 수행.
ㅇ 특징:
– 순차적인 데이터 구조를 다룸.
– 데이터 길이를 맞추기 위해 패딩이나 특수 토큰을 활용.
– Recurrent Neural Networks(RNN), Transformer 등의 모델에서 주로 사용.
ㅇ 적합한 경우:
– 자연어 처리(NLP)에서 문장 단위의 데이터 처리.
– 음성 신호, 주식 가격 등 시간에 따라 변하는 데이터를 분석할 때.
ㅇ 시험 함정:
– 시퀀스 데이터가 항상 시간 순서를 의미하는 것은 아님.
– 패딩 토큰과 실제 데이터의 차이를 혼동할 가능성.
ㅇ 시험 대비 “패턴 보기” 예시:
– O: 시퀀스 처리는 데이터의 순서를 유지하며 모델 학습에 활용된다.
– X: 시퀀스 처리는 항상 시간 시계열 데이터를 처리하는 데만 사용된다.
================================
1.
ㅇ 정의:
– 문장 또는 시퀀스 간의 구분을 위해 사용되는 특수 토큰으로, 모델이 입력 데이터의 경계를 인식할 수 있도록 함.
ㅇ 특징:
– BERT 등 Transformer 모델에서 주로 사용.
– 입력 데이터가 여러 문장으로 구성된 경우에 각 문장을 구분하는 역할.
ㅇ 적합한 경우:
– 다중 문장 입력을 처리해야 하는 NLP 작업.
– 문장 간 관계를 학습해야 하는 분류 또는 회귀 작업.
ㅇ 시험 함정:
–
– 모델에 따라
ㅇ 시험 대비 “패턴 보기” 예시:
– O:
– X:
ㅁ 추가 학습 내용
시험 대비를 위한 학습 노트:
1. 특수 토큰의 역할과 차이점:
–
–
–
2.
– 문장 분류: 두 문장을
– 문장 유사도 계산: 두 문장을