ㅁ 불확실성 추정 ㅇ 정의: 모델의 예측 결과에 대한 신뢰도를 정량적으로 측정하는 기법으로, 예측값과 함께 불확실성 정도를 제공하여 의사결정의 안정성을 높임. ㅇ 특징: – 확률적 모델링을 통해 예측값의 분포를 추정 – 데이터 불확실성(aleatoric)과 모델 불확실성(epistemic) 구분 가능 – 의료, 자율주행, 금융 등 고위험 분야에서 중요 ㅇ 적합한 경우: – 예측 결과의 신뢰도를 기반으로 후속 조치를
ㅁ 책임 있는 AI ㅇ 정의: 인공지능 시스템이 공정성, 투명성, 안전성, 책임성을 갖추도록 설계·운영하는 접근 방식. ㅇ 특징: – 윤리적 원칙과 법규 준수를 목표로 함 – 데이터 수집부터 모델 배포까지 전 과정 관리 – 이해관계자의 신뢰 확보를 중시 ㅇ 적합한 경우: – 금융, 의료, 공공 분야 등 사회적 영향이 큰 AI 적용 시 – 규제
ㅁ 에너지 기반 모델 ㅇ 정의: – 데이터의 확률분포를 에너지 함수로 표현하고, 낮은 에너지를 가지는 상태가 높은 확률을 갖도록 모델링하는 기법. ㅇ 특징: – 확률분포 추정에 강점이 있으나, 학습 시 복잡한 정규화 상수 계산이 필요. – 샘플링 기반 학습(MCMC 등) 필요. ㅇ 적합한 경우: – 데이터의 잠재 구조를 학습하거나 생성 모델로 활용할 때. ㅇ 시험
ㅁ 강화학습 ㅇ 정의: 에이전트가 환경과 상호작용하며 보상을 최대화하는 방향으로 정책을 학습하는 기계학습 방법. ㅇ 특징: 상태(State), 행동(Action), 보상(Reward)의 3요소를 기반으로 함. 탐험(Exploration)과 활용(Exploitation)의 균형이 중요. ㅇ 적합한 경우: 게임, 로보틱스 제어, 자율주행 등 시뮬레이션 기반 환경에서 최적 정책을 찾아야 하는 경우. ㅇ 시험 함정: 지도학습과 혼동, 보상 지연 문제를 간과, 정책과 가치기반 방법의 차이를
ㅁ 멀티모달 구조 ㅇ 정의: 텍스트, 이미지, 음성 등 서로 다른 형태의 데이터를 동시에 처리하고 이해할 수 있도록 설계된 모델 구조. ㅇ 특징: – 서로 다른 모달리티 간의 정보 융합 필요 – 모달별 인코더와 공통 표현 공간 사용 – 학습 시 멀티태스크 또는 공동 학습 기법 활용 ㅇ 적합한 경우: – 이미지 캡셔닝, 비디오 설명,
ㅁ 대규모 언어모델 세부 1. Instruction-tuning ㅇ 정의: – 사전 학습된 대규모 언어모델(LLM)에 대해 특정 작업 지시문에 더 잘 반응하도록 추가로 미세조정하는 기법. – 주로 대화형 AI, 질의응답, 요약 등 다양한 태스크에 대해 사용자가 원하는 방식으로 답변하도록 학습. ㅇ 특징: – 대규모의 지시문-응답 쌍 데이터셋을 사용. – zero-shot, few-shot 성능 향상. – 모델이 일반적인 지시문
ㅁ 그래프 데이터 증강 ㅇ 정의: 그래프 데이터의 구조나 속성을 변형하여 학습 데이터의 다양성을 높이고 모델의 일반화 성능을 향상시키는 기법. ㅇ 특징: – 노드, 엣지, 속성 등을 다양한 방식으로 변형 가능 – 원본 그래프의 중요한 구조적 특징을 유지하면서도 변형을 가함 – 지도학습, 자가지도학습 모두에서 활용 가능 ㅇ 적합한 경우: – 그래프 데이터가 적어 과적합 위험이
ㅁ 시간 데이터 처리 ㅇ 정의: 시간 데이터 처리란 시계열 데이터의 품질을 높이고 분석 및 모델링에 적합하도록 변환, 보정, 구조화하는 전처리 과정이다. ㅇ 특징: – 시간 순서가 중요한 데이터 특성을 반영 – 주기성, 추세, 불규칙성을 고려한 변환 필요 – 결측치, 이상치 처리와 함께 주파수 변환, 분해 등의 기법 포함 ㅇ 적합한 경우: – 금융, 제조,
ㅁ 데이터 통합 ㅇ 정의: 서로 다른 출처의 데이터를 하나의 일관된 형식과 구조로 결합하여 분석이나 활용이 가능하도록 만드는 과정. ㅇ 특징: – 데이터 소스가 다양(관계형 DB, 로그 파일, API 등) – 스키마 매핑, 중복 제거, 형식 변환 등의 과정 필요 – 배치 또는 실시간 방식 모두 가능 ㅇ 적합한 경우: – 여러 시스템에서 생성된 데이터를
ㅁ 데이터 거버넌스 ㅇ 정의: 조직 내 데이터의 수집, 저장, 활용, 폐기까지 전 과정에서 데이터의 품질, 보안, 규제 준수를 보장하기 위한 정책과 절차의 체계. ㅇ 특징: 데이터 표준화, 접근 권한 관리, 규제 준수, 데이터 계보 추적 등의 기능을 포함하며, 데이터 기반 의사결정을 지원. ㅇ 적합한 경우: 대규모 데이터 환경, 규제 산업(금융, 의료), 데이터 활용이 중요한