AI 모델 개발: 불확실성 추정

ㅁ 불확실성 추정 ㅇ 정의: 모델이 예측한 결과에 대해 신뢰도를 수치로 표현하는 기법으로, 예측값의 분포나 변동성을 분석하여 모델의 불확실성을 정량화함. ㅇ 특징: – 단일 예측값뿐 아니라 예측 분포를 고려함 – 의사결정의 위험도를 줄이는 데 활용 – 데이터 부족, 분포 변화 상황에서 중요 ㅇ 적합한 경우: – 의료 진단, 자율주행 등 오판의 비용이 큰 분야 –

AI 모델 개발: 책임 있는 AI

ㅁ 책임 있는 AI ㅇ 정의: 인공지능 시스템이 사회적, 윤리적, 법적 기준을 준수하며 공정하고 투명하게 작동하도록 설계·운영하는 개념. ㅇ 특징: – 공정성, 투명성, 설명 가능성, 안전성, 개인정보 보호를 포함 – 이해관계자 신뢰 확보를 목표로 함 – 규제 준수 및 기업 윤리 정책과 연계 ㅇ 적합한 경우: – 금융, 의료, 채용 등 사회적 영향이 큰 AI

AI 모델 개발: 에너지 기반 모델

ㅁ 에너지 기반 모델 ㅇ 정의: – 확률분포를 에너지 함수로 표현하고, 낮은 에너지 값을 갖는 상태를 더 높은 확률로 간주하는 모델 계열. ㅇ 특징: – 명시적 확률 계산이 어려운 경우가 많아 MCMC 등 샘플링 기반 학습 필요. – 비지도 학습, 생성 모델링에 활용. ㅇ 적합한 경우: – 데이터의 복잡한 분포 학습이 필요할 때. – 라벨이

AI 모델 개발: 강화학습

ㅁ 강화학습 ㅇ 정의: 에이전트가 환경과 상호작용하며 보상을 최대화하는 방향으로 정책을 학습하는 기계학습 방법. ㅇ 특징: – 시퀀스 의사결정 문제 해결에 적합 – 탐험(Exploration)과 이용(Exploitation)의 균형 필요 – 보상 설계가 학습 성능에 큰 영향 ㅇ 적합한 경우: – 게임 AI, 로봇 제어, 자율주행 등 시뮬레이션 기반 학습이 가능한 경우 ㅇ 시험 함정: – 지도학습과 혼동하여

AI 모델 개발: 멀티모달 구조

ㅁ 멀티모달 구조 ㅇ 정의: 텍스트, 이미지, 음성 등 서로 다른 형태의 데이터를 동시에 처리하고 이해할 수 있도록 설계된 모델 구조. ㅇ 특징: – 입력 데이터의 형식이 다르더라도 공통 표현 공간에서 의미를 매칭. – 각 모달리티별 인코더와 이를 통합하는 융합 모듈 포함. – 학습 시 멀티태스크 학습, 대규모 사전학습 활용. ㅇ 적합한 경우: – 이미지

AI 모델 개발: 대규모 언어모델 세부

ㅁ 대규모 언어모델 세부 1. Instruction-tuning ㅇ 정의: 대규모 언어모델이 사용자의 지시문(Instruction)에 맞춰 응답을 생성하도록 대규모 지시-응답 데이터셋으로 미세조정하는 과정. ㅇ 특징: – 지도학습(Supervised Fine-tuning) 기반 – 다양한 도메인과 문체에 대응 가능 – 모델의 일반화 능력 향상 ㅇ 적합한 경우: – 범용 대화형 AI 개발 시 – 특정 작업 지시문에 최적화된 모델 생성 시 ㅇ

데이터 전처리: 그래프 데이터 증강

ㅁ 그래프 데이터 증강 ㅇ 정의: 그래프 데이터에서 노드, 엣지, 속성 등을 변형하거나 일부를 제거/추가하여 데이터 다양성을 높이고 모델의 일반화 성능을 향상시키는 기법. ㅇ 특징: 구조적 데이터 특성을 유지하면서도 다양한 변형을 적용해 과적합을 방지하고 학습 데이터의 편향을 줄임. ㅇ 적합한 경우: 학습 데이터가 적거나 네트워크 구조가 복잡하여 일반화 성능 확보가 필요한 경우. ㅇ 시험 함정:

데이터 전처리: 시간 데이터 처리

ㅁ 시간 데이터 처리 ㅇ 정의: 시간 축을 기반으로 한 데이터의 변환, 집계, 분해, 패턴 분석 등을 수행하여 분석 및 모델링에 적합한 형태로 만드는 과정 ㅇ 특징: – 시간 단위(초, 분, 시, 일, 주, 월 등)에 따라 데이터의 간격과 패턴이 달라짐 – 결측치, 이상치, 불규칙 간격 등 시간 데이터 특유의 품질 문제 존재 – 시계열

데이터 전처리: 데이터 통합

ㅁ 데이터 통합 ㅇ 정의: 서로 다른 출처의 데이터를 하나의 일관된 형식과 구조로 결합하여 분석 및 활용이 가능하도록 만드는 과정. ㅇ 특징: – 데이터 포맷, 스키마, 단위 등이 서로 다른 경우 변환 과정 필요 – 중복 제거, 키 매핑, 참조 무결성 확보가 필수 – 배치 또는 실시간 방식으로 수행 가능 ㅇ 적합한 경우: – 여러

데이터 전처리: 데이터 거버넌스

ㅁ 데이터 거버넌스 ㅇ 정의: 조직 내 데이터의 품질, 보안, 활용, 규제 준수 등을 총괄적으로 관리하는 체계와 정책. ㅇ 특징: 데이터의 생성부터 폐기까지 전 주기 관리, 표준화, 책임자 지정, 규제 준수 포함. ㅇ 적합한 경우: 대규모 데이터 환경, 규제 산업(금융, 의료 등), 다부서 데이터 공유 필요 시. ㅇ 시험 함정: 단순한 데이터베이스 관리와 혼동, IT