ㅁ 대규모 언어모델 세부 1. Instruction-tuning ㅇ 정의: – 사전 학습된 대규모 언어모델(LLM)에 대해 특정 작업 지시문에 더 잘 반응하도록 추가로 미세조정하는 기법. – 주로 대화형 AI, 질의응답, 요약 등 다양한 태스크에 대해 사용자가 원하는 방식으로 답변하도록 학습. ㅇ 특징: – 대규모의 지시문-응답 쌍 데이터셋을 사용. – zero-shot, few-shot 성능 향상. – 모델이 일반적인 지시문
ㅁ 그래프 데이터 증강 ㅇ 정의: 그래프 데이터의 구조나 속성을 변형하여 학습 데이터의 다양성을 높이고 모델의 일반화 성능을 향상시키는 기법. ㅇ 특징: – 노드, 엣지, 속성 등을 다양한 방식으로 변형 가능 – 원본 그래프의 중요한 구조적 특징을 유지하면서도 변형을 가함 – 지도학습, 자가지도학습 모두에서 활용 가능 ㅇ 적합한 경우: – 그래프 데이터가 적어 과적합 위험이
ㅁ 시간 데이터 처리 ㅇ 정의: 시간 데이터 처리란 시계열 데이터의 품질을 높이고 분석 및 모델링에 적합하도록 변환, 보정, 구조화하는 전처리 과정이다. ㅇ 특징: – 시간 순서가 중요한 데이터 특성을 반영 – 주기성, 추세, 불규칙성을 고려한 변환 필요 – 결측치, 이상치 처리와 함께 주파수 변환, 분해 등의 기법 포함 ㅇ 적합한 경우: – 금융, 제조,
ㅁ 데이터 통합 ㅇ 정의: 서로 다른 출처의 데이터를 하나의 일관된 형식과 구조로 결합하여 분석이나 활용이 가능하도록 만드는 과정. ㅇ 특징: – 데이터 소스가 다양(관계형 DB, 로그 파일, API 등) – 스키마 매핑, 중복 제거, 형식 변환 등의 과정 필요 – 배치 또는 실시간 방식 모두 가능 ㅇ 적합한 경우: – 여러 시스템에서 생성된 데이터를
ㅁ 데이터 거버넌스 ㅇ 정의: 조직 내 데이터의 수집, 저장, 활용, 폐기까지 전 과정에서 데이터의 품질, 보안, 규제 준수를 보장하기 위한 정책과 절차의 체계. ㅇ 특징: 데이터 표준화, 접근 권한 관리, 규제 준수, 데이터 계보 추적 등의 기능을 포함하며, 데이터 기반 의사결정을 지원. ㅇ 적합한 경우: 대규모 데이터 환경, 규제 산업(금융, 의료), 데이터 활용이 중요한
ㅁ 응용 분야 1. AI 기반 헬스케어 ㅇ 정의: 인공지능 기술을 활용하여 질병 예측, 진단, 치료 계획 수립, 환자 모니터링 등을 수행하는 의료 서비스 분야. ㅇ 특징: – 대규모 의료 데이터(영상, 유전체, EMR 등)를 분석하여 의사 결정 지원 – 딥러닝 기반 의료 영상 판독, 자연어 처리 기반 전자의무기록 분석 – 규제와 개인정보 보호 이슈가 큼
ㅁ 중점 이슈 1. Responsible AI ㅇ 정의: – 인공지능 개발·운영 전 과정에서 윤리, 법률, 사회적 책임을 고려하여 설계·운영하는 접근 방식. ㅇ 특징: – 투명성, 공정성, 책임성, 안전성, 프라이버시 보호를 핵심 원칙으로 함. – 기업의 AI 거버넌스 체계와 연계되어 지속적 모니터링 필요. ㅇ 적합한 경우: – 금융, 의료, 공공 서비스 등 사회적 영향이 큰 AI
ㅁ 정책 기법 1. Policy Gradient ㅇ 정의: – 강화학습에서 정책 함수를 직접 파라미터화하여, 보상 신호를 통해 정책 파라미터를 최적화하는 방법. – 행동 선택 확률을 미분 가능하게 하여 경사 상승법으로 학습. ㅇ 특징: – 연속적 행동 공간에서도 적용 가능. – 정책을 직접 학습하므로 탐색과 수렴이 빠를 수 있음. – 고분산 문제 발생 가능. ㅇ 적합한
ㅁ 융합 개념 ㅇ 정의: – 서로 다른 AI 접근 방식(기호 기반 추론, 통계 기반 학습 등)을 결합하여 상호 보완적인 지능을 구현하는 개념. ㅇ 특징: – 데이터 기반 학습의 유연성과 규칙 기반 추론의 해석 가능성을 동시에 확보. – 복잡한 문제 해결에서 단일 접근법보다 높은 정확도와 신뢰성을 제공. ㅇ 적합한 경우: – 데이터가 불완전하거나 규칙 기반
ㅁ 주요 예시 1. AutoGPT ㅇ 정의: – GPT 계열 모델을 기반으로 사용자의 고수준 목표를 스스로 세분화하고, 인터넷 검색·코드 실행·파일 작성 등의 작업을 자율적으로 수행하는 오픈소스 에이전트 프레임워크. ㅇ 특징: – 연속적 프롬프트 생성 및 실행 – 외부 API 호출과 데이터 저장 기능 지원 – 장기 메모리(벡터DB) 활용 가능 ㅇ 적합한 경우: – 복잡한 다단계