AI 모델 개발: 핵심 개념

ㅁ 핵심 개념 1. AGI ㅇ 정의: – Artificial General Intelligence의 약자로, 인간 수준의 전반적인 지능을 가진 인공지능을 의미. 다양한 분야의 문제를 이해하고 학습하며 새로운 상황에 적응할 수 있음. ㅇ 특징: – 특정 도메인에 한정되지 않고 다양한 분야에 적용 가능 – 추론, 창의성, 감정 이해 등 인간 지능의 폭넓은 능력을 보유 – 아직 실현되지 않은

AI 모델 개발: 주요 구조

ㅁ 주요 구조 ㅇ 정의: 에이전트 기반 AI에서 시스템이 동작하는 기본적인 구조와 구성 요소를 의미하며, 단일 에이전트 또는 다중 에이전트 간의 상호작용 방식을 포함한다. ㅇ 특징: – 자율성, 환경 인식, 목표 지향성, 상호작용 가능성 – 구조에 따라 성능, 확장성, 복잡성이 달라짐 ㅇ 적합한 경우: – 분산 환경, 협업 작업, 복잡한 의사결정이 필요한 시스템 설계 시

AI 모델 개발: 운영 전략

ㅁ 운영 전략 ㅇ 정의: 모델 개발 및 배포 과정에서 여러 버전의 모델과 관련 메타데이터를 체계적으로 관리하고, 운영 환경에서의 성능과 안정성을 보장하기 위한 전략. ㅇ 특징: – 모델의 라이프사이클(개발, 검증, 배포, 폐기) 전 단계 관리 – 재현성과 추적성을 확보하기 위한 메타데이터 저장 – 운영 환경에서의 품질 유지와 신속한 롤백 가능 ㅇ 적합한 경우: – 여러

AI 모델 개발: 불확실성 추정

ㅁ 불확실성 추정 1. Bayesian Learning ㅇ 정의: – 데이터와 사전 확률(prior)을 바탕으로 사후 확률(posterior)을 계산하여 모델 파라미터의 불확실성을 추정하는 학습 방법. ㅇ 특징: – 확률 분포 기반으로 예측값과 불확실성을 동시에 제공. – 데이터가 부족한 상황에서도 사전 지식을 반영할 수 있음. ㅇ 적합한 경우: – 의료 진단, 금융 리스크 분석 등 예측 신뢰도가 중요한 경우.

AI 모델 개발: 세부 이슈

ㅁ 세부 이슈 1. Instruction-tuning ㅇ 정의: – 대규모 언어모델(LLM)에 특정 지시문 형식의 데이터셋을 학습시켜 사용자의 명령을 더 잘 따르도록 하는 미세조정 기법. ㅇ 특징: – 지도학습 기반, 대규모 지시문-응답 쌍 데이터 필요. – Zero-shot, Few-shot 성능 향상. – 모델이 다양한 형태의 질문에 일관된 포맷으로 답변. ㅇ 적합한 경우: – 범용 질의응답, 고객지원 챗봇, 작업

AI 모델 개발: 프롬프트 설계

ㅁ 프롬프트 설계 ㅇ 정의: 프롬프트 설계는 AI 모델, 특히 대규모 언어모델(LLM)이 원하는 출력과 행동을 하도록 입력 문장을 구성하는 기법이다. ㅇ 특징: – 입력 문장의 구조, 맥락, 예시 제공 여부에 따라 모델의 응답 품질이 크게 달라진다. – 다양한 설계 패턴(Zero-shot, Few-shot, Chain-of-Thought 등)이 존재한다. ㅇ 적합한 경우: – 모델의 응답 품질을 높이거나 특정 형식의 출력을

AI 모델 개발: 대표 기법

ㅁ 대표 기법 1. Pseudo Labeling ㅇ 정의: – 라벨이 없는 데이터에 대해 현재 모델이 예측한 값을 임시 라벨(가짜 라벨)로 사용하여 학습에 활용하는 방법. ㅇ 특징: – 초기 모델의 예측 정확도에 따라 성능이 크게 좌우됨. – 간단히 구현 가능하나, 잘못된 라벨이 누적되면 성능 저하 가능. – 점진적으로 라벨링 데이터셋을 확장하는 효과. ㅇ 적합한 경우: –

AI 모델 개발: 주요 기법

ㅁ 주요 기법 1. 클러스터링 ㅇ 정의: – 데이터의 유사성을 기반으로 그룹(클러스터)으로 묶는 비지도 학습 기법. ㅇ 특징: – 사전 라벨 없이 데이터 패턴을 발견. – 거리 기반(K-means) 또는 밀도 기반(DBSCAN) 등 다양한 알고리즘 존재. – 결과는 클러스터 개수, 초기값, 거리 척도 등에 민감. ㅇ 적합한 경우: – 고객 세분화, 이상치 탐지, 문서 주제 분류

데이터 전처리: 처리 기술

ㅁ 처리 기술 1. 기상 보간 ㅇ 정의: – 시계열 데이터에서 결측값을 주변 시점의 데이터 값을 이용해 추정하여 채우는 기법. – 기상 데이터나 센서 데이터 등에서 시간 간격이 불규칙하거나 누락된 값을 보완하는 데 사용. ㅇ 특징: – 선형 보간, 스플라인 보간, 최근접값 보간 등 다양한 방식 존재. – 데이터의 연속성과 패턴을 유지하려는 목적. ㅇ 적합한

데이터 전처리: 보안 전략

ㅁ 보안 전략 ㅇ 정의: 데이터의 기밀성과 무결성을 유지하고, 불법 접근이나 유출을 방지하기 위해 적용하는 다양한 기술과 절차. ㅇ 특징: 법적 규제 준수, 기술적 방어 수단, 관리적 통제 수단을 모두 포함. ㅇ 적합한 경우: 개인정보, 금융정보, 기밀 데이터 등 민감한 데이터를 처리할 때. ㅇ 시험 함정: 보안 전략은 단일 기술이 아니라 복합적인 접근이라는 점을 간과하기