ㅁ 프로젝트와 조직 ㅇ 정의: 인공지능(AI) 및 머신러닝(ML) 프로젝트를 효율적으로 수행하기 위해 팀 구성, 역할 분담, 의사결정 구조, 협업 방식 등을 체계적으로 설계하고 운영하는 것. ㅇ 특징: – 기술, 데이터, 비즈니스 도메인 전문가가 함께 협력 – 프로젝트 특성에 맞춘 유연한 조직 구조 필요 – 커뮤니케이션과 문서화가 중요 ㅇ 적합한 경우: – 복잡한 AI 프로젝트를 여러
ㅁ 대규모 모델 활용 ㅇ 정의: 사전 학습된 초대규모 AI 모델을 다양한 다운스트림 작업에 적용하거나 커스터마이징하여 활용하는 방법. ㅇ 특징: – 대량의 데이터와 연산을 통해 사전 학습됨 – 다양한 태스크에 범용적으로 적용 가능 – 추가 학습 없이도 제로샷/소샷 학습 가능 ㅇ 적합한 경우: – 데이터 수집이 어렵거나 적은 경우 – 빠른 프로토타이핑이 필요한 경우 ㅇ
ㅁ 시스템 구축 1. 컨티뉴얼 러닝 ㅇ 정의: – 데이터가 시간에 따라 순차적으로 도착할 때, 과거 학습 내용을 유지하면서 새로운 데이터를 반영해 모델을 지속적으로 업데이트하는 학습 방식. ㅇ 특징: – 과거 데이터 재학습 없이 새로운 데이터만으로 모델 갱신 가능 – 데이터 분포 변화(Concept Drift)에 대응 – 메모리 및 연산 효율성 중요 ㅇ 적합한 경우: –
ㅁ 실시간 로그 및 피드백 ㅇ 정의: 실시간으로 시스템 사용 중 발생하는 로그 데이터와 사용자 피드백을 수집·분석하여 모델 성능과 사용자 경험을 지속적으로 개선하는 프로세스. ㅇ 특징: – 데이터 수집과 분석이 실시간 또는 준실시간으로 이루어짐. – 사용자 행동 데이터와 시스템 내부 로그를 함께 활용. – 모델 운영 환경에서 직접 성능 변화를 감지 가능. ㅇ 적합한 경우:
ㅁ 웹 배포 및 서버리스 1. 웹 UI ㅇ 정의: 웹 브라우저를 통해 AI 모델의 결과를 시각적으로 제공하고, 사용자가 직접 입력·설정을 할 수 있는 인터페이스. ㅇ 특징: – HTML/CSS/JavaScript 기반으로 구현 – 실시간 상호작용 가능 – 모델 호출은 백엔드 API를 통해 수행 ㅇ 적합한 경우: – 사용자가 직접 결과를 확인하고 조작해야 하는 경우 – 대시보드,
ㅁ 성능 분석 ㅇ 정의: AI 모델 개발 과정에서 코드 실행 효율, 자원 사용량, 처리 속도 등을 측정하고 개선 포인트를 찾는 활동. ㅇ 특징: – CPU/GPU 사용률, 메모리 소비, 실행 시간 등을 계측 – 병목 구간 식별 및 최적화 전략 수립 가능 – 다양한 도구와 라이브러리 활용 가능 ㅇ 적합한 경우: – 모델 훈련 시간이
ㅁ 추적 및 재현성 ㅇ 정의: AI 모델 개발 과정에서 실험의 입력, 설정, 결과를 기록하여 동일 조건에서 재실행이 가능하도록 하는 관리 활동. ㅇ 특징: – 실험 데이터, 코드, 환경, 하이퍼파라미터, 결과를 체계적으로 기록 – 재현 가능성을 높이고 협업 시 실험 이력 공유 용이 – 실험 비교 및 성능 분석에 활용 ㅇ 적합한 경우: – 모델
ㅁ DNN 및 최신 모델 1. ResNet ㅇ 정의: – Residual Network의 약자로, 딥러닝에서 매우 깊은 신경망 학습 시 발생하는 기울기 소실 문제를 해결하기 위해 ‘Residual Block’을 도입한 아키텍처. ㅇ 특징: – Skip Connection(잔차 연결)을 통해 입력을 다음 층 출력에 더해줌. – 매우 깊은 네트워크(수백 층)에서도 학습이 가능. – ImageNet 대회에서 우수한 성능을 기록. ㅇ
ㅁ 도구 및 기법 1. Label Studio ㅇ 정의: – 오픈소스 데이터 라벨링 도구로, 이미지, 텍스트, 오디오 등 다양한 데이터 유형에 대한 라벨링을 지원함. ㅇ 특징: – 웹 기반 UI 제공, 커스터마이징 가능, 로컬 또는 클라우드 배포 가능. – 다양한 포맷(JSON, CSV 등) 입출력 지원. ㅇ 적합한 경우: – 내부 데이터 보안이 중요한 경우 로컬
ㅁ 워크플로우 및 파이프라인 1. Airflow ㅇ 정의: – Apache에서 개발한 오픈소스 워크플로우 스케줄러로, DAG(Directed Acyclic Graph)를 기반으로 데이터 파이프라인을 정의하고 실행하는 도구. ㅇ 특징: – Python 코드로 파이프라인 정의 – 스케줄링, 모니터링, 재시도 기능 제공 – 다양한 연동(데이터베이스, 클라우드 서비스) 지원 ㅇ 적합한 경우: – 주기적 배치 작업, 데이터 ETL 파이프라인 – 복잡한 의존성을