AI 모델 개발: 운영 전략 – Model Registry
ㅁ 운영 전략
ㅇ 정의:
모델 레지스트리(Model Registry)는 머신러닝 및 딥러닝 모델의 버전, 메타데이터, 배포 상태 등을 중앙에서 관리하는 시스템으로, 모델의 라이프사이클 전반을 추적하고 관리할 수 있게 해준다.
ㅇ 특징:
– 모델 버전 관리: 동일 모델의 여러 버전을 기록 및 비교 가능
– 메타데이터 저장: 학습 데이터셋, 하이퍼파라미터, 성능 지표 등 저장
– 배포 단계 추적: Staging, Production 등 환경별 상태 관리
– 접근 제어: 모델 등록, 수정, 배포 권한 관리
ㅇ 적합한 경우:
– 여러 팀원이 협업하여 모델을 개발/운영하는 경우
– 모델 변경 이력과 성능 변화를 추적해야 하는 경우
– 규제나 컴플라이언스 요구사항으로 모델 관리 기록이 필요한 경우
ㅇ 시험 함정:
– 단순히 모델을 저장하는 저장소(예: 파일 서버)와 혼동할 수 있음 → 레지스트리는 메타데이터와 상태까지 관리
– Model Registry는 데이터 버전 관리와 다르다는 점 구분 필요
ㅇ 시험 대비 “패턴 보기” 예시:
O: Model Registry는 모델 버전과 메타데이터를 함께 관리한다.
X: Model Registry는 데이터셋 버전만 관리하는 시스템이다.
ㅁ 추가 학습 내용
Model Registry 관련 주요 학습 내용 정리
1. 주요 오픈소스 및 상용 도구 예시
– MLflow Model Registry
– SageMaker Model Registry
– Vertex AI Model Registry
2. CI/CD 파이프라인과의 연계
– 모델 학습 완료 시 자동으로 Model Registry에 등록
– 등록된 모델은 검증 과정을 거친 후 자동 또는 승인 절차를 통해 배포
3. 모델 승격(Promotion) 개념
– 모델의 상태를 Staging에서 Production으로 전환
– 전환 시 품질 검증 및 승인 절차 필요
4. 실무 활용
– Model Registry는 MLOps의 핵심 구성 요소
– Feature Store, Experiment Tracking과 함께 통합적으로 사용
5. 시험 출제 포인트
– Model Registry, Experiment Tracking, Feature Store의 역할 차이를 구분하는 문제 빈출