ㅁ 성능 분석 ㅇ 정의: AI 모델 개발 과정에서 코드 실행 효율, 자원 사용량, 처리 속도 등을 측정하고 개선 포인트를 찾는 활동. ㅇ 특징: – CPU/GPU 사용률, 메모리 소비, 실행 시간 등을 계측 – 병목 구간 식별 및 최적화 전략 수립 가능 – 다양한 도구와 라이브러리 활용 가능 ㅇ 적합한 경우: – 모델 훈련 시간이
ㅁ 추적 및 재현성 ㅇ 정의: AI 모델 개발 과정에서 실험의 입력, 설정, 결과를 기록하여 동일 조건에서 재실행이 가능하도록 하는 관리 활동. ㅇ 특징: – 실험 데이터, 코드, 환경, 하이퍼파라미터, 결과를 체계적으로 기록 – 재현 가능성을 높이고 협업 시 실험 이력 공유 용이 – 실험 비교 및 성능 분석에 활용 ㅇ 적합한 경우: – 모델
ㅁ DNN 및 최신 모델 1. ResNet ㅇ 정의: – Residual Network의 약자로, 딥러닝에서 매우 깊은 신경망 학습 시 발생하는 기울기 소실 문제를 해결하기 위해 ‘Residual Block’을 도입한 아키텍처. ㅇ 특징: – Skip Connection(잔차 연결)을 통해 입력을 다음 층 출력에 더해줌. – 매우 깊은 네트워크(수백 층)에서도 학습이 가능. – ImageNet 대회에서 우수한 성능을 기록. ㅇ
ㅁ 도구 및 기법 1. Label Studio ㅇ 정의: – 오픈소스 데이터 라벨링 도구로, 이미지, 텍스트, 오디오 등 다양한 데이터 유형에 대한 라벨링을 지원함. ㅇ 특징: – 웹 기반 UI 제공, 커스터마이징 가능, 로컬 또는 클라우드 배포 가능. – 다양한 포맷(JSON, CSV 등) 입출력 지원. ㅇ 적합한 경우: – 내부 데이터 보안이 중요한 경우 로컬
ㅁ 워크플로우 및 파이프라인 1. Airflow ㅇ 정의: – Apache에서 개발한 오픈소스 워크플로우 스케줄러로, DAG(Directed Acyclic Graph)를 기반으로 데이터 파이프라인을 정의하고 실행하는 도구. ㅇ 특징: – Python 코드로 파이프라인 정의 – 스케줄링, 모니터링, 재시도 기능 제공 – 다양한 연동(데이터베이스, 클라우드 서비스) 지원 ㅇ 적합한 경우: – 주기적 배치 작업, 데이터 ETL 파이프라인 – 복잡한 의존성을
ㅁ 데이터 프레임과 SQL 1. Pandas ㅇ 정의: 파이썬 기반의 데이터 분석 라이브러리로, 표 형태의 데이터 처리를 위한 DataFrame과 Series 자료구조를 제공. ㅇ 특징: – 메모리 내 연산으로 속도가 빠르지만 대규모 데이터 처리에는 한계가 있음. – 풍부한 데이터 조작 함수와 인덱싱 기능 제공. – CSV, Excel, SQL DB 등 다양한 데이터 소스와 연동 가능. ㅇ
ㅁ 데이터 소스 및 저장소 ㅇ 정의: 데이터 분석, 처리, 활용을 위해 원천 데이터를 저장하거나 불러오는 다양한 형태의 저장 위치 및 시스템. ㅇ 특징: 데이터 형식, 접근 속도, 확장성, 비용 구조가 저장소 유형마다 다름. ㅇ 적합한 경우: 프로젝트 요구사항, 데이터 크기, 처리 빈도에 따라 선택. ㅇ 시험 함정: 저장소별 특징과 장단점을 혼동하기 쉬움. ㅇ 시험
ㅁ 확장현실(XR) 통합 ㅇ 정의: 현실과 가상 환경을 결합하여 사용자가 몰입형 경험을 할 수 있도록 하는 기술을 통합적으로 구현하는 개념. ㅇ 특징: – AR, VR, MR 등 다양한 XR 기술을 하나의 플랫폼이나 애플리케이션에서 결합. – 실시간 센서 데이터 처리와 3D 공간 인식이 필수. – AI 기반의 환경 이해 및 상호작용 기능 강화. ㅇ 적합한 경우:
ㅁ 엣지/휴머노이드 ㅇ 정의: 사람과 유사한 외형과 동작, 또는 현장에서 실시간 AI 처리를 수행하는 로봇 기술을 포괄하는 분야. ㅇ 특징: – 사람과 유사한 신체 구조, 감각, 의사소통 능력을 갖춤 – 엣지 컴퓨팅 기반으로 지연시간 최소화 – 다양한 센서, AI 알고리즘, 네트워크 연결성 필수 ㅇ 적합한 경우: – 제조, 물류, 서비스 산업에서 사람과 협업 필요 시
ㅁ 새로운 응용 ㅇ 정의: ㅇ 특징: ㅇ 적합한 경우: ㅇ 시험 함정: ㅇ 시험 대비 “패턴 보기” 예시: ================================ 1. 디지털 트윈 ㅇ 정의: 실제 환자의 신체·생리 데이터를 기반으로 가상 환경에 동일한 ‘쌍둥이’ 모델을 만들어 질병 예측, 치료 시뮬레이션, 맞춤형 치료 계획을 수립하는 기술. ㅇ 특징: – 센서, IoT, 웨어러블 기기 등을 통해 실시간