ㅁ 개인화 분석 1. Federated Analytics ㅇ 정의: 여러 클라이언트(사용자 단말)에서 생성된 데이터를 중앙 서버로 직접 전송하지 않고, 각 클라이언트에서 로컬로 분석을 수행한 뒤 통계적 요약 정보만을 서버에 전송하여 전체 분석을 수행하는 방식. ㅇ 특징: – 개인 데이터의 원본은 로컬에 남겨 개인정보 유출 위험을 감소시킴. – 모델 학습이 아니라 통계 분석이나 지표 산출에 초점. –
ㅁ 경량화 기법 ㅇ 정의: 모델 경량화 기법은 딥러닝 모델의 파라미터 수, 연산량, 메모리 사용량을 줄여 추론 속도를 높이고 배포 효율성을 향상시키는 기술이다. ㅇ 특징: – 정확도를 최대한 유지하면서 연산량과 저장 공간을 절감 – 모바일, 임베디드 환경에서 활용도 높음 – 다양한 기법을 조합하여 사용 가능 ㅇ 적합한 경우: – 제한된 하드웨어 환경에서 모델 배포 –
ㅁ 가속기 종류 ㅇ 정의: ㅇ 특징: ㅇ 적합한 경우: ㅇ 시험 함정: ㅇ 시험 대비 “패턴 보기” 예시: ================================ 1. GPU ㅇ 정의: – 그래픽 연산을 위해 설계되었지만, 대규모 병렬 연산이 가능하여 딥러닝 학습/추론에 활용되는 범용 연산 장치. ㅇ 특징: – 수천 개의 코어로 병렬 연산에 최적화. – 대규모 행렬/벡터 연산 속도가 빠름. –
ㅁ 추론 기술 1. ONNX Runtime ㅇ 정의: 오픈 뉴럴 네트워크 익스체인지(Open Neural Network Exchange) 형식을 기반으로 다양한 하드웨어와 프레임워크에서 모델을 최적화하여 실행할 수 있는 범용 추론 엔진. ㅇ 특징: – PyTorch, TensorFlow 등 다양한 프레임워크에서 학습된 모델을 ONNX 포맷으로 변환하여 실행 가능 – CPU, GPU, 모바일, IoT 등 다양한 환경 지원 – 그래프 최적화,
ㅁ 효율화 방식 ㅇ 정의: 메모리 사용량과 연산 효율을 높이기 위해 모델 파라미터와 연산 방식을 최적화하는 기법들의 집합. ㅇ 특징: – 연산 정밀도를 낮추거나 연산 단계를 줄여 메모리와 계산 자원을 절감 – 일부 기법은 학습 단계에서 적용, 일부는 추론 단계에서 적용 ㅇ 적합한 경우: – 제한된 GPU 메모리 환경 – 모바일, 임베디드 디바이스 배포 전
ㅁ 학습 구조 ㅇ 정의: 메타러닝에서 모델이 새로운 작업에 빠르게 적응할 수 있도록 설계된 학습 패턴과 알고리즘 구조를 의미함. ㅇ 특징: 기존 데이터셋에서 다양한 작업을 학습하며, 새로운 작업에 대한 적은 데이터로도 빠른 적응이 가능하도록 설계됨. ㅇ 적합한 경우: 데이터 수집이 어려운 환경, 다양한 도메인에 빠르게 적용해야 하는 경우. ㅇ 시험 함정: 일반적인 전이학습과 혼동하기 쉬움.
ㅁ 자동화 기법 ㅇ 정의: 반복적이거나 예측 가능한 운영 작업을 자동으로 수행하여 효율과 안정성을 높이는 기술 집합. ㅇ 특징: – 사람 개입 최소화 – 오류 감지 및 대응 자동화 – 리소스 사용 최적화 – 이벤트 기반 동작 가능 ㅇ 적합한 경우: – 대규모 분산 시스템 운영 – 실시간 대응이 필요한 서비스 – 운영 인력 부족
ㅁ 분산 전략 ㅇ 정의: 여러 개의 장치나 서버에서 데이터를 직접 공유하지 않고 모델 학습을 수행하는 방식으로, 데이터 프라이버시를 보장하면서 분산 환경에서 학습 효율을 높이는 전략. ㅇ 특징: – 데이터가 로컬에 머물고, 모델 파라미터나 중간 결과만 공유. – 네트워크 지연, 통신 비용, 보안 위협 등을 고려해야 함. – 프라이버시 보호와 성능 간의 균형이 중요. ㅇ
ㅁ 최적화 ㅇ 정의: AI 시스템의 개발·운영 과정에서 자원 사용을 최소화하고 성능을 극대화하는 기법을 적용하는 것. ㅇ 특징: – 연산 효율성, 에너지 효율성, 비용 절감을 동시에 고려. – 하드웨어·소프트웨어·알고리즘 전반에 걸친 개선 가능. ㅇ 적합한 경우: – 대규모 AI 모델 운영 시 전력비용과 탄소배출을 줄이고자 할 때. ㅇ 시험 함정: – 단순 성능 향상만을 목적으로
ㅁ 응용 분야 ㅇ 정의: 엣지 AI 기술이 실제 산업 및 생활 환경에서 적용되는 구체적인 영역을 의미하며, ARM 기반 장치나 경량 AI 칩셋을 활용해 현장에서 데이터를 처리하는 방식. ㅇ 특징: – 중앙 서버 의존도 감소 – 저지연, 실시간 반응 가능 – 네트워크 불안정 환경에서도 동작 ㅇ 적합한 경우: – 네트워크 지연이 치명적인 환경 – 개인정보