AI: 인프라 및 자동화 – Explainability Logging

ㅁ 인프라 및 자동화 ㅇ 정의: – Explainability Logging은 AI 모델의 예측 결과와 함께 해당 예측에 영향을 준 주요 특징(feature)과 가중치, 모델 내부 의사결정 경로 등을 로그로 기록하는 기법이다. 주로 모델의 투명성 확보와 사후 분석, 규제 준수를 위해 사용된다. ㅇ 특징: – 예측값뿐 아니라 Feature Importance, SHAP 값, LIME 해석 결과 등을 함께 저장 –

AI: 인프라 및 자동화 – Feature Store 구현

ㅁ 인프라 및 자동화 ㅇ 정의: Feature Store는 머신러닝 모델 학습과 예측에 필요한 피처(feature)를 중앙에서 저장, 관리, 재사용할 수 있도록 하는 데이터 인프라 구성 요소이다. ㅇ 특징: – 온라인(실시간) 및 오프라인(배치) 피처 저장소를 모두 지원하여 학습과 예측 간 일관성을 유지한다. – 데이터 엔지니어, 데이터 사이언티스트 간 협업을 촉진하고 중복 계산을 방지한다. – 데이터 품질 관리,

AI: 인프라 및 자동화 – Kubernetes Operators

ㅁ 인프라 및 자동화 ㅇ 정의: Kubernetes Operators는 Kubernetes의 Custom Resource Definition(CRD)와 컨트롤러를 활용하여 특정 애플리케이션이나 서비스의 배포, 구성, 업그레이드, 복구 작업을 자동화하는 패턴이다. ㅇ 특징: – 애플리케이션의 라이프사이클 관리 자동화 – 도메인 지식을 코드로 구현하여 운영 복잡성 감소 – Kubernetes API와 네이티브하게 통합 – 선언형(Declarative) 방식으로 구성 ㅇ 적합한 경우: – 상태를 유지해야 하는

배포/운영: 고급 전략 – Explainability in Anomaly Detection

ㅁ 고급 전략 ㅇ 정의: 머신러닝 기반 이상 탐지 모델에서 탐지 결과의 근거를 인간이 이해할 수 있도록 설명하는 기법. 모델의 블랙박스 특성을 줄이고, 의사결정의 신뢰성을 높인다. ㅇ 특징: – SHAP, LIME, Counterfactual Explanation 등 다양한 기법 존재 – 모델 예측의 기여도 분석을 통해 특정 피처가 이상 탐지 결과에 미친 영향 파악 가능 – 규제 산업(금융,

학습: 첨단 방법 – NAS Variants

ㅁ 첨단 방법 ㅇ 정의: – 첨단 방법은 기존의 단순한 하이퍼파라미터 탐색 기법을 넘어, 탐색 효율성과 성능을 동시에 높이기 위해 설계된 고급 탐색 기법을 의미함. NAS Variants는 신경망 구조 탐색(Neural Architecture Search)의 다양한 변형 기법을 포함함. ㅇ 특징: – NAS Variants는 모델의 구조 자체를 자동으로 설계하며, 강화학습(RL), 진화 알고리즘(EA), 그래디언트 기반 탐색 등 다양한 접근

학습: 첨단 방법 – Population Based Training

ㅁ 첨단 방법 ㅇ 정의: – Population Based Training(PBT)은 여러 개의 모델(population)을 병렬로 학습시키면서, 주기적으로 성능이 낮은 모델의 가중치와 하이퍼파라미터를 성능이 좋은 모델로 교체하거나 변이시켜 최적의 하이퍼파라미터를 탐색하는 방법. ㅇ 특징: – 탐색(exploration)과 활용(exploitation)을 동시에 수행. – 하이퍼파라미터를 학습 중에 동적으로 변경 가능. – 병렬 처리 환경에서 효율적. – 초기 하이퍼파라미터 설정에 덜 민감. ㅇ

그래프: 최신 모델 – GAT

ㅁ 최신 모델 1. GAT ㅇ 정의: – Graph Attention Network의 약자로, 그래프 구조 데이터에서 노드 간의 중요도를 학습하기 위해 Attention 메커니즘을 적용한 그래프 신경망 모델. – GCN(Graph Convolutional Network)의 한계인 고정된 이웃 가중치 문제를 해결. ㅇ 특징: – 각 노드가 연결된 이웃 노드별로 Attention Score를 계산하여 가중합. – Self-attention 방식으로 노드별 중요도를 동적으로 산정.

그래프: 최신 모델 – GIN

ㅁ 최신 모델 1. GIN ㅇ 정의: Graph Isomorphism Network(GIN)는 그래프의 구조적 동형성을 구분하는 능력을 최대화하기 위해 설계된 그래프 신경망 모델로, Weisfeiler-Lehman(1-WL) 그래프 동형성 테스트와 동일한 구별 능력을 갖도록 설계됨. ㅇ 특징: – 노드 이웃의 특성을 단순 합(sum) 연산으로 집계하여 정보 손실을 최소화함. – MLP(다층 퍼셉트론)를 활용해 집계된 정보를 변환. – 파라미터 ε(epsilon)을 통해 자기

AI: 연합학습 및 프라이버시 – Federated Averaging

ㅁ 연합학습 및 프라이버시 ㅇ 정의: 여러 개별 디바이스나 클라이언트가 로컬 데이터를 외부로 전송하지 않고, 각자 학습한 모델 파라미터(가중치)만 중앙 서버로 전송하여 평균화하는 방식의 연합학습 기법. ㅇ 특징: – 데이터 프라이버시 보호: 원본 데이터는 로컬에 유지 – 통신 효율성: 전체 데이터 전송 대신 모델 파라미터만 공유 – 비동기적/동기적 학습 가능 – 데이터 분포가 IID가 아닐

AI: 연합학습 및 프라이버시 – Secure Multi-Party Computation

ㅁ 연합학습 및 프라이버시 ㅇ 정의: – Secure Multi-Party Computation(SMPC)은 여러 참여자가 자신의 입력 데이터를 노출하지 않고도 공동으로 연산을 수행하여 결과를 얻는 암호학적 기법이다. ㅇ 특징: – 데이터는 각 참여자 로컬에서 암호화된 상태로 유지되며, 연산 과정에서도 원본 데이터가 공개되지 않는다. – 비신뢰 환경에서도 안전한 연산이 가능하며, 중간 결과를 통한 정보 유출을 방지한다. – 주로 비밀분산(Secret