ㅁ 샘플링 기법 1. 비례할당 표본추출 ㅇ 정의: 모집단을 여러 계층으로 나눈 후 각 계층의 크기에 비례하여 표본을 추출하는 방식. ㅇ 특징: – 각 계층의 비율이 모집단과 동일하게 유지됨 – 표본 대표성이 높음 – 표본 오차를 줄일 수 있음 ㅇ 적합한 경우: – 계층별 구성 비율이 중요한 경우 – 전체 모집단의 비율을 그대로 반영해야 하는
ㅁ 데이터 편향 유형 1. 선택 편향 ㅇ 정의: 표본을 선택하는 과정에서 모집단을 대표하지 못하는 데이터가 수집되어 발생하는 편향. ㅇ 특징: 표본 추출 단계에서 특정 집단이 과대 또는 과소 대표됨. 무작위 추출이 아닌 자발적 참여, 특정 채널 모집 등에서 빈번히 발생. ㅇ 적합한 경우: 실제 분석에서는 피해야 하며, 실험 설계 시 발생 가능성을 사전에 점검할
ㅁ 주요 과제 1. AI 투명성 ㅇ 정의: – AI 시스템의 의사결정 과정, 데이터 사용 방식, 모델 구조 등을 이해 가능하게 공개하는 것. ㅇ 특징: – 데이터 출처, 알고리즘 로직, 모델 성능 지표 등을 문서화. – 이해관계자가 결과를 해석할 수 있도록 정보 제공. ㅇ 적합한 경우: – 금융, 의료 등 규제 산업에서 신뢰 확보 필요
ㅁ 융합/응용 ㅇ 정의: 기호 기반(Symbolic) 접근과 신경망(Neural Network) 기반 접근을 결합하여 복잡한 문제 해결에 활용하는 방식. ㅇ 특징: – 규칙 기반 추론과 패턴 인식의 장점을 동시에 활용 – 데이터 기반 학습과 지식 기반 추론의 상호 보완 – 설명 가능성과 일반화 능력 향상 ㅇ 적합한 경우: – 복잡한 규칙과 불확실성이 혼재된 문제 – 데이터가 제한적이지만
ㅁ 구성/활용법 1. Agentic AI ㅇ 정의: – 스스로 목표를 설정하고 계획을 세워 실행하며, 환경 변화에 따라 적응하는 AI 시스템. – 단순 질의응답형 LLM과 달리 장기적 과업 수행과 의사결정이 가능. ㅇ 특징: – 자율성(Autonomy), 목표 지향성(Goal-Oriented), 환경 인식(Context Awareness), 실행 능력(Action Execution). – 외부 도구와 API를 호출하여 작업을 완수. ㅇ 적합한 경우: – 복잡한 문제
ㅁ 경량화 ㅇ 정의: 모델의 메모리 사용량과 연산량을 줄여 배포 및 추론 속도를 향상시키는 최적화 기법들의 집합. ㅇ 특징: – 정확도 손실을 최소화하면서 모델 크기와 연산량을 줄임 – 하드웨어 특성에 맞춘 최적화 가능 – 다양한 기법을 조합하여 사용 가능 ㅇ 적합한 경우: – 모바일, 엣지 디바이스처럼 연산 자원이 제한된 환경 – 실시간 추론이 필요한 서비스
ㅁ 전처리 확대 ㅇ 정의: 텍스트, 이미지, 스캔 문서 등 다양한 비정형 데이터를 AI 모델 학습이나 분석에 적합하도록 가공하는 사전 처리 범위를 확장하는 것을 의미함. ㅇ 특징: – OCR, 문서 파서, 메타데이터 추출, 데이터 변환 API 등 다양한 기술을 결합하여 처리 – 데이터 품질 향상과 모델 성능 개선에 직결됨 – 처리 속도, 정확도, 확장성이 중요
ㅁ AutoML/자동화 1. AutoML ㅇ 정의: – 데이터 전처리, 모델 선택, 하이퍼파라미터 튜닝, 성능 평가를 자동화하여 최소한의 인적 개입으로 최적의 모델을 생성하는 기술. ㅇ 특징: – 비전문가도 모델 개발 가능 – 다양한 알고리즘 후보를 자동 탐색 – 반복적인 실험 과정 단축 – GUI 기반 툴과 API 제공 ㅇ 적합한 경우: – 데이터 사이언스 인력이 부족한
ㅁ 기술 1. Federated Learning ㅇ 정의: – 데이터가 각 클라이언트(디바이스, 기관)에 분산되어 있는 상태에서 원본 데이터를 중앙 서버로 모으지 않고, 각 클라이언트에서 학습한 모델 파라미터(가중치)만 중앙 서버로 전송하여 통합 학습하는 방식. ㅇ 특징: – 데이터 프라이버시 보호 강화. – 통신량은 모델 파라미터 전송에 한정. – 중앙 서버에서 모델 집계(Aggregation) 수행. – 클라이언트 간 데이터
ㅁ 효율화 ㅇ 정의: AI 시스템을 설계·운영할 때 에너지 사용량과 자원 소모를 최소화하여 환경 영향을 줄이는 접근 방식. ㅇ 특징: – 연산 효율을 높이는 알고리즘 적용 – 하드웨어 자원 사용 최적화 – 탄소 배출량 모니터링 및 감축 목표 설정 ㅇ 적합한 경우: – 대규모 AI 모델 운영 시 전력 비용 절감 필요 – ESG 경영