ㅁ 주요 기법 1. FFT ㅇ 정의: – Fast Fourier Transform의 약자로, 시계열 데이터를 주파수 영역으로 변환하는 알고리즘. – 시간 영역에서의 신호를 주파수 성분으로 분해하여 분석. ㅇ 특징: – 연산 속도가 빠르고 대규모 데이터 처리에 적합. – 주기성, 진동 패턴 분석에 유리. – 노이즈 제거, 필터링, 스펙트럼 분석 등에 활용. ㅇ 적합한 경우: – 주기성이
ㅁ 보안 기술 1. 암호화 ㅇ 정의: 데이터를 인가되지 않은 사용자가 이해할 수 없도록 수학적 변환을 적용하는 기술. ㅇ 특징: 대칭키/비대칭키 방식이 있으며, 데이터 기밀성 보장. 전송 중, 저장 시 모두 적용 가능. ㅇ 적합한 경우: 개인정보, 금융정보, 기밀문서 전송 및 저장 시. ㅇ 시험 함정: 암호화는 데이터 무결성을 보장하지 않는다는 점을 혼동하는 경우가 있음.
ㅁ 라벨링 방법 ㅇ 정의: 데이터에 의미 있는 태그나 클래스를 부여하는 다양한 방식으로, 모델 학습을 위한 정답 데이터를 생성하는 절차. ㅇ 특징: 정확도, 비용, 속도, 확장성 측면에서 방식별로 차이가 있음. ㅇ 적합한 경우: 데이터 특성, 예산, 인력, 프로젝트 기간에 따라 적절한 방법을 선택. ㅇ 시험 함정: 라벨링 방법 간 장단점을 혼동하거나 특정 방법을 모든 상황에
ㅁ 의료 AI ㅇ 정의: 의료 분야에서 인공지능 기술을 활용하여 진단, 치료, 예방, 환자 관리 등 다양한 의료 서비스를 지원하는 기술 영역. ㅇ 특징: 대규모 의료 데이터(영상, 생체신호, 전자의무기록 등)를 기반으로 하며, 정확성과 신뢰성이 매우 중요하고 규제와 윤리적 고려가 필수. ㅇ 적합한 경우: 대규모 환자 데이터를 분석해 의사결정을 지원하거나, 반복적이고 표준화된 진단 업무를 자동화할 때.
ㅁ 합성 데이터 ㅇ 정의: 실제 데이터를 수집하지 않고 알고리즘, 시뮬레이션, 생성 모델 등을 통해 인공적으로 만들어낸 데이터. ㅇ 특징: – 개인정보 유출 위험이 적음 – 데이터 부족 문제 해결 가능 – 실제 데이터와 유사한 통계적 특성을 가짐 – 품질은 생성 알고리즘 성능에 의존 ㅇ 적합한 경우: – 개인정보 보호가 중요한 의료, 금융 분야 –
ㅁ 뉴로시mbolic AI ㅇ 정의: 심볼릭(Symbolic) AI의 논리 기반 추론 능력과 뉴럴(Neural) AI의 패턴 인식 능력을 결합한 인공지능 접근 방식. ㅇ 특징: – 복잡한 규칙 기반 추론과 대규모 데이터 기반 학습을 동시에 수행 가능 – 설명 가능성(Explainability)과 일반화 능력 강화 – 지식 표현, 규칙 추론, 패턴 인식의 융합 ㅇ 적합한 경우: – 규칙이 명확하지만 예외가
ㅁ AI 윤리 ㅇ 정의: 인공지능 기술 개발 및 활용 과정에서 사회적 책임, 공정성, 투명성, 안전성을 확보하기 위한 원칙과 지침. ㅇ 특징: 법적 규제와 사회적 기대를 모두 고려하며, 기술적·비기술적 요소를 통합적으로 관리. ㅇ 적합한 경우: 공공 부문, 금융, 의료 등 사회적 영향이 큰 분야의 AI 도입 시. ㅇ 시험 함정: 단순히 개인정보 보호만을 의미한다고 오해하기
ㅁ 생성형 에이전트 ㅇ 정의: 대규모 언어모델(LLM)을 기반으로 스스로 목표를 설정하고, 계획을 수립하며, 외부 도구와 상호작용하여 작업을 수행하는 지능형 자동화 시스템. ㅇ 특징: – 프롬프트 기반 자율 실행 – 외부 API, 데이터베이스, 웹 브라우징 등과 연계 가능 – 메모리 기능을 통해 이전 작업 맥락을 유지 – 다단계 추론 및 의사결정 수행 ㅇ 적합한 경우: –
ㅁ 경량 모델 최적화 ㅇ 정의: ㅇ 특징: ㅇ 적합한 경우: ㅇ 시험 함정: ㅇ 시험 대비 “패턴 보기” 예시: ================================ 1. Pruning ㅇ 정의: 신경망의 불필요한 가중치나 뉴런을 제거하여 모델 크기와 연산량을 줄이는 기법. ㅇ 특징: 중요도가 낮은 연결을 제거, 성능 저하 최소화, 구조적 프루닝과 비구조적 프루닝 존재. ㅇ 적합한 경우: 메모리 제약이 심한
ㅁ 지능형 캐싱 ㅇ 정의: – AI 시스템에서 모델 학습 및 추론 시 반복적으로 사용되는 데이터나 특징 벡터를 메모리나 고속 스토리지에 저장하여 재사용 속도를 높이는 기술. ㅇ 특징: – 데이터 접근 지연(latency) 최소화 – 중복 연산 방지로 인한 비용 절감 – 주기적 갱신 정책 필요 ㅇ 적합한 경우: – 대규모 데이터셋에서 동일한 특징을 반복적으로 조회하는