AI 트렌드: AI+Edge – Edge TPU

ㅁ AI+Edge 1. Edge TPU ㅇ 정의: 구글이 개발한 저전력 고속 추론 전용 ASIC(응용 특화 집적 회로)으로, 엣지 디바이스에서 머신러닝 모델을 효율적으로 실행하기 위해 설계된 하드웨어 가속기. ㅇ 특징: – 클라우드 연결 없이 로컬에서 실시간 추론 가능 – 전력 소모가 매우 낮아 IoT, 모바일, 임베디드 환경에 적합 – TensorFlow Lite 모델에 최적화되어 있음 – CPU

AI 트렌드: AI+Edge – TinyML

ㅁ AI+Edge ㅇ 정의: 인공지능 모델을 초소형·저전력 장치(마이크로컨트롤러, 센서 등)에 탑재하여 현장에서 실시간 추론을 수행하는 기술. ㅇ 특징: – 초저전력 소비(수 mW 수준)로 배터리 기반 장치에서도 장기간 동작 가능 – 클라우드 연결 없이 로컬에서 데이터 처리 → 지연 시간 최소화 및 개인정보 보호 강화 – 모델 크기 수십~수백 KB 수준으로 경량화 필요 ㅇ 적합한 경우:

AI 트렌드: 생성형 AI – MusicGen

ㅁ 생성형 AI 1. MusicGen ㅇ 정의: 텍스트 설명이나 멜로디 입력을 기반으로 음악을 자동 생성하는 Meta AI의 오픈소스 생성형 AI 모델로, Transformer 기반 아키텍처를 사용하여 음악의 멜로디, 리듬, 화음을 학습하고 생성함. ㅇ 특징: – 텍스트 프롬프트나 기존 멜로디를 입력으로 받아 다양한 장르와 스타일의 음악 생성 가능 – 대규모 음악 데이터셋 학습을 통해 악기별 음색, 박자,

AI 트렌드: 생성형 AI – Midjourney

ㅁ 생성형 AI 1. Midjourney ㅇ 정의: 텍스트 프롬프트를 기반으로 고품질 이미지를 생성하는 AI 이미지 생성 플랫폼으로, 주로 예술적이고 창의적인 시각자료 제작에 특화되어 있음. ㅇ 특징: – 디스코드(Discord) 기반으로 작동하며, 채팅창에 프롬프트를 입력하면 이미지가 생성됨 – 사실적 표현보다는 예술적·환상적 스타일에 강점 – 다양한 스타일·해상도 옵션 제공 – 프롬프트 엔지니어링의 영향력이 큼 ㅇ 적합한 경우: –

AI 트렌드: 생성형 AI – DALL·E

ㅁ 생성형 AI ㅇ 정의: 대규모 학습 데이터를 기반으로 새로운 이미지, 텍스트, 오디오, 영상 등을 생성하는 인공지능 기술로, 기존 데이터를 단순 변형하는 것이 아니라 새로운 콘텐츠를 창작하는 것을 목표로 함. ㅇ 특징: – 대규모 딥러닝 모델(예: Transformer 기반) 사용 – 학습 데이터의 패턴을 이해하고 이를 바탕으로 새로운 결과물 생성 – 이미지, 텍스트, 음성 등 다양한

AI 트렌드: 생성형 AI – Stable Diffusion

ㅁ 생성형 AI ㅇ 정의: 대량의 데이터 학습을 통해 새로운 텍스트, 이미지, 음성, 영상 등을 생성하는 인공지능 기술로, 기존 데이터를 단순 변형하는 것이 아니라 새로운 콘텐츠를 창작하는 능력을 갖춘 모델. ㅇ 특징: – 대규모 딥러닝 모델과 고성능 컴퓨팅 자원을 필요로 함 – 비지도학습 또는 자기지도학습 기법을 활용 – 생성 결과의 품질은 학습 데이터의 다양성과 품질에

AI 트렌드: 멀티모달 AI – VideoGPT

ㅁ 멀티모달 AI ㅇ 정의: 텍스트, 이미지, 음성, 영상 등 서로 다른 형태의 데이터를 동시에 처리하고 이해하는 인공지능 기술. ㅇ 특징: 서로 다른 모달리티 간 상호 보완적 정보 활용, 복합 입력 기반의 정교한 추론 가능. ㅇ 적합한 경우: 영상 자막 생성, 시각-청각 기반 감정 분석, 멀티미디어 검색 등. ㅇ 시험 함정: 단일 모달 AI와 혼동,

AI 트렌드: 멀티모달 AI – Kosmos-1

ㅁ 멀티모달 AI ㅇ 정의: 텍스트, 이미지, 음성 등 서로 다른 형태의 데이터를 동시에 처리하고 이해할 수 있는 인공지능 기술. ㅇ 특징: – 다양한 데이터 소스 결합 가능 – 입력 간 상호 보완적 정보 활용 – 복합적인 질문 응답 및 추론 가능 ㅇ 적합한 경우: – 이미지 설명 생성, 시각 질의응답(VQA) – 음성과 텍스트를 함께

AI 트렌드: 멀티모달 AI – Flamingo

ㅁ 멀티모달 AI ㅇ 정의: 텍스트, 이미지, 오디오 등 서로 다른 형태의 데이터를 동시에 처리하고 이해할 수 있는 인공지능 기술을 의미한다. ㅇ 특징: – 다양한 데이터 소스를 결합하여 더 정교한 분석과 추론이 가능함 – 단일 모달보다 맥락 이해도가 높음 – 대규모 사전학습 모델과 결합 시 성능 향상 ㅇ 적합한 경우: – 이미지 설명 생성, 비디오

AI 트렌드: 멀티모달 AI – CLIP

ㅁ 멀티모달 AI ㅇ 정의: 텍스트, 이미지, 오디오 등 서로 다른 형태의 데이터를 동시에 처리하고 이해하는 인공지능 기술. ㅇ 특징: – 다양한 데이터 소스를 결합하여 더 풍부한 의미를 추론 가능 – 복합 입력 기반의 질의응답, 검색, 생성 작업에 활용 – 데이터 간 의미적 매핑을 학습함 ㅇ 적합한 경우: – 이미지와 텍스트를 함께 분석해야 하는 검색