AI 트렌드: 생성형 AI

ㅁ 생성형 AI

ㅇ 정의:
인공지능이 기존 데이터를 학습하여 새로운 이미지, 음성, 음악, 텍스트 등을 생성하는 기술로, 대규모 데이터셋과 딥러닝 모델을 기반으로 함.

ㅇ 특징:
– 비지도 또는 자기지도 학습 기반
– 창의적 콘텐츠 자동 생성 가능
– 이미지, 텍스트, 오디오 등 멀티모달 학습 적용
– 모델 학습 시 대규모 GPU 자원 필요

ㅇ 적합한 경우:
– 새로운 디자인, 이미지, 음악 창작
– 콘텐츠 제작 자동화
– 프로토타입 시각화 및 아이디어 발상

ㅇ 시험 함정:
– “생성형 AI는 기존 데이터를 단순 복사” → X (패턴 학습을 통한 새로운 데이터 생성)
– “생성형 AI는 지도학습만 사용” → X (비지도/자기지도도 사용)

ㅇ 시험 대비 “패턴 보기” 예시:
O: “텍스트 입력으로 이미지를 생성하는 AI”
X: “생성형 AI는 기존 데이터베이스에서 해당 이미지를 검색하여 반환”

================================

1. Stable Diffusion

ㅇ 정의:
오픈소스 기반의 텍스트-투-이미지(Text-to-Image) 생성 AI 모델로, 잠재 확산(Latent Diffusion) 기법을 사용하여 고품질 이미지를 생성함.

ㅇ 특징:
– 로컬 환경 실행 가능 (GPU 필요)
– 확산 모델(Diffusion Model) 기반
– 오픈소스 커뮤니티 중심 개발
– 프롬프트 엔지니어링 중요

ㅇ 적합한 경우:
– 커스터마이징 가능한 이미지 생성
– 프라이버시가 중요한 환경(로컬 실행)
– 특정 스타일 학습 및 적용

ㅇ 시험 함정:
– “Stable Diffusion은 클라우드에서만 실행 가능” → X
– “Stable Diffusion은 GAN 기반” → X (확산 모델 기반)

ㅇ 시험 대비 “패턴 보기” 예시:
O: “오픈소스 텍스트-투-이미지 모델”
X: “Stable Diffusion은 비공개 상용 모델로만 제공”

================================

2. DALL·E

ㅇ 정의:
OpenAI에서 개발한 텍스트-투-이미지 생성 AI로, GPT 아키텍처와 이미지 디코더를 결합하여 창의적인 이미지 생성 가능.

ㅇ 특징:
– 클라우드 기반 서비스
– 창의적 이미지 합성 및 변형 가능
– 인페인팅(Inpainting), 아웃페인팅(Outpainting) 지원

ㅇ 적합한 경우:
– 아이디어 시각화
– 복잡한 장면 구성
– 창의적 일러스트 제작

ㅇ 시험 함정:
– “DALL·E는 오픈소스” → X (상용 API 제공)
– “DALL·E는 텍스트 생성 모델” → X (이미지 생성 모델)

ㅇ 시험 대비 “패턴 보기” 예시:
O: “텍스트 설명을 기반으로 이미지를 생성하는 OpenAI 모델”
X: “DALL·E는 로컬 PC에서 무료로 실행 가능”

================================

3. Midjourney

ㅇ 정의:
독립 연구팀이 개발한 디스코드(Discord) 기반의 텍스트-투-이미지 생성 AI 서비스.

ㅇ 특징:
– 디스코드 채널에서 명령어로 사용
– 예술적, 스타일리시한 이미지에 특화
– 고품질, 고해상도 이미지 생성

ㅇ 적합한 경우:
– 예술 작품, 컨셉 아트 제작
– 마케팅, 광고 시각 자료 제작
– 빠른 프로토타입 이미지 생성

ㅇ 시험 함정:
– “Midjourney는 오픈소스” → X
– “Midjourney는 로컬에서 실행” → X (클라우드 기반, Discord UI)

ㅇ 시험 대비 “패턴 보기” 예시:
O: “디스코드에서 프롬프트를 입력하여 이미지 생성”
X: “Midjourney는 텍스트만 생성하는 AI”

================================

4. MusicGen

ㅇ 정의:
Meta AI에서 개발한 텍스트-투-뮤직(Text-to-Music) 생성 AI로, 사용자의 텍스트 설명이나 멜로디 입력을 기반으로 음악을 생성함.

ㅇ 특징:
– 텍스트, 멜로디 입력 모두 가능
– 특정 장르, 악기 스타일 반영 가능
– 오픈소스 제공

ㅇ 적합한 경우:
– 광고 배경음악 제작
– 게임/영상용 음악 제작
– 음악 아이디어 스케치

ㅇ 시험 함정:
– “MusicGen은 이미지 생성 모델” → X
– “MusicGen은 상용 서비스로만 제공” → X (오픈소스)

ㅇ 시험 대비 “패턴 보기” 예시:
O: “텍스트 설명을 기반으로 음악을 생성하는 Meta AI 모델”
X: “MusicGen은 텍스트를 생성하는 언어 모델”

================================

저는 원하시면 다음 단계로 각 세부 용어별 **하위 주요 기술**까지 확장한 버전도 만들어 드릴 수 있습니다.
원하시면 진행할까요?

최신 글