AI: 네트워크 구조 – EfficientNet

ㅁ 네트워크 구조

1. EfficientNet

ㅇ 정의:
구글에서 제안한 CNN 모델 계열로, 모델의 깊이(depth), 너비(width), 해상도(resolution)를 균형 있게 확장하는 Compound Scaling 방법을 통해 정확도와 효율성을 동시에 향상시킨 네트워크 구조.

ㅇ 특징:
– 기존의 단일 차원 확장이 아닌 세 가지 차원을 동시에 조절하여 성능과 연산량의 균형을 맞춤.
– 기본 구조로 Mobile Inverted Bottleneck Conv(MBConv) 사용.
– 파라미터 수와 FLOPs 대비 높은 정확도를 달성.
– EfficientNet-B0 ~ B7까지 다양한 크기 버전 제공.

ㅇ 적합한 경우:
– 모바일, 임베디드 환경 등 자원 제약이 있는 환경에서 높은 정확도가 필요한 경우.
– 이미지 분류, 전이학습(Transfer Learning) 기반 다양한 비전 태스크.

ㅇ 시험 함정:
– 단순히 네트워크 깊이만 늘린다고 효율이 좋아진다고 착각.
– EfficientNet은 구조 자체뿐 아니라 scaling 방법론이 핵심임을 간과.
– EfficientNet-B0이 가장 큰 모델이라고 잘못 이해하는 경우.

ㅇ 시험 대비 “패턴 보기” 예시:
– O: EfficientNet은 깊이, 너비, 해상도를 동시에 확장하는 Compound Scaling을 적용한다.
– X: EfficientNet은 깊이만 확장하여 성능을 높인다.

ㅁ 추가 학습 내용

EfficientNet은 모델의 깊이, 너비, 해상도를 동시에 확장하는 Compound Scaling 방식을 사용하며, 이때 α(깊이 계수), β(너비 계수), γ(해상도 계수)를 설정한다. 이러한 계수는 grid search를 통해 최적값을 찾는다. EfficientNetV2에서는 학습 속도와 메모리 효율성을 높이기 위해 Fused-MBConv 구조를 도입하였다. EfficientNet은 ImageNet에서 SOTA 성능을 달성했으며, 전이학습 시 소규모 데이터셋에서도 우수한 성능을 보인다. 파라미터 수 대비 정확도 그래프나 FLOPs 비교 자료를 함께 숙지하는 것이 중요하다.

답글 남기기

Your email address will not be published. Required fields are marked *.

*
*