딥러닝에서 백본의 역할과 ResNet, ViT와 같은 주요 아키텍처를 살펴보고 실제 AI 응용 분야에 대해 알아보세요.
백본은 딥 러닝 아키텍처의 핵심 특징 추출 구성 요소로, 원시 데이터를 의미 있는 표현으로 변환하는 주 엔진 역할을 합니다. 컴퓨터 비전 분야에서 백본은 일반적으로 입력 이미지를 처리하여 계층적 패턴을 식별하는 신경망 내 일련의 레이어로 구성됩니다. 이러한 패턴은 가장자리나 질감 같은 단순한 저수준 특징부터 형태나 물체 같은 복잡한 고수준 개념까지 다양합니다. 백본의 출력(흔히 특징 맵이라 함)은 분류나 탐지와 같은 특정 작업을 수행하는 하류 구성 요소의 입력으로 사용됩니다.
백본의 주요 기능은 어떤 구체적인 결정이 내려지기 전에 이미지의 시각적 콘텐츠를 "보고" 이해하는 것이다. 이는 보편적인 번역기 역할을 하며 픽셀 값을 압축되고 정보가 풍부한 형식으로 변환한다. 대부분의 현대적 백본은 컨볼루션 신경망(CNN) 또는 비전 트랜스포머(ViT) 에 의존하며 종종 ImageNet과 같은 방대한 데이터셋으로 사전 훈련됩니다. 이 사전 훈련 과정은 전이 학습의 핵심 요소로, 모델이 이전에 학습된 시각적 특징을 활용할 수 있게 하여 특정 응용 분야를 위한 새 모델 훈련에 필요한 데이터와 시간을 크게 줄여줍니다.
예를 들어, Ultralytics 활용할 때 아키텍처는 다중 스케일 특징을 효율적으로 추출하는 고도로 최적화된 백본을 포함합니다. 이를 통해 네트워크의 후속 부분은 기본 시각 구조를 처음부터 다시 학습할 필요 없이 오브젝트의 위치 파악과 클래스 확률 할당에 전적으로 집중할 수 있습니다.
객체 탐지 모델의 아키텍처를 완전히 이해하려면 백본을 다른 두 주요 구성 요소인 넥과 헤드와 구분하는 것이 필수적이다.
백본은 수많은 산업 및 과학 AI 애플리케이션의 뒤에서 묵묵히 일하는 핵심 요소입니다. 시각적 데이터를 일반화하는 능력 덕분에 다양한 분야에 걸쳐 적용이 가능합니다.
최첨단 아키텍처들처럼 YOLO11 과 최첨단 YOLO26은 기본적으로 강력한 백본을 통합합니다. 이러한 구성 요소는 엣지 디바이스부터 고성능 GPU에 이르기까지 다양한 하드웨어 플랫폼에서 최적의 추론 지연 시간을 위해 설계되었습니다.
다음 Python 사전 훈련된 백본을 사용하여 모델을 로드하는 방법을 보여줍니다.
ultralytics 패키지. 이 설정은 추론 과정에서 특징 추출을 위해 백본을 자동으로 활용합니다.
from ultralytics import YOLO
# Load a YOLO26 model, which includes a pre-trained CSP backbone
model = YOLO("yolo26n.pt")
# Perform inference on an image
# The backbone extracts features, which are then used for detection
results = model("https://ultralytics.com/images/bus.jpg")
# Display the resulting detection
results[0].show()
사전 훈련된 백본을 활용함으로써 개발자는 Ultralytics 통해 자체 맞춤형 데이터셋에 대한 미세 조정을 수행할 수 있습니다. 이러한 접근 방식은 물류 분야에서 패키지 탐지에사용되는 모델과 같은 특화 모델의 신속한 개발을 가능하게 하며, 딥 뉴럴 네트워크를 처음부터 훈련하는 데 일반적으로 필요한 막대한 계산 자원을 요구하지 않습니다.