딥러닝에서 백본의 역할과 ResNet, ViT와 같은 주요 아키텍처를 살펴보고 실제 AI 응용 분야에 대해 알아보세요.
백본은 딥 러닝 모델의 핵심 구성 요소입니다. 딥러닝 모델, 특히 컴퓨터 비전(CV)의 핵심 구성 요소입니다. 백본은 기본 특징 추출 네트워크의 역할을 하며 이미지와 같은 원시 입력 데이터를 높은 수준의 특징 집합으로 변환하도록 설계되었습니다. 이러한 피처 맵은 가장자리와 같은 필수 패턴을 캡처합니다, 텍스처, 모양과 같은 필수 패턴을 캡처합니다. 그런 다음 이 풍부한 표현은 네트워크의 후속 부분에서 다음과 같은 작업을 수행하는 데 사용됩니다. 객체 감지 이미지 분할 또는 이미지 분류와 같은 작업을 수행하는 데 사용됩니다. 백본은 신경망의 기초입니다. 신경망(NN)의 기초입니다. "이미지 내의 기본적인 시각적 요소를 '보는' 방법을 학습합니다.
일반적으로 백본은 심층적인 컨볼루션 신경망(CNN) 으로, 다음과 같은 대규모 분류 데이터 세트에 대해 사전 학습된 것입니다. ImageNet. 전이 학습의 한 형태인 이 사전 훈련은 전이 학습의 한 형태인 이 사전 학습은 네트워크가 일반적인 시각적 특징에 대한 방대한 시각적 특징 라이브러리를 학습할 수 있습니다. 새롭고 특정한 작업을 위한 모델을 개발할 때 개발자는 종종 처음부터 시작하지 않고 사전 훈련된 백본을 사용합니다. 이 접근 방식은 사용자 지정 모델을 학습하는 데 필요한 시간을 크게 단축하고 사용자 지정 모델을 학습하고 데이터 요구 사항을 줄임으로써 더 나은 성능으로 이어집니다. 그런 다음 백본에서 추출한 특징은 네트워크의 "목"과 "머리"로 전달됩니다. 네트워크의 "헤드"로 전달되어 추가 세분화를 수행하고 최종 결과물을 생성합니다. 백본의 선택은 백본의 선택은 종종 정확도, 모델 크기, 추론 지연 시간 사이의 정확도, 모델 크기, 추론 지연 시간 사이의 달성하기 위한 실시간 성능.
다음 코드는 사전 학습된 Ultralytics YOLO11 모델이 효율적인 백본을 로드하여 이미지 추론에 사용할 수 있는 방법을 보여줍니다.
from ultralytics import YOLO
# Load a pre-trained YOLO11 model. Its architecture includes a powerful backbone.
model = YOLO("yolo11n.pt")
# Run inference. The backbone processes the image to extract features for detection.
results = model("https://ultralytics.com/images/bus.jpg")
# Display the detection results
results[0].show()
백본의 설계는 크게 발전해 왔으며, 새로운 아키텍처마다 성능 및 효율성을 제공합니다. 가장 영향력 있는 백본 아키텍처는 다음과 같습니다:
최신 객체 감지 아키텍처에서 모델은 일반적으로 세 가지 주요 부분으로 구분됩니다:
따라서 백본은 전체 모델의 기본 구성 요소입니다. 다양한 다양한 YOLO 모델 비교를 통해 다양한 아키텍처 선택이 성능에 어떤 영향을 미치는지 살펴볼 수 있습니다.
백본은 다양한 산업 분야의 수많은 AI 애플리케이션에서 필수적인 구성 요소입니다:

