Yolo 비전 선전
선전
지금 참여하기
용어집

백본

딥러닝에서 백본의 역할과 ResNet, ViT와 같은 주요 아키텍처를 살펴보고 실제 AI 응용 분야에 대해 알아보세요.

백본은 딥 러닝 모델의 핵심 구성 요소입니다. 딥러닝 모델, 특히 컴퓨터 비전(CV)의 핵심 구성 요소입니다. 백본은 기본 특징 추출 네트워크의 역할을 하며 이미지와 같은 원시 입력 데이터를 높은 수준의 특징 집합으로 변환하도록 설계되었습니다. 이러한 피처 맵은 가장자리와 같은 필수 패턴을 캡처합니다, 텍스처, 모양과 같은 필수 패턴을 캡처합니다. 그런 다음 이 풍부한 표현은 네트워크의 후속 부분에서 다음과 같은 작업을 수행하는 데 사용됩니다. 객체 감지 이미지 분할 또는 이미지 분류와 같은 작업을 수행하는 데 사용됩니다. 백본은 신경망의 기초입니다. 신경망(NN)의 기초입니다. "이미지 내의 기본적인 시각적 요소를 '보는' 방법을 학습합니다.

백본 작동 방식

일반적으로 백본은 심층적인 컨볼루션 신경망(CNN) 으로, 다음과 같은 대규모 분류 데이터 세트에 대해 사전 학습된 것입니다. ImageNet. 전이 학습의 한 형태인 이 사전 훈련은 전이 학습의 한 형태인 이 사전 학습은 네트워크가 일반적인 시각적 특징에 대한 방대한 시각적 특징 라이브러리를 학습할 수 있습니다. 새롭고 특정한 작업을 위한 모델을 개발할 때 개발자는 종종 처음부터 시작하지 않고 사전 훈련된 백본을 사용합니다. 이 접근 방식은 사용자 지정 모델을 학습하는 데 필요한 시간을 크게 단축하고 사용자 지정 모델을 학습하고 데이터 요구 사항을 줄임으로써 더 나은 성능으로 이어집니다. 그런 다음 백본에서 추출한 특징은 네트워크의 "목"과 "머리"로 전달됩니다. 네트워크의 "헤드"로 전달되어 추가 세분화를 수행하고 최종 결과물을 생성합니다. 백본의 선택은 백본의 선택은 종종 정확도, 모델 크기, 추론 지연 시간 사이의 정확도, 모델 크기, 추론 지연 시간 사이의 달성하기 위한 실시간 성능.

다음 코드는 사전 학습된 Ultralytics YOLO11 모델이 효율적인 백본을 로드하여 이미지 추론에 사용할 수 있는 방법을 보여줍니다.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model. Its architecture includes a powerful backbone.
model = YOLO("yolo11n.pt")

# Run inference. The backbone processes the image to extract features for detection.
results = model("https://ultralytics.com/images/bus.jpg")

# Display the detection results
results[0].show()

일반적인 백본 아키텍처

백본의 설계는 크게 발전해 왔으며, 새로운 아키텍처마다 성능 및 효율성을 제공합니다. 가장 영향력 있는 백본 아키텍처는 다음과 같습니다:

  • 잔여 네트워크(ResNet): Microsoft Research에서 도입한 ResNet 모델은 다음을 사용합니다. "연결 건너뛰기"를 사용하여 사라지는 기울기 문제를 완화함으로써 훨씬 더 깊은 네트워크를 학습할 수 있습니다. 문제를 완화합니다.
  • EfficientNet: Google AI에서 개발한 이 모델 제품군은 은 네트워크 깊이, 폭, 해상도의 균형을 균일하게 맞추는 복합 스케일링 방법을 사용하여 매우 정확하고 계산 효율이 높은 매우 정확하고 계산적으로 효율적인 모델을 생성합니다.
  • 비전 트랜스포머(ViT): 이 아키텍처는 매우 성공적인 트랜스포머 모델을 자연어 처리(NLP) 모델을 비전 작업에 적용합니다. ViT는 이미지를 패치 시퀀스로 처리하고 글로벌 컨텍스트를 포착하기 위해 스스로 주의를 기울입니다. 기존 CNN의 로컬 수용 영역에서 벗어난 것입니다.
  • CSPNet(크로스 스테이지 부분 네트워크): 원본 논문에서 자세히 설명한 것처럼 이 아키텍처는 다음과 같은 방식으로 학습 효율성을 개선합니다. 기능 맵을 분할하여 계산 병목 현상을 줄임으로써 학습 효율성을 향상시킵니다. 이 아키텍처는 많은 Ultralytics YOLO 모델의 핵심 구성 요소입니다.

백본 대 헤드 및 넥

최신 객체 감지 아키텍처에서 모델은 일반적으로 세 가지 주요 부분으로 구분됩니다:

  1. 백본: 기초로서, 입력 이미지에서 다양한 축척의 특징 맵을 추출하는 역할을 합니다. 이미지에서 다양한 스케일의 피처 맵을 추출하는 것입니다.
  2. 목: 이 컴포넌트는 백본과 머리를 연결합니다. 백본의 피처를 세분화하고 통합하여 기능을 구체화하고 집계하며, 종종 다른 레이어의 정보를 결합하여 더 풍부한 표현을 만듭니다. 일반적인 예 피처 피라미드 네트워크(FPN)가 있습니다.
  3. 탐지 헤드: 네트워크의 마지막 네트워크의 마지막 부분입니다. 목에서 정제된 특징을 가져와서 경계 상자, 클래스 레이블, 신뢰 점수 예측과 같은 주요 작업을 수행합니다. 경계 상자, 클래스 레이블 및 신뢰도 점수 를 예측하는 등의 주요 작업을 수행합니다.

따라서 백본은 전체 모델의 기본 구성 요소입니다. 다양한 다양한 YOLO 모델 비교를 통해 다양한 아키텍처 선택이 성능에 어떤 영향을 미치는지 살펴볼 수 있습니다.

실제 애플리케이션

백본은 다양한 산업 분야의 수많은 AI 애플리케이션에서 필수적인 구성 요소입니다:

  1. 자율 주행 차량: In 자율 주행 차량에서는 ResNet이나 또는 EfficientNet과 같은 강력한 백본이 카메라의 이미지를 처리하여 다른 차량, 보행자, 교통 신호 등을 detect classify . 교통 신호를 감지합니다. 이러한 특징 추출은 차량의 내비게이션과 의사 결정에 매우 중요합니다. Waymo와 같은 회사에서 개발한 시스템에서 볼 수 있듯이 차량의 내비게이션과 의사 결정에 매우 중요합니다.
  2. 의료 이미지 분석: 의료 AI 솔루션에서는 백본이 사용되며 을 사용하여 엑스레이와 MRI와 같은 의료 스캔을 분석합니다. 예를 들어, 백본은 흉부 엑스레이에서 특징을 추출하여 폐렴의 징후를 식별하거나 CT 스캔에서 잠재적인 종양을 찾는 데 도움을 줄 수 있습니다. 방사선학: 인공 지능. 이를 통해 영상의학과 전문의는 더 빠르고 정확한 진단을 내리는 데 도움이 되며, YOLO11 같은 모델은 다음과 같은 특수한 작업에 맞게 미세 조정할 수 있습니다. 종양 탐지.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기