深圳Yolo 视觉
深圳
立即加入
词汇表

Backbone

探索骨干网络在深度学习中的作用。了解 Ultralytics YOLO26 如何使用优化后的骨干网络实现快速、准确的特征提取和目标检测。

骨干网络是深度学习架构的基础特征提取组件,作为将原始数据转换为有意义表示的主要引擎。在计算机视觉领域,骨干网络通常包含神经网络中的一系列层,用于处理输入图像以识别分层模式。这些模式从简单的低级特征(如边缘和纹理)到复杂的更高级概念(如形状和对象)不等。骨干网络的输出,通常称为特征图,作为下游组件的输入,用于执行分类或 detect 等特定任务。

脊柱的作用

主干网络的主要功能是在做出任何具体决策之前“看到”并理解图像的视觉内容。它充当通用翻译器,将像素值转换为浓缩的、信息丰富的格式。大多数现代主干网络依赖于卷积神经网络 (CNN)视觉Transformer (ViT),并经常在ImageNet等海量数据集上进行预训练。这种预训练过程是迁移学习的核心方面,使模型能够利用先前学习的视觉特征,显著减少了为特定应用训练新模型所需的数据和时间。

例如,在使用Ultralytics YOLO26时,该架构包含一个高度优化的骨干网络,可有效提取多尺度特征。这使得网络的后续部分能够完全专注于定位对象和分配类别概率,而无需从头开始重新学习如何识别基本视觉结构。

脊柱 vs. 颈部 vs. 头部

为了充分理解目标检测模型的架构,区分主干网络与另外两个主要组件(颈部网络和检测头)至关重要。

  • 主干网络“特征提取器”。它从输入图像中分离出重要的视觉信息。常见的例子包括最初由Microsoft Research开发的残差网络 (ResNet),以及为计算效率优化的CSPNet。
  • 颈部:“特征聚合器”。颈部位于骨干网络和头部之间,负责提炼并结合来自不同尺度的特征。此处常用的一种结构是特征金字塔网络 (FPN),它增强了模型检测不同尺寸目标的能力。
  • 检测头:“预测器”。检测头处理来自颈部的聚合特征,以生成最终输出,例如边界框和类别标签。

实际应用

骨干网络是许多工业和科学 AI 应用幕后的无名英雄。它们泛化视觉数据的能力使其能够适应不同领域。

  1. 医疗诊断:在医疗保健领域,骨干网络分析复杂的医学影像,如X射线、CT扫描和MRI。通过执行医学图像分析,这些网络可以提取指示疾病的细微异常。例如,专用模型利用强大的骨干网络进行肿瘤检测,识别可能被人眼忽略的早期癌症迹象。北美放射学会 (RSNA)等组织倡导这些深度学习工具彻底改变患者护理。
  2. 自动系统:在汽车和机器人行业中,主干网络处理来自车载摄像头的视频流以解释环境。汽车AI依赖这些强大的特征提取器来实时detect车道、读取交通标志和识别行人。可靠的主干网络确保系统能够区分静态障碍物和移动车辆,这是像Waymo这样的公司开发的自动驾驶技术的一项关键安全要求。

利用Ultralytics实施

诸如YOLO11和尖端YOLO26等最先进的架构默认集成了强大的骨干网络。这些组件经过精心设计,可在从边缘设备到高性能GPU的各种硬件平台上实现最佳的推理延迟

以下Python代码片段演示了如何加载带有预训练骨干网络的模型。 ultralytics 包。此设置在推理过程中自动利用骨干网络进行特征提取。

from ultralytics import YOLO

# Load a YOLO26 model, which includes a pre-trained CSP backbone
model = YOLO("yolo26n.pt")

# Perform inference on an image
# The backbone extracts features, which are then used for detection
results = model("https://ultralytics.com/images/bus.jpg")

# Display the resulting detection
results[0].show()

通过利用预训练的骨干网络,开发者可以使用Ultralytics Platform在自己的自定义数据集上执行fine-tuning。这种方法促进了专用模型的快速开发(例如用于物流中包裹 detect的模型),而无需通常从头开始训练深度神经网络所需的巨大计算资源。

让我们一起共建AI的未来!

开启您的机器学习未来之旅