探索骨干网络在深度学习中的作用。了解 Ultralytics YOLO26 如何使用优化后的骨干网络实现快速、准确的特征提取和目标检测。
骨干网络是深度学习架构的基础特征提取组件,作为将原始数据转换为有意义表示的主要引擎。在计算机视觉领域,骨干网络通常包含神经网络中的一系列层,用于处理输入图像以识别分层模式。这些模式从简单的低级特征(如边缘和纹理)到复杂的更高级概念(如形状和对象)不等。骨干网络的输出,通常称为特征图,作为下游组件的输入,用于执行分类或 detect 等特定任务。
主干网络的主要功能是在做出任何具体决策之前“看到”并理解图像的视觉内容。它充当通用翻译器,将像素值转换为浓缩的、信息丰富的格式。大多数现代主干网络依赖于卷积神经网络 (CNN) 或视觉Transformer (ViT),并经常在ImageNet等海量数据集上进行预训练。这种预训练过程是迁移学习的核心方面,使模型能够利用先前学习的视觉特征,显著减少了为特定应用训练新模型所需的数据和时间。
例如,在使用Ultralytics YOLO26时,该架构包含一个高度优化的骨干网络,可有效提取多尺度特征。这使得网络的后续部分能够完全专注于定位对象和分配类别概率,而无需从头开始重新学习如何识别基本视觉结构。
为了充分理解目标检测模型的架构,区分主干网络与另外两个主要组件(颈部网络和检测头)至关重要。
骨干网络是许多工业和科学 AI 应用幕后的无名英雄。它们泛化视觉数据的能力使其能够适应不同领域。
诸如YOLO11和尖端YOLO26等最先进的架构默认集成了强大的骨干网络。这些组件经过精心设计,可在从边缘设备到高性能GPU的各种硬件平台上实现最佳的推理延迟。
以下Python代码片段演示了如何加载带有预训练骨干网络的模型。
ultralytics 包。此设置在推理过程中自动利用骨干网络进行特征提取。
from ultralytics import YOLO
# Load a YOLO26 model, which includes a pre-trained CSP backbone
model = YOLO("yolo26n.pt")
# Perform inference on an image
# The backbone extracts features, which are then used for detection
results = model("https://ultralytics.com/images/bus.jpg")
# Display the resulting detection
results[0].show()
通过利用预训练的骨干网络,开发者可以使用Ultralytics Platform在自己的自定义数据集上执行fine-tuning。这种方法促进了专用模型的快速开发(例如用于物流中包裹 detect的模型),而无需通常从头开始训练深度神经网络所需的巨大计算资源。

开启您的机器学习未来之旅