探索 Backbones 在深度学习中的作用,探索 ResNet 和 ViT 等顶级架构,并了解它们在现实世界中的 AI 应用。
主干是深度学习模型的核心组件 深度学习模型的核心组件,尤其是在 计算机视觉(CV)中。它作为 主要特征提取网络,旨在 获取图像等原始输入数据,并将其转化为一组高级特征。这些 特征图可以捕捉边缘、纹理和形状等基本模式、 纹理和形状等基本模式。随后,网络的后续部分将使用这种丰富的表征来执行以下任务 物体检测 图像分割或 图像分类等任务。骨干网是 神经网络 (NN)的基础。 "看到 "图像中的基本视觉元素。
通常情况下,骨干网是一个深度 卷积神经网络(CNN) 已在大规模分类数据集(如 ImageNet.这种预训练是一种 迁移学习的一种形式。 庞大的通用视觉特征库。在为新的特定任务开发模型时,开发人员通常会使用预先训练好的骨干网络,而不是从头开始。 而不是从头开始。这种方法大大缩短了 训练自定义模型所需的时间,并减少对数据的要求,通常能获得更好的性能。 从而提高性能。骨干网提取的特征随后会传递给网络的 "颈部 "和 "头部"。 网络的 "头部",这两个部分进行进一步细化并生成最终输出。选择 骨干网的选择通常是在准确性、模型大小和 推理延迟之间进行权衡。 实现 实时性能的关键因素。
下面的代码演示了如何将预先训练好的 Ultralytics YOLO11模型,其中包含一个高效的 骨干,可以加载并用于图像推理。
from ultralytics import YOLO
# Load a pre-trained YOLO11 model. Its architecture includes a powerful backbone.
model = YOLO("yolo11n.pt")
# Run inference. The backbone processes the image to extract features for detection.
results = model("https://ultralytics.com/images/bus.jpg")
# Display the detection results
results[0].show()
主干网的设计有了很大发展,每种新架构都能提高性能和效率。 效率。一些最有影响力的主干网架构包括
在现代 在现代物体检测架构中 模型通常分为三个主要部分:
因此,骨干网是整个模型的基本构件。您可以探索各种 YOLO 模型比较,了解不同的架构选择对性能的影响。 对性能的影响。
骨干网是各行各业无数人工智能应用的重要组成部分:

