深圳Yolo 视觉
深圳
立即加入
词汇表

Backbone

探索 Backbones 在深度学习中的作用,探索 ResNet 和 ViT 等顶级架构,并了解它们在现实世界中的 AI 应用。

主干是深度学习模型的核心组件 深度学习模型的核心组件,尤其是在 计算机视觉(CV)中。它作为 主要特征提取网络,旨在 获取图像等原始输入数据,并将其转化为一组高级特征。这些 特征图可以捕捉边缘、纹理和形状等基本模式、 纹理和形状等基本模式。随后,网络的后续部分将使用这种丰富的表征来执行以下任务 物体检测 图像分割图像分类等任务。骨干网是 神经网络 (NN)的基础。 "看到 "图像中的基本视觉元素。

Backbone 网络的工作原理

通常情况下,骨干网是一个深度 卷积神经网络(CNN) 已在大规模分类数据集(如 ImageNet.这种预训练是一种 迁移学习的一种形式。 庞大的通用视觉特征库。在为新的特定任务开发模型时,开发人员通常会使用预先训练好的骨干网络,而不是从头开始。 而不是从头开始。这种方法大大缩短了 训练自定义模型所需的时间,并减少对数据的要求,通常能获得更好的性能。 从而提高性能。骨干网提取的特征随后会传递给网络的 "颈部 "和 "头部"。 网络的 "头部",这两个部分进行进一步细化并生成最终输出。选择 骨干网的选择通常是在准确性、模型大小和 推理延迟之间进行权衡。 实现 实时性能的关键因素。

下面的代码演示了如何将预先训练好的 Ultralytics YOLO11模型,其中包含一个高效的 骨干,可以加载并用于图像推理。

from ultralytics import YOLO

# Load a pre-trained YOLO11 model. Its architecture includes a powerful backbone.
model = YOLO("yolo11n.pt")

# Run inference. The backbone processes the image to extract features for detection.
results = model("https://ultralytics.com/images/bus.jpg")

# Display the detection results
results[0].show()

常见骨干网络架构

主干网的设计有了很大发展,每种新架构都能提高性能和效率。 效率。一些最有影响力的主干网架构包括

  • 残差网络(ResNet)Microsoft 研究院推出,ResNet 模型使用 "跳过连接",从而缓解梯度消失问题,训练更深层次的网络。 问题。
  • EfficientNet: Google 人工智能开发,该模型系列 采用了一种复合缩放方法,可统一平衡网络深度、宽度和分辨率,从而创建出既高精度又高效计算的模型。 既高精度又高效计算的模型。
  • 视觉Transformer (ViT) 该架构采用了非常成功的 Transformer模型 自然语言处理(NLP) 视觉任务。ViTs 将图像处理为片段序列,并使用 自我注意来捕捉全局上下文,这与传统 CNN 的局部感受野 与传统 CNN 的局部感受野不同。
  • CSPNet(跨阶段部分网络):正如其 该架构通过对特征图进行分区来降低计算瓶颈,从而提高学习效率。 通过分割特征图来减少计算瓶颈,从而提高学习效率。它是许多Ultralytics YOLO 模型的关键组件。

主干网络与 Head 和 Neck

在现代 在现代物体检测架构中 模型通常分为三个主要部分:

  1. 骨干网:作为基础,它的作用是从输入图像中提取不同尺度的特征图 图像。
  2. 颈部:颈部:该组件连接脊柱和头部。它可以细化和聚合来自骨干层的特征 通常结合来自不同层的信息来创建更丰富的表征。一个常见的例子 是特征金字塔网络(FPN)
  3. 检测头这是网络的最后 网络的最后一部分。它从颈部获取细化特征,并执行主要任务,如预测 边界框、类标签和置信度分数。 等。

因此,骨干网是整个模型的基本构件。您可以探索各种 YOLO 模型比较,了解不同的架构选择对性能的影响。 对性能的影响。

实际应用

骨干网是各行各业无数人工智能应用的重要组成部分:

  1. 自动驾驶汽车自动驾驶汽车中,ResNet 或 EfficientNet 变体等强大的骨干网 或 EfficientNet 变体等强大的主干网处理来自摄像头的图像,detect 其他车辆、行人和交通信号,并classify 。 交通信号。这种特征提取对于车辆的导航和决策至关重要。 Waymo 等公司开发的系统就证明了这一点。
  2. 医学图像分析医疗人工智能解决方案中,骨干网用于 用于分析 X 光和核磁共振成像等医学扫描。例如,骨干可以从胸部 X 光片中提取特征,帮助识别肺炎迹象,或从 CT 扫描中发现潜在的肿瘤。 帮助识别肺炎的迹象,或从 CT 扫描中发现潜在的肿瘤。 放射学:人工智能》中的研究强调了这一点。这有助于放射科医生 像YOLO11 这样的模型可以针对专门任务进行微调,如 肿瘤检测

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入