深圳Yolo 视觉
深圳
立即加入
词汇表

残差网络 (ResNet)

了解 ResNet 如何通过解决梯度消失问题来革新深度学习,从而实现用于图像分析、自然语言处理等的超深层网络。

残差网络(ResNets)是人工智能(AI)领域的一个重要进步。 人工智能(AI)计算机视觉(CV)领域的重要进步。该架构于 2015 年由 该架构解决了 深度学习(DL 梯度消失问题 梯度消失问题。在 ResNet 出现之前,增加神经网络(NN 神经网络 (NN) 的深度往往会导致收益递减。 收益递减,增加层数实际上会增加训练误差。ResNet 通过引入 "跳过 连接",从而成功训练出 网络,同时保持高精度。 准确性

核心创新:残块

ResNet 的决定性特征是残差块。在传统的 卷积神经网络(CNN)中,层是按顺序堆叠的,每一层都试图直接学习从输入到输出的映射。 然而,随着网络变得越来越深,输入数据的信号在到达网络末端之前就会衰减。

ResNet 引入了一种 "快捷方式 "或跳过连接,允许将一个层的输入直接添加到其输出中。 输出。这种机制本质上是让网络学习输入与最佳输出之间的 "残差"(差值),而不是从头开始学习整个转换过程。 的 "残差"(差值),而不是从头开始学习整个转换过程。这种架构 保留了信息流,有利于更好地 特征提取,使模型能够 捕捉纹理和形状等复杂模式,而不会丢失原始输入数据。您可以阅读原文 深度残差学习图像识别论文,以了解其 数学基础。

ResNet 在机器学习中的重要性

ResNet 被认为是许多现代视觉系统的基础支柱。 现代视觉系统的基础骨干。它能够训练非常深度的网络,从而创建出高度鲁棒的模型,这些模型可以在大规模数据集(例如:... 在大规模数据集(如 ImageNet.

该架构对于 迁移学习尤为重要。因为预训练的 ResNet 模型已经从大量数据中学习了丰富的特征图 由于预训练的 ResNet 模型已从大量数据中学习了丰富的特征图,因此只需使用相对较小的数据集,就能针对特定任务对其进行微调。这种多功能性使 ResNet 成为从图像分类到复杂视频的各种任务的标准选择。 图像分类到复杂视频 分析等任务的标准选择。

实际应用

ResNet 提供的稳定性和深度使其能够用于关键的高风险环境。

  • 医疗诊断:在医疗领域的 人工智能在医疗保健领域的应用 经常用于 医疗图像分析。例如 研究人员使用深度 ResNet 模型分析核磁共振成像扫描或 X 射线,以进行 肿瘤检测、 在这种情况下,模型必须识别组织结构中的微小异常,而较浅的网络可能会忽略这些异常。
  • 自动驾驶: 自动驾驶汽车依靠实时 感知系统进行安全导航。ResNet 变体通常用作以下系统的特征提取器 物体检测系统的特征提取器。 行人、交通标志和其他车辆。网络的深度可确保汽车在不同的光照和天气条件下识别物体。 在不同的光照和天气条件下识别物体,这是汽车安全人工智能的一个关键组成部分。 人工智能在汽车安全领域的关键组成部分。

ResNet 与其他架构的比较

将 ResNet 与深度学习库中的其他常见架构区分开来很有帮助,例如 PyTorchTensorFlow:

  • ResNet 与 VGG 的对比:VGG(视觉几何组)网络因其简单性而广受欢迎,只使用 3x3 卷积。然而,VGG 模型的计算量很大,超过 19 层就很难进行有效训练。 ResNet 使用跳转连接,层数更深(如 50、101 或 152 层),推理延迟相对其深度更低。 推理延迟
  • ResNet 与YOLO11 的对比:ResNet 主要是分类器骨干网、 YOLO11则是最先进的物体检测器。然而 现代检测器(如YOLO11 )采用了从 ResNet 演化而来的架构概念,如跨阶段部分连接,以确保训练过程中高效的梯度流。 连接,以确保在训练过程中有效的梯度流。

利用Ultralytics实施

您可以使用 ultralytics Python 软件包。这 允许您访问预训练的权重,并用最少的代码执行推理。

from ultralytics import YOLO

# Load a pre-trained ResNet50 model capable of classifying images
model = YOLO("resnet50.pt")  # Downloads the model weights automatically

# Perform inference on an image URL
results = model("https://ultralytics.com/images/bus.jpg")

# Display the top classification result
print(f"Top class: {results[0].names[results[0].probs.top1]}")

对于有兴趣了解更深层理论的人,斯坦福大学的 CS231n 等课程提供了有关 CNN 架构的优秀学术资源。 斯坦福 CS231n 等课程提供了有关 CNN 架构的优秀学术资源。 无论您是要构建一个简单的分类器,还是要构建一个用于 智能制造的复杂系统,了解 ResNet 对于掌握现代计算机视觉技术至关重要。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入