遇见 YOLO26: 下一代视觉 AI。
Ultralytics
返回 Ultralytics 词汇表

Residual Networks (ResNet)

探索残差网络 (ResNet) 的力量。了解跳跃连接如何解决梯度消失问题,从而实现计算机视觉的深度学习。

残差网络 (ResNet) 是一种特定类型的 人工神经网络 (ANN) 架构,旨在实现极深网络的训练。ResNet 由微软研究人员于 2015 年提出,解决了深度学习中一个关键的瓶颈,即 梯度消失问题。在传统网络中,堆叠更多层往往会导致性能饱和或下降,因为更新 模型权重 所需的信号会随着层级反向传播而逐渐减弱。ResNet 引入了“跳跃连接”(或称残差连接),允许数据绕过一个或多个层直接流向后续的处理阶段。这一创新证明了更深的网络可以被有效训练,从而在 计算机视觉 (CV) 领域取得了重大突破,并成为现代架构的基础概念。

Link to this section核心概念:残差学习#

ResNet 的定义特征是“残差块”。在标准的 卷积神经网络 (CNN) 中,每一层都试图学习从输入到输出的直接映射。随着网络变得越来越深,学习这种直接映射变得愈发困难。

ResNet 通过以不同方式构建学习目标改变了这种方法。残差块不再期望每一层堆栈都学习整个底层映射,而是强制各层学习输入与期望输出之间的“残差”或差异。然后,原始输入通过跳跃连接加回到已学习的残差中。这种结构变化意味着如果恒等映射(保持输入不变)是最优的,网络可以很容易地学习将残差推向零。这使得 深度学习 (DL) 模型更容易优化,从而使其能够从几十层扩展到数百甚至数千层。

Link to this section关键架构变体#

自诞生以来,ResNet 的几种变体已成为 AI 社区的标准基准。

  • ResNet-50 一个 50 层的版本,采用了“瓶颈”设计。这种设计使用 1x1 卷积来减少然后恢复维度,从而在保持高 准确率 的同时实现了计算高效。
  • ResNet-101 和 ResNet-152: 分别具有 101 层和 152 层的更深变体。当计算资源允许更高的复杂性以捕获更复杂的 特征图 时,通常会使用这些变体。
  • ResNeXt: ResNet 的一种演进版本,引入了“基数”(cardinality)维度,将残差块拆分为多个并行路径,从而提高了效率和性能。

Link to this section实际应用#

ResNet 架构的鲁棒性使其成为处理广泛视觉任务的首选。

  • 医学图像分析 在医疗保健领域,识别高分辨率扫描中的细微异常至关重要。基于 ResNet 的模型经常被用于检测诸如 医学影像中的肿瘤检测 等病症,其中网络的深度有助于辨别 MRI 或 CT 数据中的细粒度模式。
  • Autonomous Vehicles: Self-driving cars require reliable feature extraction from camera feeds to identify pedestrians, signs, and obstacles. ResNets often serve as the backbone for object detection systems in AI in automotive applications, providing the rich visual features needed for safe navigation.

Link to this sectionResNet 与其他架构的对比#

将 ResNet 与其他流行架构进行区分,有助于理解其具体用途。

  • ResNet vs. VGG VGG (Visual Geometry Group) 网络也是深层 CNN,但缺乏残差连接。因此,它们在与 ResNet 相当的深度下更难训练,并且由于其庞大的全连接层,通常计算开销更大。
  • ResNet vs. Inception Inception 网络注重宽度,在同一层内使用多种尺寸的滤波器来捕获不同尺度的特征。ResNet 则注重深度。像 Inception-ResNet 这样的现代架构结合了这两种概念。
  • ResNet vs. 视觉 Transformer (ViT) 虽然 ViT 使用自注意力机制来全局处理图像,但 ResNet 依赖于局部卷积。然而,ResNet 仍然是一个强大的基准,并且对于较小的数据集或实时 推理 而言,通常速度更快。

Link to this section实现示例#

像 PyTorch 这样的现代深度学习库可以轻松调用预训练的 ResNet 模型。这些模型对于 迁移学习 非常有价值,其中在 ImageNet 等大型数据集上训练的模型会被微调以用于特定任务。

以下 Python 代码片段展示了如何使用 torchvision(PyTorch 生态系统的一部分)加载预训练的 ResNet-50 模型并执行简单的正向传播。虽然 Ultralytics Platform 的用户可能经常使用 YOLO26 进行检测,但了解 ResNet 等底层骨干网概念对于高级定制至关重要。

import torch
import torchvision.models as models

# Load a pre-trained ResNet-50 model
resnet50 = models.resnet50(weights=models.ResNet50_Weights.DEFAULT)
resnet50.eval()  # Set model to evaluation mode

# Create a dummy input tensor (batch_size, channels, height, width)
input_tensor = torch.randn(1, 3, 224, 224)

# Perform a forward pass to get predictions
with torch.no_grad():
    output = resnet50(input_tensor)

print(f"Output shape: {output.shape}")  # Expect [1, 1000] for ImageNet classes

Link to this section在现代 AI 中的重要性#

尽管像 YOLO26 这样的较新架构采用了高度优化的结构以实现最大速度和精度,但残差学习的原则仍然无处不在。跳跃连接的概念现在是许多先进网络中的标准组件,包括用于 自然语言处理 (NLP) 的 Transformer 以及最新的 目标检测 模型。通过使信息能够更自由地在网络中流动,ResNet 为驱动当今人工智能的深层、复杂模型铺平了道路。

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅