遇见 YOLO26: 下一代视觉 AI。
Ultralytics
返回 Ultralytics 词汇表

Gated Recurrent Unit (GRU)

探索门控循环单元 (GRU) 以实现高效的序列数据处理。了解 GRU 如何增强 RNN、与 Ultralytics YOLO26 集成并优化 AI 任务。

门控循环单元 (GRU) 是一种精简且高效的 循环神经网络 (RNN) 架构,专为处理序列数据而设计。GRU 最初由 Cho et al. 于 2014 年 提出,旨在解决经常阻碍传统 RNN 性能的 梯度消失 问题。通过结合门控机制,GRU 可以有效地捕获数据中的长期依赖关系,使网络能够在处理长序列时“记住”重要信息,同时舍弃不相关的细节。这使其在涉及 时间序列分析、自然语言处理和音频合成的任务中非常有效。

Link to this sectionGRU 的工作原理#

与数据单向流动的标准前馈 神经网络 不同,GRU 维护着一个内部记忆状态。该状态在每个时间步使用两个关键组件进行更新:更新门重置门。这些门使用 激活函数(通常为 sigmoid 和 tanh)来控制信息流。

  • 更新门: 决定了多少过去的信息(来自之前的时间步)需要传递到未来。它帮助模型决定是复制之前的记忆还是计算新的状态。
  • 重置门: 决定了遗忘多少过去的信息。这允许模型丢弃对未来预测不再相关的信息。

这种架构经常与 长短期记忆 (LSTM) 网络进行比较。虽然两者解决的问题相似,但 GRU 在结构上更简单,因为它合并了单元状态和隐藏状态,并且没有专门的输出门。这导致参数更少,通常能带来更快的训练速度和更低的 推理延迟,同时不会显著牺牲准确性。

Link to this section实际应用#

GRU 用途广泛,可以应用于各种需要时间上下文的领域。

  • 视频中的人类动作识别: 虽然 卷积神经网络 (CNN) 在分析单个图像方面表现出色,但它们缺乏时间感知能力。为了识别“奔跑”或“挥手”等动作,系统可能会使用 Ultralytics YOLO26 从每个视频帧中提取特征,并将这些特征序列传递给 GRU。GRU 通过分析帧之间的时间变化来对随时间发生的动作进行分类。
  • 制造业中的预测性维护: 在工业环境中,机器会产生传感器数据流(温度、振动、压力)。GRU 可以分析这些 训练数据 以识别故障发生前的模式。通过尽早发现这些异常,公司可以主动安排维护,从而防止昂贵的停机时间。

Link to this section与计算机视觉工作流的集成#

在现代 AI 中,GRU 经常与视觉模型配对以创建多模态系统。例如,使用 Ultralytics 平台 的开发者可能会标注一个视频数据集用于 目标检测,然后利用输出结果训练下游的 GRU 来进行事件描述。

Link to this sectionGRU vs. LSTM vs. 标准 RNN#

  Feature
  Standard RNN
  LSTM
  GRU




  **Complexity**
  Low
  High
  Moderate


  **Memory**
  Short-term only
  Long-term capable
  Long-term capable


  **Parameters**
  Fewest
  Most
  Fewer than LSTM


  **Training Speed**
  Fast (but unstable)
  Slower
  Faster than LSTM

Link to this section实现示例#

以下 Python 代码片段展示了如何使用 PyTorch 库初始化 GRU 层。此类层可以连接到视觉特征提取器的输出端。

import torch
import torch.nn as nn

# Initialize a GRU: Input feature size 64, Hidden state size 128
# 'batch_first=True' expects input shape (Batch, Seq_Len, Features)
gru_layer = nn.GRU(input_size=64, hidden_size=128, batch_first=True)

# Simulate a sequence of visual features from 5 video frames
# Shape: (Batch Size: 1, Sequence Length: 5, Features: 64)
dummy_visual_features = torch.randn(1, 5, 64)

# Pass features through the GRU
output, hidden_state = gru_layer(dummy_visual_features)

print(f"Output shape: {output.shape}")  # Shape: [1, 5, 128]
print(f"Final hidden state shape: {hidden_state.shape}")  # Shape: [1, 1, 128]

Link to this section相关概念#

  • 深度学习 (DL) 基于人工神经网络的更广泛的机器学习领域,涵盖了 GRU、CNN 和 Transformer 等架构。
  • 自然语言处理 (NLP) GRU 应用的主要领域,涉及机器翻译、文本摘要和词序至关重要的情感分析等任务。
  • 随机梯度下降 (SGD) 一种常用的优化算法,通过最小化预测结果与实际结果之间的误差来训练 GRU 网络的权重。

如需对这些单元背后的数学原理进行更深入的技术探究,像 Dive into Deep Learning 教科书或官方 TensorFlow GRU 文档 这样的资源提供了广泛的理论背景。

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅