词汇表

循环神经网络 (RNN)

探索循环神经网络（RNN）如何利用记忆处理序列数据。了解RNN架构、自然语言处理应用及PyTorch 。

循环神经网络（RNN）是一种专门设计用于识别数据序列模式的人工神经网络，例如文本、基因组、手写体或语音。与假设所有输入（和输出）彼此独立的传统前馈网络不同，RNN具备某种形式的记忆能力。这种内部记忆机制使其能够结合历史信息处理输入，使其在需要上下文关联和时间序列的任务中具有独特优势。该架构模拟了人类处理信息的方式——例如阅读句子时，需要记住前文才能理解当前词语。

循环神经网络的工作原理

循环神经网络（RNN）的核心创新在于其循环结构。在标准的前馈网络中，信息仅单向流动：从输入到输出。而RNN则具备反馈回路，使信息得以持续存在。当网络处理序列时，它会维持一个"隐藏状态"——该向量充当网络的短期记忆。在每个时间步，RNN会结合当前输入与前一时间步的隐藏状态，生成输出并更新下步的隐藏状态。

这种序列处理能力对自然语言处理（NLP）和时间序列分析至关重要。然而，标准循环神经网络（RNNs）常因梯度消失问题难以处理长序列——随着序列增长，网络会遗忘早期输入。这一局限催生了更先进的变体，如长短期记忆网络（LSTM）和门控循环单元（GRU），它们引入了机制以更好地调控长时段的信息流。

实际应用

循环神经网络通过使机器能够理解序列数据，已彻底改变了众多行业。以下是两个突出的例子：

机器翻译：诸如Google 之类的服务最初主要依赖基于循环神经网络（RNN）的架构（特别是序列到序列模型）来实现文本的语言转换。该网络会读取整个输入句子（例如English），构建上下文向量，随后逐词生成翻译结果（例如法文），确保语法一致性。
预测输入与自动更正：当你在智能手机上输入文字时，键盘会自动推荐下一个最可能的词汇。该功能通常由基于循环神经网络（RNN）训练的语言模型驱动。该模型通过分析已输入的词汇序列，预测最可能的下一个词，从而提升用户输入速度与准确性。类似原理也适用于将语音转录为文本的语音识别系统。

循环神经网络与卷积神经网络及Transformer模型之比较

区分循环神经网络（RNN）与其他主要架构颇有裨益。卷积神经网络（CNN） (CNN) 主要用于处理图像等空间数据，通过处理像素网格来识别形状和物体。例如Ultralytics 采用强大的卷积神经网络骨干结构实现实时目标检测。卷积神经网络擅长回答 "这张图像里有什么？"，而循环神经网络则擅长回答 "这段视频接下来会发生什么？"。

最近， Transformer 架构在许多复杂的自然语言处理任务中已基本取代了循环神经网络（RNNs）。Transformer通过注意力机制并行处理整个序列，而非顺序处理。然而，在特定的低延迟、资源受限的流式应用中，RNNs仍具有极高的效率，且在边缘设备上部署简单的时间序列预测任务时更为便捷。

PyTorch 示例

虽然现代计算机视觉任务通常依赖卷积神经网络（CNN），但混合模型可能采用循环神经网络（RNN）来分析从视频帧中提取的时间特征。以下是一个使用PyTorch实现的简单可运行示例： PyTorch 创建基础RNN层处理序列数据的示例。

import torch
import torch.nn as nn

# Define a basic RNN layer
# input_size: number of features in the input (e.g., 10 features per time step)
# hidden_size: number of features in the hidden state (memory)
# batch_first: input shape will be (batch, seq, feature)
rnn = nn.RNN(input_size=10, hidden_size=20, num_layers=1, batch_first=True)

# Create a dummy input: Batch size 1, Sequence length 5, Features 10
input_seq = torch.randn(1, 5, 10)

# Forward pass through the RNN
# output contains the hidden state for every time step
# hn contains the final hidden state
output, hn = rnn(input_seq)

print(f"Output shape: {output.shape}")  # Expected: torch.Size([1, 5, 20])
print(f"Final hidden state shape: {hn.shape}")  # Expected: torch.Size([1, 1, 20])

挑战与未来展望

尽管具有实用性，循环神经网络仍面临计算障碍。序列化处理限制了并行化能力，导致其在GPU上的训练速度慢于Transformers模型。此外，为解决梯度爆炸问题，需要通过精细的超参数调优和梯度裁剪等技术进行管理。

尽管如此，循环神经网络（RNN）仍是深度学习（DL）的核心概念。它们对于理解人工智能（AI）的发展历程至关重要，至今仍在物联网传感器的简单异常检测系统中广泛应用。对于构建复杂管道的开发者——例如将视觉模型与序列预测器相结合——管理数据集和训练工作流至关重要。Ultralytics 通过提供高效管理数据及跨环境部署模型的工具，显著简化了这一流程。

循环神经网络 (RNN)

培训Ultralytics YOLO 模型，以简化各行业的工作流程

灵活的企业许可解决方案，助力您的创新

使用Ultralytics YOLO在数秒内训练人工智能模型

循环神经网络的工作原理

实际应用

循环神经网络与卷积神经网络及Transformer模型之比较

PyTorch 示例

挑战与未来展望

阅读更多此类别的内容

12个基于计算机视觉的航拍影像应用场景

什么是单目深度估计？概述

Ultralytics YOLO 进行人工智能威胁检测

加入Ultralytics 社区