遇见 YOLO26: 下一代视觉 AI。
Ultralytics
返回 Ultralytics 词汇表

Reformer

探索 Reformer 架构,这是一种针对长序列的高效 Transformer 变体。了解 LSH 注意力和 RevNets 如何为 AI 研究优化内存。

Reformer 是 Transformer 架构的一种高效变体,专为处理对于标准模型来说计算成本过高的超长数据序列而设计。Reformer 的推出旨在解决传统 深度学习 系统中固有的内存瓶颈,它将 注意力机制 的复杂度从二次方降低到了线性对数项。这一创新使得 人工智能 研究人员能够在单块 GPU 上对跨越数万个 token 的上下文窗口进行模型训练,例如整本书、高分辨率图像或长篇音乐作品。

Link to this sectionReformer 的核心创新#

Reformer 通过两项主要的架构更改实现了其高效性,这使其区别于 BERT 或原始 GPT 系列等模型。这些技术解决了在 模型训练 过程中存储激活值所需的大量内存问题。

  • 局部敏感哈希 (LSH) 注意力: 在标准 Transformer 中,序列中的每个元素都会关注其他所有元素,从而产生巨大的计算负载。Reformer 使用 局部敏感哈希 (Locality-Sensitive Hashing) 将相似的向量组合在一起。模型不再计算所有对的注意力分数,而是仅针对一小部分 最近邻 (nearest neighbors) 计算分数,从而显著加快了 推理引擎 的速度。
  • 可逆残差层 (RevNets): 传统的 神经网络 必须存储每一层的激活值,以便在 反向传播 过程中计算梯度。Reformer 利用可逆神经网络,允许在反向传递过程中从输出重新计算层的输入。此技术消除了缓存中间激活值的需求,从而为 更大的批次大小 释放了内存。

Link to this sectionReformer 与标准 Transformer 的对比#

虽然两种架构都依赖于自注意力机制,但它们在 机器学习 生态系统中服务于不同的目的。

  • 标准 Transformer: 非常适合中短长度的序列。然而,其内存使用量会随序列长度 ($L$) 呈二次方 ($O(L^2)$) 增长。它是许多 大语言模型 (LLMs) 的基石,这些模型常用于 情感分析 或聊天机器人等任务。
  • Reformer: Optimized for extreme lengths ($O(L \log L)$). It sacrifices a small amount of accuracy in some contexts for the ability to handle inputs that are impossible for standard Transformers, such as processing extremely long time series analysis data or generating pixel-by-pixel imagery.

Link to this section实际应用#

Reformer 处理庞大上下文窗口的能力为那些数据难以碎片化的领域开辟了新的可能性。

  1. 基因组分析: DNA 序列由数百万个碱基对组成。Reformer 可以分析这些长字符串,在不丢失更广泛上下文的情况下识别 生物信息学 中的模式,从而辅助蛋白质结构预测。

  2. 长篇文本生成: 与标准 文本生成 模型在几段后可能失去连贯性不同,Reformer 可以在数千个字之间保持一致性,这使其非常适合生成长篇法律合同的摘要或整部小说的章节。

Link to this section计算机视觉中的效率#

尽管 Reformer 通常与文本相关联,但效率原则在 计算机视觉 中至关重要。正如 Reformer 优化了 Transformer 一样,像 YOLO26 这样的现代视觉模型也在为 实时推理 优化卷积神经网络 (CNNs)。当通过 Ultralytics Platform 将模型部署到硬件资源有限的边缘设备时,理解内存限制至关重要。

以下代码演示了如何使用 PyTorch 检查模型的内存占用,这是一个对于开发像 Reformer 这样内存高效架构至关重要的概念。

import torch
import torch.nn as nn

# Define a simple Transformer layer (Standard, not Reformer optimized)
layer = nn.TransformerEncoderLayer(d_model=512, nhead=8)
model = nn.TransformerEncoder(layer, num_layers=6)

# Create a long sequence input (Sequence Length: 2000, Batch: 1, Features: 512)
# Standard Transformers struggle as this length increases.
input_data = torch.rand(2000, 1, 512)

# Check parameter count to understand model complexity
params = sum(p.numel() for p in model.parameters())
print(f"Model Parameters: {params:,}")

# Perform a forward pass
output = model(input_data)
print(f"Output shape: {output.shape}")

Link to this section相关概念#

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅