词汇表

注意：水槽

了解注意力沉降机制如何为无限序列生成稳定大型语言模型（LLMs）和大型视觉模型（VLMs）。学习如何利用Ultralytics 优化内存并部署稳定的 AI 系统。

注意力沉积是现代大型语言模型（LLMs）和视觉语言模型（VLMs）架构中发现的一种关键现象，它能确保在持续生成长篇文本或数据时保持稳定性。在注意力机制中，神经网络会动态地为输入的不同部分分配“权重”。研究人员观察到，自回归模型会将大量多余的注意力权重倾注到序列的最初几个令牌上，无论这些令牌的实际语义含义如何。这些初始令牌充当“注意力汇”，提供了一个数学锚点，防止模型的注意力权重崩溃。通过将这些汇集令牌永久保存在模型的键值缓存中，开发者能够实现无限序列生成，且不会因内存限制而导致精度下降或模型崩溃。

注意力沉降如何稳定模型

对注意力沉积的需求源于 Transformer 中使用的 Softmax 运算。由于注意力得分之和必须始终为 1，因此在处理高度局部化的数据时，模型需要一个位置来分配多余的注意力。提示词中最早出现的词元自然会吸收这些多余的注意力。

历史上，在生成非常长的序列时，工程师们会采用分窗技术，将较早的令牌从内存中移除。然而，丢弃初始的“沉积”令牌会导致性能立即崩溃。现代实现方案，例如 StreamingLLM，会明确地将这些初始令牌与最新令牌一同保留。这种高度优化的内存管理方法正在 OpenAI的视觉开发和 Google 的研究中积极探索，并且在 PyTorch 得到了原生支持。

区分相关的注意力概念

为了全面理解AI模型如何优化上下文，将注意力沉积与其他内存和硬件策略进行对比会很有帮助：

注意力沉积与滑动窗口注意力： 滑动窗口注意力将模型的关注范围限制在固定数量的近期令牌上，以节省内存。然而，严格的滑动窗口会丢弃最初的令牌，从而导致不稳定性。注意力沉积通过将窗口锚定在这些关键的最初令牌上来改进这一机制。
注意力接收器与闪存注意力： 闪存注意力是一种硬件级优化，可加速GPU 上的内存读写操作。而注意力接收器，则是关于为维持逻辑稳定性必须在内存中保留哪些令牌的架构层面的发现。

实际应用

“注意力黑洞”的发现，为各行各业解锁了高效、持续的处理能力。

连续式人工智能代理与聊天机器人：通过保留注意力沉积点，人工智能代理或客服机器人能够持续数小时进行不间断的对话。它会选择性地遗忘中间的令牌，同时保留初始沉积点和最近的上下文，从而在避免内存不足错误的同时，保持对话的一致性。
实时视频理解：在智能监控和持续监测中，保持稳定的上下文窗口至关重要。模型能够对连续的视频流进行长达数天的分析，其效率可媲美针对边缘设备优化的视觉架构。

实现高效的连续推理

虽然注意力沉降主要用于优化大规模生成模型，但在计算机视觉（CV）领域，应用高效且注重内存管理的推理循环具有普遍的重要性。在使用Ultralytics 处理连续视频流时，利用Python 生成器可确保在长时间内保持内存稳定性，这类似于管理一个局部上下文窗口。

from ultralytics import YOLO

# Load the recommended Ultralytics YOLO26 model for efficient, real-time edge processing
model = YOLO("yolo26n.pt")

# Process a continuous video stream efficiently without memory overflow
results = model.predict(source="rtsp://continuous_camera_stream", stream=True)

# Iterate through the generator to maintain a stable memory footprint over time
for frame_result in results:
    print(f"Detected {len(frame_result.boxes)} objects in the current frame.")

要将这些高效、连续的物体检测管道扩展至企业级应用，需要强大的管理工具。开发人员可以利用Ultralytics 简化模型部署和自动化数据集管理，从而让团队能够轻松构建稳定、长期运行的视觉应用程序。

注意：水槽

导出至17+种格式。部署至全球43个区域。

以每小时2.39美元的价格在H100 GPU上训练YOLO26。

灵活的企业级许可，为您的视觉AI项目赋能。

专为赋能您的下一个项目而设计的企业级许可

智能标注可将标注速度提升高达10倍

标注。训练。部署。一站式平台。

注意力沉降如何稳定模型

区分相关的注意力概念

实际应用

实现高效的连续推理

阅读更多此类别的内容

如何使用Ultralytics 导出Ultralytics YOLO

利用Ultralytics 检测不安全的托盘堆放

Ultralytics 多边形标注指南

让我们一起共建AI的未来！