遇见 YOLO26: 下一代视觉 AI。
Ultralytics
返回 Ultralytics 词汇表

Linear Attention

了解线性注意力如何通过将 Transformer 复杂度降低至 O(N) 来优化深度学习模型。了解它如何为 AI 应用提升效率。

Linear attention is a foundational optimization technique designed to drastically improve the computational efficiency of modern deep learning (DL) models. In traditional Transformer architectures, standard attention mechanisms process sequences by comparing every single token against every other token. This creates a severe computational and memory bottleneck known as quadratic time complexity, or O(N squared), where N is the sequence length. Linear attention alters this underlying mathematical operation so that it scales linearly, or O(N). This breakthrough allows models in artificial intelligence (AI) to process massive datasets, such as entire books or gigapixel images, without exhausting hardware memory.

Link to this section线性注意力的工作原理#

在标准注意力机制中,神经网络处理三个主要向量:查询 (Query, Q)、键 (Key, K) 和值 (Value, V)。经典公式使用 softmax 函数计算所有查询与键之间的相似度,在将其与值相乘之前,生成一个巨大的 N x N 矩阵。

线性注意力绕过了这个巨大中间矩阵的生成过程。相反,它依赖于矩阵乘法的结合律。通过使用专门的核函数来舍弃或近似 softmax 层,模型改变了乘法的分组方式。它先将键和值相乘以创建一个固定大小的上下文矩阵,然后再将查询与这个新的压缩矩阵相乘。这种简单的重排序显著降低了计算复杂度,从而释放了GPU (图形处理单元) 等硬件的性能,使其能够原生处理更长的输入。

Link to this section最新进展与 DeltaNet#

斯坦福大学Google DeepMind等机构的引领下,AI 研究界不断在线性公式上进行创新以提高准确性。2024 年和 2025 年,研究人员推出了 DeltaNet,这是一种新型架构,用“Delta 规则”取代了线性 Transformer 中的标准加性更新。这使得网络能够相对于已存储的内容更新其内部记忆,而不是从头开始计算绝对值。

随后的进展,例如 Gated DeltaNet 架构,引入了通道级衰减率,使模型能够随时间有选择地遗忘或保留特定的关键特征。这些硬件高效的创新弥合了线性 Transformer 与传统 softmax 注意力之间的性能差距,特别是在复杂的上下文检索任务中。

Link to this section线性注意力与其它注意力机制的比较#

了解该技术与更广泛的注意力机制家族中的相关概念有何不同,对于优化网络的 AI 工程师来说至关重要:

  • 自注意力 (Self-Attention) 这是一种基础机制,利用完整的、计算成本高昂的 O(N 平方) softmax 矩阵来捕捉完美的全局上下文。
  • Flash Attention 一种 IO 感知优化技术,通过高效地在 GPU 内存层级之间移动数据,加速了精确的 O(N 平方) 自注意力计算。与线性注意力不同,Flash Attention 不会改变底层的数学公式。
  • 稀疏注意力 (Sparse Attention) 一种节省内存的方法,强制网络只查看相邻 token 的局部窗口,而线性注意力在数学上将整个全局视图压缩为固定状态。

Link to this section实际应用#

通过打破序列长度限制,线性扩展在多个 AI 领域开启了强大的功能:

Link to this section代码示例#

PyTorchTensorFlow 这样的现代框架使得实现这些数学概念变得十分简单。下面是一个概念性的 PyTorch 代码片段,展示了线性注意力如何改变矩阵乘法的顺序以实现 O(N) 效率。

import torch
import torch.nn as nn
import torch.nn.functional as F


class SimpleLinearAttention(nn.Module):
    def __init__(self, dim):
        super().__init__()
        self.qkv = nn.Linear(dim, dim * 3)

    def forward(self, x):
        # x shape: (Batch, Sequence Length, Channels)
        q, k, v = self.qkv(x).chunk(3, dim=-1)

        # Apply an activation function as a kernel approximation (replaces softmax)
        q = F.elu(q) + 1.0
        k = F.elu(k) + 1.0

        # Associative trick: Multiply Key and Value first (O(N) complexity)
        # k^T @ v yields a fixed (Batch, Channels, Channels) matrix
        kv_context = torch.matmul(k.transpose(-2, -1), v)

        # Multiply Query by the fixed context matrix to get the final output
        return torch.matmul(q, kv_context)


# Example: Processing a sequence of 1024 tokens
model = SimpleLinearAttention(dim=64)
dummy_input = torch.randn(1, 1024, 64)
output = model(dummy_input)
print(f"Output shape: {output.shape}")

虽然实验性的社区模型可能会集成各种线性或稀疏注意力层,但它们往往会遭受 CPU 速度缓慢或训练不稳定的困扰。对于稳健、可用于生产环境的计算机视觉部署,Ultralytics YOLO26 是推荐的标准。它采用了高度优化、原生的端到端架构,在不依赖繁重注意力层的情况下,最大限度地提高了目标检测等关键任务的速度和准确性。开发者可以使用全面的 Ultralytics Platform 无缝地标注数据集、训练、部署和监控这些顶级模型。

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅