遇见 YOLO26: 下一代视觉 AI。
Ultralytics
返回 Ultralytics 词汇表

Flash Attention

探索 Flash Attention 如何优化内存并加速 Transformer 模型。了解它如何增强计算机视觉,以及为什么 Ultralytics YOLO26 是首选。

Flash Attention 是一种高度优化的算法,旨在通过更高效地管理内存访问,加速 Transformer 模型的训练和推理。在现代 深度学习 (DL) 中,特别是在处理大模型时,主要的瓶颈通常不是处理器的计算速度,而是数据在内存存储和计算单元之间传输所花费的时间。Flash Attention 通过重组 注意力机制 处理数据的方式来解决这一“内存墙”问题,从而在不牺牲 准确率 的前提下实现更快的性能和更低的内存使用量。

Link to this sectionFlash Attention 的工作原理#

要理解 Flash Attention,了解 GPU (图形处理单元) 的架构会有所帮助。GPU 具有高容量但速度较慢的高带宽内存 (HBM),以及低容量但速度极快的片上 SRAM。标准的注意力实现会反复地将大型矩阵读写到缓慢的 HBM 中,从而产生积压。

Flash Attention 使用一种称为“分块 (tiling)”的技术,将大型注意力矩阵分解为可以完全放入快速 SRAM 中的小块。通过将这些块保留在快速内存中并在写回结果之前进行更多计算,该算法显著减少了对 HBM 的读写操作次数。这项由 斯坦福大学 研究人员引入的创新使该过程具有了“IO 感知”,意味着它显式地考虑了数据移动的成本。你可以在 原始研究论文 中探索技术细节。

Link to this section与相关术语的区别#

将 Flash Attention 与 人工智能 (AI) 词汇表中的类似概念区分开来非常重要:

  • 标准注意力 计算完整注意力矩阵的传统实现。它在输出上与 Flash Attention 在数学上是相同的,但通常速度较慢且内存密集,因为它没有优化内存 IO。
  • Flash Attention 标准注意力的精确优化版本。它不进行近似;它提供完全相同的数值结果,只是速度显著加快。
  • 稀疏注意力 一种通过忽略某些连接来节省计算能力的近似技术。与 Flash Attention 不同,稀疏注意力方法 以牺牲部分精度来换取速度。

Link to this section在计算机视觉和 YOLO 中的相关性#

虽然 Flash Attention 最初是为了处理长文本序列的 自然语言处理 (NLP) 而开发的,但它在 计算机视觉 (CV) 中已变得至关重要。当由 视觉 Transformer (ViT) 处理时,高分辨率图像会产生海量的数据序列。

这项技术影响了目标检测器的开发。例如,一些实验性模型(如社区驱动的 YOLO12)引入了利用这些原则的注意力层。然而,纯基于注意力的架构可能会遭受训练不稳定和 CPU 速度缓慢的困扰。对于大多数专业应用,Ultralytics YOLO26 是推荐标准。YOLO26 利用了高度优化的架构,在端到端 目标检测图像分割 之间平衡了速度和准确性,避免了在边缘设备上使用沉重注意力层通常带来的开销。

Link to this section实际应用#

Flash Attention 带来的效率提升使那些以前因成本过高或速度过慢而无法运行的应用成为可能。

  1. Long-Context Generative AI: In the world of Large Language Models (LLMs) like GPT-4, Flash Attention allows the model to "remember" vast amounts of information. This enables a massive context window, allowing users to upload entire books or legal codebases for text summarization without the model crashing due to memory limits.

  2. 高分辨率医学诊断:医学图像分析 中,细节至关重要。病理学家需要分析组织样本的千兆像素扫描图。Flash Attention 允许模型以原生分辨率处理这些海量图像,从而识别出早期 脑肿瘤 等微小异常,而无需缩小图像导致丢失重要数据。

Link to this section代码示例#

虽然 Flash Attention 通常是像 PyTorch 等库内部的优化手段,但你可以通过 Ultralytics 轻松利用基于注意力的模型。以下代码片段展示了如何加载使用注意力机制的 RT-DETR 模型,并对图像执行推理。

from ultralytics import RTDETR

# Load a pre-trained RT-DETR model which utilizes transformer attention
model = RTDETR("rtdetr-l.pt")

# Perform inference on an image to detect objects
results = model("https://ultralytics.com/images/bus.jpg")

# Display the number of detected objects
print(f"Detected {len(results[0].boxes)} objects.")

使用像 Ultralytics Platform 这样的工具,开发者无需手动实现复杂的 GPU 内核即可训练和部署这些复杂的模型。该平台处理基础设施问题,使团队能够专注于策划高质量数据集和解读结果。

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅