词汇表

Longformer

了解 Longformer，它是专为长序列优化的transformer 模型，可为 NLP、基因组学和视频分析提供可扩展的效率。

长变压器是一种改进型 Transformer架构设计用于高效处理长序列数据，克服了传统模型（如......）的输入长度限制。如 BERT 等传统模型的输入长度限制。虽然标准转换器功能强大，但其内存使用量与序列长度成二次方关系，因此对于长度超过几百个单词的文档来说，计算成本非常昂贵。Longformer 采用了一种稀疏关注机制来解决这个问题。线性扩展的稀疏关注机制来解决这一问题，使其能够处理由数千个标记组成的文档。这一功能使它成为现代自然语言处理（NLP）任务的基石技术，例如分析法律合同、总结书籍或处理基因组数据。

结构：稀疏关注

Longformer 背后的关键创新点在于，它不同于标准深度学习（DL）模型中使用的完全自我关注（self-attention）。深度学习 (DL)模型中使用的完全自我关注。在传统设置中每个令牌都会关注其他令牌，从而形成密集的连接网络，迅速耗尽内存。Longformer 用一种更高效、更稀疏的方法取而代之，既能保持高性能，又能降低计算复杂性。

注意推拉窗受卷积神经网络（CNN）局部连接性的启发卷积神经网络（CNN）的启发，Longformer 使用了一个滑动窗口，其中每个标记只关注其近邻。这就捕捉到了对理解语法和句子结构至关重要的局部语境。
全球关注：为了理解文件的大背景，指定特定的标记符来关注整个序列。这样，模型就能执行以下任务问题解答或分类等任务。聚合整个输入的信息，缩小局部细节与全局理解之间的差距。理解。

这种混合机制允许研究人员在标准硬件上处理多达 4,096 个令牌或更多令牌的序列、大大扩展了可用于分析的上下文窗口用于分析的上下文窗口。

实际应用

无需截断就能分析长序列的能力为数据连续性至关重要的各个领域带来了新的可能性。连续性至关重要。

法律和财务摘要：专业人士经常需要从冗长的协议或年度报告中提取深刻见解。Longformer 提供先进的文本摘要工具，可以一次性消化整份文件，确保合同末尾的关键条款与导言一起得到考虑。导言。
基因组研究：在生物信息学领域，科学家们分析 DNA 序列极长的生物文本字符串。Longformer 通过对遗传密码固有的长程依赖关系建模，帮助识别基因功能和预测蛋白质结构。通过对遗传密码中固有的长程依赖关系建模，Longformer 可帮助识别基因功能和预测蛋白质结构。标准大型语言模型 (LLM) 难以完成的任务。

区分长方体与相关概念

将 Longformer 与其他架构进行比较，有助于为特定的人工智能（AI）项目选择合适的工具。人工智能（AI）项目选择合适的工具。

Transformer原始架构提供了完整的连接性（$O(n^2)$），是短句的理想选择，但对于长句的输入就会变得内存不足。长输入则会占用内存。Longformer 与此近似，复杂度为 $O(n)$。
Reformer与 Longformer 一样，Reformer 的目标是提高效率，但使用位置敏感散列（LSH）来分组同类标记和可逆残余层。对于需要严格定义局部上下文（相邻词语）的任务，Longformer 通常是首选。而当内存成为绝对瓶颈时，Reformer 则非常有用。
Transformer：该模型通过递归方式处理长度，保留对过去片段的记忆。Longformer 同时处理整个长序列，这对于非自回归任务（如文档分类）非常有利。

高效推理示例

正如 Longformer 优化了文本处理的速度和内存一样，现代视觉模型也优化了图像处理。下面的下面的示例使用 Ultralytics YOLO11来演示高效推理。这与使用优化架构处理复杂数据输入而不使硬件资源超载的概念相似。过载的硬件资源。

from ultralytics import YOLO

# Load a YOLO11 model, optimized for efficiency similar to Longformer's design goals
model = YOLO("yolo11n.pt")

# Perform inference on an image URL
# The model processes the input effectively in a single pass
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Output the detection summary
for result in results:
    print(f"Detected {len(result.boxes)} objects.")

通过减少处理大量输入所需的内存占用，Longformer 使开发人员能够构建更复杂的人工智能代理和分析工具。人工智能代理和分析工具。这种向向线性可扩展性的转变对于未来的模型部署至关重要，可确保强大的人工智能保持可访问性和高效性。

Longformer

培训Ultralytics YOLO 模型，以简化各行业的工作流程

灵活的企业许可解决方案，助力您的创新

使用Ultralytics YOLO在数秒内训练人工智能模型

结构：稀疏关注

实际应用

区分长方体与相关概念

高效推理示例

阅读更多此类别的内容

自监督学习在去噪中的应用：分步解析

未来物体检测趋势：需要关注的 7 个关键问题

利用Ultralytics YOLO 模型增强车辆再识别能力

加入Ultralytics 社区