Ultralytics YOLO26:以边缘计算为先的视觉 AI 新标准
了解 Ultralytics YOLO26 如何通过端到端、无 NMS 推理、更快的 CPU 性能和简化的生产部署为以边缘计算为先的视觉 AI 设定新标准。

今天,Ultralytics 正式发布了 YOLO26,这是迄今为止最先进、最易于部署的 YOLO 模型。YOLO26 最初在 YOLO Vision 2025 (YV25) 上发布,它代表了计算机视觉模型在现实系统中训练、部署和扩展方式的根本性转变。
视觉 AI 正在迅速向边缘迁移。图像和视频处理正越来越多地直接在设备、摄像头、机器人和嵌入式系统上完成,这些场景中延迟、可靠性和成本比原始云端算力更为重要。YOLO26 专为应对这一现实而设计,在 CPU、边缘加速器和低功耗硬件上运行时,依然能提供世界领先的性能。
尽管 YOLO26 实现了重大飞跃,但它依然保持了开发者所信赖的熟悉且精简的 Ultralytics YOLO 体验。它能无缝融入现有工作流,支持广泛的视觉任务,且易于使用,从而让研究团队和生产团队都能轻松采用。

图 1. 使用 Ultralytics YOLO26 进行目标检测的示例
在本文中,我们将深入解析你需要了解的关于 Ultralytics YOLO26 的一切,以及一个更轻、更小、更快的 YOLO 模型对视觉 AI 的未来意味着什么。让我们开始吧!
Link to this sectionUltralytics YOLO26 为视觉 AI 树立了新标准#
Ultralytics YOLO26 的核心理念是:让每个人都能轻松获得极具影响力的视觉 AI 能力。我们相信,强大的 计算机视觉 工具不应被锁定或仅限于少数组织使用。
在伦敦举行的 YV25 大会上,我们的创始人兼 CEO Glenn Jocher 分享了他对这一愿景的看法:“最令人惊叹的 AI 技术往往深藏在封闭的门后,并不开放。大公司掌控着新技术的发展,其他人只能排队等待访问权限。我们在 Ultralytics 有不同的愿景。我们希望 AI 能掌握在每个人手中。”
他还解释说,这意味着要将 AI 从云端带到现实世界环境中,并补充道:“我们不仅希望技术停留在云端,还希望将其引入边缘设备,比如你的手机、车辆和低功耗系统中。我们希望这些创造解决方案的杰出人才能够获得这些技术。”
YOLO26 实践了这一愿景:它是一个专为视觉 AI 实际部署环境设计的模型,而非仅仅为了方便原型设计。
Link to this section解析 Ultralytics YOLO26:顶尖的视觉模型#
与之前的 Ultralytics YOLO 模型一样,YOLO26 在一个统一的模型系列中支持多种计算机视觉任务。它提供五种尺寸:Nano (n)、Small (s)、Medium (m)、Large (l) 和 Extra Large (x),让团队能够根据部署限制平衡速度、准确性和模型大小。
除了灵活性之外,YOLO26 提高了性能门槛。 与 YOLO11 相比,YOLO26 nano 模型可提供高达 43% 的 CPU 推理速度提升,使其成为目前可用于边缘和基于 CPU 部署的最快高精度目标检测模型之一。
.webp)
图 2. Ultralytics YOLO26 是一款顶尖的视觉模型。
以下是 YOLO26 支持的 计算机视觉任务 的详细说明:
- 图像分类: YOLO26 可以分析整张图像并将其分配给特定类别,帮助系统理解场景的整体背景。
- 目标检测: 该模型可以查找并定位图像或视频中的多个目标。
- 实例分割: YOLO26 可以勾勒出具有像素级细节的独立对象。
- 姿态估计: 它可用于识别关键点并估计人物和其他对象的姿态。
- 旋转边界框 (OBB) 检测: YOLO26 可以检测不同角度的目标,这对于航空和卫星图像尤为有用。
- 目标追踪: 结合 Ultralytics Python 软件包,YOLO26 可用于在视频帧和实时流中追踪目标。
所有任务均在统一的框架内支持训练、验证、推理和导出。
Link to this sectionUltralytics YOLO26 背后的核心创新#
Ultralytics YOLO26 引入了多项核心创新,旨在提升推理速度、训练稳定性和部署简单性。以下是这些创新的概述:
- 移除分布焦点损失 (DFL): DFL 模块已被移除,以简化边界框预测,提高硬件兼容性,并使模型更易于导出并在边缘及低功耗设备上运行。
- 端到端无 NMS 推理: YOLO26 被设计为原生的端到端模型,直接输出最终预测结果,无需非极大值抑制 (NMS),从而降低了推理延迟并简化了部署复杂性。
- 渐进式损失平衡 + STAL: 这些改进的损失策略稳定了训练并提高了检测准确度,特别是针对难以检测的小目标。
- MuSGD 优化器: YOLO26 使用了一种全新的混合优化器,它融合了 SGD 和受 Muon 启发的优化技术,以实现更稳定的训练。
- 高达 43% 的 CPU 推理加速: 专为边缘计算进行了优化,YOLO26 可提供高达 43% 的 CPU 推理加速,使边缘设备实现实时性能。
接下来,我们将详细介绍这些使 YOLO26 更快、更高效且更易于部署的下一代特性。
Link to this section通过移除分布焦点损失 (DFL) 简化预测#
早期的 YOLO 模型在训练中使用分布焦点损失 (DFL) 来提高边界框精度。虽然有效,但 DFL 增加了复杂性,并施加了固定的回归限制,这使得导出和部署变得更具挑战性,尤其是在边缘和低功耗硬件上。
YOLO26 完全移除了 DFL。移除 DFL 消除了早期模型中存在的固定边界框回归限制,从而在检测超大目标时提高了可靠性和准确性。
通过简化边界框预测过程,YOLO26 变得更易于导出,并在各种边缘和低功耗设备上运行得更加稳定。
Link to this sectionUltralytics YOLO26 的端到端无 NMS 推理#
传统的 目标检测 流水线依赖非极大值抑制 (NMS) 作为后处理步骤来过滤重叠预测。尽管有效,但 NMS 增加了延迟、复杂性和不稳定性,特别是在跨多个运行时和硬件目标部署模型时。
YOLO26 引入了一种原生的端到端推理模式,模型直接输出最终预测结果,无需将 NMS 作为独立的后处理步骤。重复预测在网络内部即可被处理。
消除 NMS 降低了延迟,简化了部署流水线,并降低了集成错误的风险,这使得 YOLO26 特别适合实时和边缘部署。
Link to this section通过渐进式损失平衡 + STAL 增强识别能力#
训练方面的一项关键特性是引入了渐进式损失平衡 (ProgLoss) 和小目标感知标签分配 (STAL)。这些改进的损失函数有助于稳定训练并提高检测准确度。
ProgLoss 帮助模型在训练过程中保持更一致的学习,减少了不稳定因素,使其收敛更加平滑。同时,STAL 专注于改进模型对小目标的学习方式,由于视觉细节有限,这些目标通常较难检测。
ProgLoss 和 STAL 共同作用,实现了更可靠的检测,并显著改善了对小目标的识别效果。对于物联网 (IoT)、机器人技术和航空图像等边缘应用而言,这一点尤为重要,因为这些场景中的目标通常较小、距离较远或仅部分可见。
Link to this section使用 MuSGD 优化器实现更稳定的训练#
在 YOLO26 中,我们采用了名为 MuSGD 的新优化器,旨在使训练更加稳定高效。MuSGD 是一种混合方法,结合了传统随机梯度下降 (SGD) 的优势与受大型语言模型 (LLM) 训练中使用的 Muon 优化器启发的技巧。
得益于其简单性和强大的泛化能力,SGD 长久以来一直是计算机视觉领域的可靠选择。同时,LLM 训练的最新进展表明,如果应用得当,新的优化方法可以提高稳定性和速度。MuSGD 将其中的一些思想带入了计算机视觉领域。
受 Moonshot AI 的 Kimi K2 启发,MuSGD 结合了优化策略,帮助模型在训练过程中更平滑地收敛。这使得 YOLO26 能够更快地达到高性能表现,同时减少了训练不稳定性,尤其是在大型或更复杂的训练配置中。
MuSGD 帮助 YOLO26 在不同模型规模下进行更可预测的训练,从而兼顾了性能提升与训练稳定性。
Link to this sectionUltralytics YOLO26 可提供高达 43% 的 CPU 推理速度提升#
随着视觉 AI 不断向数据生成端靠拢,强大的边缘性能变得日益关键。YOLO26 专为边缘计算优化,CPU 推理速度提升高达 43%,确保了在无 GPU 设备上的实时性能。这一改进使响应灵敏且可靠的视觉系统能够直接在摄像头、机器人和嵌入式硬件上运行,这些场景下延迟、效率和成本约束决定了系统的可行性。
Link to this sectionUltralytics YOLO26 支持的改进型计算机视觉任务#
除了使目标检测更准确的架构改进外,YOLO26 还包含了旨在提升计算机视觉任务性能的任务特定优化。例如,它通过定向更新增强了实例分割、姿态估计和旋转边界框检测,从而提升了准确性和可靠性。
以下是这些优化的概述:
- 实例分割: YOLO26 使用语义分割损失来改善模型在训练过程中的学习方式,这导致了更准确且一致的实例掩码。升级后的 proto 模块还使得利用来自多个尺度的信息成为可能,因此模型能更有效地处理不同大小的目标,即使在复杂场景中也是如此。
- 姿态估计: 通过集成残差对数似然估计 (RLE)(一种为关键点预测中的不确定性建模的技术)并改进解码过程,YOLO26 提供了更准确的关键点并具有更好的实时性能。
- 旋转边界框检测: YOLO26 引入了一种专门的角度损失,帮助模型更准确地学习目标旋转,特别是对于方向可能模糊的方形目标。优化后的 OBB 解码还减少了旋转边界附近角度预测的突变,从而产生了更稳定且一致的方位估计。

图 3. 使用 Ultralytics YOLO26 进行实例分割。
Link to this sectionUltralytics YOLOE-26:基于 YOLO26 构建的开放词汇分割模型#
Ultralytics 还推出了 YOLOE-26,这是一个基于 YOLO26 架构和训练创新的全新开放词汇分割模型系列。
YOLOE-26 并非一项新任务或新特性,而是一个专门的模型系列,它重用了现有的分割任务,同时启用了文本提示、视觉提示和免提示推理。YOLOE-26 在所有标准 YOLO 尺寸下均可用,比早期的开放词汇分割模型提供了更强的准确性和更可靠的现实世界性能。
Link to this sectionUltralytics YOLO26 专为视觉 AI 的实际运行环境而设计#
从视觉驱动的摄像头到由计算机视觉驱动的机器人,再到边缘处的微小处理芯片,计算机视觉和 AI 正直接在设备上部署以进行实时推理。Ultralytics YOLO26 正是为这些环境构建的,在这些环境中,低延迟、效率和可靠的性能至关重要。
在实际应用中,这意味着 YOLO26 可以轻松跨多种硬件进行部署。具体而言,通过 Ultralytics Python 软件包及其广泛的 集成支持,模型可以导出为针对不同平台和硬件加速器优化的格式。
例如,导出至 TensorRT 可在 NVIDIA GPU 上实现高性能推理,CoreML 支持在 Apple 设备上进行原生部署,而 OpenVINO 则优化了 Intel 硬件上的性能。YOLO26 还可以导出至多种专用边缘加速器上运行,从而在专业的边缘 AI 硬件上实现高吞吐量、高能效的推理。
这些只是几个示例,在边缘和生产环境中还有更多集成支持。这种灵活性使得单一的 YOLO26 模型能够跨多种部署目标运行。它简化了生产工作流,并将视觉 AI 带到了边缘。
Link to this section重新定义各行业的计算机视觉用例#
YOLO26 专为现实部署而设计,可用于各行业的广泛计算机视觉用例。以下是它的一些应用场景:
-
机器人技术:YOLO26 可用于导航、障碍物检测和目标交互等任务。这些能力支持机器人在动态环境中的安全高效运行。
-
制造业: 在生产线上,YOLO26 可以分析图像和视频以识别缺陷、缺失组件或工艺问题。在设备上处理数据可保持检测速度,并减少对云系统的依赖。
-
航空和无人机应用:当部署在无人机上时,YOLO26 可以在飞行过程中处理航空图像,用于检查、测绘和勘测。这使得实时分析场景成为可能,即使在偏远地区。
-
嵌入式和物联网系统:凭借轻量级设计,YOLO26 可以在低功耗、嵌入式硬件上运行,以在本地处理视觉数据。常见的用例包括智能摄像头、连接传感器和自动化监控设备。
-
智慧城市:在城市环境中,YOLO26 可以分析来自交通和公共空间摄像头的视频流。这使得边缘端的交通监控、公共安全和基础设施管理等应用成为可能。

图 4. YOLO26 可用于多种计算机视觉应用。
Link to this section开始使用 Ultralytics YOLO26#
根据构建和部署视觉 AI 的方式,你可以通过两种互补的工作流来使用 Ultralytics YOLO26。
选项 1: 通过 Ultralytics 平台使用 Ultralytics YOLO26(推荐)
Ultralytics 平台提供了一种中心化的方式来在生产环境中训练、部署和监控 YOLO26 模型。它将数据集、实验和部署集中在一处,使得大规模管理视觉 AI 工作流变得更加容易,特别是对于部署到边缘和生产环境的团队。
通过该平台,用户可以:
- 访问 YOLO26 模型
- 在自定义数据集上进行训练和微调
- 导出模型用于边缘和生产部署
- 在统一工作流中监控实验和已部署的模型
👉 在 Ultralytics 平台上探索 YOLO26:platform.ultralytics.com/ultralytics/yolo26
选项 2: 通过开源工作流使用 Ultralytics YOLO26
YOLO26 依然可以通过 Ultralytics 的开源生态系统完全访问,并可与现有的基于 Python 的工作流配合使用,用于训练、推理和导出。
开发者可以安装 Ultralytics 软件包,加载预训练的 YOLO26 模型,并使用熟悉的工具和格式(如 ONNX、TensorRT、CoreML 或 OpenVINO)进行部署。
pip install ultralyticsfrom ultralytics import YOLO
# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")
# Run inference with the YOLO26n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")对于喜欢亲自动手控制或自定义流水线的用户,完整的文档和指南 可在 Ultralytics 文档中找到。
Link to this sectionUltralytics YOLO26:为计算机视觉的未来而生#
Ultralytics YOLO26 旨在满足未来视觉 AI 解决方案的需求,即模型必须具备快速、高效的特性,并能轻松在真实硬件上部署。通过提升性能、简化部署并扩展模型能力,YOLO26 自然地适用于广泛的现实应用。YOLO26 为视觉 AI 的构建、部署和扩展设定了新的基准。我们非常期待看到社区如何利用它来交付现实世界的计算机视觉系统。
加入我们日益壮大的社区,并探索我们的 GitHub 仓库以获取实践 AI 资源。要立即构建视觉 AI,请探索我们的许可选项。通过访问我们的解决方案页面,了解农业中的 AI 如何变革农业,以及机器人中的视觉 AI 如何塑造未来。






