将 Ultralytics YOLO11 与之前的 YOLO 模型进行比较
对比 Ultralytics YOLOv8、YOLOv9、YOLOv10 和 Ultralytics YOLO11,了解这些模型从 2023 年到 2025 年的演进与改进。

从自动化日常任务到助力实时做出明智决策,人工智能 (AI) 正在重塑各行各业的未来。人工智能领域中一个特别令人着迷的方向是 计算机视觉,也就是视觉 AI。它致力于使机器能够像人类一样分析和解读视觉数据。
具体来说,计算机视觉模型 正在推动增强安全性和效率的创新。例如,这些模型被用于自动驾驶汽车以检测行人,并被用于安防摄像头进行全天候的场所监控。
最广为人知的计算机视觉模型之一就是 YOLO (You Only Look Once) 模型,它以其实时目标检测能力而闻名。随着时间的推移,YOLO 模型不断改进,每一个新版本都提供了更好的性能和更强的灵活性。
像 Ultralytics YOLO11 这样的较新版本,能够处理实例分割、图像分类、姿态估计和多目标跟踪等多种任务,并且在准确性、速度和精度上都达到了前所未有的高度。
在本文中,我们将对比 Ultralytics YOLOv8、YOLOv9、YOLOv10 和 Ultralytics YOLO11,以便更好地了解这些模型是如何演进的。我们将分析它们的核心功能、基准测试结果以及性能差异。让我们开始吧!
Link to this sectionUltralytics YOLOv8 概述#
YOLOv8 由 Ultralytics 于 2023 年 1 月 10 日发布,与之前的 YOLO 模型相比,它迈出了重要的一步。它针对实时且准确的检测进行了优化,结合了经过充分验证的方法与创新更新,从而带来了更好的结果。
除了 目标检测 之外,它还支持以下计算机视觉任务:实例分割、姿态估计、旋转边界框 (OBB) 目标检测和图像分类。YOLOv8 的另一个重要特性是它提供了五种不同的模型变体——Nano、Small、Medium、Large 和 X——因此你可以根据自身需求在速度和准确性之间选择最合适的平衡点。
凭借其多功能性和强大的性能,YOLOv8 可以应用于许多现实场景中,如安防系统、智慧城市、医疗保健和工业自动化。

图 1。使用 YOLOv8 的智慧城市停车管理。
Link to this sectionYOLOv8 的关键特性#
以下是 YOLOv8 其他一些关键特性的详细介绍:
- 增强的检测架构:YOLOv8 使用了改进的 CSPDarknet 主干网络。该主干网络针对特征提取进行了优化,即识别并捕获输入图像中关键模式或细节的过程,这有助于模型做出准确的预测。
- 检测头:它采用了 无锚点 的解耦设计,这意味着它不依赖预设的边界框形状(锚点),而是直接学习预测目标的位置。由于采用了解耦设置,识别目标类别和预测目标位置(回归)的任务是分别处理的,这有助于提高准确性并加快训练速度。
- 准确性与速度的平衡:该模型在实现令人印象深刻的准确性的同时,保持了快速的推理时间,使其适用于云端和边缘计算环境。
- 用户友好:YOLOv8 的设计旨在让你轻松上手——使用 Ultralytics Python 软件包,你可以在几分钟内开始预测并查看结果。
Link to this sectionYOLOv9 专注于计算效率#
YOLOv9 由台湾中央研究院信息科学研究所的 Chien-Yao Wang 和 Hong-Yuan Mark Liao 于 2024 年 2 月 21 日发布。它支持目标检测和 实例分割 等任务。
该模型基于 Ultralytics YOLOv5 构建,并引入了两大创新:可编程梯度信息 (PGI) 和广义高效层聚合网络 (GELAN)。
PGI 帮助 YOLOv9 在数据通过网络层时保留关键信息,从而产生更准确的结果。同时,GELAN 改进了模型利用其层级的方式,提升了性能和计算效率。得益于这些升级,YOLOv9 可以在计算资源通常受限的边缘设备和移动应用上执行实时任务。

图 2。了解 GELAN 如何提高 YOLOv9 的准确性。
Link to this sectionYOLOv9 的关键特性#
以下是 YOLOv9 其他一些关键特性的简介:
- 高精度与高效率:YOLOv9 提供了高检测准确度且不消耗大量计算资源,使其成为资源受限情况下的理想选择。
- 轻量化模型:YOLOv9 的轻量化模型变体专为边缘和移动端部署而优化。
- 易于使用:YOLOv9 由 Ultralytics Python 软件包支持,因此无论你使用代码还是命令行,都能在不同环境中轻松设置和运行。
Link to this sectionYOLOv10 实现了无需 NMS 的目标检测#
YOLOv10 由清华大学研究人员于 2024 年 5 月 23 日推出,专注于实时目标检测。它通过消除对非极大值抑制 (NMS) 的需求(这是一种用于消除重复检测的后处理步骤)并改进整体模型设计,解决了早期 YOLO 版本中的局限性。这使得目标检测更快、更高效,同时仍然实现了行业领先的准确度。
实现这一点的关键部分是一种称为“一致性双标签分配”的训练方法。它结合了两种策略:一种允许对同一个目标进行多个预测学习(一对多),另一种专注于选择最佳的单一预测(一对一)。由于这两种策略遵循相同的匹配规则,模型能够自行学会避免重复,因此不再需要 NMS。

图 3。YOLOv10 使用一致性双标签分配进行免 NMS 训练。
YOLOv10 的架构还使用了改进的 CSPNet 主干网络来更有效地学习特征,并使用 PAN (Path Aggregation Network) 颈部结构结合来自不同层的信息,使其在检测小物体和大物体方面表现更好。这些改进使得 YOLOv10 能够应用于制造业、零售业和自动驾驶等现实场景。
Link to this sectionYOLOv10 的关键特性#
以下是 YOLOv10 的一些其他突出特性:
-
大核卷积:该模型使用大核卷积来捕获图像中更广阔区域的更多上下文信息,帮助它更好地理解整体场景。
-
部分自注意力模块:模型集成了部分自注意力模块,以便在不消耗过多计算资源的情况下专注于图像中最重要的部分,从而高效地提升性能。
-
独特的模型变体:除了常规的 YOLOv10 尺寸(Nano、Small、Medium、Large 和 X)外,还有一个名为 YOLOv10b (Balanced) 的特殊版本。它是一个更宽的模型,意味着它在每一层处理更多的特征,这有助于在平衡速度和尺寸的同时提高准确性。
-
用户友好:YOLOv10 与 Ultralytics Python 软件包兼容,使用起来非常方便。
Link to this sectionUltralytics YOLO11:提升速度与准确性#
今年 9 月 30 日,Ultralytics 在其年度混合活动 YOLO Vision 2024 (YV24) 上正式发布了 YOLO11——YOLO 系列的最新模型之一。
此次发布相比以往版本有了显著改进。YOLO11 更快、更准确且非常高效。它支持 YOLOv8 用户所熟悉的全部 计算机视觉任务,包括目标检测、实例分割和图像分类。它还保持了与 YOLOv8 工作流的兼容性,使用户能够平滑过渡到新版本。
除此之外,YOLO11 的设计旨在满足广泛的计算需求——从轻量级边缘设备到强大的云系统。该模型提供开源版和企业版,使其能够适应不同的使用场景。
它是医疗影像和卫星检测等高精度任务的绝佳选择,同时也适用于自动驾驶车辆、农业和医疗保健等更广泛的应用领域。

图 4。使用 Ultralytics YOLO11 进行流量检测、计数和跟踪。
Link to this sectionYOLO11 的关键特性#
以下是 YOLO11 的一些其他独特特性:
- 快速且高效的检测:YOLO11 拥有专为最小延迟设计的检测头,专注于在最终预测层实现速度提升,且不会影响性能。
- 改进的特征提取:经过优化的主干网络和颈部架构增强了特征提取能力,从而带来更精确的预测。
- 跨平台无缝部署:YOLO11 经过优化,可在边缘设备、云平台和 NVIDIA GPU 上高效运行,确保了在不同环境下的适应性。
Link to this section在 COCO 数据集上对 YOLO 模型进行基准测试#
在探索不同模型时,仅凭查看其功能并不总是容易进行 比较。这就是基准测试的意义所在。通过在相同的数据集上运行所有模型,我们可以客观地衡量和比较它们的性能。让我们看看每个模型在 COCO 数据集 上的表现如何。
在比较 YOLO 模型时,每一个新版本在准确性、速度和灵活性方面都带来了显著的改进。特别是 YOLO11m,它迈出了重要的一步,其参数量比 YOLOv8m 少 22%,这意味着它更轻量且运行速度更快。此外,尽管尺寸更小,它在 COCO 数据集上却实现了更高的平均精度均值 (mAP)。该指标衡量了模型检测和定位目标的水平,因此更高的 mAP 意味着更准确的预测。

图 5。在 COCO 数据集上对 YOLO11 和其他 YOLO 模型进行基准测试。
Link to this section在视频上测试和比较 YOLO 模型#
让我们探索这些模型在现实情况下的表现。
为了比较 YOLOv8, YOLOv9, YOLOv10 和 YOLO11,所有四个模型都在同一段交通视频上进行了运行,使用了 0.3 的置信度分数(只有当模型至少有 30% 的把握正确识别出目标时才会显示检测结果)和 640 的图像尺寸以确保公平评估。目标检测和跟踪结果凸显了在检测准确性、速度和精度方面的关键差异。
从第一帧开始,YOLO11 就识别出了 YOLOv10 错过的卡车等大型车辆。YOLOv8 和 YOLOv9 表现不错,但会根据光照条件和目标尺寸而有所波动。较小且遥远的车辆对所有模型来说都是一个挑战,尽管 YOLO11 在这些检测方面也表现出了明显的改进。

图 6。比较 YOLOv8、YOLOv9、YOLOv10 和 YOLO11。
在速度方面,所有模型每帧的运行时间都在 10 到 20 毫秒之间,足以以超过 50 FPS 的速度处理实时任务。一方面,YOLOv8 和 YOLOv9 在整个视频中提供了稳定且可靠的检测结果。有趣的是,专为低延迟设计的 YOLOv10 虽然速度更快,但在检测某些类型的目标时表现出了一些不一致。
另一方面,YOLO11 因其精度而脱颖而出,在速度和 准确性 之间实现了极佳的平衡。虽然没有任何模型在每一帧的表现都完美无缺,但并排比较清楚地表明,YOLO11 提供了最佳的整体性能。
Link to this section哪种 YOLO 模型最适合计算机视觉任务?#
为项目选择模型取决于其具体需求。例如,有些应用可能优先考虑速度,而另一些则可能需要更高的准确性,或者面临影响决策的部署约束。
另一个重要因素是你需要解决的计算机视觉任务类型。如果你正在寻求不同任务间的广泛灵活性,YOLOv8 和 YOLO11 都是不错的选择。
你选择 YOLOv8 还是 YOLO11,实际上取决于你的需求。如果你是计算机视觉的新手,并且看重更大的社区、更多的教程以及丰富的 第三方集成,那么 YOLOv8 是一个可靠的选择。
另一方面,如果你正在追求具有更好准确性和速度的前沿性能,那么 YOLO11 是更好的选择,尽管由于它是较新的版本,其社区规模较小且集成支持较少。
Link to this section关键要点#
从 Ultralytics YOLOv8 到 Ultralytics YOLO11,YOLO 模型系列的演进反映了向更智能的计算机视觉模型不断迈进的趋势。每一个版本的 YOLO 在速度、准确性和精度方面都带来了实质性的升级。
随着计算机视觉的不断进步,这些模型为从目标检测到自动驾驶系统等现实挑战提供了可靠的解决方案。YOLO 模型的持续发展展示了该领域的巨大进步,我们有理由在未来期待更多成果。
要了解更多关于 AI 的信息,请访问我们的 GitHub 存储库 并参与 我们的社区。探索各行业的进步,从 制造业中的视觉 AI 到 医疗保健中的计算机视觉。查看我们的 许可选项 以立即开始你的视觉 AI 项目。






