遇见 YOLO26: 下一代视觉 AI。
Ultralytics
返回 Ultralytics 词汇表

Benchmark Dataset

探索基准数据集(benchmark datasets)在评估 AI 中的作用。了解 Ultralytics YOLO26 如何为计算机视觉任务设定准确性和速度的新标准。

基准数据集(Benchmark Dataset)是一个标准化的、高质量的数据集合,旨在以公正、可复现且客观的方式评估机器学习 (ML) 模型的性能。与用于内部测试的专有数据不同,基准数据集充当了研究与开发界的公共“衡量标准”。通过在完全相同的输入上测试不同的算法并利用统一的评估指标,开发者能够准确判断哪些模型在准确性、速度或效率方面表现更优。这些数据集对于追踪计算机视觉 (CV) 和自然语言处理等领域的科学进步至关重要。

Link to this section标准化的重要性#

在快速发展的人工智能 (AI) 领域,如果没有一个共同的参考点,声称一个新模型“更快”或“更准确”实际上毫无意义。基准数据集提供了这一必要的共同基础。它们通常经过精心策划,以代表特定的挑战,例如检测小目标、处理遮挡或应对恶劣光照条件。

诸如 ImageNet 大规模视觉识别挑战赛 等重大竞赛,都依赖这些数据集来促进良性竞争与创新。这种标准化确保了模型架构 的改进代表了技术的真正进步,而不是仅仅基于更简单、非标准或精挑细选的数据进行测试的结果。此外,使用成熟的基准测试有助于研究人员识别潜在的数据集偏差,确保模型能够很好地泛化到各种真实场景中。

Link to this section区分基准测试与其他数据切分#

区分基准数据集与标准模型开发生命周期中使用的其他数据切分至关重要。虽然它们有相似之处,但各自的角色截然不同:

  • 训练数据:用于训练模型的材料。算法根据这些数据调整其内部权重。
  • 验证数据:在训练期间用于调整超参数并防止过拟合的子集。它作为初步检查,但不代表最终得分。
  • 测试数据:用于在发布前检查性能的内部数据集。
  • 基准数据集: 一个被普遍接受的外部测试集。虽然基准测试充当了测试数据,但其主要区别在于它作为模型比较的公共标准。

Link to this section实际应用#

基准数据集通过建立严格的安全与可靠性标准,定义了各行各业的成功指标。它们使组织能够验证模型是否已准备好在关键环境中进行部署。

Link to this section通用视觉中的目标检测#

目标检测中最著名的例子是 COCO (Common Objects in Context) 数据集。当 Ultralytics 发布像 YOLO26 这样的新架构时,其性能会根据 COCO 进行严格的基准测试,以验证平均精度均值 (mAP) 的改进情况。这使研究人员能够准确了解 YOLO26 在识别行人、自行车和动物等日常物体方面,与 YOLO11 或其他最先进模型相比表现如何。

Link to this section自动驾驶安全#

在汽车行业,安全至关重要。自动驾驶汽车的开发者利用专门的基准测试,如 KITTI Vision Benchmark SuiteWaymo Open Dataset。这些数据集包含城市驾驶环境的复杂标注记录,包括行人、骑行者和交通标志。通过根据这些基准评估感知系统,工程师可以量化其系统在真实交通场景中的鲁棒性,从而确保 AI 对动态危险做出正确的反应。

Link to this section使用 Ultralytics 进行基准测试#

为了促进准确的比较,Ultralytics 提供了内置工具,用于跨不同导出格式(例如 ONNXTensorRT)对模型进行基准测试。这有助于用户针对其特定硬件识别推理延迟与准确性之间的最佳平衡点,无论是在边缘设备还是云服务器上进行部署。

以下示例演示了如何使用 Python API 对 YOLO26 模型进行基准测试。此过程将评估模型在标准数据集配置下的速度和准确性。

from ultralytics import YOLO

# Load the official YOLO26 nano model
model = YOLO("yolo26n.pt")

# Run benchmarks to evaluate performance across different formats
# This checks speed and accuracy (mAP) on the COCO8 dataset
results = model.benchmark(data="coco8.yaml", imgsz=640, half=False)

Link to this section挑战与注意事项#

虽然基准测试必不可少,但它们并非完美无缺。如果研究人员为了在基准测试中获得高分而专门优化模型,却以牺牲对未见数据的泛化能力为代价,就会出现所谓的“为了考试而教学”的现象。此外,随着现实世界条件的变化,静态基准可能会过时。对数据集的持续更新(例如 Objects365 项目或 Google Open Images 中的更新)有助于通过增加多样性和规模来缓解这些问题。希望管理自己的数据集以进行定制基准测试的用户,可以利用 Ultralytics Platform 来实现高效的数据获取与评估。

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅