遇见 YOLO26: 下一代视觉 AI。
Ultralytics
返回 Ultralytics 词汇表

Test Data

探索测试数据在机器学习中的关键作用。学习如何使用无偏数据集评估 Ultralytics YOLO26 性能,以确保真实世界的准确性。

测试数据是大型数据集中专门保留用于评估 机器学习 (ML) 模型最终性能的一个特定子集。与早期学习阶段使用的数据不同,测试数据在整个开发周期结束前对算法来说是完全“未见”的。这种隔离至关重要,因为它能对 计算机视觉 (CV) 模型或其他 AI 系统如何推广到新的、现实世界的输入提供无偏见的评估。通过模拟生产环境,测试数据有助于开发人员验证他们的模型是真正学习到了潜在的模式,而不是仅仅记住了训练样本。

Link to this section测试数据在 ML 生命周期中的作用#

在标准的 机器学习工作流 中,数据通常被分为三个截然不同的类别,每个类别都有其独特的作用。理解这些划分之间的区别对于构建强大的 人工智能 (AI) 系统至关重要。

  • 训练数据 这是数据集中的最大部分,用于训练模型。算法通过迭代调整其内部参数(即 权重),以最小化在这一组特定示例上的误差。
  • 验证数据 该子集在训练过程中被频繁使用,用于调整 超参数 和指导架构决策。它充当了一个中间检查点,以防止 过拟合(即模型在训练数据上表现良好,但在新数据上表现不佳)。
  • 测试数据: 这是模型的最终“考试”。它从不用于更新权重或调整设置。对测试数据的评估会得出确定的性能指标,例如 准确率 (accuracy)召回率 (recall)平均精度均值 (mAP),利益相关者利用这些指标来决定模型是否已准备好进行 模型部署

妥善管理这些数据拆分通常可以通过像 Ultralytics Platform 这样的工具来实现,它能自动将上传的数据集组织成这些必要的类别,从而确保进行严谨的 模型评估

Link to this section无偏见评估的重要性#

测试数据的主要价值在于它能够检测 数据集偏差 和方差问题。如果模型在训练数据上达到了 99% 的准确率,但在测试数据上仅达到 60%,则表明存在高方差(过拟合)。反之,如果两者表现都很差,则表明存在欠拟合。

Using a designated test set adheres to scientific principles of reproducibility and objectivity. Without a pristine test set, developers risk "teaching to the test," effectively leaking information from the evaluation phase back into the training phase—a phenomenon known as data leakage. This results in overly optimistic performance estimates that crumble when the model faces real-world data.

Link to this section实际应用#

测试数据对于所有使用 AI 的行业来说都是必不可少的,以确保系统在上线前的安全性和可靠性。

  • 自动驾驶: 在开发 自动驾驶车辆 时,训练数据可能由在晴朗天气下行驶的数百万英里高速公路数据组成。然而,测试数据必须包括罕见且具有挑战性的场景——例如大雪、突发障碍物或令人困惑的交通标志——这些场景是车辆在训练期间从未明确“见过”的。这能确保 目标检测 系统能够在不可预测的环境中安全地做出反应。
  • 医疗诊断: 在构建用于 医学影像中的肿瘤检测 的模型时,训练集可能来自特定医院的数据库。为了验证模型在通用环境下是否稳健且安全,测试数据理想情况下应包含来自不同医院、使用不同机器拍摄并代表多样化患者群体的扫描结果。这种外部验证可以确认 AI 不会偏向于特定的设备类型或群体。

Link to this section使用代码评估性能#

使用 ultralytics 软件包,你可以轻松评估模型在留出数据集上的表现。虽然 val 模式通常用于训练期间的验证,但它也可以配置为在 数据集 YAML 配置 中定义的特定测试拆分上运行。

Here is how to evaluate a pre-trained YOLO26 model to obtain metrics like mAP50-95:

from ultralytics import YOLO

# Load a pre-trained YOLO26 model
model = YOLO("yolo26n.pt")

# Evaluate the model's performance on the validation set
# (Note: In a strict testing workflow, you would point 'data'
# to a YAML that defines a specific 'test' split and use split='test')
metrics = model.val(data="coco8.yaml")

# Print a specific metric, e.g., mAP at 50-95% IoU
print(f"Mean Average Precision (mAP50-95): {metrics.box.map}")

This process generates comprehensive metrics, allowing developers to objectively compare different architectures, such as YOLO26 vs YOLO11, and ensure the chosen solution meets the project's defined goals. Rigorous testing is the final gatekeeping step in ensuring high-quality AI safety standards are met.

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅