敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024
词汇表

数据标注

探索数据标注在机器学习中的关键作用、流程、挑战以及在人工智能开发中的实际应用。

数据标注是识别原始数据(例如图像、文本文件或视频)并添加一个或多个信息性标签或注释以提供上下文的过程,从而使机器学习模型能够从中学习。此过程是监督学习的基础,其中带标签的数据集充当“真实数据”,算法使用该数据来训练自己,从而对新的、未标记的数据进行准确的预测。高质量的数据标注是构建强大的AI模型中最关键和最耗时的步骤之一,因为模型的性能直接取决于它所学习的标签的质量和准确性。

为什么数据标注如此重要?

数据标注为模型理解和解释世界提供了必要的基础。在计算机视觉(CV)中,标签教导模型识别对象是什么以及它在图像中的位置。如果没有准确的标签,模型将无法学习执行其任务所需的模式,从而导致准确率低和不可靠。训练数据的质量(通过标注创建)直接决定了结果AI的质量。这个原则通常概括为“垃圾进,垃圾出”。诸如COCOImageNet之类的良好标注的基准数据集在推动计算机视觉领域的最新技术发展方面发挥了重要作用。

计算机视觉中的数据标注类型

不同的计算机视觉任务需要不同类型的标注。最常见的方法包括:

  • 图像分类: 最简单的形式,其中为整个图像分配一个标签以描述其内容(例如,“猫”、“狗”)。您可以探索此任务的数据集,例如 CIFAR-100
  • 目标检测: 指在图像中每个感兴趣的对象周围绘制边界框,并为其分配一个类别标签。这告诉模型对象是什么以及它在哪里。
  • 图像分割: 一种更精细的方法,涉及在像素级别勾勒出物体的精确形状。这可以进一步分为 语义分割(其中同一类的所有对象共享一个掩码)和 实例分割(其中每个单独的对象实例被单独分割)。
  • 姿态估计(Pose Estimation):此技术通过标注关键点来识别物体的位置和方向。例如,在人体姿态估计中,关键点将标记肘部、膝盖和手腕等关节。COCO 关键点数据集(COCO Keypoints dataset)是此任务的常用资源。

实际应用

  1. 自动驾驶车辆: 数据标注对于训练自动驾驶汽车的感知系统至关重要。人工标注员会一丝不苟地标注数百万张图像和视频帧,在汽车、行人和骑自行车的人周围绘制边界框,分割车道标记并对交通标志进行分类。这种丰富的、带标签的数据使 Ultralytics YOLO11 等模型能够学习安全地在复杂的城市环境中导航。Waymo 等公司所做的工作在很大程度上依赖于庞大的、准确标注的数据集。您可以在我们的汽车解决方案中的人工智能页面上了解有关该领域的更多信息。
  2. 医学图像分析:医疗保健领域AI中,放射科医生和医学专家标记MRI、CT和X光片等扫描图像,以识别肿瘤、病变和其他异常情况。例如,在脑肿瘤数据集上,专家将勾勒出肿瘤的确切边界。此标记数据用于训练可以协助早期诊断的模型,从而可能减少医疗专业人员的工作量并改善患者的治疗效果。北美放射学会 (RSNA)积极探索AI在医学诊断中的作用。

数据标注与相关概念

数据标注通常与其他数据准备任务一起执行,但区分它们非常重要:

  • 数据增强: 这种技术通过创建已标记数据的修改版本(例如,旋转、翻转或更改图像的亮度)来人为地扩展训练数据集。 增强增加了数据的多样性,但依赖于一组初始的带标签数据。 数据增强概述提供了更多详细信息。
  • 数据清洗: 此过程包括识别并纠正或删除数据集中的错误、不一致和不准确之处。虽然这可能包括修复不正确的标签,但数据清洗是一个质量保证步骤,而数据标注是创建注释的初始行为。维基百科上的数据清理提供了更多背景信息。
  • 数据预处理: 这是一个更广泛的术语,包括数据标注、清洗和其他转换,例如归一化或调整图像大小,以便为模型准备数据。标注是更大的预处理管道中的一个特定且至关重要的步骤。

挑战与解决方案

尽管数据标注非常重要,但它也面临着诸多挑战,包括高成本、大量的时间投入以及人为错误或主观性的可能性。确保大型标注团队的标签质量和一致性是一个主要的后勤障碍。

为了简化这一过程,团队通常使用专门的标注工具,如CVAT,或像Ultralytics HUB这样的平台,这些平台提供了一个协作环境,用于管理数据集和标注工作流程。此外,像主动学习这样的先进技术可以通过智能地选择最具信息量的数据点进行标注来提供帮助,从而优化人工标注员的时间和精力。正如斯坦福人工智能实验室的一篇文章中所详述的那样,关注数据质量是人工智能成功的关键。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入
链接已复制到剪贴板