敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024
词汇表

数据标注

什么是数据标注?了解如何使用边界框或多边形标记数据对于训练准确的 AI 和计算机视觉模型至关重要。

数据标注是标记或标记原始数据的过程,以帮助 机器学习 (ML) 模型理解并从中学习。这个关键步骤将图像或视频等非结构化数据转换为算法可以解释的结构化信息。在 监督学习 的背景下,这些注释充当“真实值”——模型用来训练自己的正确答案。数据标注的质量和准确性直接影响生成的 人工智能 (AI) 模型的性能和可靠性。如果没有精确的标注,即使是最先进的模型也无法有效地学习模式。

标注在计算机视觉中的作用

计算机视觉 (CV)中,数据标注是教导模型“看”和解释世界的基础。它涉及人工标注员使用专用软件来识别和标记视觉数据中感兴趣的对象。有几种类型的标注,每种都适用于不同的 CV 任务:

  • 边界框标注: 这是最常见的形式,用于目标检测。标注者在单个对象周围绘制矩形框,并分配一个类别标签(例如,“汽车”、“人”)。
  • 多边形分割: 对于需要更高精度的任务,例如实例分割,标注员会追踪每个对象的精确轮廓。这使得模型能够理解对象的特定形状和边界,即使对象重叠也是如此。
  • 语义分割: 这种方法涉及将图像中的每个像素分类为特定类别(例如,“天空”、“道路”、“建筑物”)。与实例分割不同,它不区分同一对象类的不同实例。
  • 关键点标注: 用于姿势估计,此技术涉及在对象上标记特定的兴趣点(关键点),例如人体关节或面部角落。
  • 分类:最简单的形式,其中整个图像被分配一个标签。这是图像分类任务的基础。

注释方法的选择取决于 CV 项目的具体目标,这些目标在定义项目目标指南中进行了概述。

实际应用

  1. 自动驾驶汽车: 自动驾驶汽车依赖于在广泛注释的数据上训练的模型。注释者在数百万张图像和 LiDAR 点云中标注从行人和骑自行车的人到交通灯、车道标记和道路标志的所有内容。这种详细的训练数据使车辆的感知系统能够了解其环境并做出安全的驾驶决策。像 Argoverse 这样的数据集对于开发强大的汽车人工智能解决方案至关重要。
  2. 医学影像分析:医疗保健 AI 领域,放射科医生和医学专家会标注医学扫描图像,如 MRI、CT 和 X 射线,以突出显示肿瘤、病变、骨折或其他异常。这些带注释的数据集(如公共的 脑肿瘤数据集)用于训练诸如 Ultralytics YOLO 等模型,这些模型可以协助早期诊断和治疗计划。北美放射学会 (RSNA) 提供了多个此类数据集用于研究。

数据标注与相关概念

数据标注通常与其他数据准备技术一起讨论,但它们有不同的用途。

  • 数据标注 vs. 数据标记这两个术语经常互换使用,指的是相同的核心过程。 在计算机视觉中,通常首选“标注”来描述更复杂的任务,例如绘制多边形或关键点,而“标记”可能用于更简单的任务,例如分类。 但是,在所有实际用途中,它们是同义词。 有关深入了解,您可以阅读我们的关于计算机视觉数据标记的解释器
  • 数据标注 vs. 数据增强标注是创建初始真实标签的过程。 另一方面,数据增强是一种在标注之后使用的技术,通过创建带标注图像的修改版本(例如,旋转、翻转或更改亮度)来人为地增加数据集的大小。
  • 数据标注 vs. 数据清洗数据清洗涉及纠正错误、删除重复项以及处理数据集中的缺失值,以确保其整体质量。 清洗可以在标注之前(例如,删除模糊图像)或之后(例如,修复不正确的标签)进行,但它与添加新标签的行为不同。 高数据质量对于有效的标注至关重要。

可以使用各种工具来管理标注过程,从 CVAT 等开源选项到 Scale AILabelbox 等商业平台。Ultralytics HUB 等平台提供集成解决方案来管理数据集、训练模型并简化从数据收集和标注到部署的整个工作流程。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入
链接已复制到剪贴板