术语表

数据注释

什么是数据标注?了解用边框或多边形标注数据对于训练精确的人工智能和计算机视觉模型至关重要。

数据注释是对原始数据进行标注或标记的过程,以帮助机器学习(ML)模型理解数据并从中学习。这一关键步骤将图像或视频等非结构化数据转化为算法可以解释的结构化信息。在有监督学习的情况下,这些注释可以作为 "基本事实"--模型用来训练自己的正确答案。数据注释的质量和准确性直接影响着人工智能(AI)模型的性能和可靠性。如果没有精确的注释,即使是最先进的模型也无法有效地学习模式。

注释在计算机视觉中的作用

计算机视觉(CV)领域,数据标注是教授模型 "看 "和解释世界的基础。这需要人类注释者使用专用软件在视觉数据中识别和标记感兴趣的对象。注释有多种类型,分别适用于不同的 CV 任务:

  • 边框注释这是最常见的形式,用于物体检测。注释者在单个物体周围画出矩形框,并指定一个类别标签(如 "汽车"、"人")。
  • 多边形分割:对于需要更高精度的任务(如实例分割),注释器会跟踪每个对象的精确轮廓。这样,即使对象重叠,模型也能了解对象的具体形状和边界。
  • 语义分割这种方法是将图像中的每个像素归入一个特定类别(如 "天空"、"道路"、"建筑")。与实例分割不同,它不区分同一对象类别的不同实例。
  • 关键点标注:这种技术用于姿势估计,包括在物体上标记特定的兴趣点(关键点),例如人体的关节或面部的角。
  • 分类:最简单的形式,为整幅图像指定一个标签。这是图像分类任务的基础。

注释方法的选择取决于简历项目的具体目标,这些目标已在项目目标定义指南中作了概述。

实际应用

  1. 自动驾驶汽车自动驾驶汽车依赖于在大量标注数据基础上训练出来的模型。在数以百万计的图像和激光雷达点云中,注释器标注了从行人、骑自行车者到交通信号灯、车道标线和道路标志等所有内容。这些详细的训练数据使车辆的感知系统能够了解周围环境并做出安全的驾驶决策。像Argoverse这样的数据集对于开发强大的人工智能汽车解决方案至关重要。
  2. 医学图像分析医疗保健领域的人工智能中,放射科医生和医学专家会对核磁共振成像、CT 和 X 光片等医学扫描图像进行注释,以突出显示肿瘤、病变、骨折或其他异常情况。这些注释数据集(如公共脑肿瘤数据集)可用于训练Ultralytics YOLO等模型,从而帮助进行早期诊断和治疗规划。北美放射学会(RSNA)提供了多个此类数据集用于研究。

数据注释与相关概念

数据标注经常与其他数据准备技术一起讨论,但它们的目的不同。

  • 数据注释与数据标签这两个术语经常互换使用,指的是相同的核心流程。在计算机视觉领域,"注释 "通常用于描述绘制多边形或关键点等更复杂的任务,而 "标注 "则可能用于分类等更简单的任务。不过,就所有实际目的而言,它们都是同义词。如需深入了解,请参阅我们的计算机视觉数据标注说明
  • 数据注释与数据增强注释是创建初始真实标签的过程。而数据扩增则是注释使用的一种技术,通过创建注释图像的修改版本(如旋转、翻转或改变亮度)来人为增加数据集的大小。
  • 数据注释与数据清理数据清理包括纠正错误、删除重复数据和处理数据集中的缺失值,以确保数据集的整体质量。数据清理可以发生在标注之前(如去除模糊图像)或之后(如修正错误标签),但它有别于添加新标签的行为本身。高数据质量对于有效标注至关重要。

注释过程可以使用各种工具进行管理,从CVAT等开源选项到Scale AILabelbox 等商业平台。Ultralytics HUB等平台提供集成解决方案,用于管理数据集、训练模型,并简化从数据收集、标注到部署的整个工作流程。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、合作和成长

立即加入
链接复制到剪贴板