深圳Yolo 视觉
深圳
立即加入
词汇表

数据标注

什么是数据标注?了解如何使用边界框或多边形标记数据对于训练准确的 AI 和计算机视觉模型至关重要。

数据注释是对原始数据进行标注、标记或转录的过程,以提供机器学习(ML)模型能够理解的上下文。 机器学习 (ML)模型可以理解的上下文。 这一步骤是 有监督学习的基础。 标注示例来学习模式并进行预测。注释数据作为 地面实况,代表 "正确 "答案 模型在训练过程中努力复制的 "正确 "答案。如果没有准确的标注,即使是复杂的架构 如 Ultralytics YOLO11也无法有效运作,因为 模型的性能与其训练数据的质量密切相关。 训练数据的质量息息相关。

标注在计算机视觉中的作用

计算机视觉(CV)领域,数据 标注涉及在图像或视频帧中标记特定特征。不同的任务需要不同的 注释风格,每种风格都能为系统提供独特的细节。

  • 物体检测注释器 在感兴趣的物体周围绘制二维边界框、 如汽车或行人。这就告诉了模型什么是物体以及物体的位置
  • 实例分割 这种技术需要在物体周围追踪精确的多边形。与边界框不同,分割可以映射出实体的精确形状和轮廓。 形状和轮廓,这对机器人抓取等应用至关重要。 机器人抓取等应用至关重要。
  • 姿势估计注释者标记特定的 "关键点",例如人体的关节(肘、膝、肩)。这样 模型track 运动和姿势。
  • 定向边框检测(Oriented Bounding Boxes)用于 与图像轴不对齐的物体,如卫星图像中的船只或传送带上的包裹。 这些方框可以旋转,以适应对象的方向。
  • 图像分类最简单的注释形式 最简单的注释形式,即为整幅图像指定一个标签(如 "晴天"、"雨天")。 整个图像。

注释通常以结构化格式保存,如JSON、XML 或简单的文本文件(如 YOLO 格式)、 XML 或简单文本文件(如YOLO 格式),然后由训练软件进行解析。 训练软件进行解析。

实际应用

数据注释是原始传感器与智能决策之间的桥梁,为无数现代技术提供了动力。 决策之间的桥梁。

  1. 自动驾驶汽车 自动驾驶汽车依赖于海量数据集,其中每一个车道标记、交通标志和障碍物都有注释。来自摄像头和激光雷达传感器的数据 来自摄像头和激光雷达传感器的数据被标注,以训练车辆的 感知系统进行安全导航。这种详细程度对于开发强大的 人工智能汽车解决方案至关重要。
  2. 医疗诊断:人工智能在医疗保健中的应用 核磁共振扫描或 X 光片,以突出肿瘤和骨折。这些注释过的医学图像可以让模型以高灵敏度标记出潜在的异常,从而为医生提供帮助。 高灵敏度的潜在异常。
  3. 智能零售:自动结账系统利用标注来识别产品。通过标注 成千上万的杂货商品,系统可以促进无缝购物体验。查看更多 零售业中的人工智能

与相关概念的比较

将数据注释与数据准备工作流程中常用的其他术语区分开来很有帮助。

  • 注释与数据标签 这两个术语经常互换使用。不过,"标注 "通常与简单的 分类任务(指定类别),而 "注释 "通常意味着更复杂的元数据生成,如在数据中绘制几何图形(多边形、方框)或标记时间戳。 例如绘制几何图形(多边形、方框)或在视频中标注时间戳。
  • 注释与数据扩充 注释为数据集创建初始标签。数据扩增是一个单独的过程,它通过修改现有的注释图像(如翻转图像亮度),人为地 通过修改现有的注释图像(如翻转、旋转或改变亮度)来人为扩展该数据集的过程 以提高模型的鲁棒性。
  • 注释与主动学习 主动学习是一种策略,在这种策略中,模型会找出它最困惑的数据点,并只要求对这些特定示例进行人工标注。 人工标注,从而优化标注预算。

工具和工作流程

创建高质量的注释通常需要专门的工具。像 CVAT(计算机视觉注释工具)Label Studio等开源选项提供了绘制方框和多边形的界面。对于大规模 操作,团队可能会转向集成环境,如即将推出的Ultralytics Platform。 该平台可简化从数据源到模型部署的生命周期。

数据注释完成后,就可以用来训练模型。下面的示例演示了如何使用YOLO11 文件中定义的数据集来训练YOLO11 模型的训练。

from ultralytics import YOLO

# Load the YOLO11 model (nano version)
model = YOLO("yolo11n.pt")

# Train on the COCO8 dataset, which contains pre-annotated images
# The 'data' argument references a YAML file defining dataset paths and classes
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入