什么是数据标注?了解如何使用边界框或多边形标记数据对于训练准确的 AI 和计算机视觉模型至关重要。
数据注释是对原始数据进行标注、标记或转录的过程,以提供机器学习(ML)模型能够理解的上下文。 机器学习 (ML)模型可以理解的上下文。 这一步骤是 有监督学习的基础。 标注示例来学习模式并进行预测。注释数据作为 地面实况,代表 "正确 "答案 模型在训练过程中努力复制的 "正确 "答案。如果没有准确的标注,即使是复杂的架构 如 Ultralytics YOLO11也无法有效运作,因为 模型的性能与其训练数据的质量密切相关。 训练数据的质量息息相关。
在计算机视觉(CV)领域,数据 标注涉及在图像或视频帧中标记特定特征。不同的任务需要不同的 注释风格,每种风格都能为系统提供独特的细节。
注释通常以结构化格式保存,如JSON、XML 或简单的文本文件(如 YOLO 格式)、 XML 或简单文本文件(如YOLO 格式),然后由训练软件进行解析。 训练软件进行解析。
数据注释是原始传感器与智能决策之间的桥梁,为无数现代技术提供了动力。 决策之间的桥梁。
将数据注释与数据准备工作流程中常用的其他术语区分开来很有帮助。
创建高质量的注释通常需要专门的工具。像 CVAT(计算机视觉注释工具)和 Label Studio等开源选项提供了绘制方框和多边形的界面。对于大规模 操作,团队可能会转向集成环境,如即将推出的Ultralytics Platform。 该平台可简化从数据源到模型部署的生命周期。
数据注释完成后,就可以用来训练模型。下面的示例演示了如何使用YOLO11 文件中定义的数据集来训练YOLO11 模型的训练。
from ultralytics import YOLO
# Load the YOLO11 model (nano version)
model = YOLO("yolo11n.pt")
# Train on the COCO8 dataset, which contains pre-annotated images
# The 'data' argument references a YAML file defining dataset paths and classes
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)