了解关于使用 Ultralytics 平台进行图像标注所需的一切,以及其用于标注数据集、管理标注和为模型准备数据的内置工具。

了解关于使用 Ultralytics 平台进行图像标注所需的一切,以及其用于标注数据集、管理标注和为模型准备数据的内置工具。

Ultralytics 近期推出了 Ultralytics 平台,这是一个旨在支持计算机视觉开发全生命周期的环境。该平台集中了用于管理视觉 AI 工作流各个阶段的工具,包括数据集准备、图像和视频标注、模型训练和部署。
尽管在自动驾驶和医疗保健等行业中得到越来越多的应用,但构建计算机视觉解决方案仍然可能被视为一个碎片化的过程。主要原因之一是计算机视觉模型严重依赖于其训练数据的质量。在训练开始之前,需要创建、组织、审查和标注数据集,以便模型能够学习要 detect 或识别的内容。
在处理视觉数据时,此过程被称为数据标注或图像标注。在图像标注过程中,图像的特定部分被标记并分配标签,以指导模型进行训练。
例如,如果目标是 detect 图像中的狗,标注者可能会在每只狗周围绘制边界框,以显示它们出现的位置。在更详细的任务中,他们可能会使用 segmentation 掩码勾勒出狗的形状,或标记关键点以捕捉其姿态。这些标注示例直接影响模型部署后的性能。
大规模管理图像标注工作流可能具有挑战性。大型数据集通常需要一致的标注标准、多个标注者之间的协作以及使标注审查和完善更容易的工具。
Ultralytics Platform 将此与内置的标注编辑器结合在一起。它支持多种标注任务类型,为团队提供了一种更简单的方式,可以在单个工作流程中标注数据并准备计算机视觉数据集。

本文将探讨 Ultralytics Platform 的标注编辑器如何帮助团队高效标注数据集并简化数据准备工作。让我们开始吧!
在探索 Ultralytics Platform 上可用的图像标注工具之前,让我们先回顾一下数据标注是什么,以及它在构建计算机视觉系统中的重要性。
计算机视觉模型通过分析大量图像或视频集合(即数据集)进行学习。然而,仅凭原始图像不足以提供模型理解其应 detect 或识别的信息。为了使数据对训练有用,图像必须通过数据标注进行标记,以便模型能够学习要寻找哪些对象、形状或模式。
在图像标注过程中,图像中的特定元素会被标记并分配标签,以描述模型应学习的内容。这些带标签的示例在训练期间指导深度学习模型和算法,并帮助它们在处理新图像时识别相似的模式。
不同的计算机视觉任务根据应用和用例需要不同类型的图像标注。例如,标注人员可能会为 object detect 任务在对象周围绘制边界框,为语义 segment 任务勾勒图像中的区域,为 姿势估计 任务定义关键点,或者为分类任务为整个图像分配标签。
为计算机视觉项目准备数据通常涉及处理各种文件格式和组织数据集。它还包括确保所有内容都为机器学习算法的标注和训练做好准备。在许多工作流程中,此过程分散在多个工具中,数据在使用前需要在系统之间上传、清理和移动。
Ultralytics Platform 通过在单一环境中处理数据准备、模型训练和部署来简化这一过程。团队可以上传图像、视频或数据集存档,并受益于完全可定制的数据准备方法,包括手动或AI自动化标注。Ultralytics Platform 支持原始数据以及 YOLO 和 COCO 等标准格式,从而轻松启动新项目。它还提供对平台上现有数据集的访问权限,包括团队可用于快速启动新项目或实验的已标注数据集。

数据可用后,可以直接在平台上进行管理。开发人员可以审查图像、监控标注进度,并使用内置可视化工具了解数据集分布并识别潜在差距。
该平台还支持数据集版本控制,帮助团队在数据演变过程中捕获数据快照。这使得跟踪变更、比较实验和在训练期间保持一致性变得更加容易。
数据准备就绪后,团队可以开始标注图像,通过标注帮助模型学习要 detect 的内容。
数据上传后,下一步是标注。这是对图像数据进行标记的步骤,为后续训练计算机视觉模型奠定基础。Ultralytics Platform 通过标注编辑器提供内置图像标注服务,使团队能够在同一环境中直接标记和管理数据集。
注释编辑器在一个简单的工作区中展开,用户可以在其中审查图像、添加标签并根据需要更新注释。所有内容都集中在一个地方,从而更容易保持数据集的一致性并为数据训练做好准备。
团队可以直接在浏览器中上传数据集并开始标注图像,定义和管理标注类别,以确保整个数据集中的标签保持一致。随着标注的创建,用户可以在编辑器中直观地查看它们,从而更容易在进行模型训练之前检查准确性。
Ultralytics Platform 还包括多项功能,支持高效的数据集标注工作流程,利用先进算法简化标注过程。
以下是 Ultralytics Platform 中的一些主要功能:
通过结合手动工具、人工智能和自动化,Ultralytics Platform 帮助用户更高效地标注图像。它还能够为可扩展的计算机视觉模型准备高质量的训练数据。
不同的用例,例如产品质量保证,将根据图像或视频中需要 detect 的内容,需要不同类型的标注。正如我们上面提到的,Ultralytics Platform 支持五种 object detect 任务,每种任务都有其自己的标注类型。
让我们仔细看看平台上支持的标注任务以及它们如何用于标记数据集。
目标检测识别并定位图像中的物体。标注人员使用边界框标记每个感兴趣的物体,指示物体在图像中的位置。
在标注编辑器中,这通过边界框工具完成。用户可以进入“编辑模式”,点击并拖动以在对象周围绘制一个矩形,然后从下拉菜单中分配一个类别标签。
边界框创建后可以进行调整。标注人员可以通过拖动角点或边缘手柄来调整大小,通过拖动框的中心来移动,或使用键盘快捷键删除。这些标注有助于视觉模型学习在不同场景和条件下 detect 物体。

实例分割通过定义图像中物体的精确形状来提供更详细的标注。标注人员不是绘制简单的框,而是使用多边形标注描绘物体的边界,为图像分割任务创建精确的掩码。
注释编辑器包含一个用于此任务的多边形工具。标注者在对象的边缘放置多个顶点以勾勒其形状。一旦顶点放置完毕,多边形即可闭合以创建一个segmentation mask。
多边形创建后,可以调整顶点。可以移动单个点来优化对象边界,并在需要时移除顶点。这些像素级标注有助于模型学习详细的视觉结构,并区分紧密相邻的对象。
姿势估计标注捕捉身体关节的位置及其相互关系。这有助于模型理解图像中人物或动物的结构和运动。
标注者使用关键点工具放置代表身体关节的关键点,例如肩膀、肘部、手腕、臀部、膝盖和脚踝。该平台支持多种内置骨架模板,包括 17 点 COCO 人体姿势格式,以及手部、面部、狗和边界框角点的模板。
模板使得一键放置完整骨架布局成为可能,之后可以调整各个关键点以匹配图像中的姿势。每个关键点还可以包含一个可见性标志,以指示其是可见还是被遮挡。

旋转框通过支持旋转,将传统边界框向前推进了一步。当物体以倾斜角度出现而非与图像帧对齐时,这种标注类型非常有用。
在标注编辑器中,标注人员可以使用旋转边界框工具围绕物体绘制旋转矩形。绘制初始框后,可以使用旋转手柄调整角度,而角点手柄允许调整框的大小。
旋转标注常用于航空影像、工业检测数据集以及其他物体呈对角线或从不同视角出现的场景。

图像分类为整个图像分配一个标签,而不是标记图像中的单个物体。
对于分类数据集,标注编辑器提供一个类别选择面板。标注人员可以通过从侧边栏选择一个类别或使用键盘快捷键进行更快的标注来为图像分配标签。
这些图像级标签帮助模型学习代表不同类别的高级视觉模式。
为分割等任务标注图像通常需要细致、详细的工作,尤其当物体需要精确勾勒时。Ultralytics 平台包含 AI 辅助标注工具,可加快流程,同时保持标注的准确性和易于审查。
例如,标注人员可以通过点击物体中他们希望包含在标注中的部分来与图像交互。他们还可以标记应排除的区域以优化结果。基于这些输入,模型实时生成分割掩码,然后可以在保存前进行审查和调整。
这种方法使得处理复杂图像变得更容易,无需手动描绘每个细节。同时,标注人员仍能控制最终输出,确保整个数据集的标注保持一致。

这些功能由 Segment Anything Models (SAM) 提供支持。这些模型是更广泛的开源计算机视觉工具生态系统的一部分,旨在从最少输入生成高质量的分割结果。该平台支持多种 SAM 变体,包括 SAM 2.1 和 SAM 3。这使团队能够根据自身需求灵活选择更快的性能或更详细的结果。
这些AI辅助工具可应用于目标检测、实例分割和有向边界框检测等任务。这意味着团队可以更高效地处理大型数据集,同时保持可靠模型训练所需的质量。
随着标注工作的进展,经常需要返回调整标签、修正错误或更仔细地审查图像。Ultralytics 标注编辑器包含内置工具,使这些日常任务更易于处理且省时。
编辑器中可用的一些工作流功能包括:
清晰一致的标注类别在构建可靠的计算机视觉数据集中发挥着重要作用。随着项目规模的扩大,管理大型数据集上的数据标注会变得困难,尤其是在涉及多名标注员时。保持类别组织良好有助于确保标注保持一致,并使模型从结构化数据中学习。
Ultralytics Platform通过将类别管理直接集成到标注编辑器中,简化了这一过程。团队无需单独处理标签,而可以在处理图像时创建、更新和审查类别,从而更容易在整个标注工作流程中保持一致性。
在编辑器中,所有类别都显示在标注画布旁的侧边栏中。这使得在标注时可以轻松选择正确的标签,并跟踪类别在整个数据集中的使用情况。用户可以根据需要搜索现有类别或创建新类别,而不会中断其 workflow。
类别详情也可以随时更新。可以直接编辑名称,并可以分配颜色,以使不同类别在标注中更容易识别。编辑器还会显示每个类别关联的标注数量,并允许用户审查它们,从而帮助团队检查一致性和准确性。
所有类别都通过一个集中式表格进行管理,可以在其中进行排序、搜索和更新。在此处进行的任何更改都会自动应用于整个数据集,帮助团队在标注项目扩展时保持一致性。

随着计算机视觉系统从开发走向实际应用,标注数据的质量在模型性能方面起着关键作用。标注良好的数据集有助于模型生成更准确和一致的预测,尤其是在动态或不可预测的环境中。
在实践中,标注中即使是微小的不一致也会影响模型行为。物体标注方式的差异或边缘情况的处理方式在训练期间可能不明显,但一旦系统部署,就可能导致预测的可靠性降低。
除此之外,这些不一致性在实际应用中会变得更加明显。例如,在机器人和医疗保健系统中,模型依赖视觉输入来detect物体并实时指导行动。标注的变化会影响这些系统解释其周围环境的准确性。
通过保持一致的标注实践并使用 Ultralytics 等平台随着时间的推移管理和优化数据集,团队可以构建在受控测试环境之外性能更可靠的模型。
高质量数据标注对于训练准确的计算机视觉模型和支持成功的图像标注项目至关重要。Ultralytics Platform 通过一个支持多种视觉任务的强大标注编辑器简化了这一过程。通过将手动标注工具与使用 SAM 的 AI 辅助标注以及内置工作流功能相结合,团队可以更高效地准备数据集,并更快地从数据准备转向模型开发。
加入我们的社区并探索GitHub 仓库,了解更多关于计算机视觉模型的信息。在我们的解决方案页面上阅读有关汽车 AI和机器人计算机视觉等应用的信息。查看我们的许可选项,开始构建您自己的视觉 AI 模型。

开启您的机器学习未来之旅