遇见 YOLO26: 下一代视觉 AI。
Ultralytics
Ultralytics 平台

使用 Ultralytics Platform 简化图像标注

了解有关使用 Ultralytics Platform 进行图像标注所需的一切知识,以及其用于标注数据集、管理标注和为模型准备数据的内置工具。

ABAbirami Vina
6 min read
Ultralytics Platform 中的图像标注编辑器

Ultralytics 最近推出了 Ultralytics Platform,这是一个旨在支持计算机视觉开发全生命周期的环境。该平台集中了用于管理视觉 AI 工作流程各个阶段的工具,包括数据集准备、图像和视频标注、模型训练以及部署。

尽管在自动驾驶和医疗保健等行业中的应用日益广泛,但构建 computer vision 解决方案在许多人眼中仍然是一个零散的过程。其主要原因之一是计算机视觉模型在很大程度上依赖于其训练所用数据的质量。在训练开始之前,必须对数据集进行创建、整理、审查和标注,以便模型学习要检测或识别的内容。

在使用视觉数据时,这个过程被称为数据标注或图像标注。在图像标注过程中,图像的特定部分会被标记并分配标签,从而在训练期间引导模型。

例如,如果目标是检测图像中的狗,标注人员可能会在每条狗周围绘制 BBox,以显示它们出现的位置。在更详细的任务中,他们可能会使用分割掩码勾勒出狗的形状,或者标记关键点以捕捉其姿态。这些带标签的示例直接影响模型部署后的性能表现。

大规模管理图像标注工作流可能具有挑战性。大型数据集通常需要一致的标注标准、多名标注人员之间的协作,以及能够让审查和优化标注过程变得更轻松的工具。

Ultralytics Platform 通过内置的 annotation editor 将这一切整合在一起。它支持多种标注任务类型,并为团队提供了一种在单一工作流中标记数据和准备计算机视觉数据集的更简单方法。

Ultralytics Platform 中的标注编辑器

图 1. Ultralytics Platform 中的标注编辑器概览 (Source)

在本文中,我们将探讨 Ultralytics Platform 的标注编辑器如何帮助团队高效地标注数据集并简化数据准备工作。让我们开始吧!

Link to this section计算机视觉中的数据标注#

在探索 Ultralytics Platform 上提供的图像标注工具之前,让我们先退一步,了解什么是数据标注,以及它在构建计算机视觉系统中的重要性。

Computer vision models 通过分析大型图像或视频集合(即数据集)来进行学习。然而,仅凭原始图像无法为模型提供足够的必要信息来理解它应该检测或识别的内容。为了使数据对训练有用,必须通过数据标签对图像进行标注,这样模型才能学习要查找的对象、形状或模式。

在图像标注过程中,图像中的特定元素会被标记并分配标签,这些标签描述了模型应该学习的内容。这些带标签的示例会在训练期间指导深度学习模型和算法,并帮助它们在处理新图像时识别类似的模式。

不同的计算机视觉任务需要不同类型的图像标注,具体取决于应用程序和用例。例如,标注人员可能会为对象检测在对象周围绘制 BBox,为语义分割勾勒图像中的区域,为姿态估计定义关键点,或者为分类任务给整张图像分配标签。

Link to this section数据管理与准备#

为计算机视觉项目准备数据通常涉及处理各种文件格式和组织数据集。它还包括确保一切就绪以进行标注和机器学习算法的训练。在许多工作流程中,这个过程分散在多个工具中,数据在能够被使用之前,必须在不同系统之间进行上传、清理和移动。

Ultralytics Platform 通过在单一环境中处理 data preparation、模型训练和部署来简化这一过程。团队可以上传图像、视频或数据集存档,并从完全可定制的方法中受益,利用手动或 AI 自动标注来准备数据。Ultralytics Platform 支持原始数据以及 YOLO 和 COCO 等标准格式,让启动新项目变得轻而易举。它还提供对平台上现有数据集的访问权限,包括团队可以用来快速启动新项目或实验的已标注数据集。

在 Ultralytics Platform 上上传和管理数据集

图 2. 在 Ultralytics Platform 的单一环境中上传和管理数据集。 (Source)

数据准备就绪后,就可以直接在平台上对其进行管理。开发人员可以审查图像、监控标注进度,并使用内置的可视化工具来了解数据集分布并识别潜在的数据缺口。

该平台还支持数据集版本控制,帮助团队在数据演变过程中捕获快照。这使得跟踪更改、比较实验以及在训练过程中保持一致性变得更加容易。

完成数据准备后,团队可以继续进行图像标注,即通过给图像分配标签来帮助模型学习要检测的对象。

Link to this section在 Ultralytics Platform 上标注数据集#

上传数据后,下一步就是标注。这是对图像数据进行标签化的过程,为后续训练计算机视觉模型奠定基础。Ultralytics Platform 通过标注编辑器提供内置的图像标注服务,使团队能够在同一环境中直接标注和管理数据集。

标注编辑器在一个简单的工作区中展开,用户可以在其中审查图像、添加标签,并根据需要更新标注。所有内容都井井有条地组织在一处,从而更容易保持数据集的一致性,并为数据训练做好准备。

团队可以直接在浏览器中上传数据集并开始标注图像,定义和管理标注类以确保标签在整个数据集中保持一致。创建标注后,用户可以在编辑器中直观地审查它们,从而在进入模型训练之前更容易检查准确性。

Link to this sectionUltralytics Platform 中的图像标注工具#

Ultralytics Platform 还包含多项功能,通过使用高级算法支持高效的数据集标签工作流,从而简化标注过程。

以下是 Ultralytics Platform 中提供的一些关键功能:

  • 手动标注: 这种方法允许用户在直接对图像创建图像标注(例如 BBox、分割区域或关键点)时拥有完全的控制权和灵活性。
  • AI 辅助标注: 此功能可自动生成建议的标注,从而减少手动标注的需求。它利用 SAM (Segment Anything Model) 只需一键即可检测对象或区域,简化了标注过程,并帮助用户在将建议添加到数据集之前进行审查和确认。
  • 标注编辑: 用户可以在任何时候修改或优化图像标注。这有助于纠正标注错误,并在整个标注过程中保持数据集标签的一致性。
  • 类别管理: 团队和个人开发者可以定义和组织在数据集标注过程中使用的标注类。这有助于在整个图像中保持标签的一致性,这对训练能够准确识别和区分不同类别的模型非常重要。

通过结合手动工具、人工智能和自动化,Ultralytics Platform 帮助用户更高效地标注图像。它还能够为可扩展的计算机视觉模型准备高质量的训练数据。

Link to this section支持的标注任务类型#

不同的用例(例如产品质量保证)需要不同类型的标注,具体取决于图像或视频中需要检测的内容。正如我们在上面提到的,Ultralytics Platform 支持五种对象检测任务,每种任务都有其特定的标注类型。

让我们更仔细地了解一下平台上支持的标注任务,以及它们如何用于标记数据集。

Link to this section目标检测#

对象检测用于识别图像中的对象并对其进行定位。标注人员使用 BBox 标记每个感兴趣的对象,以指示项目在图像中出现的位置。

在标注编辑器中,这是通过 BBox 工具完成的。用户可以进入“编辑模式”,点击并拖动以在对象周围绘制一个矩形,并从下拉菜单中分配类标签。

BBox 在创建后可以进行调整。标注人员可以通过拖动角或边缘手柄来调整它们的大小,通过拖动框中心来移动它们,或者使用键盘快捷键删除它们。这些标注有助于视觉模型学习在不同场景和条件下检测对象。

使用 Ultralytics Platform 上的 BBox 进行对象检测标注

图 3. Ultralytics Platform 中使用 BBox 的对象检测标注。 (Source)

Link to this section实例分割#

实例分割通过定义图像内对象的精确形状来提供更详细的标注。标注人员不是绘制一个简单的框,而是使用多边形标注描绘对象的边界,从而为图像分割任务创建精确的掩码。

标注编辑器包含用于此任务的多边形工具。标注人员在对象边缘周围放置多个顶点以勾勒其形状。放置顶点后,可以闭合多边形以创建分割掩码。

多边形创建后可以调整顶点。可以移动各个点以优化对象边界,并且可以根据需要移除顶点。这些像素级的标注有助于模型学习详细的视觉结构,并区分外观接近的对象。

Link to this section姿态估计#

姿态估计标注用于捕捉身体关节的位置及其相互关系。这有助于模型理解图像中人或动物的结构和动作。

使用关键点工具,标注人员放置代表身体关节(如肩膀、肘部、手腕、臀部、膝盖和脚踝)的关键点。该平台支持多种内置骨架模板,包括 17 点 COCO 人体姿态格式,以及用于手部、面部、狗和框角的模板。

模板可以通过单次点击放置完整的骨架布局,之后可以调整单个关键点以匹配图像中的姿势。每个关键点还可以包含一个可见性标志,以指示它是可见还是被遮挡。

使用关键点和骨架模板进行姿态估计标注

图 4. 使用关键点和骨架模板进行姿态估计标注。 (Source)

Link to this section旋转对象检测框 (OBB)#

旋转对象检测框 (OBB) 在传统 BBox 的基础上增加了对旋转的支持。当对象呈一定角度出现,而不是与图像框架对齐时,这种类型的标注非常有用。

在标注编辑器中,标注人员可以使用旋转对象检测框工具在对象周围绘制旋转矩形。绘制初始框后,可以使用旋转手柄来调整角度,同时角手柄允许调整框的大小。

旋转标注常用于航空影像、工业检测数据集以及对象呈对角线显示或从不同视点观察的其他场景。

用于航空图像中旋转对象的旋转对象检测框标注

图 5. 用于航空图像中旋转对象的旋转对象检测框 (OBB) 标注。 (Source)

Link to this section图像分类#

图像分类为整张图像分配一个标签,而不是标记图像内的各个对象。

对于分类数据集,标注编辑器提供了一个类别选择器面板。标注人员可以通过从侧边栏选择类别或使用键盘快捷键进行更快速的标注,从而为图像分配标签。

这些图像级标签有助于模型学习代表不同类别的高级视觉模式。

Link to this section基于 SAM 的 AI 辅助标注#

标记图像以进行分割等任务通常需要细致的工作,尤其是当对象需要精确勾勒时。Ultralytics Platform 包含 AI 辅助标注工具,可在保持标注准确且易于审查的同时加快处理过程。

例如,标注人员可以通过点击他们想要包含在标注中的对象部分来与图像交互。他们还可以标记应该排除的区域以优化结果。根据这些输入,模型会实时生成分割掩码,然后可以在保存前对其进行审查和调整。

这种方法使得在处理复杂图像时更容易,而无需手动追踪每个细节。与此同时,标注人员仍然掌握最终输出的控制权,确保标注在整个数据集中保持一致。

使用智能标注工具进行 AI 辅助分割

图 6. 在 Ultralytics Platform 中使用智能标注工具进行 AI 辅助分割。 (Source)

这些功能由 Segment Anything Models (SAM) 提供支持。这些模型是一个更广泛的开源计算机视觉工具生态系统的一部分,旨在以极少的输入生成高质量的分割结果。该平台支持多种 SAM 变体,包括 SAM 2.1 和 SAM 3。这让团队能够根据自身需求在更快的性能和更详细的结果之间灵活选择。

这些 AI 辅助工具可以应用于对象检测、实例分割和旋转对象检测框检测等任务。这意味着团队可以更高效地处理大型数据集,同时保持可靠模型训练所需的质量。

Link to this section使用内置工具改进标注工作流#

随着标注工作的进展,经常需要回过头来调整标签、修复错误或仔细查看图像。Ultralytics 标注编辑器包含内置工具,使这些日常任务更易于处理且更省时。

编辑器中提供的一些工作流功能包括:

  • 键盘快捷键: 编辑器包含一些快捷键,可加快保存标注、撤消或重做更改、删除标签以及在标注时选择类别等常见操作。
  • 撤消和重做历史记录: 标注人员可以轻松撤消或恢复编辑过程中所做的更改。这有助于团队对标注进行实验并快速修复错误,而不会丢失进度,从而支持数据集准备过程中的更好质量控制。
  • 灵活的标注编辑: 标注可以在创建后进行调整。用户可以根据需要调整形状大小、移动标注、旋转旋转对象检测框或更新类标签,尤其是在优化形状不规则的对象时。
  • 可见性控制: 编辑器包含可见性开关,允许用户显示或隐藏标注和类标签,从而使标注期间更容易检查图像。
  • 精度工具: 缩放功能以及带像素坐标的十字准线光标等功能,可帮助标注人员在处理详细图像时更准确地放置标签。

Link to this section在 Ultralytics Platform 上管理标注类#

清晰且一致的标注类在构建可靠的计算机视觉数据集中发挥着重要作用。随着项目的增长,跨大型数据集管理数据标签可能会变得困难,尤其是当涉及多名标注人员时。保持类别组织良好有助于确保标注保持一致,并确保模型从结构化数据中学习。

Ultralytics Platform 通过将类别管理直接引入标注编辑器来简化此过程。团队无需单独处理标签,而是在处理图像时创建、更新和审查类别,从而更容易在整个标注工作流中保持一致性。

在编辑器内,所有类别都可在标注画布旁边的侧边栏中找到。这使得在标注时选择正确的标签并跟踪类别在整个数据集中的使用情况变得很容易。用户可以根据需要搜索现有类别或创建新类别,而无需中断工作流。

类别详情也可以随时更新。名称可以直接编辑,并可以分配颜色以便在标注中更容易识别不同的类别。编辑器还会显示每个类别关联了多少个标注,并允许用户对其进行审查,帮助团队检查一致性和准确性。

所有类别均通过一个集中式表格进行管理,可以在其中进行排序、搜索和更新。在此处所做的任何更改都会自动应用到整个数据集中,从而帮助团队在标注项目扩展时保持一致性。

带标签颜色的标注编辑器中的类别管理

图 7. 标注编辑器中的类别管理展示了标签组织和颜色自定义。 (Source)

Link to this section标注质量如何影响实际性能#

随着计算机视觉系统从开发走向实际应用,已标注数据的质量在模型性能中起着关键作用。标记良好的数据集可帮助模型生成更准确、更一致的预测,尤其是在动态或不可预测的环境中。

在实践中,即使标注中的微小不一致也会影响模型行为。对象标记方式或处理边缘情况方式的差异在训练期间可能不明显,但一旦系统部署,可能会导致预测可靠性降低。

最重要的是,这些不一致在实际应用中会变得更加明显。例如,在机器人和医疗保健系统中,模型依靠视觉输入来实时检测对象并引导动作。标记的差异会影响这些系统解释其周围环境的准确程度。

通过保持一致的标注实践,并使用像 Ultralytics 这样的平台随时间推移来管理和优化数据集,团队可以构建在受控测试环境之外也能更可靠运行的模型。

Link to this section关键要点#

高质量的数据标注对于训练准确的计算机视觉模型和支持成功的图像标注项目至关重要。Ultralytics Platform 通过强大的标注编辑器简化了此过程,该编辑器支持多种视觉任务。通过将手动标注工具与基于 SAM 的 AI 辅助标注以及内置工作流功能相结合,团队可以更高效地准备数据集,并更快地从数据准备阶段推进到模型开发。

加入我们的 community 并探索 GitHub repository 以了解更多关于计算机视觉模型的信息。在我们的解决方案页面上阅读有关 AI in automotivecomputer vision in robotics 等应用的信息。查看我们的 licensing options 并开始构建您自己的视觉 AI 模型。

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅