遇见 YOLO26: 下一代视觉 AI。
Ultralytics
视觉 AI

主动学习加速计算机视觉开发

学习主动学习在计算机视觉中如何用于最小化标注工作量,并探索其在各行业的实际应用。

ABAbirami Vina
3 min read
主动学习加速计算机视觉开发

训练计算机视觉模型就像教孩子识别颜色一样。首先,你需要收集一些彩色物体。然后,你要引导孩子正确辨认每种颜色,这通常是一项既耗时又重复的任务。

就像孩子需要大量示例才能学会一样,视觉模型也需要大量的标注数据来识别图像中的模式和物体。然而,标注海量数据不仅耗时耗力,还需要大量资源。主动学习等技术可以帮助简化这一过程。

主动学习是一个循序渐进的过程,即从大型数据集中筛选并标注最重要的部分。模型通过这些标注数据进行学习,从而变得更加准确和有效。仅关注最有价值的数据可以减少所需的标注量,并加速模型的开发。

在本文中,我们将探讨主动学习如何辅助模型训练、降低标注成本并提高模型的整体准确性。

Link to this section构建图像数据集并非易事#

数据集是计算机视觉和深度学习模型的基石。像 ImageNet 这样热门的数据集提供了数百万张涵盖多样化物体类别的图像。然而,创建和维护如此庞大的高质量数据集面临着诸多挑战。

例如,收集和标注数据需要耗费时间、资源和专业的标注人员,这使得该过程在某些特定应用中充满挑战。为了跟上对 image datasets 不断增长的需求,我们需要创新且更高效的解决方案,而这正是主动学习旨在解决的问题。

主动学习通过优化数据标注过程提供了一个完美的解决方案。通过策略性地选择最具信息量的数据点进行标注,主动学习能够在最大化模型性能的同时,将标注工作量降至最低。

Link to this section什么是主动学习?#

主动学习是一种迭代式的机器学习技术,模型从大型未标注数据池中筛选出最重要的待标注数据点。这些被选中的数据点经人工标注后,会被加入到训练集中。

随后,模型会在更新后的数据集上进行重新训练,并选出下一批待标注的数据点。这一过程不断重复,模型通过专注于最具信息量的数据点持续改进。该循环会一直持续,直到模型达到预期的准确性或满足预设的标注标准。

主动学习概览

图 1. 主动学习概览。

Link to this section理解主动学习的工作原理#

你可能想知道主动学习技术是如何决定哪些数据点需要人工标注以及下一步该标注哪些内容的。让我们将主动学习类比为备考来理解其原理——你需要专注于不确定的主题,同时确保涵盖各类学科,从而做好充分准备。

对于初始的数据选择过程,主动学习会采用不确定性采样和基于多样性的采样等策略。不确定性采样优先考虑模型预测置信度最低的数据点,旨在提高在困难情况下的准确性。基于多样性的采样则选择涵盖广泛特征的数据点,通过让模型接触多样的示例,确保其对未知数据的泛化能力。

左侧为不确定性采样,右侧为基于多样性的采样

图 2. 不确定性采样(左侧)和基于多样性的采样(右侧)。

在初始数据选择后,主动学习使用两种主要标注方法:基于池的采样和基于流的采样。它们类似于老师帮助学生专注于最重要知识点的过程。

在基于池的采样中,模型扫描大型未标注数据池并选出最具挑战性或信息量最大的示例进行标注,这就像学生优先复习他们觉得最难的抽认卡。而在基于流的采样中,模型处理随之而来的数据,决定是标注还是跳过,类似于学生只在遇到困难时寻求帮助。在这两种情况下,标注后的数据都会被加入训练集,模型进行自我重训,并在每次迭代中稳步提升。

Link to this section探索主动学习的应用#

主动学习在 计算机视觉应用 中发挥着关键作用,例如医疗影像和自动驾驶,通过提高模型准确性和精简数据标注流程。一个有趣的例子是自动驾驶汽车中用于在低光或雾天环境下检测行人或物体的 计算机视觉模型。主动学习可以通过专注于多样化且具有挑战性的驾驶场景来提升准确性。

具体来说,主动学习可以用于识别此类场景中的不确定数据或帧,进行选择性标注。将这些已标注的示例添加到训练集中,能使模型在恶劣天气或夜间驾驶等困难环境下更好地识别行人和物体。

例如,NVIDIA 曾利用主动学习来提升其自动驾驶模型在夜间检测行人的能力。通过策略性地选择训练中最具信息量的数据,特别是在极具挑战性的场景中,模型性能得到了显著提高。

使用主动学习检测撑伞的行人

图 3. 使用主动学习检测撑伞的行人。

Link to this section主动学习能够降低标注成本#

主动学习的另一个关键点在于其降低标注成本的潜力。它通过仅关注最重要的数据点来实现这一目标,而不是要求对整个数据集进行标注。这种有针对性的方法节省了时间、精力和金钱。通过聚焦于不确定的或多样的样本,主动学习在减少所需标注数量的同时,依然保持了高模型准确性。

事实上,研究表明主动学习可以在不牺牲性能的情况下 削减标注成本 40-60%。这在医疗保健和制造业等领域尤其有帮助,因为在这些行业中数据标注成本高昂。通过简化标注流程,主动学习助力企业更快地开发模型并更高效地进行部署,同时保证准确性。

Link to this section主动学习的益处#

以下是主动学习可以提供的其他一些关键优势:

  • 解决类别不平衡:主动学习可以通过标注少数类的数据实例来帮助解决类别不平衡问题。模型可以在数据有限的稀有场景下表现得更好。
  • 更快的开发周期:标注更少的数据间接意味着加速机器学习和计算机视觉模型的开发过程,从而腾出更多时间和资源用于额外的迭代和实验。
  • 适应性:它可以通过对不确定的或边缘情况样本进行迭代,持续改进训练数据,使其非常适合动态或不断演变的数据集。

Link to this section主动学习与 AutoML 可以协同工作#

自动化机器学习 (AutoML) 专注于自动化构建和部署机器学习模型中耗时且重复的任务。它通过自动化模型选择和性能评估等任务,减少人工需求,从而简化机器学习工作流程。

当与主动学习集成时,AutoML 可以加速并优化模型开发生命周期。主动学习组件策略性地选择最具信息量的数据点进行标注,而 AutoML 则通过自动化架构选择、参数设置和调优来完善模型。

AutoML 工作流程

图 4. AutoML 工作流程。

让我们通过一个示例来理解这种技术组合。

假设你正在尝试检测 医疗影像 中的罕见病症(这种情况下的标注数据集有限且获取成本高昂)。主动学习可以识别并挑选出不确定的数据,例如模型无法分类的 X 光图像细微变化。随后,这些不确定的数据可以被优先处理进行人工标注,以提高模型的理解能力。

有了标注数据后,AutoML 可以通过探索各种架构、超参数和其他数据增强技术来优化模型。这种迭代过程加速了像 Ultralytics YOLO11 这样可靠的视觉模型的开发,从而帮助医疗专业人员做出准确诊断。

Link to this section主动学习的挑战#

主动学习及其技术提供了诸多优势,但在实施这些策略时仍需考虑以下几点:

  • 查询策略选择:主动学习涉及许多技术,选择最佳方法对模型的有效性有重大影响。选择不恰当的策略可能会降低模型在特定应用中的性能。
  • 重训成本:主动学习的迭代特性需要昂贵的计算资源,特别是对于大型数据集而言。模型在每一轮标注后都需要重训,这增加了其复杂性。
  • 初始模型质量:主动学习的有效性取决于初始模型的质量。表现较差的初始模型可能无法准确识别有价值的信息点,从而导致标注请求质量低下,进而降低整体性能。

Link to this section主动学习与 AutoML 的未来之路#

随着 AI 和计算机视觉的最新进展,主动学习将有望解决更复杂的挑战并简化机器学习工作流程。将主动学习与联邦学习和自监督学习等技术相结合,可以进一步增强视觉模型的效率和可扩展性。

联邦学习 使模型能够通过分布式框架在多个设备或服务器上进行训练,而无需原始数据离开其所在位置。考虑到像医疗保健这种数据隐私非常重要的行业,联邦学习使得直接在敏感的本地数据上进行训练成为可能,同时确保数据安全。无需共享原始数据,只需共享模型更新或见解,确保私人信息得到保护的同时,仍能为训练过程做出贡献。

与此同时,自监督学习 通过在未标注数据上预训练模型,有助于减少对标注数据的需求。这一过程为模型创建了一个强大的基础。之后,主动学习可以通过识别和选择最重要的人工标注数据点来进一步优化模型。

Link to this section从主动学习到主动影响#

主动学习为解决计算机视觉中的重大挑战提供了一种切实可行的方法,例如高昂的数据标注成本和对更高精度模型的需求。通过仅专注于标注最有价值的数据点,它减少了人类所需的工作量,同时提升了模型的性能。

当与 AutoML 等技术结合时,主动学习通过自动化耗时任务来简化模型开发。随着进步的持续,主动学习注定会成为构建更智能、更高效计算机视觉系统的核心工具。

探索我们的 GitHub 仓库 并加入我们的 社区 以了解有关 AI 和计算机视觉模型的更多信息。在我们的解决方案页面上发现 制造业医疗保健 领域中计算机视觉的更多应用。你也可以查看我们的 授权许可选项,立即开启你的视觉 AI 之旅。

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅