敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024

主动学习加速计算机视觉开发

Abirami Vina

3 分钟阅读

2025年1月23日

了解主动学习如何在计算机视觉中用于最大限度地减少标注工作,并探索其在各个行业的实际应用。

训练计算机视觉模型很像教孩子识别颜色。首先,您需要收集一组彩色物体。然后,您需要引导孩子正确识别每种颜色,这是一项既耗时又重复的任务。

就像孩子需要大量例子来学习一样,视觉模型需要大量的标记数据来识别图像中的模式和对象。然而,标记大量数据需要大量的时间和精力,更不用说资源了。像主动学习这样的技术可以帮助简化这个过程。

主动学习是一个循序渐进的过程,从大型数据集中选择和标记最重要的数据。该模型从这些标记数据中学习,使其更加准确和有效。只关注最有价值的数据可以减少所需的标记量,并加快模型的开发。

在本文中,我们将了解主动学习如何帮助模型训练、降低标注成本并提高模型的整体准确性。

图像数据集不易构建

数据集是计算机视觉和深度学习模型的基础。诸如 ImageNet 之类的常用数据集提供了数百万张具有不同对象类别图像。但是,创建和维护如此庞大的高质量数据集面临着各种挑战。 

例如,收集和标注数据需要时间、资源和熟练的标注员,这使得该过程具有挑战性,具体取决于特定的应用。为了跟上对图像数据集日益增长的需求,需要创新和更高效的解决方案,而这正是主动学习旨在解决的问题。 

主动学习通过优化数据标注过程提供了一个完美的解决方案。通过策略性地选择信息量最大的数据点进行标注,主动学习可以最大限度地提高模型性能,同时最大限度地减少标注工作。 

什么是主动学习?

主动学习是一种迭代机器学习技术,模型从大量未标记数据中挑选出最重要的需要标记的数据点。这些选定的数据点会被手动标记并添加到训练数据集中。 

然后,在更新后的数据集上重新训练模型,并选择下一组要标记的数据点。这个过程重复进行,模型通过专注于信息量最大的数据点来不断改进。循环持续进行,直到模型达到所需的准确度或满足预先设定的标记标准。

__wf_reserved_inherit
图 1. 主动学习概述。

了解主动学习的工作原理

您可能想知道主动学习技术如何决定哪些数据点需要手动标注,以及接下来标注哪些数据点。让我们通过将其与备考进行比较来了解主动学习的工作原理——您专注于您不确定的主题,并确保涵盖各种主题以做好充分准备。

对于初始数据选择过程,主动学习使用诸如不确定性抽样和基于多样性的抽样等策略。不确定性抽样优先考虑模型对其预测最不确定的数据点,旨在提高在具有挑战性的案例中的准确性。基于多样性的抽样选择涵盖广泛特征的数据点,通过将模型暴露于不同的示例,确保模型能够很好地泛化到未见过的数据。

__wf_reserved_inherit
图 2. 不确定性抽样(左图)和基于多样性的抽样(右图)。

在初始数据选择之后,主动学习使用两种主要的标注方法:基于池的抽样和基于流的抽样,它们类似于老师帮助学生专注于最重要内容的方式。 

在基于池的抽样中,模型扫描大量未标记的数据池,并选择最具挑战性或信息量的示例进行标记,就像学生优先考虑他们认为最难的抽认卡一样。对于基于流的抽样,模型在数据到达时对其进行处理,决定是否对其进行标记或跳过,类似于学生仅在遇到困难时才寻求帮助。在这两种情况下,标记的数据都会添加到训练集中,并且模型会重新训练自身,从而在每次迭代中稳步改进。

探索主动学习的应用

主动学习在计算机视觉应用(如医学成像和自动驾驶)中发挥着关键作用,它通过提高模型准确性和简化数据标注过程来实现这一点。一个有趣的例子是用于自动驾驶汽车的计算机视觉模型,用于检测弱光或雾天条件下的行人和物体。主动学习可以通过专注于各种具有挑战性的驾驶场景来提高准确性。 

具体来说,主动学习可用于识别此类场景中不确定的数据或帧,以进行选择性标记。将这些标记的示例添加到训练集中,可以使模型更好地识别恶劣天气或夜间驾驶等困难环境中的行人和物体。

例如,NVIDIA 已经使用主动学习来改进其自动驾驶模型中夜间行人检测。通过策略性地选择最具信息量的数据进行训练,尤其是在具有挑战性的场景中,模型的性能会大幅提高。

__wf_reserved_inherit
图 3. 使用主动学习检测携带雨伞的行人。

主动学习可以降低标注成本

主动学习的另一个关键方面是它具有降低标注成本的潜力。它通过只关注最重要的数据点来实现这一点,而不是要求对整个数据集进行标注。这种有针对性的方法节省了时间、精力和金钱。通过专注于不确定或多样化的样本,主动学习减少了所需的标注数量,同时仍保持较高的模型准确率。

事实上,研究表明,主动学习可以在不牺牲性能的情况下降低 40-60% 的标注成本。这在医疗保健和制造业等数据标注成本高昂的行业中尤其有用。通过简化标注过程,主动学习帮助企业更快地开发模型并更有效地部署它们,同时保持准确性。

主动学习的优势

以下是主动学习可以提供的一些其他主要优势:

  • 解决类别不平衡问题:主动学习可以通过标记来自少数数据类别的实例来帮助解决类别不平衡问题。该模型可以在数据有限的罕见情况下表现更好。
  • 更快的开发周期: 标注更少的数据间接意味着加速机器学习和计算机视觉模型的开发过程,从而为额外的迭代和实验留出更多的时间和资源。
  • 适应性:它可以通过迭代不确定或边缘案例样本来不断改进训练数据,使其非常适合动态或不断发展的数据集。

主动学习和 AutoML 可以协同工作

自动化机器学习 (AutoML) 侧重于自动化构建和部署机器学习模型中涉及的耗时且迭代的任务。它通过自动化模型选择和性能评估等任务来简化机器学习工作流程,从而减少手动工作量。 

当与主动学习结合时,AutoML可以加速和优化模型开发生命周期。主动学习组件有策略地选择信息量最大的数据点进行标注,而AutoML通过自动选择架构、参数和调整来改进模型。

__wf_reserved_inherit
图 4. AutoML 工作流程。

让我们通过一个例子来理解这种技术组合。 

假设您正在尝试检测医学影像中的罕见病症(在这种用例中,标记数据集的获取成本很高且数量有限)。主动学习可以识别和选择不确定的数据,例如 X 射线图像中的细微变化,这些数据模型无法分类。然后,可以优先考虑对这些不确定数据进行手动标注,以提高模型的理解能力。 

利用带注释的数据,AutoML 可以通过探索各种架构、超参数和其他数据增强技术来优化模型。迭代过程加快了可靠的视觉模型(如 Ultralytics YOLO11)的开发,从而帮助医疗保健专业人员做出准确的诊断。

主动学习的挑战

主动学习及其技术具有许多优势,但在实施这些策略时,需要牢记以下几点:

  • 查询策略选择:主动学习涉及许多技术,选择最佳方法会显着影响模型的有效性。选择不适当的策略可能会降低模型在特定应用中的性能。
  • 重新训练成本:主动学习的迭代性质需要昂贵的计算资源,特别是对于大型数据集。模型在每一轮标注后都会重新训练,从而增加了其复杂性。
  • 初始模型质量:主动学习的有效性取决于初始模型的质量。性能不佳的初始模型可能无法准确识别信息丰富的数据点,从而导致不合格的标签请求并降低整体性能。

主动学习和 AutoML 的未来发展方向

随着 AI 和计算机视觉的最新进展,主动学习将应对更复杂的挑战并简化机器学习工作流程。将主动学习与联邦学习和自监督学习等技术相结合,可以进一步提高视觉模型的效率和可扩展性。 

联邦学习支持跨多个设备或服务器,以分布式框架训练模型,而无需数据离开其原始位置。以医疗保健等数据隐私至关重要的行业为例,联邦学习可以直接在敏感的本地数据上进行训练,同时确保其安全性。无需共享原始数据,只需共享模型更新或见解,从而确保在保护私人信息的同时,仍然为训练过程做出贡献。

同时,自监督学习通过在未标记数据上预训练模型,有助于减少对标记数据的需求。这个过程为模型创建了一个强大的基础。然后,主动学习可以通过识别和选择最重要的数据点进行人工标注,从而进一步完善模型。

从主动学习到积极影响

主动学习提供了一种实用的方法来应对计算机视觉中的主要挑战,例如高昂的数据标注成本和对更准确模型的需求。通过专注于仅标注最有价值的数据点,它可以减少人类所需的工作量,同时提高模型的性能。

当与 AutoML 等技术结合使用时,主动学习通过自动化耗时的任务来简化模型开发。随着技术的不断进步,主动学习将成为构建更智能、更高效的计算机视觉系统的基本工具。

探索我们的GitHub 仓库,加入我们的社区,以了解更多关于 AI 和计算机视觉模型的信息。在我们的解决方案页面上,了解计算机视觉在制造业医疗保健领域的更多应用。您还可以查看我们的许可选项,立即开始您的 Vision AI 之旅。

让我们一起构建人工智能的未来!

开启您的机器学习未来之旅

免费开始
链接已复制到剪贴板