探索计算机视觉中少样本学习、零样本学习和迁移学习之间的差异,以及这些范例如何塑造 AI 模型训练。

探索计算机视觉中少样本学习、零样本学习和迁移学习之间的差异,以及这些范例如何塑造 AI 模型训练。
人工智能(AI)系统可以处理复杂的任务,如识别人脸、分类图像和驾驶汽车,而无需过多的人工输入。它们通过研究数据、识别模式并使用这些模式进行预测或决策来实现这一点。随着人工智能的进步,我们正在见证人工智能模型以越来越复杂的方式学习、适应和执行任务,并且效率惊人。
例如,计算机视觉是 AI 的一个分支,专注于使机器能够解释和理解来自世界的视觉信息。传统的计算机视觉模型开发在很大程度上依赖于大型带注释的数据集进行训练。收集和标记此类数据可能既耗时又昂贵。
为了应对这些挑战,研究人员引入了创新方法,如小样本学习 (FSL),它从有限的例子中学习;零样本学习 (ZSL),它识别未见过的对象;以及迁移学习 (TL),它将来自预训练模型的知识应用于新任务。
在本文中,我们将探讨这些学习范式的工作原理,强调它们的主要区别,并了解实际应用。让我们开始吧!
让我们探讨一下关于计算机视觉的少样本学习、零样本学习和迁移学习是什么以及它们是如何工作的。
Few-shot learning(少样本学习)是一种系统仅使用少量示例就能学习识别新对象的方法。例如,如果您向模型展示几张企鹅、鹈鹕和海鹦的图片(这个小组被称为“支持集”),它就会学习这些鸟类的样子。
之后,如果您向模型展示一张新图片,比如企鹅,它会将这张新图片与支持集中的图片进行比较,并选择最接近的匹配项。当难以收集大量数据时,此方法非常有用,因为系统仍然可以通过少量示例进行学习和适应。
零样本学习 是一种让机器识别以前从未见过的物体的方法,而无需提供这些物体的示例。它使用语义信息(如描述)来帮助建立联系。
例如,如果一台机器通过理解“小而蓬松”、“大型野生猫科动物”或“长脸”等特征来了解猫、狮子和马等动物,那么它就可以利用这些知识来识别一种新的动物,比如老虎。即使它以前从未见过老虎,它也可以使用“一种像狮子一样的动物,带有黑色条纹”这样的描述来正确识别它。这使得机器更容易学习和适应,而不需要大量的例子。
迁移学习是一种学习范式,其中模型使用从一项任务中学到的知识来帮助解决类似的新任务。当涉及到计算机视觉任务(如对象检测、图像分类和模式识别)时,此技术特别有用。
例如,在计算机视觉中,预训练模型可以识别一般对象(如动物),然后通过迁移学习进行微调以识别特定对象(如不同的犬种)。通过重用早期任务中的知识,迁移学习可以更轻松地在较小的数据集上训练计算机视觉模型,从而节省时间和精力。
您可能想知道哪些类型的模型支持迁移学习。Ultralytics YOLO11 是一个很好的计算机视觉模型示例,它可以做到这一点。它是一种最先进的对象检测模型,首先在大型通用数据集上进行预训练。之后,可以针对特定任务在较小的专用数据集上对其进行微调和自定义训练。
既然我们已经讨论了少样本学习、零样本学习和迁移学习,那么让我们对它们进行比较,看看它们有何不同。
当只有少量标记数据时,Few-shot learning(少样本学习)非常有用。它使 AI 模型能够仅从几个示例中学习。另一方面,Zero-shot learning(零样本学习)不需要任何标记数据。相反,它使用描述或上下文来帮助系统处理新任务。同时,迁移学习采用不同的方法,利用预训练模型中的知识,使其能够以最少的额外数据快速适应新任务。每种方法都有其自身的优势,具体取决于您正在处理的数据类型和任务。
这些学习范式已经在许多领域发挥作用,通过创新的解决方案解决复杂的问题。让我们仔细看看它们如何在现实世界中应用。
Few-shot learning(少样本学习)正在改变医疗保健行业,尤其是在医学影像领域。它可以帮助医生仅使用少量示例甚至描述来诊断罕见疾病,而无需大量数据。当数据有限时,这一点尤其有用,因为收集罕见疾病的大型数据集通常具有挑战性。
例如,SHEPHERD 使用少样本学习和生物医学知识图来诊断罕见遗传疾病。它将患者信息(如症状和测试结果)映射到已知基因和疾病的网络上。这有助于查明可能的遗传原因并找到相似的病例,即使数据有限。
在农业中,快速识别植物病害至关重要,因为延迟检测会导致作物大面积受损、产量降低和重大经济损失。传统方法通常依赖于大型数据集和专家知识,但这些方法可能并不总是可用的,尤其是在偏远或资源有限的地区。这就是零样本学习等 AI 进步发挥作用的地方。
假设一位农民种植了西红柿和土豆,并注意到叶子发黄或出现褐色斑点等症状。零样本学习可以帮助识别晚疫病等疾病,而无需大型数据集。通过使用症状描述,该模型可以对以前未见过的疾病进行分类。这种方法快速、可扩展,并让农民能够检测各种植物问题。它有助于他们更有效地监测作物健康,及时采取行动并减少损失。
自动驾驶车辆通常需要适应不同的环境才能安全导航。迁移学习帮助他们利用先前的知识快速适应新条件,而无需从头开始训练。结合计算机视觉(可帮助车辆解释视觉信息),这些技术可以更顺畅地在不同地形和天气条件下导航,从而使自动驾驶更加高效和可靠。
一个很好的实际例子是使用Ultralytics YOLO11来监控停车位的停车管理系统。YOLO11是一个预训练的目标检测模型,可以使用迁移学习进行微调,以实时识别空闲和已占用的停车位。通过在较小的停车场图像数据集上训练模型,它可以学习准确地检测空位、已满车位,甚至预留区域。
该系统与其他技术集成后,可以引导驾驶员前往最近的可用停车位,从而帮助减少搜索时间和交通拥堵。迁移学习通过构建在 YOLO11 现有的目标检测功能之上,使其能够适应停车管理的特定需求,而无需从头开始,从而使这成为可能。这种方法节省了时间和资源,同时创建了一个高效且可扩展的解决方案,从而改善了停车运营并提升了整体用户体验。
计算机视觉中学习范式的未来正朝着开发更智能、更可持续的视觉人工智能系统倾斜。特别地,一个日益增长的趋势是使用混合方法,它结合了少样本学习、零样本学习和迁移学习。通过结合这些方法的优势,模型可以用最少的数据学习新任务,并将它们的知识应用到不同的领域。
一个有趣的例子是使用自适应深度嵌入,利用先前任务中的知识和少量新数据来微调模型,从而更轻松地处理有限的数据集。
同样,X-shot 学习旨在处理具有不同数据量的任务。它使用弱监督,模型从有限或嘈杂的标签中学习,并使用明确的指令来帮助它们快速适应,即使在几乎没有或没有先验示例的情况下也是如此。这些混合方法展示了整合不同学习方法如何帮助 AI 系统更有效地应对挑战。
Few-shot learning(少样本学习)、Zero-shot learning(零样本学习)和迁移学习各自解决了计算机视觉中的特定挑战,使它们适用于不同的任务。正确的方法取决于具体的应用以及有多少可用数据。例如,Few-shot learning(少样本学习)在数据有限的情况下效果良好,而 Zero-shot learning(零样本学习)非常适合处理未见过或不熟悉的类别。
展望未来,将这些方法结合起来,创建集成视觉、语言和音频的混合模型,很可能将成为一个关键焦点。这些进步旨在使 AI 系统更加灵活、高效,并能够解决复杂问题,从而为该领域的创新开辟新的可能性。
加入我们的社区并查看我们的 GitHub 存储库,了解更多关于 AI 的信息。了解自动驾驶汽车中的 AI和农业中的计算机视觉如何重塑未来。查看可用的YOLO 许可证选项以开始使用!