敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024
词汇表

One-Shot Learning (单样本学习)

探索 One-Shot Learning 的强大功能,这是一种革命性的人工智能技术,使模型能够从最少的数据中进行泛化,从而应用于实际场景。

单样本学习 (OSL) 是机器学习 (ML)中的一项分类任务,其中模型经过训练,只需一个示例即可识别新的对象类别。与需要大量训练数据的传统深度学习模型不同,OSL 旨在模仿人类从单个实例中学习新概念的能力。这使得它在数据收集成本高昂、困难或不可能的情况下尤其有价值。其核心思想不是学习直接对对象进行分类,而是学习一种相似性函数,该函数可以确定两个图像是否属于同一类别。

One-Shot Learning 的工作原理

OSL 模型通常不是训练模型来识别特定类别,而是接受不同的任务训练:确定两个输入图像是否相同。用于此目的的常见架构是 Siamese Network,它由两个相同的 神经网络 组成,这两个网络共享相同的 权重。每个网络处理两个输入图像中的一个,以创建一个 embedding——图像的紧凑数值表示。

然后,该模型比较这两个嵌入以计算相似度分数。在模型训练期间,网络学习为同一类别的图像生成相似的嵌入,为不同类别的图像生成不同的嵌入。训练完成后,模型可以通过将新图像与每个已知类别的单个“样本”或示例进行比较来对新图像进行分类。新图像被分配给具有最高相似度分数的类别。这种方法在很大程度上依赖于良好的 特征提取 来构建强大的表示。

与其他学习范式的关系

OSL 是一系列更广泛的学习方法的一部分,专为低数据场景而设计:

  • Few-Shot Learning (FSL): 是 OSL 的一种推广,其中模型从每个类别的少量示例(例如,2 到 5 个)而不是仅一个示例中学习。FSL 提供了比 OSL 更多的信息,通常会带来更好的性能。
  • 零样本学习(Zero-Shot Learning - ZSL):一种更具挑战性的模式,模型必须识别在训练期间从未见过的类别,通常是通过学习视觉特征和高级语义描述之间的映射来实现。
  • 元学习: 通常被称为“学习如何学习”,这种方法在各种各样的学习任务上训练模型,使其能够更有效地解决新任务。许多OSL和FSL技术都基于元学习原理,正如加州大学伯克利分校的BAIR等机构的研究中所描述的那样。
  • 迁移学习:这涉及使用在大型数据集(如 ImageNet)上预训练的模型,然后在较小的特定数据集上微调它。虽然相关,但 OSL 侧重于从单个示例中学习,而无需进行广泛的微调。

实际应用

在数据稀缺的情况下,小样本学习非常有效。

  1. 人脸识别: 安全系统可以使用 OSL 在仅显示一张照片后识别一个人。该系统学习创建唯一的面部签名(嵌入),然后可以从不同的角度和各种光照条件下识别该人。这用于从解锁智能手机到安全建筑物访问等应用。Facebook AI 的一篇早期有影响力的论文 DeepFace 展示了深度网络在此任务中的强大功能。
  2. 药物发现: 在药理学中,鉴定可能成为有效药物的新分子是一个昂贵的过程。 OSL可用于构建模型,以基于具有所需特征的单个已知示例来预测新分子的特性。 这加快了筛选过程,如关于基于图的深度学习用于药物开发的研究中所讨论的那样。

挑战和未来方向

OSL 的主要挑战在于泛化。模型必须从单个示例中学习一个类的核心本质,而不会过度拟合到其特定特征。因此,单个示例的质量至关重要。正在进行的研究,例如 Papers with Code 上重点介绍的工作,侧重于开发更强大的特征表示和先进的 元学习 策略。将 OSL 功能集成到像 Ultralytics HUB 这样的通用视觉平台中,可以极大地扩展它们在数据受限环境中的使用。随着模型变得越来越强大,在这些严苛的条件下使用适当的 性能指标 评估它们也是一个关键的研究领域。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入
链接已复制到剪贴板