探索 One-Shot Learning 的强大功能,这是一种革命性的人工智能技术,使模型能够从最少的数据中进行泛化,从而应用于实际场景。
单样本学习 (OSL) 是机器学习 (ML)中的一项分类任务,其中模型经过训练,只需一个示例即可识别新的对象类别。与需要大量训练数据的传统深度学习模型不同,OSL 旨在模仿人类从单个实例中学习新概念的能力。这使得它在数据收集成本高昂、困难或不可能的情况下尤其有价值。其核心思想不是学习直接对对象进行分类,而是学习一种相似性函数,该函数可以确定两个图像是否属于同一类别。
OSL 模型通常不是训练模型来识别特定类别,而是接受不同的任务训练:确定两个输入图像是否相同。用于此目的的常见架构是 Siamese Network,它由两个相同的 神经网络 组成,这两个网络共享相同的 权重。每个网络处理两个输入图像中的一个,以创建一个 embedding——图像的紧凑数值表示。
然后,该模型比较这两个嵌入以计算相似度分数。在模型训练期间,网络学习为同一类别的图像生成相似的嵌入,为不同类别的图像生成不同的嵌入。训练完成后,模型可以通过将新图像与每个已知类别的单个“样本”或示例进行比较来对新图像进行分类。新图像被分配给具有最高相似度分数的类别。这种方法在很大程度上依赖于良好的 特征提取 来构建强大的表示。
OSL 是一系列更广泛的学习方法的一部分,专为低数据场景而设计:
在数据稀缺的情况下,小样本学习非常有效。
OSL 的主要挑战在于泛化。模型必须从单个示例中学习一个类的核心本质,而不会过度拟合到其特定特征。因此,单个示例的质量至关重要。正在进行的研究,例如 Papers with Code 上重点介绍的工作,侧重于开发更强大的特征表示和先进的 元学习 策略。将 OSL 功能集成到像 Ultralytics HUB 这样的通用视觉平台中,可以极大地扩展它们在数据受限环境中的使用。随着模型变得越来越强大,在这些严苛的条件下使用适当的 性能指标 评估它们也是一个关键的研究领域。