了解少样本学习如何使 AI 能够以最少的数据进行调整,从而改变医疗诊断和野生动物保护等领域。
Few-Shot Learning(FSL)是机器学习(ML)的一个专门子领域。 机器学习(ML)的一个专门子领域,其重点是训练 人工智能模型来分类、detect或理解新概念。 标注示例来训练人工智能模型,以分类、检测或理解新概念。在传统的 深度学习(DL)中,模型通常需要数千个 图像才能达到较高的准确率。然而,FSL 模拟了人类从有限的经验中快速归纳的能力--就像儿童能够识别出自己的眼睛一样。 就像孩子只看一两张图片就能认出长颈鹿一样。这种能力对于 对于那些获取大量 训练数据昂贵、耗时或几乎不可能的应用来说,这种能力至关重要。 几乎是不可能的。
FSL 的主要目标是利用先验知识,减少对海量数据集的依赖。该模型不是 从头开始学习新模式,而是利用从基础数据集中学到的信息来解释新任务中可用的少量示例。 新任务的可用示例。这通常是通过不同的方法实现的:
在实际计算机视觉(CV)场景中,FSL 通常是通过迁移学习来实现的。通过采用像 YOLO11这样的稳健模型,该模型已经从海量数据集(如 表征。 COCO, 开发人员可以在一个微小的自定义数据集上对模型进行微调。预训练的权重可作为强大的特征 提取器,使模型能在样本极少的情况下收敛到新的类别。
下面的Python 代码演示了如何使用 ultralytics 包装通过
加载预先训练好的模型,并在一个小数据集上进行短时间训练,基本上就能实现少量的
适应。
from ultralytics import YOLO
# Load a pre-trained YOLO11 model to leverage learned feature representations
model = YOLO("yolo11n.pt")
# Fine-tune the model on a small dataset (e.g., 'coco8.yaml' has only 4 images per batch)
# The model adapts its existing knowledge to the new few-shot task
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# The model can now detect objects from the small dataset with high efficiency
要了解 FSL 在人工智能领域的定位,最好将其与类似的学习范式区分开来:
Few-Shot Learning 正在释放数据天然稀缺或罕见异常的行业的潜力。
在医学图像分析中,获得 在医学图像分析中,通常不可能获得数千个罕见病症的标记扫描结果。FSL 使 人工智能模型识别罕见肿瘤类型 或遗传病。像 斯坦福医学中心等机构正在积极探索这些技术,以实现人工智能诊断工具的民主化。 诊断工具。
现代制造领域的人工智能依赖于检测 缺陷来确保质量。然而,特定的缺陷可能在一百万个单位中才会出现一次。工程师无需等待 几个月来收集大量 "缺陷 "数据集,工程师们可以使用 FSL 对象检测系统,而不是等待数月才能收集到大量的 "缺陷 "数据集。 新缺陷,以便立即部署更新的质量保证协议。
在动态环境中运行的机器人经常会遇到从未见过的物体。使用 FSL、 机器人系统只需观看几次演示,就能学会抓取或操纵新工具。 工具。这种能力对于仓储和物流领域的灵活自动化至关重要。 这种能力对于仓储和物流领域的灵活自动化至关重要,而仓储和物流正是波士顿动力(Boston Dynamics)等公司的业务重点。
尽管 FSL 前景广阔,但在可靠性方面仍面临挑战。模型可能对所提供的少数几个特定示例非常敏感。 如果支持集不具代表性,性能就会大幅下降。目前的研究重点是 提高嵌入的鲁棒性和开发 更好的不确定性估计方法。框架,如 PyTorch和 TensorFlow等框架不断发展,为研究人员提供了推动 的工具。随着 YOLO26 这样的模型即将发布,我们期待它们能从最少的数据输入中获得更强的学习能力。