深圳Yolo 视觉
深圳
立即加入
词汇表

Few-Shot Learning (少样本学习)

探索小样本学习 (FSL) 如何用少量数据训练 AI。了解 Ultralytics YOLO26 如何利用元学习实现快速适应和高精度。

小样本学习 (FSL) 是机器学习 (ML)的一个专门子领域,旨在通过极少量带标签的示例来训练模型识别和分类新概念。在传统的深度学习 (DL)中,实现高精度通常需要每个类别包含数千张图像的海量数据集。然而,FSL 模仿了人类从有限经验中快速泛化的认知能力——就像孩子在书中只看到一两张长颈鹿图片后就能认出长颈鹿一样。这种能力对于在收集大量训练数据成本过高、耗时或实际上不可能的场景中部署人工智能 (AI)至关重要。

少量学习的核心机制

FSL的主要目标是通过利用先验知识来减少对大规模数据收集的依赖。 该模型无需从零开始学习模式,而是利用包含少量标注样本的"支持集"来理解新类别。这通常通过元学习(亦称"学习如何学习")等先进技术实现。在此范式下,模型通过训练多种任务来习得最优初始化或更新规则,从而能以最小调整适应新任务。

另一种常见方法是基于度量的学习,模型通过嵌入技术将输入数据映射到向量空间。 在此空间中,相似元素 被聚类至邻近位置,而相异元素则被推离。诸如 原型网络等算法会为每类计算均值表示(即原型), 并根据classify 查询样本与这些原型的距离classify 。该方法通常依赖于 在大型通用数据集预训练阶段 培养的特征提取能力。

实际应用

少样本学习正在改变那些因数据稀缺而阻碍人工智能技术应用的行业。

医学影像与诊断

医学图像分析领域,获取数千张稀有病理的带标签扫描图通常是不可行的。FSL 允许研究人员仅使用少量带注释的案例研究,训练计算机视觉 (CV)系统来检测罕见肿瘤类型或特定基因异常。这种能力使先进诊断工具的获取变得大众化,这是像斯坦福医学院这样的机构所追求的目标,有助于识别那些否则需要专业人类知识才能诊断的疾病。

工业质量控制

现代制造业人工智能高度依赖自动化检测。然而某些特定缺陷可能极为罕见,导致难以构建大规模的"不良"零件数据集。FSL技术使异常检测系统仅凭少量图像即可学习新型缺陷特征,使工厂操作员能够快速更新质量保证协议,无需停产收集数据,从而显著提升动态生产环境中的效率。

区分相关概念

区分FSL与类似的低数据学习范式有助于理解其特定的应用领域:

  • 迁移学习自监督学习(FSL)通常被实现为迁移学习的一种特殊极端形式。标准迁移学习可能通过数百张图像对YOLO26等模型进行微调,而FSL则针对每类仅有5至10张图像的场景(称为"N类K样本"分类)。
  • 单样本学习这是 自由样本学习(FSL)的严格子集,要求模型仅从单个标注样本中学习。该技术常用于 人脸识别领域,通过比对存储的单张照片来 验证身份。
  • 零样本学习不同于需要至少少量视觉支持集的监督学习,零样本学习在训练过程中无需目标类的视觉样本。它依赖语义描述或属性(如文本提示)来识别未见过的对象。

Ultralytics的实际应用

在实践中,执行小样本学习最有效的方法之一是利用高度鲁棒的预训练模型。像新型YOLO26这样的最先进模型已经从像COCOImageNet这样的海量数据集中学习了丰富的特征表示。通过在小型自定义数据集上微调这些模型,它们可以以惊人的速度和准确性适应新任务。

以下Python 演示了如何使用小数据集训练模型: ultralytics 包,有效实现少样本适应:

from ultralytics import YOLO

# Load a pre-trained YOLO26 model (incorporates learned features)
model = YOLO("yolo26n.pt")

# Fine-tune on a tiny dataset (e.g., coco8 has only 4 images per batch)
# This leverages the model's prior knowledge for the new task
results = model.train(data="coco8.yaml", epochs=20, imgsz=640)

# The model adapts to detect objects in the small dataset
print("Few-shot adaptation complete.")

挑战与未来展望

尽管FSL功能强大,但其在可靠性方面面临挑战。如果提供的少量示例是异常值或存在噪声,模型性能可能会下降,这个问题被称为过拟合。对数据增强合成数据生成的研究对于缓解这些风险至关重要。随着基础模型变得更大、能力更强,以及Ultralytics Platform等工具简化了模型训练和管理,利用少量数据创建定制AI解决方案的能力将越来越普及,全球开发者将更容易获得。

让我们一起共建AI的未来!

开启您的机器学习未来之旅