深圳Yolo 视觉
深圳
立即加入
词汇表

半监督学习

了解半监督学习如何结合标记和未标记数据来增强 AI 模型,降低标记成本并提高准确性。

半监督学习(SSL)是机器学习(ML)中的一个强大范例。 半监督学习(SSL)是机器学习(ML)中一种强大的范式,它在完全监督学习和半监督学习之间架起了一座桥梁。 之间桥梁。 无监督学习之间桥梁。有监督 方法需要完全注释的数据集,而无监督方法则完全在没有标签的情况下工作。 利用少量有标记数据和大量无标记数据。在现实世界的许多 在许多现实世界中,获取原始数据的成本相对较低,但对数据进行标注的过程却非常昂贵、费时。 数据标注过程却昂贵、耗时,而且需要人类的专业知识。 需要人类的专业知识。SSL 解决了这一瓶颈问题,它利用有限的标注示例来指导学习过程,使模型能够提取出结构化的数据。 让模型从大量未标注的片段中提取结构和模式,从而提高整体模型的准确性和概括性。 整体模型的准确性和通用性。

半监督学习的工作原理

SSL 背后的基本机制包括从标记数据向非标记数据传播信息。这一过程 一般来说,这一过程首先是在小型标签数据集上训练一个初始模型。然后用这个模型来推断 预测。最有信心的预测结果--通常被称为伪标签--被视为基本事实。 真值,并在此扩展数据集上重新训练模型。这种迭代循环允许 神经网络学习的决策边界 比仅从标注数据中学习到的决策边界更稳健。

SSL 常用的技术包括

  • 伪标记:模型为未标记的数据生成标签,并将高置信度的预测结果 添加到训练数据中。这通常与置信度阈值 与置信度阈值结合使用。
  • 一致性正则化:这种方法鼓励模型对原始图像和扰动版本图像(例如在应用了 原始图像和扰动版本的图像(例如,在应用了 数据增强)产生相同的预测结果。如果模型能够理解 物体,翻转或轻微旋转图像应该不会改变分类结果。您可以阅读更多关于 一致性正则化概念的更多信息。
  • 基于图形的方法:数据点在图中表示为节点,其中的边反映了 相似性。标签从有标签的节点传播到无标签的邻近节点,这是图式神经网络(GNN)研究中经常讨论的一种技术。 图神经网络(GNN)研究中经常讨论的一种技术。

实际应用

在数据丰富但专家注释稀缺的行业中,半监督学习尤其具有变革性。 稀缺。

  1. 医学图像分析:在医疗保健领域,生成 标注数据集,如 肿瘤检测 需要高薪聘请放射科医生对核磁共振成像或 CT 扫描进行人工标注。有了 SSL,研究人员就可以在一小部分由医生验证的数据集上训练模型。 然后利用成千上万未加注释的医院档案来提高性能。 性能。这大大降低了成本,同时保持了医疗领域的高诊断标准。 人工智能在医疗保健领域的应用
  2. 语音识别:专门的语音助手需要大量的音频数据。虽然 转录数千小时的音频是不切实际的,但科技公司可以使用一小部分转录语音来 训练一个基础模型。然后,该模型会从数百万小时的未转录音频中学习细微差别。 网络数据中找到的数百万小时未转录音频中的细微差别进行学习,通过自动语音识别改进其理解不同口音和方言的能力。 自动语音识别

区分相关概念

要充分理解 SSL,最好将其与类似的学习范式区分开来:

  • SSL 与 自我监督学习(Self-Supervised Learning): 虽然它们的首字母缩写相同,但却截然不同。自监督学习会根据数据结构创建自己的标签(例如,预测句子中的下一个单词或图像中的缺失补丁 例如,预测句子中的下一个单词或图像中缺失的补丁)。 半监督学习仍然依赖于人类提供的标签种子集来指导学习过程。
  • SSL 与主动学习在 主动学习:在主动学习中,模型会找出最容易混淆的数据点,并明确要求人类给它们贴上标签。 它们。相比之下,SSL 试图自动解决未标注数据的问题,而不会中断工作流程,让人工输入。 人工输入。
  • SSL 与迁移学习 迁移学习包括 源任务(如ImageNet)中的模型权重 并在目标任务中对其进行微调。SSL 侧重于使用同一目标分布中的未标记数据 分布,从一开始就改善学习效果。

具体实施

实施半监督工作流程通常涉及 "教师-学生 "循环或迭代培训。下面 是一个概念性示例,使用 ultralytics Python 软件包来演示如何根据 来生成预测,这些预测可以作为进一步训练的伪标签。

from ultralytics import YOLO

# Initialize the YOLO11 model (Teacher)
model = YOLO("yolo11n.pt")

# Train initially on a small, available labeled dataset
model.train(data="coco8.yaml", epochs=10)

# Run inference on a directory of unlabeled images to generate predictions
# These results can be filtered by confidence to create 'pseudo-labels'
results = model.predict(source="./unlabeled_data", save_txt=True, conf=0.8)

# The saved text files from prediction can now be combined with the original
# dataset to retrain a robust 'Student' model.

工具和未来展望

深度学习框架,如 PyTorchTensorFlow等深度学习框架提供了实现自定义 SSL 循环和损失函数所需的构建模块。随着模型越来越大、数据量越来越大,像 SSL 这样的技术正成为标准做法 以最大限度地提高数据效率。

即将推出的Ultralytics 平台旨在简化类似的工作流程,帮助团队管理从原始数据到模型部署的过渡。 从原始数据到模型部署的过渡。 数据整理和 自动注释流程,帮助团队管理从原始数据到模型部署的过渡。通过 通过有效利用无标记数据,企业可以部署高性能的人工智能解决方案,如 YOLO11这样的高性能人工智能解决方案。 监督方法。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入