词汇表

半监督学习

了解半监督学习如何结合标记和未标记数据来增强 AI 模型，降低标记成本并提高准确性。

半监督学习（SSL）是机器学习（ML）中的一个强大范例。半监督学习（SSL）是机器学习（ML）中一种强大的范式，它在完全监督学习和半监督学习之间架起了一座桥梁。之间的桥梁。无监督学习之间的桥梁。有监督方法需要完全注释的数据集，而无监督方法则完全在没有标签的情况下工作。利用少量有标记数据和大量无标记数据。在现实世界的许多在许多现实世界中，获取原始数据的成本相对较低，但对数据进行标注的过程却非常昂贵、费时。数据标注过程却昂贵、耗时，而且需要人类的专业知识。需要人类的专业知识。SSL 解决了这一瓶颈问题，它利用有限的标注示例来指导学习过程，使模型能够提取出结构化的数据。让模型从大量未标注的片段中提取结构和模式，从而提高整体模型的准确性和概括性。整体模型的准确性和通用性。

半监督学习的工作原理

SSL 背后的基本机制包括从标记数据向非标记数据传播信息。这一过程一般来说，这一过程首先是在小型标签数据集上训练一个初始模型。然后用这个模型来推断预测。最有信心的预测结果--通常被称为伪标签--被视为基本事实。真值，并在此扩展数据集上重新训练模型。这种迭代循环允许神经网络学习的决策边界比仅从标注数据中学习到的决策边界更稳健。

SSL 常用的技术包括

伪标记：模型为未标记的数据生成标签，并将高置信度的预测结果添加到训练数据中。这通常与置信度阈值与置信度阈值结合使用。
一致性正则化：这种方法鼓励模型对原始图像和扰动版本图像（例如在应用了原始图像和扰动版本的图像（例如，在应用了数据增强）产生相同的预测结果。如果模型能够理解物体，翻转或轻微旋转图像应该不会改变分类结果。您可以阅读更多关于一致性正则化概念的更多信息。
基于图形的方法：数据点在图中表示为节点，其中的边反映了相似性。标签从有标签的节点传播到无标签的邻近节点，这是图式神经网络（GNN）研究中经常讨论的一种技术。图神经网络（GNN）研究中经常讨论的一种技术。

实际应用

在数据丰富但专家注释稀缺的行业中，半监督学习尤其具有变革性。稀缺。

医学图像分析：在医疗保健领域，生成标注数据集，如肿瘤检测需要高薪聘请放射科医生对核磁共振成像或 CT 扫描进行人工标注。有了 SSL，研究人员就可以在一小部分由医生验证的数据集上训练模型。然后利用成千上万未加注释的医院档案来提高性能。性能。这大大降低了成本，同时保持了医疗领域的高诊断标准。人工智能在医疗保健领域的应用
语音识别：专门的语音助手需要大量的音频数据。虽然转录数千小时的音频是不切实际的，但科技公司可以使用一小部分转录语音来训练一个基础模型。然后，该模型会从数百万小时的未转录音频中学习细微差别。网络数据中找到的数百万小时未转录音频中的细微差别进行学习，通过自动语音识别改进其理解不同口音和方言的能力。自动语音识别。

区分相关概念

要充分理解 SSL，最好将其与类似的学习范式区分开来：

SSL 与自我监督学习（Self-Supervised Learning）： 虽然它们的首字母缩写相同，但却截然不同。自监督学习会根据数据结构创建自己的标签（例如，预测句子中的下一个单词或图像中的缺失补丁例如，预测句子中的下一个单词或图像中缺失的补丁）。半监督学习仍然依赖于人类提供的标签种子集来指导学习过程。
SSL 与主动学习在主动学习：在主动学习中，模型会找出最容易混淆的数据点，并明确要求人类给它们贴上标签。它们。相比之下，SSL 试图自动解决未标注数据的问题，而不会中断工作流程，让人工输入。人工输入。
SSL 与迁移学习： 迁移学习包括源任务（如ImageNet）中的模型权重并在目标任务中对其进行微调。SSL 侧重于使用同一目标分布中的未标记数据分布，从一开始就改善学习效果。

具体实施

实施半监督工作流程通常涉及 "教师-学生 "循环或迭代培训。下面是一个概念性示例，使用 ultralytics Python 软件包来演示如何根据来生成预测，这些预测可以作为进一步训练的伪标签。

from ultralytics import YOLO

# Initialize the YOLO11 model (Teacher)
model = YOLO("yolo11n.pt")

# Train initially on a small, available labeled dataset
model.train(data="coco8.yaml", epochs=10)

# Run inference on a directory of unlabeled images to generate predictions
# These results can be filtered by confidence to create 'pseudo-labels'
results = model.predict(source="./unlabeled_data", save_txt=True, conf=0.8)

# The saved text files from prediction can now be combined with the original
# dataset to retrain a robust 'Student' model.

工具和未来展望

深度学习框架，如 PyTorch和 TensorFlow等深度学习框架提供了实现自定义 SSL 循环和损失函数所需的构建模块。随着模型越来越大、数据量越来越大，像 SSL 这样的技术正成为标准做法以最大限度地提高数据效率。

即将推出的Ultralytics 平台旨在简化类似的工作流程，帮助团队管理从原始数据到模型部署的过渡。从原始数据到模型部署的过渡。数据整理和自动注释流程，帮助团队管理从原始数据到模型部署的过渡。通过通过有效利用无标记数据，企业可以部署高性能的人工智能解决方案，如 YOLO11这样的高性能人工智能解决方案。监督方法。

半监督学习

培训Ultralytics YOLO 模型，以简化各行业的工作流程

灵活的企业许可解决方案，助力您的创新

使用Ultralytics YOLO在数秒内训练人工智能模型

半监督学习的工作原理

实际应用

区分相关概念

具体实施

工具和未来展望

阅读更多此类别的内容

未来物体检测趋势：需要关注的 7 个关键问题

利用Ultralytics YOLO 模型增强车辆再识别能力

利用Ultralytics YOLO 模型改进碰撞预测

加入Ultralytics 社区