探索 AI 中的监督学习。了解 Ultralytics YOLO26 等模型如何利用标注数据进行分类和回归,以实现高精度结果。
监督学习是人工智能 (AI)中的一种基础方法,其中算法通过带有正确输出标签的输入数据进行训练。在此方法中,模型通过将其自身预测与这些提供的标签进行比较来学习,本质上在训练过程中有一个“监督者”来纠正它。主要目标是让系统充分学习从输入到输出的映射函数,以便能够准确预测新的、未见过的测试数据的标签。这种技术是当今许多最实用和成功的 AI 应用背后的驱动力,从电子邮件垃圾邮件过滤器到自动驾驶系统。
监督学习的工作流程围绕着标注数据的使用展开。构建一个数据集,其中每个训练样本都与相应的“真实标签”配对。在模型训练阶段,算法处理输入特征并生成预测。一个称为损失函数的数学公式会测量误差——即模型预测与实际标签之间的差异。
为了最小化这个误差,优化算法(例如随机梯度下降(SGD))会迭代调整模型的内部参数或模型权重。这个过程会重复多个周期,这些周期被称为epochs,直到模型在不过拟合训练数据的情况下达到令人满意的准确度。像Ultralytics Platform这样的工具通过在统一环境中管理数据集标注、训练和评估,简化了整个流程。
监督学习问题通常基于目标变量的性质分为两种主要类型:
监督学习驱动着跨越不同行业的广泛技术:
将监督学习与无监督学习区分开来非常重要。监督学习依赖于带有标签的输入-输出对,而无监督学习则处理无标签数据。在无监督场景中,算法会尝试自主发现数据中的隐藏结构、模式或分组,例如市场营销中的客户细分。监督学习通常在有历史数据的特定任务中更准确,而无监督学习则更适合探索性数据分析。
监督学习是训练现代计算机视觉模型的关键。以下 python 代码片段演示了如何使用监督数据集 (COCO8) 训练 YOLO26 模型。模型从数据集中标注的图像中学习以 detect 对象。
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n.pt") # load a pretrained model (recommended for training)
# Train the model using the 'coco8.yaml' dataset (supervised learning)
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)
# The model is now fine-tuned based on the supervised labels in the dataset
这一简单过程在底层利用了 PyTorch 的强大功能,以执行复杂的矩阵运算和梯度计算。对于那些希望简化数据管理方面的人来说,Ultralytics Platform 提供了用于云端 training 和自动标注的工具,显著提高了监督学习工作流的效率。

开启您的机器学习未来之旅