了解监督学习如何通过标记数据为 AI 提供支持,从而实现准确的预测和应用,例如对象检测和情感分析。
监督学习是机器学习(ML)领域的主流模式。 监督学习是机器学习(ML)领域的主流范式。 在这种情况下,算法是根据已标注正确输出的输入数据进行训练的。与系统自主探索数据的其他方法不同 数据的方法不同,这种方法依赖于一个 "监督者"--已标记的数据--来指导学习过程。 标注数据来指导学习过程。其 主要目的是让模型学习一个从输入变量到输出变量的映射函数,并具有足够的准确性,从而能够预测新的输入变量和输出变量的结果。 它可以预测新的、未见过的数据的结果。这种方法是许多 商业 人工智能(AI) 应用的基础,从垃圾邮件过滤器到先进的计算机视觉(CV 计算机视觉 (CV)系统。
工作流程从包含成对输入(特征)和所需输出(标签)的数据集开始。这个数据集 通常分为不同的子集: 用于教授模型的训练数据、用于调整参数的验证数据 用于调整参数,测试数据用于最终评估。 评估。
在模型训练阶段,算法会处理输入数据并进行预测。 输入数据并做出预测。一个称为 损失函数来计算预测结果与实际标签之间的差值。 与实际标签之间的差值。为了最小化这一误差,一种 优化算法,如 梯度下降法等优化算法,反复调整内部 模型权重。这种循环会持续多次、 或历时,直到模型达到令人满意的性能 而不会过度拟合训练集。要深入 深入了解这些机制,可以参考 Scikit-learn 监督学习指南。
根据输出变量的类型,大多数监督学习问题主要分为两类:
通过高级应用程序接口,训练监督模型变得越来越容易。下面的Python 示例 演示了如何在MNIST 数据集(数字分类的标准基准)上训练YOLO11 模型。
from ultralytics import YOLO
# Load a pretrained classification model
model = YOLO("yolo11n-cls.pt")
# Train the model on the MNIST dataset
# Ultralytics handles the download of the 'mnist160' dataset automatically
results = model.train(data="mnist160", epochs=5, imgsz=64)
# Run inference on a sample image to verify the supervised learning
print(model("https://ultralytics.com/images/bus.jpg"))
监督学习为各行各业的关键技术提供动力。两个突出的例子包括
必须将监督学习与其他机器学习范式区分开来: