探索人工智能中的监督学习。了解Ultralytics 等模型如何利用标注数据进行分类和回归,从而实现高精度结果。
监督学习是人工智能(AI)领域的基础方法,其算法通过标记正确输出结果的输入数据进行训练。在此方法中,模型通过将自身预测与给定标签进行对比来学习,本质上是在训练过程中由"监督者"进行纠正。 其核心目标是使系统充分掌握输入到输出的映射函数,从而能够准确预测新测试数据的标签。这项技术驱动着当今众多实用且成功的AI应用,从电子邮件垃圾过滤器到自动驾驶系统皆属此列。
监督学习的工作流程围绕标注数据展开。数据集经过精心整理,每个训练样本都配有对应的"真实标签"。在模型训练阶段,算法处理输入特征并生成预测结果。随后通过称为损失函数的数学公式衡量误差——即模型预测值与实际标签之间的差异。
为最大限度减少此误差,可采用 优化算法(如 随机梯度下降(SGD) 反复调整模型内部参数或 模型权重。该过程在多个周期(称为训练 epoch)中循环进行, 直至模型在不拟合训练数据的前提下 达到满意的准确度水平。Ultralytics 通过在统一环境中管理数据集标注、训练和评估, 简化了整个流程Ultralytics
监督学习问题通常根据目标变量的性质分为两大类:
监督学习为不同行业的众多技术提供支持:
区分监督学习与无监督学习至关重要。监督学习依赖于标记的输入-输出对,而无监督学习则处理无标记数据。 在无监督场景中,算法会自主尝试发掘数据中的隐含结构、模式或分组关系,例如营销中的客户细分。对于存在历史数据的特定任务,监督学习通常更精准;而无监督学习则更适用于探索性数据分析。
监督学习是训练现代计算机视觉模型的核心方法。以下Python 演示了如何使用监督数据集(COCO8)训练YOLO26模型。该模型通过学习数据集中的标注图像来detect 。
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n.pt") # load a pretrained model (recommended for training)
# Train the model using the 'coco8.yaml' dataset (supervised learning)
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)
# The model is now fine-tuned based on the supervised labels in the dataset
这个简单的过程利用了 PyTorch 在后台执行 复杂矩阵运算和梯度计算。对于希望优化数据管理环节的用户, Ultralytics 提供基于云端的训练工具和 自动标注功能,显著提升监督学习工作流的效率。