术语表

型号重量

了解模型权重在机器学习中的重要性、它们在预测中的作用,以及 Ultralytics YOLO 如何简化它们在人工智能任务中的使用。

模型权重是神经网络中的数字参数,在训练过程中进行调整。这些数值基本上代表了模型的学习知识。把它们想象成一个非常复杂的方程中的系数;通过调整这些系数,模型学会将输入数据(如图像)映射到所需的输出(如物体周围的边界框)。模型权重的质量直接决定了它在特定任务(如图像分类物体检测)中的表现。

如何确定重量

模型权重不是手动设置的,而是从数据中 "学习 "出来的。这一过程首先是将权重初始化为小的随机数。在训练过程中,模型会对训练数据进行预测,损失函数会计算这些预测的错误程度。然后,这个误差信号会被用于一个称为反向传播的过程,以计算相对于每个权重的损失梯度。然后,随机梯度下降(SGD)优化算法会沿着梯度的相反方向调整权重,以最小化误差。这个循环会重复许多次,直到模型在单独验证数据集上的性能不再提高,这表明它已经学会了数据中的模式。

预训练重量的重要性

从零开始训练最先进的模型需要大量的计算资源和海量数据集。为了克服这一困难,计算机视觉领域广泛使用预训练权重。这包括使用一个模型,比如Ultralytics YOLO模型,该模型已经在COCO 等大型通用数据集上训练过。通过一种称为迁移学习的过程,这些权重可以作为新的特定任务的绝佳起点。通过使用预先训练好的权重,您可以用更少的数据实现更高的准确性,并通过称为微调的过程缩短训练时间。

实际应用

  • 医学图像分析:开发人员可以利用YOLOv8模型及其预先训练的权重,在定制的脑肿瘤扫描数据集上对其进行微调。由此产生的模型具有专门优化的权重,可以识别肿瘤的细微模式,协助放射科医生进行诊断。这是人工智能在医疗保健领域的重要应用。
  • 零售库存管理:零售公司可以使用模型来监控货架和清点产品。根据商店产品的图像对物体检测模型进行微调。最终的权重可使模型准确检测和清点特定物品,从而实现自动库存跟踪

权重与相关概念

必须将模型权重与机器学习中的其他相关术语区分开来:

  • 超参数与学习权重不同,超参数是在训练开始前配置的。例如学习率批量大小和优化器的选择。寻找最佳超参数配置的过程称为超参数调整
  • 偏差:权重和偏置都是学习到的参数。不过,权重会缩放神经元的输出,而偏置项则会移动神经元的输出。它们共同赋予神经网络适应数据的灵活性。
  • 模型架构:架构(如主干检测头)是模型的蓝图--它定义了层以及层与层之间的连接方式。权重是该结构中的值。同一结构可以有无数不同的权重集,这取决于它是如何训练的。您可以探索不同的模型比较,了解架构的差异。

管理和跟踪重量

随着模型变得越来越复杂,管理其权重和产生权重的实验对可重复性和协作至关重要。权重与偏差(Weights & Biases,W&B)等工具专门为MLOps 提供了一个平台,允许团队跟踪超参数、指标、代码版本以及每次实验产生的模型权重。值得注意的是,"权重与偏差 "平台有别于作为神经网络参数的 "权重 "和 "偏差 "概念;该平台有助于管理寻找最佳权重和偏差的过程。您可以在文档中了解更多关于将 Ultralytics 与 W&B 整合的信息。高效管理是使用PyTorchTensorFlow 等框架完成从超参数调整模型部署等任务的关键。Ultralytics HUB等平台也为管理整个模型生命周期提供了集成解决方案。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、合作和成长

立即加入
链接复制到剪贴板