了解模型权重在机器学习中的重要性、它们在预测中的作用,以及 Ultralytics YOLO 如何简化它们在人工智能任务中的使用。
模型权重是神经网络中的数字参数,在训练过程中进行调整。这些数值基本上代表了模型的学习知识。把它们想象成一个非常复杂的方程中的系数;通过调整这些系数,模型学会将输入数据(如图像)映射到所需的输出(如物体周围的边界框)。模型权重的质量直接决定了它在特定任务(如图像分类或物体检测)中的表现。
模型权重不是手动设置的,而是从数据中 "学习 "出来的。这一过程首先是将权重初始化为小的随机数。在训练过程中,模型会对训练数据进行预测,损失函数会计算这些预测的错误程度。然后,这个误差信号会被用于一个称为反向传播的过程,以计算相对于每个权重的损失梯度。然后,随机梯度下降(SGD)等优化算法会沿着梯度的相反方向调整权重,以最小化误差。这个循环会重复许多次,直到模型在单独验证数据集上的性能不再提高,这表明它已经学会了数据中的模式。
从零开始训练最先进的模型需要大量的计算资源和海量数据集。为了克服这一困难,计算机视觉领域广泛使用预训练权重。这包括使用一个模型,比如Ultralytics YOLO模型,该模型已经在COCO 等大型通用数据集上训练过。通过一种称为迁移学习的过程,这些权重可以作为新的特定任务的绝佳起点。通过使用预先训练好的权重,您可以用更少的数据实现更高的准确性,并通过称为微调的过程缩短训练时间。
必须将模型权重与机器学习中的其他相关术语区分开来:
随着模型变得越来越复杂,管理其权重和产生权重的实验对可重复性和协作至关重要。权重与偏差(Weights & Biases,W&B)等工具专门为MLOps 提供了一个平台,允许团队跟踪超参数、指标、代码版本以及每次实验产生的模型权重。值得注意的是,"权重与偏差 "平台有别于作为神经网络参数的 "权重 "和 "偏差 "概念;该平台有助于管理寻找最佳权重和偏差的过程。您可以在文档中了解更多关于将 Ultralytics 与 W&B 整合的信息。高效管理是使用PyTorch或TensorFlow 等框架完成从超参数调整到模型部署等任务的关键。Ultralytics HUB等平台也为管理整个模型生命周期提供了集成解决方案。