了解模型权重在机器学习中的重要性、它们在预测中的作用,以及Ultralytics YOLO 如何简化它们在人工智能任务中的使用。
模型权重是神经网络中可学习的基本参数。 神经网络中可学习的基本参数。 有意义的预测。这些数值的作用类似于生物大脑中突触的强度,决定了特定输入特征对网络输出的影响程度。 值决定了特定输入特征对网络输出的影响程度。当模型处理 图像或文本等信息时,输入数据会逐层乘以这些权重。最终 这些加权信号的最终组合产生结果,无论是 图像分类、语言翻译或 识别视频流中的物体。
权重不是静态的,而是在训练过程中不断改进的动态值。 在训练过程中不断完善。最初,模型的权重是随机的 权重,这意味着它的预测基本上是猜测。通过一个称为 监督学习的循环,模型会将其预测结果 预测与标注的训练数据集进行比较。A 数学公式 损失函数来计算误差--即 即预测值与实际值之间的误差。
为尽量减小这一误差,模型采用了一种 优化算法,如 随机梯度下降算法(SGD 或Adam算法。这种算法通过 反向传播计算梯度,以确定每个权重应如何调整 权重应如何调整--增加或减少--以减少下一次迭代中的误差。这一循环 直到权重收敛到一个最佳状态,使模型达到高精度。 状态,使模型达到高精度。
要充分理解模型权重,最好将其与机器学习中的相关术语区分开来。 机器学习中的相关术语区分开来:
从头开始训练模型需要大量的数据集和计算资源。 计算资源。为了解决这个问题,开发人员通常会使用预训练权重。这包括将一个模型如 YOLO11这样的模型,该模型已经从大型数据集(如 表征。 COCO等大型数据集中学习了丰富的特征表征,并将其应用于新的 问题。
这种技术被称为迁移学习、 允许用户在较小的自定义数据集上对模型进行微调、 自定义数据集上对模型进行微调。预先训练的权重提供了一个 "起跑线",使模型能够立即识别边缘、纹理和形状,从而加快训练速度,提高性能、 纹理和形状,从而提高训练速度和性能。
下面的Python 代码段演示了如何将特定的预训练权重加载到YOLO11 模型中,以便立即进行 物体检测。
from ultralytics import YOLO
# Load the YOLO11 model with pre-trained weights (learned on COCO)
model = YOLO("yolo11n.pt")
# Run inference on an image using the loaded weights
# The weights determine the model's ability to recognize the bus
results = model("https://ultralytics.com/images/bus.jpg")
# Display the resulting bounding boxes and classes
results[0].show()
优化模型权重的实用性在各行各业都有体现,其中包括 部署了人工智能解决方案:
随着研究的深入,处理重量的方式也在不断发展。像 模型量化等技术降低了权重的精度 权重的精度(例如,从 32 位浮点到 8 位整数),以减小文件大小,加快边缘设备上的推理速度,同时又不会明显牺牲精度。 边缘设备上的推理速度,而不会明显牺牲精度。 此外,YOLO26等即将推出的架构旨在 此外,即将推出的架构(如 YOLO26)旨在建立更高效的模型,确保学习到的权重能为每个参数提供尽可能高的性能。 性能。
有效管理这些文件也至关重要。像 Ultralytics Platform这样的平台可以让团队无缝地对模型权重进行版本控制、track和部署。 权重,确保生产中的模型始终是性能最佳的版本。

