深圳Yolo 视觉
深圳
立即加入
词汇表

模型权重

了解模型权重在机器学习中的重要性、它们在预测中的作用,以及Ultralytics YOLO 如何简化它们在人工智能任务中的使用。

模型权重是神经网络中可学习的基本参数。 神经网络中可学习的基本参数。 有意义的预测。这些数值的作用类似于生物大脑中突触的强度,决定了特定输入特征对网络输出的影响程度。 值决定了特定输入特征对网络输出的影响程度。当模型处理 图像或文本等信息时,输入数据会逐层乘以这些权重。最终 这些加权信号的最终组合产生结果,无论是 图像分类、语言翻译或 识别视频流中的物体。

如何学习模型权重

权重不是静态的,而是在训练过程中不断改进的动态值。 在训练过程中不断完善。最初,模型的权重是随机的 权重,这意味着它的预测基本上是猜测。通过一个称为 监督学习的循环,模型会将其预测结果 预测与标注的训练数据集进行比较。A 数学公式 损失函数来计算误差--即 即预测值与实际值之间的误差。

为尽量减小这一误差,模型采用了一种 优化算法,如 随机梯度下降算法(SGD 或Adam算法。这种算法通过 反向传播计算梯度,以确定每个权重应如何调整 权重应如何调整--增加或减少--以减少下一次迭代中的误差。这一循环 直到权重收敛到一个最佳状态,使模型达到高精度。 状态,使模型达到高精度

区分关键概念

要充分理解模型权重,最好将其与机器学习中的相关术语区分开来。 机器学习中的相关术语区分开来:

  • 偏见:权重控制变换的陡度或范围,而偏置允许激活函数向左或向右移动。 向左或向右移动。weights and biases 共同作用,使网络能够适应复杂的非线性数据模式。
  • 超参数:权重是从数据中学习的,而超参数是在训练开始前配置的结构设置。 超参数则是训练开始配置的结构设置。例如 学习率、 网络中的层数
  • 建筑模型:架构是网络(如 ResNet 或Transformer)的蓝图或骨架,定义神经元如何连接。 神经元的连接方式。权重是存储在该结构中的具体值。

迁移学习的力量

从头开始训练模型需要大量的数据集和计算资源。 计算资源。为了解决这个问题,开发人员通常会使用预训练权重。这包括将一个模型如 YOLO11这样的模型,该模型已经从大型数据集(如 表征。 COCO等大型数据集中学习了丰富的特征表征,并将其应用于新的 问题。

这种技术被称为迁移学习、 允许用户在较小的自定义数据集上对模型进行微调、 自定义数据集上对模型进行微调。预先训练的权重提供了一个 "起跑线",使模型能够立即识别边缘、纹理和形状,从而加快训练速度,提高性能、 纹理和形状,从而提高训练速度和性能。

下面的Python 代码段演示了如何将特定的预训练权重加载到YOLO11 模型中,以便立即进行 物体检测

from ultralytics import YOLO

# Load the YOLO11 model with pre-trained weights (learned on COCO)
model = YOLO("yolo11n.pt")

# Run inference on an image using the loaded weights
# The weights determine the model's ability to recognize the bus
results = model("https://ultralytics.com/images/bus.jpg")

# Display the resulting bounding boxes and classes
results[0].show()

实际应用

优化模型权重的实用性在各行各业都有体现,其中包括 部署了人工智能解决方案

  • 人工智能在医疗保健领域的应用:放射科医生使用根据医学图像微调权重的模型来辅助诊断。例如,一个模型 可以识别核磁共振扫描中的脑肿瘤。这个特定模型中的 该特定模型中的权重已学会区分健康组织和异常组织之间细微的纹理差异。 和异常组织之间的细微纹理差异,从而提供第二意见,增强诊断信心。
  • 智能零售系统:零售商利用计算机视觉 自动结账流程。配备了对产品包装进行模型权重训练的摄像系统可即时 识别放在柜台上的商品。这种应用依赖于砝码将视觉输入(如麦片盒的颜色和徽标)映射到正确的产品 SKU 的能力。 谷物盒的颜色和徽标等视觉输入映射到正确的产品 SKU,从而实现库存管理。 库存管理

模型权重的未来

随着研究的深入,处理重量的方式也在不断发展。像 模型量化等技术降低了权重的精度 权重的精度(例如,从 32 位浮点到 8 位整数),以减小文件大小,加快边缘设备上的推理速度,同时又不会明显牺牲精度。 边缘设备上的推理速度,而不会明显牺牲精度。 此外,YOLO26等即将推出的架构旨在 此外,即将推出的架构(如 YOLO26)旨在建立更高效的模型,确保学习到的权重能为每个参数提供尽可能高的性能。 性能。

有效管理这些文件也至关重要。像 Ultralytics Platform这样的平台可以让团队无缝地对模型权重进行版本控制、track和部署。 权重,确保生产中的模型始终是性能最佳的版本。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入