了解模型权重如何充当 AI 的知识。探索 Ultralytics YOLO26 如何使用优化权重实现更快、更准确的训练和推理。
模型权重是机器学习模型中可学习的参数,它们将输入数据转换为预测输出。在神经网络中,这些权重代表了不同层之间神经元连接的强度。当模型初始化时,这些权重通常被设置为随机的小值,这意味着模型“一无所知”。通过一个称为训练的过程,模型根据其产生的错误迭代地调整这些权重,逐渐学习识别数据中的模式、特征和关系。您可以将模型权重视为人工智能的“记忆”或“知识”;它们存储了系统从其训练数据中学到的内容。
训练神经网络的主要目标是找到最优的模型权重集,以最小化模型预测与实际真值之间的误差。这个过程涉及数据通过网络——称为前向传播的步骤——然后使用特定的损失函数计算损失值。如果预测不正确,像Stochastic Gradient Descent (SGD)或YOLO26中使用的更新的 Muon 优化器这样的优化算法会计算每个权重对误差的贡献程度。
通过一种称为反向传播的技术,算法会轻微更新权重,以减少下次的误差。这个循环重复数千或数百万次,直到模型权重稳定,系统达到高精度。一旦训练完成,权重就会被“冻结”并保存,从而使模型能够部署用于对新的、未见过的数据进行推理。
区分权重和偏置至关重要,因为它们协同工作但目的不同。尽管模型权重决定了神经元之间连接的强度和方向(控制激活的斜率),但偏置则允许激活函数向左或向右移动。这种偏移确保了模型即使在所有输入特征为零时也能更好地拟合数据。权重和偏置共同构成了可学习参数,它们定义了卷积神经网络 (CNNs)等架构的行为。
模型权重是使人工智能系统能够在各个行业中发挥作用的核心组件。以下是它们如何应用的两个具体示例:
在实践中,处理模型权重涉及将训练好的参数保存到文件中,然后加载它们以进行预测或。 微调。在 Ultralytics 生态系统中,这些通常存储为 .pt (PyTorch) 文件。
以下是一个简单示例,展示如何将预训练权重加载到YOLO模型中并运行预测:
from ultralytics import YOLO
# Load a model with pre-trained weights (e.g., YOLO26n)
model = YOLO("yolo26n.pt")
# Run inference on an image using the loaded weights
results = model("https://ultralytics.com/images/bus.jpg")
# Print the number of detected objects
print(f"Detected {len(results[0].boxes)} objects.")
模型权重最强大的方面之一是它们的可移植性。开发者通常使用迁移学习,而不是从头开始训练模型——这需要海量数据集和大量计算能力。这包括获取一个在COCO或ImageNet等大型数据集上预训练权重的模型,并将其适应特定任务。
例如,您可以获取通用目标检测器的权重,并在较小的太阳能电池板数据集上对其进行微调。由于预训练权重已经理解边缘、形状和纹理,模型收敛速度更快,并且需要更少的标注数据。Ultralytics Platform等工具简化了这一过程,使团队能够无缝管理数据集、在云端训练模型并将优化后的权重部署到边缘设备。
现代AI研究常致力于在不牺牲性能的情况下减小模型权重的文件大小,这一过程称为模型量化。通过降低权重的精度(例如,从32位浮点数到8位整数),开发者可以显著减少内存使用并提高推理速度。这对于在移动电话或Raspberry Pi设备等资源受限硬件上部署模型至关重要。此外,剪枝等技术可以移除对输出贡献较小的权重,进一步精简模型以适应实时应用。

开启您的机器学习未来之旅