Model Soups

了解如何通过对 Ultralytics YOLO 模型权重取平均值来利用 Model Soups 提高准确性和稳健性。学习如何在不增加延迟的情况下提升性能。

Model Soups 指的是一种机器学习技术，即将从同一个预训练基础模型出发，使用不同超参数微调得到的多个神经网络的权重进行平均，从而创建一个单一的、更稳健的模型。这种方法使开发者能够在不增加推理阶段计算成本的情况下，提高整体准确性和泛化能力。

在微调模型时，从业者通常会进行广泛的 hyperparameter tuning 搜索，以找到表现最好的配置。传统上，人们会选择表现最好的单一模型，而丢弃其余模型。然而，创建 Model Soups 可以充分利用搜索中所有模型所学习到的多样化特征。通过直接对它们的 model weights 取平均值，所生成的网络往往优于单个最佳模型，有效地结合了它们的优势，同时最大限度地减少了 overfitting。此过程非常高效，并且可以在 Ultralytics Platform 等协作环境中轻松管理。

Link to this section实际应用#

Model Soups 在计算资源受限但需要高准确性和稳健性的场景中非常有效。

自动驾驶视觉： 在自动驾驶汽车中部署 object detection 系统时，模型必须在不同的光照和天气条件下保持泛化能力。通过对使用不同数据增强和学习率训练出的多个模型取平均值，工程师可以创建一个高度稳健的 Soup，并维持较低的 inference latency。这确保了 autonomous navigation 所需的实时处理速度不受影响。
移动医疗诊断： 在边缘 AI 应用中，例如在智能手机上运行 image classification 进行初步皮肤筛查时，计算能力受到严重限制。Model Soup 提供了临床可靠性所需的增强准确性，同时确保最终的模型占用空间可以轻松适应 mobile edge devices，而不会耗尽电池或需要云连接。

Link to this section区分相关概念#

为了理清 deep learning optimization 的领域，区分 Model Soups 与类似技术非常重要：

Model Ensemble： 集成学习结合了多个独立模型的预测（输出）结果。虽然这提高了准确性，但它需要在推理期间运行每个模型，从而成倍增加了计算成本。Model Soups 在推理前对权重取平均，使计算成本保持与单个模型相同。
Model Merging： 这是一个更广泛的术语，用于组合可能是在完全不同的任务或数据集上训练出来的模型。Model Soups 是模型合并的一个特定子集，其中所有模型都源自完全相同的 pre-trained base architecture，并且是在同一个目标任务上进行微调的。

Link to this section实现示例#

Creating a uniform model soup involves accessing the PyTorch state dictionary of multiple trained models and mathematically averaging their tensors. Below is a concise example of how this can be achieved using an Ultralytics YOLO26 workflow natively backed by the PyTorch framework.

import torch

# Load the PyTorch state dictionaries from two fine-tuned YOLO26 models
model1 = torch.load("yolo26_run1.pt")["model"].state_dict()
model2 = torch.load("yolo26_run2.pt")["model"].state_dict()

# Create a uniform model soup by averaging the model weights
soup_dict = {key: (model1[key] + model2[key]) / 2.0 for key in model1.keys()}

# The resulting soup_dict can now be loaded into a new YOLO26 instance

By leveraging this technique, computer vision practitioners can easily boost performance metrics like zero-shot learning capabilities and general robustness without sacrificing the deployment speed required for modern, edge-first AI architectures.

Explore solutions

农业中的 AI

利用 Ultralytics YOLO 模型将视觉 AI 引入智慧农业。为农作物监测、牲畜追踪和精准农业提供支持，实现更高、更智能的产量。

Model Soups

Link to this section实际应用#

Link to this section区分相关概念#

Link to this section实现示例#

Explore solutions

农业中的 AI

汽车领域的 AI

医疗保健中的 AI

零售业中的AI

机器人领域的 AI

制造业中的 AI

物流中的 AI

农业中的 AI

汽车领域的 AI

医疗保健中的 AI

零售业中的AI

机器人领域的 AI

制造业中的 AI

物流中的 AI

农业中的 AI

汽车领域的 AI

医疗保健中的 AI

零售业中的AI

机器人领域的 AI

制造业中的 AI

物流中的 AI

让我们一起构建 AI 的未来！