Model Soups

Descobre como Model Soups melhoram a precisão e a robustez através da média dos pesos de modelos Ultralytics YOLO. Aprende a aumentar o desempenho sem aumentar a latência.

Model Soups referem-se a uma técnica de aprendizagem automática onde os pesos de múltiplas redes neuronais, ajustadas a partir do mesmo modelo base pré-treinado usando diferentes hiperparâmetros, são calculados em conjunto para criar um único modelo mais robusto. Esta abordagem permite aos programadores melhorar a precisão geral e a generalização sem aumentar o custo computacional durante a inferência.

Ao ajustar um modelo, os profissionais normalmente executam uma ampla pesquisa de hyperparameter tuning para encontrar a configuração com melhor desempenho. Tradicionalmente, o melhor modelo único é selecionado e os restantes são descartados. No entanto, criar um model soup tira partido das diversas características aprendidas por todos os modelos na pesquisa. Ao calcular diretamente a média dos seus model weights, a rede resultante supera frequentemente o melhor modelo único, combinando eficazmente os seus pontos fortes enquanto minimiza o overfitting. Este processo é altamente eficiente e pode ser facilmente gerido em ambientes colaborativos como a Ultralytics Platform.

Link to this sectionAplicações no Mundo Real#

Model Soups são altamente eficazes em cenários onde os recursos computacionais são limitados, mas é necessária uma elevada precisão e robustez.

Visão de Veículos Autónomos: Ao implementar sistemas de object detection em carros autónomos, os modelos devem generalizar através de diversas condições de iluminação e meteorológicas. Ao calcular a média de múltiplos modelos treinados com variadas aumentações de dados e taxas de aprendizagem, os engenheiros criam um soup altamente robusto que mantém uma baixa inference latency. Isto garante que as velocidades de processamento em tempo real, cruciais para a autonomous navigation, não sejam afetadas.
Diagnóstico Médico Móvel: Em aplicações de Edge AI, como a execução de image classification em smartphones para triagem dermatológica inicial, o poder computacional é severamente limitado. Um model soup fornece a precisão aumentada necessária para a fiabilidade clínica, garantindo ao mesmo tempo que a pegada final cabe facilmente em mobile edge devices sem drenar a bateria ou exigir conectividade à nuvem.

Link to this sectionDiferenciando Conceitos Relacionados#

Para navegar no panorama da deep learning optimization, é importante distinguir Model Soups de técnicas semelhantes:

Model Ensemble: O ensembling combina as predições (saídas) de múltiplos modelos independentes. Embora isto melhore a precisão, exige a execução de cada modelo durante a inferência, multiplicando o custo computacional. Os Model Soups calculam a média dos pesos antes da inferência, mantendo o custo computacional idêntico ao de um único modelo.
Model Merging: Este é um termo mais amplo para combinar modelos que podem ter sido treinados em tarefas ou conjuntos de dados totalmente diferentes. Model Soups são um subconjunto específico de fusão onde todos os modelos provêm da mesma pre-trained base architecture e são ajustados para a mesma tarefa alvo.

Link to this sectionExemplo de Implementação#

Criar um model soup uniforme envolve aceder ao PyTorch state dictionary de múltiplos modelos treinados e calcular matematicamente a média dos seus tensores. Abaixo está um exemplo conciso de como isto pode ser alcançado utilizando um fluxo de trabalho Ultralytics YOLO26 nativamente suportado pelo PyTorch framework.

import torch

# Load the PyTorch state dictionaries from two fine-tuned YOLO26 models
model1 = torch.load("yolo26_run1.pt")["model"].state_dict()
model2 = torch.load("yolo26_run2.pt")["model"].state_dict()

# Create a uniform model soup by averaging the model weights
soup_dict = {key: (model1[key] + model2[key]) / 2.0 for key in model1.keys()}

# The resulting soup_dict can now be loaded into a new YOLO26 instance

By leveraging this technique, computer vision practitioners can easily boost performance metrics like zero-shot learning capabilities and general robustness without sacrificing the deployment speed required for modern, edge-first AI architectures.

Explore solutions

IA na Agricultura

Leve a IA de visão para a agricultura inteligente com os modelos Ultralytics YOLO. Potencialize o monitoramento de colheitas, rastreamento de gado e agricultura de precisão para obter rendimentos maiores e mais inteligentes.

Model Soups

Link to this sectionAplicações no Mundo Real#

Link to this sectionDiferenciando Conceitos Relacionados#

Link to this sectionExemplo de Implementação#

Explore solutions

IA na Agricultura

IA no Setor Automotivo

IA na Saúde

IA no Varejo

IA em Robótica

IA na Manufatura

IA na logística

IA na Agricultura

IA no Setor Automotivo

IA na Saúde

IA no Varejo

IA em Robótica

IA na Manufatura

IA na logística

IA na Agricultura

IA no Setor Automotivo

IA na Saúde

IA no Varejo

IA em Robótica

IA na Manufatura

IA na logística

Vamos construir o futuro da IA juntos!