Model Soups
Model Soups'un, Ultralytics YOLO modellerinin ağırlıklarını ortalayarak doğruluğu ve sağlamlığı nasıl artırdığını keşfet. Gecikmeyi artırmadan performansı nasıl yükselteceğini öğren.
Model Soups, aynı önceden eğitilmiş temel modelden farklı hiperparametreler kullanılarak ince ayar yapılmış birden fazla sinir ağının ağırlıklarının, tek ve daha sağlam bir model oluşturmak için bir araya getirildiği bir makine öğrenimi tekniğini ifade eder. Bu yaklaşım, geliştiricilerin çıkarım sırasındaki hesaplama maliyetini artırmadan genel doğruluğu ve genellemeyi iyileştirmelerini sağlar.
Bir modele ince ayar yaparken, uygulayıcılar genellikle en iyi performans gösteren yapılandırmayı bulmak için geniş bir hiperparametre ayarı taraması yaparlar. Geleneksel olarak, en iyi tek model seçilir ve geri kalanı atılır. Ancak bir model soup oluşturmak, taramadaki tüm modellerin öğrendiği çeşitli özelliklerden yararlanır. Model ağırlıklarını doğrudan ortalayarak, ortaya çıkan ağ genellikle en iyi tek modelden daha iyi performans gösterir ve aşırı öğrenmeyi en aza indirirken güçlü yönlerini etkili bir şekilde birleştirir. Bu süreç oldukça verimlidir ve Ultralytics Platform gibi iş birliğine dayalı ortamlarda kolayca yönetilebilir.
Link to this sectionGerçek Dünya Uygulamaları#
Model Soups, hesaplama kaynaklarının kısıtlı olduğu ancak yüksek doğruluk ve sağlamlığın gerekli olduğu senaryolarda oldukça etkilidir.
- Otonom Araç Görüşü: Kendi kendine giden arabalarda nesne algılama sistemleri kullanılırken, modellerin farklı ışık ve hava koşullarında genelleme yapabilmesi gerekir. Mühendisler, çeşitli veri artırmaları ve öğrenme oranları ile eğitilmiş birden fazla modeli ortalayarak, düşük çıkarım gecikmesini koruyan son derece sağlam bir soup oluştururlar. Bu, otonom navigasyon için kritik olan gerçek zamanlı işlem hızlarının etkilenmemesini sağlar.
- Mobil Tıbbi Tanı: Akıllı telefonlarda ilk dermatolojik tarama için görüntü sınıflandırma çalıştırmak gibi uç AI uygulamalarında hesaplama gücü ciddi şekilde sınırlıdır. Bir model soup, klinik güvenilirlik için gereken artırılmış doğruluğu sağlarken, nihai ayak izinin pili tüketmeden veya bulut bağlantısı gerektirmeden mobil uç cihazlara kolayca sığmasını sağlar.
Link to this sectionİlgili Kavramları Ayırt Etme#
Derin öğrenme optimizasyonu ortamında yol almak için, Model Soups'u benzer tekniklerden ayırmak önemlidir:
- Model Ensemble: Ensembling, birden fazla bağımsız modelin tahminlerini (çıktılarını) birleştirir. Bu doğruluğu artırsa da, çıkarım sırasında her modelin çalıştırılmasını gerektirir ve hesaplama maliyetini katlar. Model Soups, çıkarımdan önce ağırlıkları ortalar ve hesaplama maliyetini tek bir modelle aynı seviyede tutar.
- Model Merging: Bu, tamamen farklı görevler veya veri kümeleri üzerinde eğitilmiş olabilecek modelleri birleştirmek için kullanılan daha geniş bir terimdir. Model Soups, tüm modellerin aynı önceden eğitilmiş temel mimariden geldiği ve aynı hedef görev üzerinde ince ayar yapıldığı bir birleştirme alt kümesidir.
Link to this sectionUygulama Örneği#
Creating a uniform model soup involves accessing the PyTorch state dictionary of multiple trained models and mathematically averaging their tensors. Below is a concise example of how this can be achieved using an Ultralytics YOLO26 workflow natively backed by the PyTorch framework.
import torch
# Load the PyTorch state dictionaries from two fine-tuned YOLO26 models
model1 = torch.load("yolo26_run1.pt")["model"].state_dict()
model2 = torch.load("yolo26_run2.pt")["model"].state_dict()
# Create a uniform model soup by averaging the model weights
soup_dict = {key: (model1[key] + model2[key]) / 2.0 for key in model1.keys()}
# The resulting soup_dict can now be loaded into a new YOLO26 instanceBy leveraging this technique, computer vision practitioners can easily boost performance metrics like zero-shot learning capabilities and general robustness without sacrificing the deployment speed required for modern, edge-first AI architectures.






