Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Örnek Çorbalar

Model Soups'un, Ultralytics YOLO ağırlıklarını ortalamalayarak doğruluğu ve sağlamlığı nasıl artırdığını keşfedin. Gecikmeyi artırmadan performansı nasıl yükseltebileceğinizi öğrenin.

Model Soups, farklı hiperparametreler kullanılarak aynı önceden eğitilmiş temel modelden ince ayarlanmış birden fazla sinir ağının ağırlıklarının ortalamasının alınarak tek ve daha sağlam bir model oluşturulduğu bir makine öğrenimi tekniğidir. Bu yaklaşım, geliştiricilerin çıkarım sırasında hesaplama maliyetini artırmadan genel doğruluğu ve genelleştirme yeteneğini iyileştirmelerine olanak tanır.

Bir modeli ince ayarlarken, uzmanlar genellikle en iyi performansı gösteren yapılandırmayı bulmak için geniş kapsamlı bir hiperparametre ayarlama taraması gerçekleştirir. Geleneksel olarak, en iyi tek model seçilir ve geri kalanlar atılır. Ancak, bir model karışımı oluşturmak, taramadaki tüm modellerin öğrendiği çeşitli özelliklerden yararlanır. Model ağırlıklarının doğrudan ortalaması alınarak elde edilen ağ, genellikle en iyi tek modeli geride bırakır; bu, modellerin güçlü yönlerini etkili bir şekilde birleştirirken aşırı uyumu en aza indirir. Bu süreç son derece verimlidir ve Ultralytics gibi işbirliğine dayalı ortamlarda kolayca yönetilebilir.

Gerçek Dünya Uygulamaları

Model Çorbaları, hesaplama kaynaklarının sınırlı olduğu ancak yüksek doğruluk ve sağlamlık gerektiren durumlarda son derece etkilidir.

  • Otonom Araç Görsel Algılama: Otonom araçlarda nesne algılama sistemleri devreye alınırken, modellerin çeşitli ışık ve hava koşullarında genelleme yapabilmesi gerekir. Mühendisler, farklı veri zenginleştirme yöntemleri ve öğrenme hızlarıyla eğitilmiş birden fazla modelin ortalamasını alarak, düşük çıkarım gecikmesi sağlayan son derece sağlam bir model karışımı oluşturur. Bu sayede, otonom navigasyon için hayati önem taşıyan gerçek zamanlı işleme hızlarının etkilenmemesi sağlanır.
  • Mobil Tıbbi Teşhis: İlk dermatolojik tarama amacıyla akıllı telefonlarda görüntü sınıflandırması yapmak gibi uç yapay zeka uygulamalarında, hesaplama gücü oldukça sınırlıdır. Model çorbası, klinik güvenilirlik için gerekli olan yüksek doğruluğu sağlarken, aynı zamanda nihai model boyutunun pil ömrünü tüketmeden veya bulut bağlantısı gerektirmeden mobil uç cihazlara kolayca sığmasını garanti eder.

İlgili Kavramların Farklılaştırılması

Derin öğrenme optimizasyonu alanını anlamak için, Model Soups'u benzer tekniklerden ayırt etmek önemlidir:

  • Model Topluluğu: Topluluk oluşturma, birden fazla bağımsız modelin tahminlerini (çıktılarını) birleştirir. Bu, doğruluğu artırsa da, çıkarım sırasında her modelin çalıştırılmasını gerektirir ve bu da hesaplama maliyetini kat kat artırır. Model Çorbaları ise, çıkarım öncesinde ağırlıkların ortalamasını alır ve böylece hesaplama maliyetini tek bir modelinkiyle aynı tutar.
  • Model Birleştirme: Bu, tamamen farklı görevler veya veri kümeleri üzerinde eğitilmiş olabilecek modelleri bir araya getirmeyi ifade eden daha geniş bir terimdir. Model Soups, tüm modellerin tam olarak aynı önceden eğitilmiş temel mimariden kaynaklandığı ve aynı hedef görev üzerinde ince ayarlandığı bir birleştirme türüdür.

Uygulama Örneği

Tek tip bir model kümesi oluşturmak, eğitimli birden fazla modelin PyTorch sözlüğüne erişmeyi ve bu modellerin tensörlerinin matematiksel ortalamasını almayı gerektirir. Aşağıda, PyTorch doğrudan desteklediği bir Ultralytics iş akışı kullanılarak bunun nasıl gerçekleştirilebileceğine dair kısa bir örnek yer almaktadır.

import torch

# Load the PyTorch state dictionaries from two fine-tuned YOLO26 models
model1 = torch.load("yolo26_run1.pt")["model"].state_dict()
model2 = torch.load("yolo26_run2.pt")["model"].state_dict()

# Create a uniform model soup by averaging the model weights
soup_dict = {key: (model1[key] + model2[key]) / 2.0 for key in model1.keys()}

# The resulting soup_dict can now be loaded into a new YOLO26 instance

Bu tekniği kullanarak, bilgisayar görme uzmanları, modern, uç öncelikli yapay zeka mimarileri için gerekli olan dağıtım hızından ödün vermeden, sıfır denemeli öğrenme yetenekleri ve genel dayanıklılık gibi performans göstergelerini kolayca artırabilirler.

Hadi birlikte yapay zekanın geleceğini şekillendirelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın