Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Model Dağıtımı

Makine öğrenimi modellerini bulut veya uç ortamlara nasıl dağıtacağınızı öğrenin. Ultralytics YOLO26 için dışa aktarma ve üretimi nasıl kolaylaştırdığını keşfedin.

Model dağıtımı, eğitilmiş bir makine öğrenimi modelinin üretim ortamına entegre edildiği kritik aşamadır ortamına entegre edildiği ve yeni verilere dayalı olarak pratik kararlar veya tahminler yaptığı kritik aşamadır. Bu aşama, genellikle izole edilmiş dizüstü bilgisayarlarda gerçekleştirilen araştırma veya deneysel ortamdan, modelin gerçek dünyadaki kullanıcılar ve sistemlerle etkileşime girdiği canlı bir uygulamaya geçişi temsil eder . Bu süreç, ağırlıkların ve mimarinin bulunduğu statik bir dosyayı, video akışındaki nesneleri tanımlama veya bir web sitesinde ürün önerme gibi değer yaratabilen aktif bir AI ajanı haline dönüştürür .

Etkili dağıtım, gecikme, ölçeklenebilirlik ve donanım uyumluluğu gibi model eğitiminin dışında kalan zorlukların ele alınmasını gerektirir. Kuruluşlar genellikle Ultralytics kullanarak bu yaşam döngüsünü kolaylaştırır ve bulutta eğitilen modellerin, güçlü sunuculardan kaynak kısıtlı uç cihazlara kadar çeşitli ortamlara sorunsuz bir şekilde sunulmasını sağlar.

Dağıtım Ortamı

Dağıtım stratejileri genellikle iki kategoriye ayrılır: bulut dağıtımı ve uç dağıtımı. Seçim, hız, gizlilik ve bağlantı için özel gereksinimlere büyük ölçüde bağlıdır.

  • Bulut Dağıtımı: Model, genellikle AWS SageMaker veya Google AI gibi hizmetler tarafından yönetilen merkezi sunucularda bulunur. Uygulamalar, internet üzerinden modele REST APIüzerinden gönderir, model ise isteği işler ve sonucu döndürür. Bu yöntem, neredeyse sınırsız bilgi işlem gücü sunarak büyük ve karmaşık modeller için idealdir, ancak istikrarlı internet bağlantısına bağlıdır.
  • Kenar Dağıtımı: Model, akıllı telefon, drone veya fabrika kamerası gibi verilerin üretildiği cihazda yerel olarak çalışır. Kenar bilişim olarak bilinen bu yaklaşım, bilgiler cihazdan çıkmadığı için gecikmeyi en aza indirir ve veri gizliliğini artırır. TensorRT gibi araçlar TensorRT bu ortamlar için modelleri optimize etmek amacıyla sıklıkla kullanılır. .

Üretim için Modellerin Hazırlanması

Bir model dağıtılmadan önce, genellikle hedef donanımda verimli bir şekilde çalışmasını sağlamak için optimizasyona tabi tutulur. Bu süreç, modelin dışa aktarılmasını içerir; burada eğitim formatı ( PyTorch gibi) ONNX gibi dağıtım dostu bir formata dönüştürülür. ONNX (Open Neural Network Exchange) veya OpenVINOgibi dağıtım dostu bir biçime dönüştürülür.

Kuantizasyon gibi optimizasyon teknikleri, modelin boyutunu ve bellek ayak izini, doğruluğu önemli ölçüde feda etmeden azaltır. Farklı bilgi işlem ortamları arasında tutarlılığı sağlamak için, geliştiriciler genellikle modeli gerekli tüm yazılım bağımlılıklarıyla birlikte paketleyen Docker gibi konteynerleştirme araçlarını kullanır.

Aşağıda, YOLO26 modelini ONNX aktarmanın bir örneği verilmiştir. Bu, dağıtım hazırlığında sıkça yapılan bir adımdır:

from ultralytics import YOLO

# Load the YOLO26 nano model
model = YOLO("yolo26n.pt")

# Export the model to ONNX format for broad compatibility
# This creates a file suitable for various inference engines
path = model.export(format="onnx")

print(f"Model successfully exported to: {path}")

Gerçek Dünya Uygulamaları

Model dağıtımı, çeşitli endüstrilerde yaygın olarak kullanılan bilgisayar görme sistemlerini destekler.

  • Üretim Kalite Kontrolü: Akıllı üretimde, konuşlandırılan modeller konveyör bantlarını gerçek zamanlı olarak izler. NVIDIA cihazları için optimize edilmiş bir model çalıştıran kamera sistemi, ürünlerdeki detect anında detect edebilir ve kusurlu ürünleri kaldırmak için bir robot kolu tetikleyebilir. Bu, yalnızca kenar AI dağıtımının sağlayabileceği ultra düşük gecikme süresi gerektirir.
  • Perakende Analitiği: Mağazalar, ziyaretçi trafiğini ve müşteri davranışını analiz etmek için dağıtılmış modeller kullanır. Nesne izleme modellerini güvenlik kamerası görüntülerine entegre ederek, perakendeciler popüler reyonların ısı haritalarını oluşturabilir. Bu bilgiler, genellikle bulut tabanlı dağıtım kullanarak birden fazla konumdan verileri toplama yoluyla mağaza düzenini optimize etmeye ve envanter yönetimini iyileştirmeye yardımcı olur. Bu, perakendecilerin mağaza trafiğini analiz etmesine ve

Dağıtım, Çıkarım ve Eğitim

Model Dağıtımını, makine öğrenimi yaşam döngüsündeki ilgili terimlerden ayırmak önemlidir:

  • Model Eğitimi, algoritmanın bir veri kümesinden kalıpları öğrendiği eğitim aşamasıdır.
  • Model Dağıtımı, eğitilmiş modelin üretim altyapısına (sunucular, uygulamalar veya cihazlar) kurulduğu entegrasyon aşamasıdır. .
  • Çıkarım, operasyonel aşamadır; yani, dağıtılmış modelin canlı verileri işleyerek bir tahmin üretme eylemidir. Örneğin, çıkarım motoru, dağıtılmış model tarafından tanımlanan hesaplamaları yürütür.

İzleme ve Bakım

Dağıtım, sürecin sonu değildir. Canlı hale geldikten sonra, modellerin veri sapması gibi sorunları detect için sürekli izlenmesi gerekir. Veri sapması, gerçek dünya verilerinin eğitim verilerinden sapmaya başladığı durumdur. Prometheus veya Grafana gibi araçlar genellikle track metriklerini track için entegre edilir ve sistemin zaman içinde güvenilirliğini korumasını sağlar. Performans düştüğünde, modelin yeniden eğitilmesi ve yeniden dağıtılması gerekebilir, böylece MLOps döngüsü tamamlanır.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın