Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Model Sunumu

Model sunumunun (model serving) temellerini öğrenin: gerçek zamanlı tahminler, ölçeklenebilirlik ve uygulamalara sorunsuz entegrasyon için yapay zeka modellerini dağıtın.

Model sunumu, makine öğrenimi yaşam döngüsünde eğitilmiş bir modelin bir sunucuda barındırıldığı kritik aşamadır. gerçek zamanlı çıkarım taleplerini karşılamak için cihaz. Bir makine öğrenimi (ML) modeli oluşturulduktan sonra eğitilmiş ve onaylanmışsa, değer sağlamak için bir üretim ortamına entegre edilmelidir. Hizmet vermek Statik model dosyası ile son kullanıcı uygulamaları arasında köprü kurar, gelen verileri dinler - örneğin görüntüler veya metin-bir API aracılığıyla ve modelin tahminlerini döndürerek. Bu süreç yazılım sistemlerinin aşağıdakilerden yararlanmasını sağlar Tahmine dayalı modelleme yetenekleri anında ve ölçekte.

Etkili model sunumu, modeli belleğe yükleyebilen, modeli yönetebilen ve modelin GPU'lar gibi donanım kaynakları ve istekleri verimli bir şekilde işleme. Basit komut dosyaları çıkarım yapabilirken, üretim sınıfı hizmet genellikle gibi özel çerçeveler NVIDIA Triton Çıkarım Sunucusu veya TorchServe. Bu araçlar yüksek verim ve düşük maliyetle çalışacak şekilde optimize edilmiştir. çıkarım gecikmesi, uygulamaların ağır kullanıcı yükleri altında bile duyarlı kalır.

Bir Hizmet Mimarisinin Temel Bileşenleri

Kapsamlı bir servis kurulumu, tahminleri güvenilir bir şekilde sunmak için birlikte çalışan birkaç farklı katmanı içerir.

  • Çıkarım Motoru: Modelin matematiksel işlemlerini yürütmekten sorumlu çekirdek yazılım. Motorlar genellikle belirli donanımlar için optimize edilir, örneğin TensorRTNVIDIA GPU'lar için veya OpenVINOIntel CPU'lar için performansı en üst düzeye çıkarmak için.
  • API Arayüzü: Uygulamalar, tanımlanmış protokoller aracılığıyla sunulan model ile iletişim kurar. REST API'ler basitlikleri nedeniyle web entegrasyonu için yaygın olarak kullanılırken gRPC, yüksek performans ve düşük performans gerektiren dahili mikro hizmetler için tercih edilir. gecikme.
  • Model Kayıt Defteri: Eğitilmiş modellerin farklı versiyonlarını yönetmek için merkezi bir depo. Bu yeni bir sürüm çıktığında hizmet veren sistemin önceki bir sürüme kolayca geri dönebilmesini sağlar. model dağıtımı beklenmedik sorunlar ortaya çıkarır.
  • Konteynerleştirme: Gibi araçlar Docker, modeli bağımlılıkları ile birlikte izole konteynerler. Bu sayede, bir geliştiricinin dizüstü bilgisayarından bir geliştiricinin dizüstü bilgisayarına kadar farklı ortamlar arasında tutarlılık garanti edilir. Bulutta Kubernetes kümesi.
  • Yük Dengeleyici: Yoğun trafik senaryolarında, bir yük dengeleyici, gelen çıkarım isteklerini Tek bir sunucunun darboğaz oluşturmasını önlemek için birden fazla model kopyası ölçeklenebilirlik.

Pratik Uygulama

Bir modeli etkili bir şekilde sunmak için, onu aşağıdaki gibi standartlaştırılmış bir formata aktarmak genellikle faydalıdır ONNXteşvik eden Farklı eğitim çerçeveleri ve hizmet motorları arasında birlikte çalışabilirlik. Aşağıdaki örnek nasıl yapılacağını göstermektedir yükleyin a YOLO11 model ve çıkarım çalıştırmak, mantık simülasyonu hizmet veren bir uç noktanın içinde var olacak.

from ultralytics import YOLO

# Load the YOLO11 model (this would happen once when the server starts)
model = YOLO("yolo11n.pt")

# Simulate an incoming request with an image source
image_source = "https://ultralytics.com/images/bus.jpg"

# Run inference to generate predictions
results = model.predict(source=image_source)

# Process and return the results (e.g., bounding boxes)
for box in results[0].boxes:
    print(f"Class: {box.cls}, Confidence: {box.conf}")

Gerçek Dünya Uygulamaları

Model sunumu, çeşitli sektörlerde her yerde bulunan yapay zeka özelliklerine güç vererek, aşağıdakilere dayalı olarak anında karar vermeyi sağlar veri.

  • Akıllı Perakendecilik: Perakendeciler şunları kullanır Ödeme süreçlerini otomatikleştirmek için perakendede yapay zeka. Nesne algılama modelleri tarafından sunulan kameralar Bir konveyör bandındaki ürünleri gerçek zamanlı olarak tanımlayın ve barkod taraması olmadan toplam maliyeti hesaplayın.
  • Kalite Güvencesi: Endüstriyel ortamlarda, Üretim sistemlerinde yapay zeka kullanımı montaj hatlarını denetlemek için modeller. Bileşenlerin yüksek çözünürlüklü görüntüleri yerel bir uç sunucuya gönderilir ve burada modeli, çizikler veya yanlış hizalamalar gibi kusurları tespit ederek hatalı öğelerin kaldırılması için anında uyarıları tetikler.
  • Finansal Dolandırıcılık Tespiti: Bankalar istihdam ediyor güvenli API'ler aracılığıyla sunulan anomali tespit modelleri işlem verilerini oluştukları anda analiz etmek. Bir işlem dolandırıcılık faaliyeti modeline uyuyorsa, sistem şunları yapabilir Mali kaybı önlemek için anında engelleyin.

Model Sunumu ve Model Dağıtımı

Genellikle birbirinin yerine kullanılmakla birlikte, model sunumu ile model dağıtımı. Dağıtım, daha geniş anlamda Bir modelin test edilmesi, paketlenmesi ve ayarlanması gibi adımları içeren bir üretim ortamında piyasaya sürülmesi süreci altyapıya kadar. Model sunumu, dağıtımın özel çalışma zamanı yönüdür - modeli gerçekten çalıştırma eylemi ve taleplerin ele alınması.

Etkili hizmet aynı zamanda sürekli hizmet gerektirir detect etmek için model izleme veri sürüklenmesi, gelen verilerin dağılımının eğitim verilerinden ayrışır, potansiyel olarak azalan doğruluk. Yakında çıkacak olan gibi modern platformlar Ultralytics Platformu, bu aşamaları birleştirmeyi amaçlayarak kesintisiz Eğitimden hizmet vermeye ve izlemeye geçişler.

Doğru Stratejiyi Seçmek

Sunum stratejisinin seçimi büyük ölçüde kullanım durumuna bağlıdır. Çevrimiçi Sunum anında hizmet sağlar Kullanıcıya yönelik uygulamalar için yanıtlar ancak düşük gecikme süresi gerektirir. Tersine, Toplu Sunum süreçleri Çevrimdışı büyük hacimli veriler, anında geri bildirimin gerekli olduğu gece raporu oluşturma gibi görevler için uygundur. kritik değildir. Dronlar veya cep telefonları gibi uzak donanımlara yerleştirilen uygulamalar için, Edge AI, servis sürecini doğrudan cihaza taşır, Bulut bağlantısına olan bağımlılığı ortadan kaldırır ve bant genişliği maliyetlerini azaltır.

Metrik toplama için Prometheus gibi araçların kullanılması ve Görselleştirme için Grafana, mühendislik ekiplerinin hizmetlerinin sağlığını track yardımcı oluyor altyapı, modellerin güvenilir bir şekilde sunulmaya devam etmesini sağlamak bilgisayarla görme yetenekleri uzun süre sonra ilk lansman.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın