Sözlük

Çıkarım Motoru

Çıkarım motorlarının gerçek zamanlı tahminler sunarak, modelleri optimize ederek ve platformlar arası dağıtımı mümkün kılarak yapay zekayı nasıl güçlendirdiğini keşfedin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Yapay zeka (AI) ve makine öğrenimi (ML) alanında, bir çıkarım motoru, yeni, görünmeyen veriler üzerinde tahminler yapmak için eğitilmiş modelleri yürütmekten sorumlu önemli bir yazılım veya donanım bileşenidir. Bir model eğitim aşamasında kalıpları öğrendikten sonra, çıkarım motoru bu eğitimli modeli alır ve gerçek dünya girdilerine uygular. Çıkarım olarak bilinen bu süreç, yapay zeka sistemlerinin pratik uygulamalarda nesne algılama, görüntü sınıflandırma veya doğal dil işleme (NLP) gibi görevleri yerine getirmesini sağlar. Esasen konuşlandırılmış bir YZ modelinin operasyonel kalbidir ve öğrenilen bilgiyi verimli bir şekilde eyleme geçirilebilir çıktılara dönüştürür.

Çıkarım Motorları Nasıl Çalışır?

Bir çıkarım motoru, genellikle aşağıdaki gibi derin öğrenme (DL) çerçeveleri kullanılarak geliştirilen önceden eğitilmiş bir model kullanır PyTorch veya TensorFlowBelirli bir görev için gereken bilgiyi kapsar. Yeni veriler (örneğin bir görüntü, ses klibi veya metin cümlesi) girdi olarak sağlandığında, çıkarım motoru bunları modelin hesaplama yapısı (genellikle bir sinir ağı) aracılığıyla işler. Bu, bir görüntüdeki sınırlayıcı kutularla nesneleri tanımlamak, konuşmayı yazıya dökmek veya duyguları sınıflandırmak gibi bir çıktı oluşturur. Ultralytics YOLO modelleri, örneğin, güçlü bulut sunucularından kaynak kısıtlı uç cihazlara kadar çeşitli platformlarda gerçek zamanlı nesne algılama ve segmentasyon elde etmek için verimli çıkarım motorlarına bağlıdır. Çıkarım motorunun performansı, genellikle çıkarım gecikmesi ve verimi ile ölçülen uygulamanın hızını ve yanıt verebilirliğini doğrudan etkiler.

Optimizasyonlar ve Temel Özellikler

Modern çıkarım motorlarının kilit rollerinden biri optimizasyondur. Büyük, eğitimli bir derin öğrenme modelini doğrudan çalıştırmak hesaplama açısından pahalı ve yavaş olabilir. Çıkarım motorları, modelleri daha hızlı ve daha verimli hale getirmek için çeşitli teknikler kullanır ve farklı donanımlarda dağıtımı mümkün kılar. Yaygın model optimizasyon stratejileri şunları içerir:

  • Model Niceleme: Model boyutunu azaltmak ve hesaplamayı hızlandırmak için model ağırlıklarının hassasiyetinin azaltılması (örneğin, 32 bit kayan noktadan 8 bit tam sayıya), genellikle doğruluk üzerinde minimum etki ile.
  • Model Budama: Daha küçük, daha hızlı bir model oluşturmak için sinir ağı içindeki gereksiz veya önemsiz bağlantıların (ağırlıkların) kaldırılması.
  • Grafik Optimizasyonu: Belirli bir donanım üzerinde yürütme verimliliğini artırmak için modelin hesaplama grafiğindeki katmanları birleştirmek veya işlemleri yeniden düzenlemek.
  • Donanım Hızlandırma: GPU'lar, TPU'lar gibi özel işlemcilerden veya Google Edge TPU veya NVIDIA Jetson gibi cihazlarda bulunan özel yapay zeka hızlandırıcılarından yararlanma.

Birçok çıkarım motoru, ONNX (Open Neural Network Exchange) gibi standartlaştırılmış model formatlarını da destekler, bu da tek bir çerçevede eğitilmiş modellere izin verir (örneğin PyTorch) farklı bir motor veya platform kullanılarak çalıştırılmasını sağlar. Popüler çıkarım motorları şunları içerir NVIDIA TensorRT, Intel'in OpenVINO'su ve TensorFlow Lite. Ultralytics modelleri, Model Dağıtım Seçenekleri kılavuzunda ayrıntılı olarak açıklanan bu motorlarla uyumlu çeşitli biçimlere dışa aktarmayı destekler.

Çıkarım Motoru ve Eğitim Çerçevesi

Çıkarım motorlarını eğitim çerçevelerinden ayırmak önemlidir.

  • Eğitim Çerçeveleri (örn, PyTorch, TensorFlow, Keras): Bunlar makine öğrenimi modellerini oluşturmak, eğitmek ve doğrulamak için kullanılan kapsamlı kütüphanelerdir. Ağ mimarilerini tanımlamak, geri yayılımı uygulamak, veri kümelerini yönetmek ve kayıp fonksiyonlarını hesaplamak için araçlar sağlarlar. Odak noktası esneklik ve öğrenme sürecidir.
  • Çıkarım Motorları (örn, TensorRT, OpenVINO, ONNX Runtime): Bunlar, önceden eğitilmiş modelleri tahmin görevleri(model dağıtımı) için verimli bir şekilde çalıştırmak üzere tasarlanmış özel araçlardır. Birincil odak noktaları hız(düşük gecikme), düşük bellek kullanımı ve hedef donanımla uyumluluk için optimizasyon yapmaktır. Genellikle çerçeveler kullanılarak eğitilen modelleri alır ve bunları optimize edilmiş bir biçime dönüştürürler.

Gerçek Dünya Uygulamaları

Çıkarım motorları, yapay zekanın pratik senaryolarda kullanılması için kritik öneme sahiptir:

  1. Otonom Araçlar: Kendi kendine giden araçlar(Waymo tarafından geliştirilenler gibi), sensör verilerini (kameralar, LiDAR) gerçek zamanlı olarak işlemek için gömülü donanım( NVIDIA Jetson platformları gibi) üzerinde çalışan verimli çıkarım motorlarına büyük ölçüde güvenmektedir. Motorlar, güvenlik için çok önemli olan nesne algılama (arabaları, yayaları, işaretleri algılama) ve semantik segmentasyon (yol düzenini anlama) gibi görevler için YOLO gibi karmaşık bilgisayarla görme modellerini minimum gecikmeyle optimize eder. Otomotiv çözümlerinde yapay zeka hakkında daha fazlasını keşfedin.
  2. Tıbbi Görüntü Analizi: Çıkarım motorları, tümörleri(bkz. Beyin TümörüVeri Seti) veya anomalileri tespit etmek gibi görevler için tıbbi taramaların (X-ışınları, CT, MRI) analizini hızlandırır. Çıkarım motorları aracılığıyla dağıtılan optimize edilmiş modeller, hastane sunucularında veya özel tıbbi cihazlarda hızlı bir şekilde çalışabilir ve daha hızlı teşhisler veya ikinci görüşler sağlayarak radyologlara yardımcı olabilir(Radyolojide Yapay Zeka hakkında bilgi edinin). Sağlık hizmetlerinde yapay zeka çözümlerine göz atın.

Özünde, çıkarım motorları, eğitimli yapay zeka modelleri ile pratik uygulamaları arasındaki boşluğu doldurarak, Ultralytics HUB gibi platformlar aracılığıyla modellerin yönetilmesi de dahil olmak üzere çok çeşitli cihaz ve platformlarda sofistike yapay zeka yeteneklerinin verimli ve etkili bir şekilde sunulmasını sağlar.

Tümünü okuyun