Ultralytics YOLO ile gerçek zamanlı çıkarımın otonom sürüş ve güvenlik sistemleri gibi yapay zeka uygulamaları için nasıl anlık tahminler sağladığını keşfedin.
Gerçek zamanlı çıkarım, eğitilmiş bir makine öğrenimi modeli canlı girdi verilerini kabul eder ve neredeyse anında bir tahmin üretir. Bu bağlamda, "gerçek zamanlı", işlemin hızı, gelen veri akışına ayak uydurmak için yeterlidir ve sistemin anında karar vermesine olanak tanır. Bu kabiliyeti modern teknolojinin temel taşıdır. bilgisayarla görme uygulamaları, etkinleştirici cihazlar Çevrelerini en az gecikmeyle algılamaları ve tepki vermeleri.
Gerçek zamanlı performansı değerlendirmek için birincil ölçüt zamanı ölçen çıkarım gecikmesi Modelin bir girdi alması ve bir çıktı üretmesi arasında geçen süre. Bir sistemin gerçek zamanlı olarak kabul edilebilmesi için bu gecikme süresi, kullanım durumunun belirli zamanlama kısıtlamalarını karşılayacak kadar düşük olmalıdır. Örneğin, bir bir akışı analiz eden video anlama sistemi saniyede 30 kare (FPS) hızında her bir kareyi işlemek için yaklaşık 33 milisaniyeye sahiptir. Çıkarım daha uzun sürerse, kareler düşer ve sistem gecikir.
Bu hıza ulaşmak genellikle aşağıdaki gibi özel donanımların kullanılmasını gerektirir GPU 'lar veya özel Edge AI hızlandırıcıları, örneğin NVIDIA Jetson platformu. Ayrıca, mühendisler genellikle model opti̇mi̇zasyon tekni̇kleri̇ doğruluktan önemli ölçüde ödün vermeden hesaplama karmaşıklığını azaltmak için.
Gerçek zamanlı iş akışlarını aşağıdakilerden ayırt etmek önemlidir toplu çıkarım. Gerçek zamanlı çıkarım, gecikmeyi en aza indirmek için veri noktalarını geldiklerinde ayrı ayrı işlerken, toplu çıkarım Verileri daha sonra birlikte işlenmek üzere büyük parçalar halinde gruplar.
Anlık tahminler üretme yeteneği, karmaşık görevleri otomatikleştirerek birçok sektörü dönüştürmüştür. anlık karar vermeyi gerektirir.
Gerçek zamanlı uygulamalar için gerekli hızlara ulaşmak amacıyla, geliştiriciler genellikle optimize edilmiş çıkarım kullanarak modeller kurarlar Motorlar. Gibi çerçeveler TensorRTNVIDIA için donanım veya OpenVINOIntel işlemciler için performansı önemli ölçüde hızlandırır. Ayrıca, aşağıdaki gibi teknikler hassasiyeti azaltan model kuantizasyonu modelin ağırlıklarının kayan noktadan tamsayı değerlere dönüştürülmesi bellekte kapladığı alanı büyük ölçüde azaltabilir ve gömülü sistemlerde yürütme hızı.
Aşağıdaki Python örneği, bir web kamerası beslemesi üzerinde gerçek zamanlı çıkarımın nasıl çalıştırılacağını göstermektedir
ultralytics kütüphane.
from ultralytics import YOLO
# Load the official YOLO11 nano model, optimized for speed
model = YOLO("yolo11n.pt")
# Run inference on the default webcam (source=0)
# 'stream=True' creates a generator for memory-efficient real-time processing
# 'show=True' displays the video feed with prediction overlays
results = model.predict(source="0", stream=True, show=True)
# Process the generator to keep the stream running
for result in results:
pass
5G bağlantısı genişledikçe ve donanım daha güçlü hale geldikçe, gerçek zamanlı yapay zekanın kapsamı giderek genişliyor. Gibi kavramlar Nesnelerin İnterneti (IoT) basit veri toplayıcılardan aktif karar vericilere geçerek daha akıllı hale geliyor. Gelecekteki gelişmeler, örneğin yaklaşan YOLO26 gibi, bu sınırları daha da zorlamayı hedefliyor daha da küçük ve daha hızlı olan yerel olarak uçtan uca modeller sunarak akıllı şehirler ve tıbbi cihazlar gerçek zamanlı olarak sorunsuz bir şekilde çalışır.
