Robotik ve gözetim gibi gerçek zamanlı uygulamalar için ideal olan YOLO gibi tek aşamalı nesne dedektörlerinin hızını ve verimliliğini keşfedin.
Tek aşamalı nesne dedektörleri bir kategori hız için optimize edilmiş derin öğrenme (DL) modelleri ve bilgisayarla görme (CV) görevlerinde verimlilik. Aksine iki aşamalı nesne dedektörleri Algılama sürecini bölge önerme ve sınıflandırma aşamalarına ayıran tek aşamalı mimariler tek bir değerlendirme geçişinde nesne tespiti. Tarafından Görevi doğrudan bir regresyon problemi olarak çerçeveleyen bu modeller sınırlayıcı kutular ve sınıf olasılıkları aynı anda giriş görüntülerinden. Bu kolaylaştırılmış yaklaşım, önemli ölçüde daha hızlı işlem yapılmasını sağlayarak onları tercih edilen gerektiren uygulamalar için seçim gerçek zamanlı çıkarım.
Tek aşamalı dedektörün merkezinde bir evrişimli sinir ağı (CNN) olarak hizmet veren backbone için özellik çıkarma. Ağ şunları işler "Sadece Bir Kez Bakarsınız" isminden de anlaşılacağı üzere, görüntünün tamamı bir kerede görüntülenerek özellik haritalarından oluşan bir ızgara oluşturulur. Erken Tek Atışlı Çoklu Kutu Dedektörü (SSD) gibi mimariler nesnelerini işlemek için önceden tanımlanmış bağlantı kutularında çeşitli ölçeklerde. Bununla birlikte, modern yinelemeler Ultralytics YOLO11 büyük ölçüde benimsemişlerdir karmaşıklığı azaltmak için ankrajsız tasarımlar ve genellemeyi iyileştirir. Çıktı tipik olarak yerelleştirme için koordinatları ve bir olasılığını gösteren güven puanı nesnenin varlığı.
Tek aşamalı ve iki aşamalı modeller arasındaki temel fark, hız ve hassasiyet arasındaki dengede yatmaktadır. R-CNN ailesi gibi iki aşamalı mimariler genellikle şunları sunar küçük veya tıkalı nesneler için daha yüksek doğruluk sağlar, ancak çok adımlı süreçleri nedeniyle daha yüksek hesaplama maliyetlerine neden olur. Tersine, tek aşamalı dedektörler düşük çıkarım gecikmesi, üzerinde dağıtım sağlar kaynak kısıtlı donanım. Aşağıdakiler de dahil olmak üzere son gelişmeler YOLOv1 'in gelecekteki evrimi YOLO26 (2025 sonu için hedeflenmektedir), uçtan uca eğitimden yararlanın ve doğruluğu kapatmak için gelişmiş kayıp fonksiyonları boşluk, genellikle iki aşamalı modellerle eşleşir veya onları aşar.
Tek aşamalı dedektörlerin verimliliği, anında yanıt vermenin önemli olduğu çok sayıda sektörde inovasyonu teşvik etmektedir Kritik:
Doğru sonuçlar elde etmek için bu modeller genellikle tek bir nesne için birden fazla potansiyel kutu öngörür. İşlem sonrası gibi teknikler Maksimum Olmayan Bastırma (NMS) filtresi dayalı bu gereksiz tahminler Birlik Üzerinde Kavşak (IoU) eşikler. gibi modern kütüphanelerle tek aşamalı bir dedektör uygulamak kolaydır. PyTorch ve Ultralytics Python paketi.
Aşağıdaki örnekte, önceden eğitilmiş bir YOLO11 modeli kullanılarak çıkarımın nasıl çalıştırılacağı gösterilmektedir:
from ultralytics import YOLO
# Load the YOLO11 model, a state-of-the-art one-stage detector
model = YOLO("yolo11n.pt")
# Run inference on a local image or URL
results = model("https://ultralytics.com/images/bus.jpg")
# Display the detected objects with bounding boxes
results[0].show()
