Robotik ve gözetim gibi gerçek zamanlı uygulamalar için ideal olan YOLO gibi tek aşamalı nesne dedektörlerinin hızını ve verimliliğini keşfedin.
Tek aşamalı nesne dedektörleri, bilgisayarlı görüde hız ve verimlilik için tasarlanmış bir derin öğrenme modeli sınıfıdır. Nesne lokalizasyonunu ve sınıflandırmasını, sinir ağının tek, birleşik bir geçişinde gerçekleştirirler. Bu, görevi iki ayrı adıma bölen daha karmaşık muadilleri olan iki aşamalı nesne dedektörleriyle çelişir. Nesne tespitini basit bir regresyon problemi olarak ele alan tek aşamalı modeller, sınırlayıcı kutuları ve sınıf olasılıklarını doğrudan görüntü özelliklerinden tahmin ederek, onları son derece hızlı ve gerçek zamanlı çıkarım gerektiren uygulamalar için uygun hale getirir.
Tek aşamalı bir dedektör, tek bir evrişimsel sinir ağı (CNN) aracılığıyla tüm görüntüyü aynı anda işler. Ağın mimarisi, aynı anda çeşitli görevleri gerçekleştirmek için tasarlanmıştır. İlk olarak, ağın omurgası, çeşitli ölçeklerdeki girdi görüntüsünün zengin temsillerini oluşturarak özellik çıkarımı gerçekleştirir. Bu özellikler daha sonra özel bir algılama başlığına beslenir.
Bu başlık, bir dizi sınırlayıcı kutuyu, bir nesnenin varlığını gösteren her kutu için bir güven puanını ve her nesnenin belirli bir sınıfa ait olma olasılığını tahmin etmekten sorumludur. Tüm bu süreç tek bir ileri geçişte gerçekleşir ve bu da yüksek hızlarının anahtarıdır. Non-maximum suppression (NMS) gibi teknikler daha sonra son çıktıyı üretmek için yedekli ve örtüşen algılamaları filtrelemek için kullanılır. Modeller, yerelleştirme kaybını (sınırlayıcı kutunun ne kadar doğru olduğu) ve sınıflandırma kaybını (sınıf tahmininin ne kadar doğru olduğu) birleştiren özel bir kayıp fonksiyonu kullanılarak eğitilir.
Temel ayrım metodolojide yatmaktadır. Tek aşamalı dedektörler hız ve basitlik için üretilirken, iki aşamalı dedektörler doğruluğa öncelik verir, ancak bu ayrım yeni modellerle daha az belirgin hale gelmektedir.
Her biri benzersiz katkıları olan çeşitli etkili tek aşamalı mimariler geliştirilmiştir:
Tek aşamalı dedektörlerin hızı ve verimliliği, onları çok sayıda yapay zeka odaklı uygulamada vazgeçilmez kılmıştır:
Tek aşamalı dedektörlerin temel avantajı, düşük güçlü uç yapay zeka cihazları olan NVIDIA Jetson veya Raspberry Pi gibi çeşitli donanımlarda gerçek zamanlı nesne tespiti sağlayan inanılmaz hızlarıdır. Daha basit, uçtan uca mimarileri, PyTorch veya TensorFlow gibi çerçeveler kullanılarak eğitilmelerini ve dağıtılmalarını da kolaylaştırır.
Tarihsel olarak, ana sınırlama, özellikle çok küçük veya yoğun şekilde tıkanmış nesnelerle uğraşırken, iki aşamalı dedektörlere kıyasla daha düşük doğruluk olmuştur. Bununla birlikte, YOLO11 gibi modellerde görülen model mimarisi ve eğitim tekniklerindeki son gelişmeler, bu performans açığını önemli ölçüde kapatarak, çok çeşitli bilgisayarlı görü görevleri için hız ve yüksek doğruluğun güçlü bir kombinasyonunu sunmaktadır. Ultralytics HUB gibi platformlar, belirli ihtiyaçlar için özel modellerin eğitilmesi sürecini daha da basitleştirmektedir.