Sözlük

Tek Aşamalı Nesne Dedektörleri

Robotik ve gözetim gibi gerçek zamanlı uygulamalar için ideal olan YOLO gibi tek aşamalı nesne dedektörlerinin hızını ve verimliliğini keşfedin.

Tek aşamalı nesne dedektörleri, bilgisayarla görmede hız ve verimlilik için tasarlanmış bir derin öğrenme modelleri sınıfıdır. Nesne lokalizasyonu ve sınıflandırmasını sinir ağının tek ve birleşik bir geçişinde gerçekleştirirler. Bu, görevi iki ayrı adıma bölen daha karmaşık muadilleri olan iki aşamalı nesne dedektörleriyle tezat oluşturur. Nesne tespitini basit bir regresyon problemi olarak ele alan tek aşamalı modeller, sınırlayıcı kutuları ve sınıf olasılıklarını doğrudan görüntü özelliklerinden tahmin ederek onları son derece hızlı ve gerçek zamanlı çıkarım gerektiren uygulamalar için uygun hale getirir.

Tek Aşamalı Dedektörler Nasıl Çalışır?

Tek aşamalı bir dedektör, tüm görüntüyü tek bir evrişimli sinir ağı (CNN) aracılığıyla bir kerede işler. Ağın mimarisi aynı anda birkaç görevi yerine getirmek üzere tasarlanmıştır. İlk olarak, ağın omurgası özellik çıkarma işlemini gerçekleştirerek giriş görüntüsünün çeşitli ölçeklerde zengin temsillerini oluşturur. Bu özellikler daha sonra özel bir algılama kafasına beslenir.

Bu kafa, bir dizi sınırlayıcı kutuyu, her kutu için bir nesnenin varlığını gösteren bir güven puanını ve her nesnenin belirli bir sınıfa ait olma olasılığını tahmin etmekten sorumludur. Tüm bu süreç, yüksek hızlarının anahtarı olan tek bir ileri geçişte gerçekleşir. Maksimum olmayan bastırma (NMS) gibi teknikler daha sonra nihai çıktıyı üretmek için gereksiz ve örtüşen tespitleri filtrelemek için kullanılır. Modeller, lokalizasyon kaybı (sınırlayıcı kutunun ne kadar doğru olduğu) ve sınıflandırma kaybını (sınıf tahmininin ne kadar doğru olduğu) birleştiren özel bir kayıp fonksiyonu kullanılarak eğitilir.

İki Aşamalı Nesne Dedektörleri ile Karşılaştırma

Temel ayrım metodolojide yatmaktadır. Tek aşamalı dedektörler hız ve basitlik için üretilirken, iki aşamalı dedektörler doğruluğa öncelik verir, ancak bu ayrım yeni modellerle daha az belirgin hale gelmektedir.

  • Tek Aşamalı Dedektörler: YOLO (You Only Look Once) ailesi gibi bu modeller, algılamayı tek bir adımda gerçekleştirir. Genellikle daha hızlıdırlar ve daha basit bir mimariye sahiptirler, bu da onları uç cihazlar ve gerçek zamanlı uygulamalar için ideal hale getirir. Çapasız ded ektörlerin geliştirilmesi, performanslarını ve basitliklerini daha da artırmıştır.
  • İki Aşamalı Nesne Dedektörleri: R-CNN serisi ve onun daha hızlı varyantları gibi modeller ilk olarak nesnelerin bulunabileceği seyrek bir bölge önerileri kümesi oluşturur. İkinci aşamada, ayrı bir ağ bu önerileri sınıflandırır ve sınırlayıcı kutu koordinatlarını iyileştirir. Bu iki aşamalı süreç, özellikle küçük nesneler için tipik olarak daha yüksek doğruluk sağlar, ancak önemli ölçüde daha yavaş çıkarım hızı pahasına. Maske R-CNN, bu yaklaşımı örnek segmentasyonuna genişleten iyi bilinen bir örnektir.

Temel Mimariler ve Modeller

Her birinin benzersiz katkıları olan birkaç etkili tek aşamalı mimari geliştirilmiştir:

  • YOLO (You Only Look Once): Çığır açan 2015 tarihli bir makalede tanıtılan YOLO, nesne tespitini tek bir regresyon problemi olarak çerçevelemiştir. YOLOv8 ve son teknoloji Ultralytics YOLO11 dahil olmak üzere sonraki sürümler, hız ve doğruluk arasındaki dengeyi sürekli olarak geliştirmiştir.
  • Tek Atış Çoklu Kutu Dedektörü (SSD): SSD mimarisi, çeşitli boyutlardaki nesneleri tespit etmek için çok ölçekli özellik haritaları kullanan ve orijinal YOLO'ya göre doğruluğu artıran bir başka öncü tek aşamalı modeldir.
  • RetinaNet: Bu model, yoğun dedektörlerin eğitimi sırasında karşılaşılan aşırı sınıf dengesizliğini gidermek için tasarlanmış yeni bir kayıp fonksiyonu olan Focal Loss'u tanıttı ve o sırada birçok iki aşamalı dedektörün doğruluğunu aşmasına izin verdi.
  • EfficientDet: Google Research tarafından geliştirilen, bileşik ölçeklendirme yöntemi ve yeni bir BiFPN özellik ağı kullanarak ölçeklenebilirlik ve verimliliğe odaklanan bir model ailesi. YOLO11 ve EfficientDet gibi diğer modellerle nasıl karşılaştırıldığını görebilirsiniz.

Gerçek Dünya Uygulamaları

Tek aşamalı dedektörlerin hızı ve verimliliği, onları çok sayıda yapay zeka odaklı uygulamada vazgeçilmez hale getirmiştir:

  1. Otonom Araçlar: Sürücüsüz araçlara yönelik yapay zekada, tek aşamalı dedektörler çevreyi gerçek zamanlı olarak algılamak için çok önemlidir. Yayaları, bisikletlileri, diğer araçları ve trafik işaretlerini anında tespit ve takip ederek aracın navigasyon sisteminin saniyelik kritik kararlar almasını sağlarlar. Tesla gibi şirketler Autopilot sistemleri için benzer ilkeleri kullanmaktadır.
  2. Akıllı Güvenlik ve Gözetim: Tek aşamalı modeller, yetkisiz giriş veya şüpheli etkinlik gibi tehditleri tespit etmek için video akışlarını analiz ederek modern güvenlik sistemlerini güçlendirir. Örneğin, bir sistem kuyruk yönetimi için kuyruktaki insanları saymak veya bir havaalanındaki terk edilmiş bagajları gerçek zamanlı olarak tespit etmek üzere eğitilebilir.

Avantajlar ve Sınırlamalar

Tek aşamalı dedektörlerin birincil avantajı, NVIDIA Jetson veya Raspberry Pi gibi düşük güçlü uç yapay zeka cihazları da dahil olmak üzere çeşitli donanımlarda gerçek zamanlı nesne algılamaya olanak tanıyan inanılmaz hızlarıdır. Daha basit, uçtan uca mimarileri, PyTorch veya TensorFlow gibi çerçeveler kullanılarak eğitilmelerini ve dağıtılmalarını da kolaylaştırır.

Tarihsel olarak, ana sınırlama, özellikle çok küçük veya yoğun şekilde tıkanmış nesnelerle uğraşırken, iki aşamalı dedektörlere kıyasla daha düşük doğruluk olmuştur. Bununla birlikte, YOLO11 gibi modellerde görüldüğü gibi model mimarisi ve eğitim tekniklerindeki son gelişmeler, bu performans açığını önemli ölçüde kapatmış ve çok çeşitli bilgisayarla görme görevleri için güçlü bir hız ve yüksek doğruluk kombinasyonu sunmuştur. Ultralytics HUB gibi platformlar, belirli ihtiyaçlar için özel modellerin eğitilmesi sürecini daha da basitleştirmektedir.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve büyüyün

Şimdi katılın
Panoya kopyalanan bağlantı