Sözlük

Çapa Tabanlı Dedektörler

Çapa tabanlı dedektörlerin hassas konumlandırma, ölçeğe uyarlanabilirlik ve gerçek dünya uygulamaları ile nesne algılamada nasıl devrim yarattığını keşfedin.

Çapa tabanlı dedektörler, bilgisayarla görmede nesne algılama modellerinin temel bir sınıfıdır. Bu modeller, bir görüntüdeki nesneleri tanımlamak ve konumlandırmak için bağlantı kutuları olarak bilinen önceden tanımlanmış bir kutu kümesi kullanarak çalışır. Bağlantı kutuları esasen görüntü boyunca döşenen çeşitli boyut ve en boy oranlarına sahip şablonlardan oluşan bir ızgaradır. Model, bir nesnenin varlığını gösteren bir güven puanıyla birlikte, nesnelerin gerçek sınırlayıcı kutu larıyla eşleşmek için bu çapaların nasıl kaydırılacağını ve ölçeklendirileceğini tahmin eder. Bu yaklaşım, nesneleri bulma sorununu bu sabit çapalara göre bir regresyon ve sınıflandırma görevine dönüştürerek basitleştirir.

Çapa tabanlı mimarilerin önde gelen örnekleri arasında Faster R-CNN gibi R-CNN ailesi ve SSD (Single Shot MultiBox Detector) gibi ilk tek aşamalı dedektörler ve son derece başarılı Ultralytics YOLOv5 de dahil olmak üzere birçok YOLO modeli bulunmaktadır.

Çapa Tabanlı Dedektörler Nasıl Çalışır?

Çapa tabanlı tespitin arkasındaki temel fikir, bir başlangıç noktası olarak önceden tanımlanmış bir dizi referans kutusunu kullanmaktır. Model eğitimi sürecinde, dedektör her bir çapa kutusu için iki ana görevi yerine getirmeyi öğrenir:

  1. Sınıflandırma: Bir bağlantı kutusunun ilgilenilen bir nesne mi içerdiğini yoksa sadece arka plan mı olduğunu belirleyin.
  2. Regresyon: Bağlantı kutusunu, algılanan nesneyi sıkıca çevreleyecek şekilde ayarlamak için gereken hassas ofsetleri (x, y, genişlik, yükseklik) hesaplayın.

Bu tahminler, omurga tarafından çıkarılan görüntü özellikleri işlendikten sonra modelin algılama kafası tarafından yapılır. Tek bir nesne birden fazla bağlantı kutusu tarafından tespit edilebildiğinden, gereksiz tespitleri filtrelemek ve yalnızca en iyi uyan kutuyu tutmak için Maksimum Olmayan Bastırma (NMS) adı verilen bir son işlem adımı kullanılır. Bu modellerin performansı genellikle Ortalama Hassasiyet (mAP) ve Birlik Üzerinden Kesişim (IoU) gibi metrikler kullanılarak değerlendirilir.

Ankraj Tabanlı Dedektörler ve Ankrajsız Dedektörler

Son yıllarda, çapasız dedektörler popüler bir alternatif olarak ortaya çıkmıştır. Çapa tabanlı modellerin aksine, çapasız yaklaşımlar, genellikle kilit noktaları (nesne merkezleri veya köşeleri gibi) belirleyerek veya bir noktadan nesnenin sınırlarına olan mesafeleri tahmin ederek, önceden tanımlanmış çapa şekillerine olan ihtiyacı ortadan kaldırarak nesne konumlarını ve boyutlarını doğrudan tahmin eder.

Temel farklılıklar şunlardır:

  • Karmaşıklık: Çapa tabanlı modeller, veri setine bağlı olabilen çapa parametrelerinin (boyutlar, oranlar, ölçekler) dikkatli bir şekilde tasarlanmasını ve ayarlanmasını gerektirir. Çapa içermeyen modeller tespit başlığı tasarımını basitleştirir.
  • Esneklik: Çapasız yöntemler, sabit çapa seti tarafından iyi temsil edilmeyen alışılmadık en-boy oranlarına veya şekillere sahip nesnelere daha iyi uyum sağlayabilir.
  • Verimlilik: Çapaların ortadan kaldırılması, modelin yapması gereken tahminlerin sayısını azaltabilir, bu da potansiyel olarak daha hızlı çıkarım ve daha basit post-processing sağlar.

YOLOv4 gibi çapa tabanlı dedektörler oldukça başarılı olsa da, Ultralytics YOLO11 de dahil olmak üzere birçok modern mimari, basitlik ve verimlilik avantajlarından yararlanmak için çapasız tasarımları benimsemiştir. YOLO11'de çapasız algılamanın avantajlarını keşfedebilir ve farklı YOLO modelleri arasındaki karşılaştırmaları görebilirsiniz.

Gerçek Dünya Uygulamaları

Çapa tabanlı dedektörler, nesnelerin nispeten standart şekil ve boyutlara sahip olduğu çeşitli uygulamalarda yaygın olarak kullanılmaktadır.

  • Otonom Sürüş: Otomotiv endüstrisine yönelik çözümlerde, bu dedektörler araçları, yayaları ve trafik işaretlerini tanımlamak için mükemmeldir. Bu nesnelerin öngörülebilir şekilleri, önceden tanımlanmış çapalarla iyi bir şekilde hizalanarak NVIDIA ve Tesla gibi şirketler için güvenilir algılama sağlar.
  • Perakende Analitiği: Yapay zeka odaklı envanter yönetimi için çapa tabanlı modeller, ürünleri saymak için rafları verimli bir şekilde tarayabilir. Ambalajlı ürünlerin tek tip boyut ve şekilleri, onları bu yaklaşım için ideal adaylar haline getirerek stok takibinin otomatikleştirilmesine yardımcı olur.
  • Güvenlik ve Gözetim: Sabit güvenlik kamerası görüntülerindeki kişileri veya araçları tanımlamak başka bir güçlü kullanım durumudur. Bu, Ultralytics güvenlik alarm sistemi kılavuzu gibi uygulamalar için temeldir.

Araçlar ve Eğitim

İster çapa tabanlı ister çapasız olsun, nesne algılama modellerinin geliştirilmesi ve dağıtılması PyTorch veya TensorFlow gibi çerçevelerin ve OpenCV gibi kütüphanelerin kullanılmasını içerir. Ultralytics HUB gibi platformlar, çeşitli model mimarilerini destekleyerek özel modelleri eğitmek, veri kümelerini yönetmek ve çözümleri dağıtmak için kolaylaştırılmış iş akışları sunar. Daha fazla bilgi edinmek için Papers With Code gibi kaynaklar son teknoloji modelleri listeler ve DeepLearning.AI gibi platformların kursları temel kavramları kapsar.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve büyüyün

Şimdi katılın
Panoya kopyalanan bağlantı