Sözlük

Çapa Tabanlı Dedektörler

Çapa tabanlı dedektörlerin hassas konumlandırma, ölçeğe uyarlanabilirlik ve gerçek dünya uygulamaları ile nesne algılamada nasıl devrim yarattığını keşfedin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Çapa tabanlı dedektörler, nesne algılama görevinin üstesinden gelmek için bilgisayarla görmede (CV) önemli ve temel bir yaklaşımı temsil eder. Bu modeller, genellikle "çapa" veya "öncül" olarak adlandırılan, belirli boyutlara ve en boy oranlarına sahip önceden tanımlanmış bir referans kutuları kümesi kullanarak çalışır. Çapalar görüntü boyunca dağıtılır ve ilk tahminler veya şablonlar olarak işlev görerek modelin, özellikle farklı ölçek ve şekillerdeki öğelerle uğraşırken nesnelerin konumunu ve sınıfını daha etkili bir şekilde tahmin etmesini sağlar. 'nin belirli sürümleri gibi birçok etkili erken nesne algılama modeli Ultralytics YOLO aile, bu tekniği kullanmıştır.

Çapa Tabanlı Dedektörler Nasıl Çalışır?

Çapa tabanlı dedektörlerin arkasındaki temel kavram, bu önceden tanımlanmış çapa kutularının yoğun bir ızgarasını giriş görüntüsü boyunca birden çok konumda ve ölçekte kaplamaktır. Her bir bağlantı kutusu, belirli bir boyut ve şekle sahip potansiyel bir nesneye karşılık gelir. Model eğitim süreci sırasında, dedektör her çapa için iki temel şey öğrenir: birincisi, çapa kutusunun ilgili bir nesne mi yoksa arka plan mı içerdiğini sınıflandırır; ikincisi, gerçek nesnenin sınırlayıcı kutusuyla tam olarak eşleşmesi için çapanın konumunu ve boyutlarını (regresyon adı verilen bir süreç) iyileştirir.

İşlek bir caddenin görüntüsündeki çeşitli araçları tespit etmeyi düşünün. Her piksel grubunu analiz etmek yerine, çapa tabanlı bir model önceden tanımlanmış kutu şablonlarını kullanır: yayalar için daha küçük olanlar, arabalar için orta kareler ve otobüsler için daha büyük dikdörtgenler. Bu şablonlar (çapalar) görüntü boyunca yerleştirilir. Bir çapa bir araba ile önemli ölçüde örtüşüyorsa, model onu 'araba' olarak sınıflandırmayı öğrenir ve çapanın koordinatlarını ve boyutunu arabaya mükemmel şekilde uyacak şekilde ayarlar. Sadece yolu veya binaları kaplayan çapalar 'arka plan' olarak sınıflandırılır. Önceden tanımlanmış şekiller tarafından yönlendirilen bu sistematik yaklaşım, nesne tespitinin karmaşıklığını yönetmeye yardımcı olur. Performans genellikle Birlik Üzerinde Kesişim (IoU) ve Ortalama Hassasiyet (mAP) gibi metrikler kullanılarak değerlendirilir.

Temel Özellikler ve Avantajlar

Genellikle omurga olarak güçlü Evrişimsel Sinir Ağlarından (CNN'ler) yararlanan çapa tabanlı dedektörler, belirgin avantajlar sunar:

  • Ölçek ve En Boy Oranı Değişkenliğini Ele Alma: Önceden tanımlanmış çapalar çeşitli şekil ve boyutları açıkça kapsar, bu da bu modellerin boyutlarından veya yönlerinden bağımsız olarak nesneleri algılamada doğal olarak iyi olmasını sağlar.
  • Yapılandırılmış Tahmin: Çapalar, görüntünün tamamında nesne önerileri oluşturmak için yapılandırılmış bir yol sağlayarak kapsamlı bir kapsama alanı sağlar.
  • Yüksek Geri Çağırma: Çapalar aracılığıyla çok sayıda potansiyel nesne konumu üreterek, bu yöntemler genellikle yüksek geri çağırma elde eder, yani en alakalı nesneleri bulmada iyidirler, ancak bu bazen kopyaları filtrelemek için Maksimum Olmayan Bastırma (NMS) gibi işlem sonrası adımlar gerektirir.
  • Kanıtlanmış Performans: Faster R-CNN ve SSD (Single Shot MultiBox Detector) gibi mimariler COCO gibi standart kıyaslama veri kümelerinde güçlü performans göstermiştir.

Gerçek Dünya Uygulamaları

Çapa tabanlı dedektörler çok sayıda gerçek dünya senaryosunda başarıyla kullanılmıştır:

  1. Otonom Araçlar: Çeşitli boyut ve mesafelerdeki araçları, yayaları, bisikletlileri ve trafik işaretlerini tespit etmek güvenli navigasyon için kritik öneme sahiptir. Çapa tabanlı yöntemler, hem yakın hem de uzak, büyük ve küçük nesnelerin güvenilir bir şekilde tanımlanmasını sağlamaya yardımcı olur. Waymo gibi şirketler sağlam nesne tespitine büyük ölçüde güveniyor. Sürücüsüz araçlarda yapay zeka hakkında daha fazla bilgi edinin.
  2. Perakende Analitiği: Mağazalarda, bu dedektörler ürünleri tanımlamak, stok seviyelerini kontrol etmek veya insanları tespit ederek müşteri trafiği modellerini analiz etmek için rafları izleyebilir. Farklı ürün ambalaj boyutlarını ve şekillerini işleyebilme yeteneği, yapay zekaya dayalı envanter yönetimi gibi uygulamalar için çok önemlidir.

Ankraj Tabanlı Dedektörler ve Ankrajsız Dedektörler

Son yıllarda, çapasız dedektörler popüler bir alternatif olarak ortaya çıkmıştır. Çapa tabanlı modellerin aksine (örn, Ultralytics YOLOv5), çapasız yaklaşımlar, genellikle kilit noktaları (nesne merkezleri veya köşeleri gibi) belirleyerek veya bir noktadan nesnenin sınırlarına olan mesafeleri tahmin ederek, önceden tanımlanmış çapa şekillerine olan ihtiyacı ortadan kaldırarak nesne konumlarını ve boyutlarını doğrudan tahmin eder.

Temel farklılıklar şunlardır:

  • Karmaşıklık: Çapa tabanlı modeller, veri setine bağlı olabilen çapa parametrelerinin (boyutlar, oranlar, ölçekler) dikkatli bir şekilde tasarlanmasını ve ayarlanmasını gerektirir. Çapa içermeyen modeller tespit başlığı tasarımını basitleştirir.
  • Esneklik: Çapasız yöntemler, sabit çapa seti tarafından iyi temsil edilmeyen alışılmadık en-boy oranlarına veya şekillere sahip nesnelere daha iyi uyum sağlayabilir.
  • Verimlilik: Çapaların ortadan kaldırılması, modelin yapması gereken tahminlerin sayısını azaltabilir, bu da potansiyel olarak daha hızlı çıkarım ve daha basit post-processing sağlar.

YOLOv4 gibi çapa tabanlı dedektörler oldukça başarılı olsa da, aşağıdakiler de dahil olmak üzere birçok modern mimari Ultralytics YOLO11basitlik ve verimlilik avantajlarından yararlanmak için çapasız tasarımları benimsemiştir. YOLO11'de çapasız algılamanın avantajlarını keşfedebilir ve farklı YOLO modelleri arasındaki karşılaştırmaları görebilirsiniz.

Araçlar ve Eğitim

İster çapa tabanlı ister çapasız olsun, nesne algılama modellerinin geliştirilmesi ve konuşlandırılması aşağıdaki gibi çerçevelerin kullanılmasını içerir PyTorch veya TensorFlow ve OpenCV gibi kütüphaneler. Ultralytics HUB gibi platformlar, çeşitli model mimarilerini destekleyerek özel modelleri eğitmek, veri kümelerini yönetmek ve çözümleri dağıtmak için kolaylaştırılmış iş akışları sunar. Daha fazla bilgi edinmek için Papers With Code gibi kaynaklar son teknoloji modelleri listeler ve DeepLearning.AI gibi platformların kursları temel kavramları kapsar.

Tümünü okuyun