Çapa tabanlı dedektörlerin hassas konumlandırma, ölçeğe uyarlanabilirlik ve gerçek dünya uygulamaları ile nesne algılamada nasıl devrim yarattığını keşfedin.
Çapa tabanlı dedektörler, bilgisayarla görmede nesne algılama modellerinin temel bir sınıfıdır. Bu modeller, bir görüntüdeki nesneleri tanımlamak ve konumlandırmak için bağlantı kutuları olarak bilinen önceden tanımlanmış bir kutu kümesi kullanarak çalışır. Bağlantı kutuları esasen görüntü boyunca döşenen çeşitli boyut ve en boy oranlarına sahip şablonlardan oluşan bir ızgaradır. Model, bir nesnenin varlığını gösteren bir güven puanıyla birlikte, nesnelerin gerçek sınırlayıcı kutu larıyla eşleşmek için bu çapaların nasıl kaydırılacağını ve ölçeklendirileceğini tahmin eder. Bu yaklaşım, nesneleri bulma sorununu bu sabit çapalara göre bir regresyon ve sınıflandırma görevine dönüştürerek basitleştirir.
Çapa tabanlı mimarilerin önde gelen örnekleri arasında Faster R-CNN gibi R-CNN ailesi ve SSD (Single Shot MultiBox Detector) gibi ilk tek aşamalı dedektörler ve son derece başarılı Ultralytics YOLOv5 de dahil olmak üzere birçok YOLO modeli bulunmaktadır.
Çapa tabanlı tespitin arkasındaki temel fikir, bir başlangıç noktası olarak önceden tanımlanmış bir dizi referans kutusunu kullanmaktır. Model eğitimi sürecinde, dedektör her bir çapa kutusu için iki ana görevi yerine getirmeyi öğrenir:
Bu tahminler, omurga tarafından çıkarılan görüntü özellikleri işlendikten sonra modelin algılama kafası tarafından yapılır. Tek bir nesne birden fazla bağlantı kutusu tarafından tespit edilebildiğinden, gereksiz tespitleri filtrelemek ve yalnızca en iyi uyan kutuyu tutmak için Maksimum Olmayan Bastırma (NMS) adı verilen bir son işlem adımı kullanılır. Bu modellerin performansı genellikle Ortalama Hassasiyet (mAP) ve Birlik Üzerinden Kesişim (IoU) gibi metrikler kullanılarak değerlendirilir.
Son yıllarda, çapasız dedektörler popüler bir alternatif olarak ortaya çıkmıştır. Çapa tabanlı modellerin aksine, çapasız yaklaşımlar, genellikle kilit noktaları (nesne merkezleri veya köşeleri gibi) belirleyerek veya bir noktadan nesnenin sınırlarına olan mesafeleri tahmin ederek, önceden tanımlanmış çapa şekillerine olan ihtiyacı ortadan kaldırarak nesne konumlarını ve boyutlarını doğrudan tahmin eder.
Temel farklılıklar şunlardır:
YOLOv4 gibi çapa tabanlı dedektörler oldukça başarılı olsa da, Ultralytics YOLO11 de dahil olmak üzere birçok modern mimari, basitlik ve verimlilik avantajlarından yararlanmak için çapasız tasarımları benimsemiştir. YOLO11'de çapasız algılamanın avantajlarını keşfedebilir ve farklı YOLO modelleri arasındaki karşılaştırmaları görebilirsiniz.
Çapa tabanlı dedektörler, nesnelerin nispeten standart şekil ve boyutlara sahip olduğu çeşitli uygulamalarda yaygın olarak kullanılmaktadır.
İster çapa tabanlı ister çapasız olsun, nesne algılama modellerinin geliştirilmesi ve dağıtılması PyTorch veya TensorFlow gibi çerçevelerin ve OpenCV gibi kütüphanelerin kullanılmasını içerir. Ultralytics HUB gibi platformlar, çeşitli model mimarilerini destekleyerek özel modelleri eğitmek, veri kümelerini yönetmek ve çözümleri dağıtmak için kolaylaştırılmış iş akışları sunar. Daha fazla bilgi edinmek için Papers With Code gibi kaynaklar son teknoloji modelleri listeler ve DeepLearning.AI gibi platformların kursları temel kavramları kapsar.