Çapa tabanlı tespit edicilerin, hassas lokalizasyon, ölçeklenebilirlik ve gerçek dünya uygulamaları ile nesne tespitinde nasıl devrim yarattığını keşfedin.
Çapa tabanlı tespit ediciler, nesne tespiti modellerinin bilgisayarlı görü'deki temel bir sınıfıdır. Bu modeller, bir görüntü içindeki nesneleri tanımlamak ve konumlandırmak için çapa kutuları olarak bilinen önceden tanımlanmış bir dizi kutu kullanır. Çapa kutuları, çeşitli boyut ve en boy oranlarına sahip ve görüntü boyunca döşenmiş şablonlardan oluşan bir ızgaradır. Model, bir nesnenin varlığını gösteren bir güven puanıyla birlikte, bu çapaları nesnelerin gerçek sınırlayıcı kutularıyla eşleşecek şekilde nasıl kaydıracağını ve ölçekleyeceğini tahmin eder. Bu yaklaşım, nesneleri bulma sorununu bu sabit çapalara göre bir regresyon ve sınıflandırma görevine dönüştürerek basitleştirir.
Çapa tabanlı mimarilerin öne çıkan örnekleri arasında Faster R-CNN gibi R-CNN ailesi ve SSD (Single Shot MultiBox Detector) gibi erken tek aşamalı dedektörler ve son derece başarılı Ultralytics YOLOv5 dahil olmak üzere birçok YOLO modeli bulunmaktadır.
Çapa tabanlı algılamanın ardındaki temel fikir, önceden tanımlanmış bir dizi referans kutusunu başlangıç noktası olarak kullanmaktır. Model eğitimi sürecinde, dedektör her bir çapa kutusu için iki ana görevi gerçekleştirmeyi öğrenir:
Bu tahminler, modelin arka planı tarafından çıkarılan görüntü özelliklerini işledikten sonra modelin algılama başlığı tarafından yapılır. Tek bir nesne birden fazla bağlantı kutusu tarafından algılanabileceğinden, yedekli algılamaları filtrelemek ve yalnızca en uygun kutuyu tutmak için Maksimum Olmayan Bastırma (NMS) adlı bir işlem sonrası adım kullanılır. Bu modellerin performansı genellikle ortalama Ortalama Hassasiyet (mAP) ve Kesişim Üzerinden Birleşim (IoU) gibi metrikler kullanılarak değerlendirilir.
Son yıllarda, anchor'suz (çıpasız) tespit ediciler popüler bir alternatif olarak ortaya çıktı. Anchor tabanlı modellerin aksine, anchor'suz yaklaşımlar, genellikle temel noktaları (nesne merkezleri veya köşeleri gibi) belirleyerek veya bir noktadan nesnenin sınırlarına olan mesafeleri tahmin ederek doğrudan nesne konumlarını ve boyutlarını tahmin eder ve önceden tanımlanmış anchor şekillerine olan ihtiyacı ortadan kaldırır.
Temel farklılıklar şunlardır:
YOLOv4 gibi anchor tabanlı dedektörler oldukça başarılı olsa da, Ultralytics YOLO11 dahil olmak üzere birçok modern mimari, basitlik ve verimlilikteki avantajlarından yararlanmak için anchor-free tasarımları benimsemiştir. YOLO11'de anchor-free tespitin avantajlarını keşfedebilir ve farklı YOLO modelleri arasındaki karşılaştırmaları görebilirsiniz.
Çapa tabanlı tespit ediciler, nesnelerin nispeten standart şekil ve boyutlara sahip olduğu çeşitli uygulamalarda yaygın olarak kullanılır.
İster ankraj tabanlı ister ankraj içermeyen nesne algılama modellerini geliştirmek ve dağıtmak, PyTorch veya TensorFlow gibi çerçeveleri ve OpenCV gibi kütüphaneleri kullanmayı içerir. Ultralytics HUB gibi platformlar, çeşitli model mimarilerini destekleyerek özel modelleri eğitmek, veri kümelerini yönetmek ve çözümleri dağıtmak için kolaylaştırılmış iş akışları sunar. Daha fazla bilgi için, Papers With Code gibi kaynaklar son teknoloji modelleri listeler ve DeepLearning.AI gibi platformlardaki kurslar temel kavramları kapsar.