Çapa tabanlı tespit edicilerin, hassas lokalizasyon, ölçeklenebilirlik ve gerçek dünya uygulamaları ile nesne tespitinde nasıl devrim yarattığını keşfedin.
Çapa tabanlı dedektörler, aşağıdaki alanlarda kullanılan temel bir model sınıfıdır sorununu çözmek için bilgisayarla görme (CV) nesne algılama. Bu sistemler bir olarak bilinen önceden tanımlanmış sınırlayıcı kutular kümesi referans şablonları olarak işlev gören bağlantı kutuları döşenmiştir bir görüntü boyunca. Ağ, bir nesnenin konumunu sıfırdan tahmin etmeye çalışmak yerine, görüntüde ne kadar Bu sabit çapaları sahnedeki nesnelere sıkıca uyacak şekilde kaydırmak ve ölçeklendirmek için. Bu yaklaşım esas olarak karmaşık yerelleştirme görevini yapılandırılmış bir regresyon problemine dönüştürerek, yerelleştirme için istikrarlı bir başlangıç noktası sağlar. mekansal öğrenme için derin öğrenme (DL) modelleri hiyerarşiler.
Çapa tabanlı bir dedektörün iş akışı, giriş görüntüsü üzerinde her biri aşağıdaki özelliklere sahip yoğun bir çapa ızgarası oluşturmayı içerir Farklı boyut ve şekillerdeki nesneleri yakalamak için değişen ölçekler ve en boy oranları. Görüntü ekranın içinden geçerken modelin backboneözellik haritaları çıkarılır ve analiz edilir. Her çapa konumu için algılama kafası iki eşzamanlı Tahminler:
Model eğitimi sırasında algoritmalar aşağıdaki gibi bir metrik kullanır Birlik Üzerindeki Kavşak (IoU) ile hangi çapaların bilinen nesnelerle yeterince örtüştüğünü belirler. Yalnızca en yüksek IoU 'ya sahip çapalar pozitif örnekler. Bu süreç binlerce aday kutu ürettiğinden, aşağıdaki gibi bilinen bir son işlem adımı Maksimum Olmayan Bastırma (NMS) gereksiz örtüşmeleri kaldırmak ve yalnızca en doğru algılamayı korumak için uygulanır.
Bu modelleri, modern nesil modellerden ayırmak önemlidir. çapasız dedektörler. Çapa tabanlı iken Orijinal Faster R-CNN gibi sistemler ve Ultralytics YOLOv5 çapanın manuel olarak ayarlanmasına dayanır boyutlarında, çapasız modeller nesne merkezlerini veya anahtar noktalarını doğrudan tahmin eder.
Daha yeni yöntemlerin ortaya çıkmasına rağmen, çapa tabanlı dedektörler, nesne tabanlı dedektörlerin kullanıldığı birçok yerleşik boru hattında yaygınlığını korumaktadır. şekiller tutarlı ve öngörülebilirdir.
Nesne algılamayı kolayca deneyebilirsiniz ultralytics Paket. Son modeller ise
anchor-free olduğundan, çerçeve çeşitli mimarileri destekler. Aşağıdaki örnek nasıl çalıştırılacağını göstermektedir
Önceden eğitilmiş bir model kullanarak bir görüntü üzerinde çıkarım:
from ultralytics import YOLO
# Load a pre-trained object detection model
# Note: YOLOv5 is a classic example of an anchor-based architecture
model = YOLO("yolov5su.pt")
# Perform inference on a local image
results = model("path/to/image.jpg")
# Display the resulting bounding boxes and class labels
results[0].show()
Çapa tabanlı detektörlerin mekaniğini anlamak, detektörlerin evrimini kavramak için sağlam bir temel sağlar. bilgisayar görüşü ve arkasındaki tasarım seçimleri gibi gelişmiş algoritmalar YOLO11 ve gelecekteki yinelemeler gibi YOLO26.
