Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Çapa Tabanlı Tespit Ediciler

Çapa tabanlı tespit edicilerin, hassas lokalizasyon, ölçeklenebilirlik ve gerçek dünya uygulamaları ile nesne tespitinde nasıl devrim yarattığını keşfedin.

Çapa tabanlı dedektörler, aşağıdaki alanlarda kullanılan temel bir model sınıfıdır sorununu çözmek için bilgisayarla görme (CV) nesne algılama. Bu sistemler bir olarak bilinen önceden tanımlanmış sınırlayıcı kutular kümesi referans şablonları olarak işlev gören bağlantı kutuları döşenmiştir bir görüntü boyunca. Ağ, bir nesnenin konumunu sıfırdan tahmin etmeye çalışmak yerine, görüntüde ne kadar Bu sabit çapaları sahnedeki nesnelere sıkıca uyacak şekilde kaydırmak ve ölçeklendirmek için. Bu yaklaşım esas olarak karmaşık yerelleştirme görevini yapılandırılmış bir regresyon problemine dönüştürerek, yerelleştirme için istikrarlı bir başlangıç noktası sağlar. mekansal öğrenme için derin öğrenme (DL) modelleri hiyerarşiler.

Çapa Tabanlı Algılama Mekanizmaları

Çapa tabanlı bir dedektörün iş akışı, giriş görüntüsü üzerinde her biri aşağıdaki özelliklere sahip yoğun bir çapa ızgarası oluşturmayı içerir Farklı boyut ve şekillerdeki nesneleri yakalamak için değişen ölçekler ve en boy oranları. Görüntü ekranın içinden geçerken modelin backboneözellik haritaları çıkarılır ve analiz edilir. Her çapa konumu için algılama kafası iki eşzamanlı Tahminler:

  1. Sınıflandırma: Model, çapanın aşağıdakileri içerip içermediğini belirten bir olasılık puanı atar belirli bir nesne sınıfı veya sadece arka plan gürültüsüdür.
  2. Sınırlayıcı Kutu Regresyonu: Model, ofset değerlerini (merkez, genişlik ve genişlik için koordinatlar) tahmin eder. yükseklik) çapanın boyutlarını zemin gerçeğiyle eşleşecek şekilde ayarlamak için sınırlayıcı kutu.

Model eğitimi sırasında algoritmalar aşağıdaki gibi bir metrik kullanır Birlik Üzerindeki Kavşak (IoU) ile hangi çapaların bilinen nesnelerle yeterince örtüştüğünü belirler. Yalnızca en yüksek IoU 'ya sahip çapalar pozitif örnekler. Bu süreç binlerce aday kutu ürettiğinden, aşağıdaki gibi bilinen bir son işlem adımı Maksimum Olmayan Bastırma (NMS) gereksiz örtüşmeleri kaldırmak ve yalnızca en doğru algılamayı korumak için uygulanır.

Ankraj Tabanlı ve Ankrajsız Mimariler

Bu modelleri, modern nesil modellerden ayırmak önemlidir. çapasız dedektörler. Çapa tabanlı iken Orijinal Faster R-CNN gibi sistemler ve Ultralytics YOLOv5 çapanın manuel olarak ayarlanmasına dayanır boyutlarında, çapasız modeller nesne merkezlerini veya anahtar noktalarını doğrudan tahmin eder.

  • Çapa Tabanlı: Hassas olabilen çapa boyutları ve oranları için hiperparametrelerin tanımlanmasını gerektirir belirli veri kümeleri için. Standart nesneler için tarihsel olarak sağlamdırlar.
  • Anchor-Free: Önceden ayarlanmış kutulara olan ihtiyacı ortadan kaldırarak mimariyi basitleştirir ve hesaplama yükü. Son teknoloji ürünü Ultralytics YOLO11 için çapasız bir yaklaşım kullanır. özellikle düzensiz geometrilere sahip nesneler için üstün hız ve esneklik elde edin. Hakkında daha fazla bilgi edinebilirsiniz ve YOLO11'de ankrajsız tasarımın faydaları blogumuzda.

Gerçek Dünya Uygulamaları

Daha yeni yöntemlerin ortaya çıkmasına rağmen, çapa tabanlı dedektörler, nesne tabanlı dedektörlerin kullanıldığı birçok yerleşik boru hattında yaygınlığını korumaktadır. şekiller tutarlı ve öngörülebilirdir.

  • Otonom Sürüş: Geliştirilmesinde otonom araçlar, sistemler güvenilir olmalıdır arabaları, kamyonları ve trafik işaretlerini detect . Araçlar genellikle tutarlı en-boy oranlarına sahip olduklarından, çapa tabanlı gibi sektör liderleri tarafından kullanılan algı yığınları için etkilidir. Waymo ve Mobileye.
  • Perakende Envanter Yönetimi: İçin Perakendede yapay zeka, kameralar rafları track stok seviyeleri. Mısır gevreği kutuları veya içecek kutuları gibi ürünlerin standartlaştırılmış şekilleri vardır. çapa şablonları, yüksek hassasiyetli sayım ve nesne takibi.

Ultralytics ile Uygulama

Nesne algılamayı kolayca deneyebilirsiniz ultralytics Paket. Son modeller ise anchor-free olduğundan, çerçeve çeşitli mimarileri destekler. Aşağıdaki örnek nasıl çalıştırılacağını göstermektedir Önceden eğitilmiş bir model kullanarak bir görüntü üzerinde çıkarım:

from ultralytics import YOLO

# Load a pre-trained object detection model
# Note: YOLOv5 is a classic example of an anchor-based architecture
model = YOLO("yolov5su.pt")

# Perform inference on a local image
results = model("path/to/image.jpg")

# Display the resulting bounding boxes and class labels
results[0].show()

Çapa tabanlı detektörlerin mekaniğini anlamak, detektörlerin evrimini kavramak için sağlam bir temel sağlar. bilgisayar görüşü ve arkasındaki tasarım seçimleri gibi gelişmiş algoritmalar YOLO11 ve gelecekteki yinelemeler gibi YOLO26.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın