Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Tespit Katmanı (Detection Head)

Nesne algılamada algılama başlıklarının kritik rolünü keşfedin; nesne konumlarını ve sınıflarını hassas bir şekilde belirlemek için özellik haritalarını iyileştirin.

Algılama kafası, bir nesne algılama modelinin son ve belki de en kritik bileşenidir. Kodlanmış görüntü özelliklerini eyleme dönüştürülebilir tahminlere çeviren karar verme katmanı. Bir binanın en sonunda yer alan derin öğrenme sinir ağından sonra, özellikle backbone ve boyun, algılama kafası yüksek seviyeli nihai çıktıyı üretmek için özellik haritaları: sınıf nesneyi ve görüntü içindeki kesin konumunu belirler. Ağın önceki katmanları özelliğe odaklanırken çıkarma - kenarları, dokuları ve karmaşık desenleri tanımlama - algılama kafası bu verileri yorumlayarak "Nedir?" ve "Nerede?"

İşlevsellik ve Mimari

Bir tespit başlığının birincil sorumluluğu iki farklı ancak eşzamanlı görevi yerine getirmektir: sınıflandırma ve gerileme. Modern nesne algılama mimarileri, bu görevler genellikle kafa içinde ayrı dallar tarafından ele alınır, bu da modelin aşağıdakileri yapmasına olanak tanıyan bir tasarım seçimidir tahminin farklı yönlerinde uzmanlaşmıştır.

  • Sınıflandırma Şubesi: Bu alt bileşen çeşitli kategorilere bir olasılık puanı atar (örn, "kişi," "bisiklet," "trafik ışığı"). Bu bir kullanır öğrenmek için Çapraz Entropi Kaybı gibi kayıp fonksiyonu sınıflar arasındaki fark.
  • Regresyon Dalı: Kafanın bu kısmı, bir nesnenin uzamsal koordinatlarını tahmin eder. nesneyi çevreleyen sınırlayıcı kutu. Bu rafine eder kutu boyutlarını (x, y, genişlik, yükseklik) zemin gerçeğine yakın bir şekilde hizalayarak genellikle en aza indirir Birlik üzerinden kesişme (IoU) kaybı.

Algılama kafasından elde edilen çıktı tipik olarak yoğun bir aday algılama kümesidir. Sonuçları sonuçlandırmak için, gibi işlem sonrası adımlar Maksimum Olmayan Bastırma (NMS) şunlardır örtüşen kutuları filtrelemek ve yalnızca en emin tahminleri tutmak için uygulanır.

Algılama Başlıklarının Türleri

Algılama kafasının tasarımı, bir modelin nesnelerin yerini belirleme sorununa nasıl yaklaştığını belirler.

  • Çapa Tabanlı Başlıklar: Geleneksel gibi tek aşamalı nesne dedektörleri YOLO versiyonları önceden tanımlanmış bağlantı kutularına dayanır. Bu kafa bu sabit referans kutularından ofsetleri tahmin eder. Etkili olsa da, bu yaklaşım dikkatli bir ayarlama gerektirir çapa hiperparametreleri.
  • Çapasız Başlıklar: Aşağıdakiler de dahil olmak üzere son teknoloji modeller Ultralytics YOLO11, kullan çapasız dedektörler. Bu başlıklar şunları öngörür nesne merkezleri ve boyutları, önceden ayarlanmış kutulara dayanmadan doğrudan özellik haritası piksellerinden elde edilir. Bu önemli ölçüde model mimarisini basitleştirir ve farklı nesne şekilleri arasında genellemeyi geliştirir.

Gerçek Dünya Uygulamaları

Algılama kafasının verimliliği ve doğruluğu, aşağıdakilerin yerleştirilmesi için hayati önem taşır karmaşık yapay zeka (AI) ortamlar.

  1. Tıbbi Teşhis: İçinde tıbbi görüntü analizi, algılama kafaları X-ışınları ve MRI taramalarında tümör veya kırık gibi anomalileri saptamak üzere eğitilmiştir. Mesela, Sağlık hizmetlerinde yapay zeka yüksek hassasiyetli kafalara dayanıyor yanlış negatifleri azaltarak radyologlara erken hastalık tespitinde yardımcı olur.
  2. Perakende Analitiği: Akıllı mağazalar envanteri track ve müşteriyi izlemek için bilgisayarla görmeyi kullanıyor davranış. Algılama kafaları Perakende uygulamaları için yapay zeka, belirli raflardaki ürünleri veya kayıp önleme için şüpheli davranışları detect eder, video akışlarını gerçek zamanlı olarak işler.

Algılama Baş vs Backbone ve Boyun

Algılama başlığını, diğer ana bileşenlerden ayırmak faydalı olacaktır. Evrişimsel Sinir Ağı (CNN):

  • Backbone: Bu backbone (örneğin, ResNet veya CSPDarknet) giriş görüntüsünden ham görsel özelliklerin çıkarılmasından sorumludur.
  • Boyun: Boyun, genellikle bir Özellik Piramidi Ağı (FPN), karışımlar ve bu özellikleri farklı ölçeklerde bağlamı bir araya getirmek için iyileştirir.
  • Başlık: Algılama başlığı, nihai sınıfı ve koordinatı oluşturmak için bu rafine özellikleri kullanır Tahminler.

Uygulama Örneği

Aşağıdaki Python kod parçacığı, önceden eğitilmiş bir YOLO11 modelinin algılama kafasının nasıl inceleneceğini göstermektedir ve ultralytics paketi. Bu, kullanıcıların aşağıdakilerden sorumlu son katmanın yapısını anlamalarına yardımcı olur çıkarım.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Inspect the final detection head layer
# This typically reveals the number of classes (nc) and anchors/outputs
print(model.model.model[-1])

# Run inference to see the head's output in action
results = model("https://ultralytics.com/images/bus.jpg")

Algılama kafasını anlamak, optimize etmek isteyen herkes için çok önemlidir performansı modellemek veya gelişmiş görevleri gerçekleştirmek modeli yeni bir model üzerinde eğitmek için kafanın sıklıkla değiştirildiği transfer öğrenme gibi özel veri kümesi. Araştırmacılar sürekli olarak gibi ölçümleri iyileştirmek için yeni kafa tasarımları Ortalama Ortalama Hassasiyet (mAP), itme bilgisayarla görmenin başarabileceği şeylerin sınırlarını belirliyor.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın