Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Tespit Katmanı (Detection Head)

Algılama kafasının gerçek zamanlı nesne algılamayı nasıl mümkün kıldığını öğrenin. Ultralytics sınırlayıcı kutuları ve etiketleri yüksek doğrulukla tahmin etmedeki rolünü keşfedin.

Algılama başlığı, nesne algılama sinir ağı mimarisinde nihai karar verme katmanı olarak işlev görür. Modelin önceki katmanları, bir görüntüdeki şekilleri, dokuları ve özellikleri anlamaktan sorumluyken, algılama başlığı bu bilgileri yorumlayarak hangi nesnelerin mevcut olduğunu ve bunların nerede bulunduğunu tam olarak tahmin eden özel bir bileşendir. Özellik çıkarıcı tarafından üretilen soyut, üst düzey verileri eyleme geçirilebilir sonuçlara dönüştürür ve genellikle tanımlanan nesneleri çevreleyen bir dizi sınırlayıcı kutu ile bunlara karşılık gelen sınıf etiketlerini ve güven puanlarını

Başı Backbone Boyundan Ayırmak

Algılama kafasının işlevini tam olarak kavramak için, modern dedektörlerin bilgisayar görme (CV) boru hattında her biri farklı bir amaca hizmet eden üç ana aşamadan oluştuğunu görselleştirmek yararlıdır:

  • Backbone: Bu, ağın ilk kısmıdır ve genellikle ResNet veya CSPNet gibi Convolutional Neural Network (CNN) türündedir. Ham girdi görüntüsünü işleyerek görsel kalıpları temsil eden özellik haritaları oluşturur.
  • Boyun: backbone kafa arasında yer alan boyun, farklı ölçeklerden gelen özellikleri rafine eder ve birleştirir. Özellik Piramidi Ağı (FPN) gibi mimariler, modelin bağlamı bir araya getirerek farklı boyutlardaki detect .
  • Baş: Boyundan gelen rafine özellikleri tüketen son bileşen. Asıl sınıflandırma (bu nedir?) ve regresyon (bu nerede?) görevini yerine getirir.

Evrim: Ankraj Tabanlı ve Ankraj Tabanlı Olmayan

Algılama kafalarının tasarımı, özellikle geleneksel yöntemlerden modern gerçek zamanlı çıkarım modellerine geçişle birlikte, hız ve doğruluğu artırmak için önemli ölçüde gelişmiştir. .

  • Anchor Tabanlı Kafalar: Geleneksel tek aşamalı nesne dedektörleri, önceden tanımlanmış anchor kutularına(çeşitli boyutlarda sabit referans şekilleri) dayanıyordu. Kafa, nesneye uyması için bu anchor'ları ne kadar uzatması veya kaydırması gerektiğini tahmin ederdi. Bu yaklaşım, Faster R-CNN üzerine yapılan temel araştırmada ayrıntılı olarak açıklanmıştır.
  • Çapa İçermeyen Kafalar: En son YOLO26 dahil olmak üzere en gelişmiş modeller, çapa içermeyen dedektörler kullanır. Bu kafalar, nesne merkezlerini ve boyutlarını doğrudan özellik haritalarındaki piksellerden tahmin eder ve manuel çapa ayarlamasına gerek kalmaz. Bu, mimariyi basitleştirir ve modelin yeni nesne şekillerine genelleme yeteneğini geliştirir. Bu teknik genellikle Tamamen Evrişimli Tek Aşamalı Nesne Algılama (FCOS) ile ilişkilendirilen bir tekniktir.

Gerçek Dünya Uygulamaları

Algılama kafasının hassasiyeti, güvenlik açısından kritik ve endüstriyel ortamlarda yapay zeka (AI) kullanımı için çok önemlidir. Kullanıcılar, Ultralytics kullanarak verileri kolayca açıklama ekleyebilir ve bu özel kafaları eğitebilir.

  • Otonom Sürüş: Otomotiv için yapay zekada, algılama kafası yayaları, trafik ışıklarını ve diğer araçları gerçek zamanlı olarak ayırt etmekten sorumludur. Yüksek düzeyde optimize edilmiş kafa, çıkarım gecikmesinin aracın anında tepki verebileceği kadar düşük kalmasını sağlar.
  • Tıbbi Teşhis: Tıbbi görüntü analizinde, algılama başlıkları MRI taramalarında tümörler gibi anormallikleri bulmak için hassas bir şekilde ayarlanır. Regresyon dalı, lezyonun kesin sınırlarını belirlemek için son derece doğru olmalı ve doktorlara sağlık çözümlerinde yardımcı olmalıdır.

Kod Örneği

Aşağıdaki örnek, bir YOLO26 modeli ve algılama kafasının çıktısını inceler. Çıkarım çalıştırıldığında, kafa görüntüyü işler ve nihai sonucu döndürür. boxes koordinatlar ve sınıf kimlikleri içeren.

from ultralytics import YOLO

# Load the YOLO26n model (nano version)
model = YOLO("yolo26n.pt")

# Run inference on an image to utilize the detection head
results = model("https://ultralytics.com/images/bus.jpg")

# The detection head outputs are stored in results[0].boxes
for box in results[0].boxes:
    # Print the bounding box coordinates and the predicted class
    print(f"Class: {int(box.cls)}, Coordinates: {box.xywh.numpy()}")

Bu etkileşim, algılama kafasının karmaşık sinir ağı aktivasyonlarını, geliştiricilerin nesne izleme veya sayma gibi aşağı akış görevleri için kullanabilecekleri okunabilir verilere nasıl dönüştürdüğünü vurgulamaktadır. .

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın