Nesne algılamada algılama başlıklarının kritik rolünü keşfedin; nesne konumlarını ve sınıflarını hassas bir şekilde belirlemek için özellik haritalarını iyileştirin.
Algılama kafası, bir nesne algılama modelinin son ve belki de en kritik bileşenidir. Kodlanmış görüntü özelliklerini eyleme dönüştürülebilir tahminlere çeviren karar verme katmanı. Bir binanın en sonunda yer alan derin öğrenme sinir ağından sonra, özellikle backbone ve boyun, algılama kafası yüksek seviyeli nihai çıktıyı üretmek için özellik haritaları: sınıf nesneyi ve görüntü içindeki kesin konumunu belirler. Ağın önceki katmanları özelliğe odaklanırken çıkarma - kenarları, dokuları ve karmaşık desenleri tanımlama - algılama kafası bu verileri yorumlayarak "Nedir?" ve "Nerede?"
Bir tespit başlığının birincil sorumluluğu iki farklı ancak eşzamanlı görevi yerine getirmektir: sınıflandırma ve gerileme. Modern nesne algılama mimarileri, bu görevler genellikle kafa içinde ayrı dallar tarafından ele alınır, bu da modelin aşağıdakileri yapmasına olanak tanıyan bir tasarım seçimidir tahminin farklı yönlerinde uzmanlaşmıştır.
Algılama kafasından elde edilen çıktı tipik olarak yoğun bir aday algılama kümesidir. Sonuçları sonuçlandırmak için, gibi işlem sonrası adımlar Maksimum Olmayan Bastırma (NMS) şunlardır örtüşen kutuları filtrelemek ve yalnızca en emin tahminleri tutmak için uygulanır.
Algılama kafasının tasarımı, bir modelin nesnelerin yerini belirleme sorununa nasıl yaklaştığını belirler.
Algılama kafasının verimliliği ve doğruluğu, aşağıdakilerin yerleştirilmesi için hayati önem taşır karmaşık yapay zeka (AI) ortamlar.
Algılama başlığını, diğer ana bileşenlerden ayırmak faydalı olacaktır. Evrişimsel Sinir Ağı (CNN):
Aşağıdaki Python kod parçacığı, önceden eğitilmiş bir YOLO11 modelinin algılama kafasının nasıl inceleneceğini göstermektedir
ve ultralytics paketi. Bu, kullanıcıların aşağıdakilerden sorumlu son katmanın yapısını anlamalarına yardımcı olur
çıkarım.
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Inspect the final detection head layer
# This typically reveals the number of classes (nc) and anchors/outputs
print(model.model.model[-1])
# Run inference to see the head's output in action
results = model("https://ultralytics.com/images/bus.jpg")
Algılama kafasını anlamak, optimize etmek isteyen herkes için çok önemlidir performansı modellemek veya gelişmiş görevleri gerçekleştirmek modeli yeni bir model üzerinde eğitmek için kafanın sıklıkla değiştirildiği transfer öğrenme gibi özel veri kümesi. Araştırmacılar sürekli olarak gibi ölçümleri iyileştirmek için yeni kafa tasarımları Ortalama Ortalama Hassasiyet (mAP), itme bilgisayarla görmenin başarabileceği şeylerin sınırlarını belirliyor.
