Algılama kafasının gerçek zamanlı nesne algılamayı nasıl mümkün kıldığını öğrenin. Ultralytics sınırlayıcı kutuları ve etiketleri yüksek doğrulukla tahmin etmedeki rolünü keşfedin.
Algılama başlığı, nesne algılama sinir ağı mimarisinde nihai karar verme katmanı olarak işlev görür. Modelin önceki katmanları, bir görüntüdeki şekilleri, dokuları ve özellikleri anlamaktan sorumluyken, algılama başlığı bu bilgileri yorumlayarak hangi nesnelerin mevcut olduğunu ve bunların nerede bulunduğunu tam olarak tahmin eden özel bir bileşendir. Özellik çıkarıcı tarafından üretilen soyut, üst düzey verileri eyleme geçirilebilir sonuçlara dönüştürür ve genellikle tanımlanan nesneleri çevreleyen bir dizi sınırlayıcı kutu ile bunlara karşılık gelen sınıf etiketlerini ve güven puanlarını
Algılama kafasının işlevini tam olarak kavramak için, modern dedektörlerin bilgisayar görme (CV) boru hattında her biri farklı bir amaca hizmet eden üç ana aşamadan oluştuğunu görselleştirmek yararlıdır:
Algılama kafalarının tasarımı, özellikle geleneksel yöntemlerden modern gerçek zamanlı çıkarım modellerine geçişle birlikte, hız ve doğruluğu artırmak için önemli ölçüde gelişmiştir. .
Algılama kafasının hassasiyeti, güvenlik açısından kritik ve endüstriyel ortamlarda yapay zeka (AI) kullanımı için çok önemlidir. Kullanıcılar, Ultralytics kullanarak verileri kolayca açıklama ekleyebilir ve bu özel kafaları eğitebilir.
Aşağıdaki örnek, bir
YOLO26 modeli ve algılama kafasının çıktısını inceler.
Çıkarım çalıştırıldığında, kafa görüntüyü işler ve nihai sonucu döndürür. boxes koordinatlar ve
sınıf kimlikleri içeren.
from ultralytics import YOLO
# Load the YOLO26n model (nano version)
model = YOLO("yolo26n.pt")
# Run inference on an image to utilize the detection head
results = model("https://ultralytics.com/images/bus.jpg")
# The detection head outputs are stored in results[0].boxes
for box in results[0].boxes:
# Print the bounding box coordinates and the predicted class
print(f"Class: {int(box.cls)}, Coordinates: {box.xywh.numpy()}")
Bu etkileşim, algılama kafasının karmaşık sinir ağı aktivasyonlarını, geliştiricilerin nesne izleme veya sayma gibi aşağı akış görevleri için kullanabilecekleri okunabilir verilere nasıl dönüştürdüğünü vurgulamaktadır. .