YOLO Vision 2025'i kaçırmayın!
25 Eylül 2025
10:00 — 18:00 BST
Hibrit etkinlik
Yolo Vision 2024
Sözlük

Tespit Katmanı (Detection Head)

Nesne algılamada algılama başlıklarının kritik rolünü keşfedin; nesne konumlarını ve sınıflarını hassas bir şekilde belirlemek için özellik haritalarını iyileştirin.

Algılama başlığı, bir görüntü veya videodaki nesnelerin varlığı, konumu ve sınıfı hakkında nihai tahminleri yapmaktan sorumlu olan nesne algılama mimarilerinde kritik bir bileşendir. Bir sinir ağının sonunda konumlandırılan bu başlık, modelin omurgası ve boynu tarafından oluşturulan işlenmiş özellik haritalarını alır ve bunları somut çıktılara çevirir. Spesifik olarak, algılama başlığı iki temel görevi yerine getirir: potansiyel nesneleri önceden tanımlanmış kategorilere (örneğin, "araba", "kişi", "köpek") sınıflandırır ve algılanan her nesneyi çevreleyen sınırlayıcı kutunun tam koordinatlarını tahmin etmek için regresyon gerçekleştirir.

Tespit Başlıkları Nasıl Çalışır?

Nesne algılama için kullanılan tipik bir Evrişimli Sinir Ağında (CNN), girdi görüntüsü bir dizi katmandan geçer. İlk katmanlar (omurga), kenarlar ve dokular gibi düşük seviyeli özellikleri çıkarırken, daha derin katmanlar daha karmaşık desenleri yakalar. Algılama başlığı, istenen çıktıyı üretmek için bu yüksek seviyeli özellikleri sentezleyen son aşamadır.

Algılama başlığının tasarımı, çeşitli nesne algılama modelleri arasında önemli bir farklılaştırıcıdır. Bazı başlıklar hız için tasarlanmıştır, bu da onları uç cihazlarda gerçek zamanlı çıkarım için uygun hale getirir, diğerleri ise maksimum doğruluk için optimize edilmiştir. Genellikle ortalama Ortalama Hassasiyet (mAP) gibi metriklerle ölçülen bir algılama modelinin performansı, algılama başlığının etkinliğinden büyük ölçüde etkilenir. Farklı mimarilerin nasıl performans gösterdiğini görmek için model karşılaştırmalarını keşfedebilirsiniz.

Modern Mimarilerde Algılama Başlıkları

Modern derin öğrenme, tespit başlığı tasarımında önemli gelişmeler kaydetmiştir. Çapa tabanlı ve çapa içermeyen dedektörler arasındaki ayrım özellikle önemlidir.

  • Çapa Tabanlı Başlıklar: Bu geleneksel başlıklar, çeşitli boyut ve en boy oranlarına sahip önceden tanımlanmış bir dizi kutu (çapalar) kullanır. Başlık, görüntüdeki gerçek nesnelerle eşleşmesi için bu çapaları nasıl kaydıracağını ve ölçekleyeceğini tahmin eder.
  • Çapasız Başlıklar: Ultralytics YOLO11 dahil olmak üzere daha yeni modeller genellikle çapassız başlıklar kullanır. Bu başlıklar, örneğin bir nesnenin merkezi gibi kilit noktaları belirleyerek nesne konumlarını doğrudan tahmin eder. Bu yaklaşım, model tasarımını basitleştirebilir ve YOLO11'in çapassız olmasının faydaları hakkındaki bu blogda ayrıntılı olarak açıklandığı gibi, alışılmadık şekillere sahip nesneler için esnekliği artırabilir.

Bu bileşenlerin geliştirilmesi, özel modelleri oluşturmak ve eğitmek için araçlar sağlayan PyTorch ve TensorFlow gibi güçlü framework'lere dayanır. Ultralytics HUB gibi platformlar bu süreci daha da kolaylaştırır.

Gerçek Dünya Uygulamaları

Algılama başlığının etkinliği, nesne algılama üzerine inşa edilmiş çok sayıda AI uygulamasının performansını doğrudan etkiler.

  1. Otonom Araçlar: Sürücüsüz otomobillerde, tespit başlıkları yayaları, diğer araçları ve trafik işaretlerini gerçek zamanlı olarak tanımlamak ve konumlandırmak için gereklidir. Bu tahminlerin hızı ve doğruluğu, güvenli navigasyon için kritik öneme sahiptir ve Waymo gibi şirketler tarafından yoğun olarak kullanılmaktadır. Bu, çeşitli ve dinamik ortamları işleyebilen sağlam tespit başlıkları gerektirir.
  2. Güvenlik ve Gözetim: Algılama başlıkları, video akışlarında yetkisiz kişileri, terk edilmiş nesneleri veya belirli olayları tanımlayarak otomatik izleme sistemlerine güç sağlar. Bu yetenek, Ultralytics Güvenlik Alarm Sistemi kılavuzu gibi uygulamalar için temeldir.
  3. Tıbbi Görüntü Analizi: Tespit başlıkları, tıbbi taramalarda tümörler veya kırıklar gibi anormallikleri tam olarak bularak radyologlara yardımcı olur ve daha hızlı ve daha doğru teşhislere katkıda bulunur. Tümör tespiti için YOLO11 kullanımını okuyarak bu uygulama hakkında daha fazla bilgi edinebilirsiniz.
  4. Üretim: Fabrikalarda, tespit başlıkları, montaj hatlarındaki ürünlerdeki kusurları tespit ederek otomatik üretimde kalite kontrolünü sağlar.
  5. Perakende Analitiği: Bu bileşenler, envanter yönetimi ve müşteri ayak izi modellerini analiz etme gibi uygulamalar için kullanılır.

YOLOv8 gibi modellerdeki gelişmiş algılama başlıkları, çok çeşitli görev ve senaryolarda yüksek performans sağlamak için COCO gibi büyük ölçekli kıyaslama veri kümeleri üzerinde eğitilir. Son çıktı, yedekli algılamaları filtrelemek için genellikle Maksimum Olmayan Bastırma (NMS) gibi teknikler kullanılarak iyileştirilir. Daha derinlemesine bilgi için, Coursera ve DeepLearning.AI gibi sağlayıcılardan alınan çevrimiçi kurslar kapsamlı öğrenme yolları sunar.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın
Bağlantı panoya kopyalandı