YOLO Vision 2025'i kaçırmayın!
25 Eylül 2025
10:00 — 18:00 BST
Hibrit etkinlik
Yolo Vision 2024
Sözlük

İki Aşamalı Nesne Algılayıcılar

Karmaşık bilgisayarlı görü görevlerinde hassas nesne algılama için doğruluğa odaklı çözümler olan iki aşamalı nesne algılayıcıların gücünü keşfedin.

İki aşamalı nesne tespit araçları, sıralı, iki adımlı bir süreçle bir görüntü veya videodaki nesneleri tanımlayan ve konumlandıran bir bilgisayarlı görü modelleri sınıfıdır. Bu metodoloji, özellikle nesneleri hassas bir şekilde konumlandırmada yüksek doğruluğu ile bilinir, ancak genellikle daha yüksek çıkarım gecikmesi pahasına gelir. Temel fikir, önce potansiyel ilgi alanlarını belirlemek ve ardından yalnızca bu umut vadeden bölgelerde ayrıntılı sınıflandırma ve konumlandırma yapmaktır.

İki Aşamalı Süreç

İki aşamalı bir dedektörün çalışması, farklı, sıralı aşamalara ayrılmıştır:

  1. Bölge Teklifi Oluşturma: İlk aşamada, model, bir nesne içerme olasılığı yüksek olan "ilgi bölgeleri" (RoI'ler) veya teklifler olarak bilinen bir dizi aday bölge oluşturmak için görüntüyü tarar. Bu, tipik olarak Faster R-CNN mimarisinde ünlü bir şekilde tanıtıldığı gibi, Bölge Teklifi Ağı (RPN) adı verilen bir alt modül tarafından gerçekleştirilir. Bu aşamanın amacı, nesneleri sınıflandırmak değil, ikinci aşamanın analiz etmesi gereken konumların sayısını azaltmaktır.

  2. Nesne Sınıflandırması ve Sınırlayıcı Kutu İyileştirmesi: İkinci aşamada, önerilen her bölge bir sınıflandırma başlığına ve bir regresyon başlığına geçirilir. Sınıflandırma başlığı, RoI içindeki nesnenin sınıfını belirler (örneğin, "kişi", "araba", "köpek") veya arka plan olarak atar. Eşzamanlı olarak, regresyon başlığı, sınırlayıcı kutunun koordinatlarını nesneye daha doğru şekilde uyacak şekilde iyileştirir. Önceden seçilmiş bölgelerin bu odaklanmış analizi, modelin yüksek yerelleştirme hassasiyetine ulaşmasını sağlar.

İki Aşamalı ve Tek Aşamalı Tespit Araçları

Temel ayrım, operasyonel hatlarında yatmaktadır. İki aşamalı dedektörler, yerelleştirme ve sınıflandırma görevlerini ayırırken, tek aşamalı nesne dedektörleri her iki görevi de tek bir geçişte aynı anda gerçekleştirir.

  • İki Aşamalı Dedektörler (örn. R-CNN ailesi): Doğruluğa öncelik verir. İki adımlı işlem, her potansiyel nesne için daha ayrıntılı özellik çıkarılmasına ve iyileştirilmesine olanak tanır; bu da çok sayıda küçük veya örtüşen nesnenin bulunduğu karmaşık sahnelerde daha iyi performansa yol açar. Bununla birlikte, karmaşıklıkları, onları hesaplama açısından yoğun ve daha yavaş hale getirir.
  • Tek Aşamalı Dedektörler (örn. Ultralytics YOLO, SSD): Hız ve verimliliğe öncelik verir. Nesne tespitini tek bir regresyon problemi olarak ele alarak, uç yapay zeka cihazlarındaki uygulamalar için uygun gerçek zamanlı çıkarım hızlarına ulaşırlar. YOLO11 gibi modern tek aşamalı modeller doğruluk açığını önemli ölçüde kapatmış olsa da, mümkün olan en yüksek hassasiyeti gerektiren görevler için iki aşamalı dedektörler hala tercih edilebilir.

Öne Çıkan Mimariler

İki aşamalı dedektörlerin evrimi, çeşitli etkili modellerle işaretlenmiştir:

  • R-CNN (Bölge Tabanlı Evrişimli Sinir Ağı): Bir evrişimli sinir ağı (CNN) ile bölge önerilerini kullanmayı ilk öneren öncü model. Öneriler oluşturmak için Seçici Arama adlı harici bir algoritma kullandı.
  • Hızlı R-CNN: Tüm görüntüyü bir CNN aracılığıyla bir kez işleyen, hesaplamayı paylaşan ve süreci önemli ölçüde hızlandıran bir iyileştirme.
  • Daha Hızlı R-CNN: Bölge teklif mekanizmasını uçtan uca derin öğrenme çözümü için sinir ağına entegre eden Bölge Teklif Ağı'nı (RPN) tanıttı.
  • Mask R-CNN: Her nesne için piksel düzeyinde bir maske çıkaran üçüncü bir dal ekleyerek Faster R-CNN'i genişletir ve örnek segmentasyonunu etkinleştirir.

Gerçek Dünya Uygulamaları

İki aşamalı tespit edicilerin yüksek doğruluğu, hassasiyetin çok önemli olduğu senaryolarda onları değerli kılar:

  • Tıbbi Görüntü Analizi: Tıbbi taramalarda (BT, MR) küçük tümörler, lezyonlar veya polipler gibi ince anormallikleri tespit etmek, teşhise yardımcı olmak için yüksek doğruluk gerektirir. Kesin lokalizasyon, tedavi planlaması için kritik öneme sahiptir. Sağlık hizmetlerinde yapay zeka ve Radiology: Artificial Intelligence gibi dergilerdeki araştırmalar hakkında daha fazla bilgi edinin. İlgili görevler için Beyin Tümörü veri seti gibi veri kümelerini keşfedebilirsiniz.
  • Autonomous Driving (Otonom Sürüş): Özellikle küçük veya kısmen gizlenmiş yayaları, bisikletlileri, diğer araçları ve trafik işaretlerini doğru bir şekilde tespit etmek ve konumlandırmak, sürücüsüz arabaların güvenlik sistemleri için çok önemlidir. Waymo gibi şirketler, sağlam algılama sistemlerine büyük ölçüde güvenmektedir.
  • Ayrıntılı Sahne Anlayışı: Nesne etkileşimlerinin ayrıntılı bir şekilde anlaşılmasını veya hassas sayım yapılmasını gerektiren uygulamalar, daha yüksek doğruluktan yararlanır.
  • Üretimde Kalite Kontrolü: Karmaşık montajlarda küçük kusurları tanımlamak veya bileşen yerleşimini doğrulamak genellikle yüksek hassasiyet gerektirir. Üretimde yapay zeka hakkında daha fazla bilgi edinin.

Bu modelleri eğitmek genellikle COCO veri kümesi gibi büyük etiketli veri kümelerini ve dikkatli ayarlamayı içerir. Ultralytics, model eğitimi ve performans metriklerini anlama konusunda kaynaklar sağlar. Ultralytics, Ultralytics YOLO gibi verimli tek aşamalı modellere odaklanırken, iki aşamalı tespit edicileri anlamak, nesne tespiti alanında değerli bir bağlam sağlar.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın
Bağlantı panoya kopyalandı