Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

İki Aşamalı Nesne Algılayıcılar

Bölge önerileri ve sınıflandırmaya odaklanarak iki aşamalı nesne algılayıcıların mekanizmasını keşfedin. Ultralytics gibi modern modellerin neden şu anda lider olduğunu öğrenin.

İki aşamalı nesne algılayıcılar, bir görüntüdeki öğeleri tanımlamak ve konumlarını belirlemek için bilgisayar görüşünde kullanılan sofistike bir derin öğrenme (DL) mimarisi sınıfıdır. Tek aşamalı muadillerinden farklı olarak, tek bir geçişte algılama yapan bu modeller, görevi iki ayrı aşamaya böler: bölge önerisi ve nesne sınıflandırması. Bu iki aşamalı yaklaşım, yüksek konumlandırma doğruluğunu önceliklendirmek için geliştirilmiştir ve bu dedektörleri yapay zeka (AI) evriminde tarihsel olarak önemli hale getirmiştir. "Nerede"yi "ne"den ayırarak, iki aşamalı algılayıcılar genellikle üstün bir hassasiyet elde ederler, özellikle küçük veya örtülü nesnelerde, ancak bu genellikle artan hesaplama kaynakları ve daha yavaş çıkarım gecikmesi pahasına olur.

İki Aşamalı Süreç

İki aşamalı dedektörün mimarisi, bir insanın bir sahneyi dikkatle inceleme şeklini taklit eden sıralı bir iş akışına dayanır .

  1. Bölge Önerisi: İlk aşamada, model giriş görüntüsünü tarayarak nesnelerin bulunabileceği potansiyel alanları belirler. Bölge Öneri Ağı (RPN) olarak bilinen bir bileşen, genellikle İlgi Alanları (RoI) olarak adlandırılan seyrek bir aday kutu kümesi oluşturur. Bu aşama arka planın çoğunu filtreleyerek, ağın işlem gücünü ilgili alanlara odaklamasını sağlar.
  2. Sınıflandırma ve İyileştirme: İkinci aşamada, model bu aday bölgelerden Convolutional Neural Networks (CNNs) kullanarak özellikleri çıkarır. Ardından her bölgeye belirli bir sınıf etiketi (örneğin, "kişi", "araç") atar ve sınırlayıcı kutunun koordinatlarını nesneyi sıkıca çevreleyecek şekilde iyileştirir.

Bu mimarinin öne çıkan örnekleri arasında R-CNN ailesi, özellikle de Faster R-CNN ve Mask R-CNN yer almaktadır. Bu örnekler, birkaç yıl boyunca akademik karşılaştırma ölçütleri için standartları belirlemiştir.

Tek Aşamalı Dedektörlerle Karşılaştırma

İki aşamalı modelleri, Single Shot MultiBox Detector (SSD) ve Ultralytics YOLO gibi tek aşamalı nesne algılayıcılardan ayırmak faydalıdır. İki aşamalı modeller, bölgeleri ayrı ayrı işleyerek doğruluğu önceliklendirirken, tek aşamalı modeller algılamayı tek bir regresyon sorunu olarak çerçeveler ve görüntü piksellerini doğrudan sınırlayıcı kutu koordinatlarına ve sınıf olasılıklarına eşler.

Tarihsel olarak, bu bir ödün verme durumu yarattı: iki aşamalı modeller daha doğruydu ancak daha yavaştı, tek aşamalı modeller ise daha hızlıydı ancak daha az hassastı. Ancak, modern gelişmeler bu çizgiyi bulanıklaştırdı. YOLO26 gibi son teknoloji modeller artık, gerçek zamanlı çıkarım için gerekli hızı korurken, iki aşamalı dedektörlerin doğruluğuna rakip olan uçtan uca mimariler kullanıyor. .

Gerçek Dünya Uygulamaları

Hassasiyet ve geri çağırma özelliklerine önem verdikleri için, iki aşamalı dedektörler genellikle ham işleme hızından daha önemli olan güvenlik ve ayrıntıların olduğu senaryolarda tercih edilir.

  • Tıbbi Tanı Görüntüleme: Sağlık hizmetlerinde yapay zeka alanında, bir tanının gözden kaçması kritik sonuçlar doğurabilir. İki aşamalı mimariler, tıbbi görüntü analizinde X-ışınları veya MRI taramalarında tümörler gibi detect için sıklıkla kullanılır. Çok aşamalı süreç, karmaşık doku arka planlarında küçük lezyonların gözden kaçmamasını sağlar ve radyologlara yüksek güvenilirlikte otomatik yardım sunar.
  • Yüksek Hassasiyetli Endüstriyel Denetim: Akıllı üretimde, otomatik görsel denetim sistemleri bu modelleri kullanarak montaj hatlarındaki mikroskobik kusurları tespit eder. Örneğin, türbin kanadındaki ince bir kırığı tespit etmek için, iki aşamalı dedektörlerin sağladığı yüksek Kesişim Üzerinde Birleşim (IoU) doğruluğu gerekir. Bu sayede, yalnızca kusursuz bileşenler üretimin bir sonraki aşamasına geçer.

Modern Algılama Uygulaması

İki aşamalı dedektörler yüksek doğruluklu görmenin temelini oluştururken, modern geliştiriciler genellikle önemli ölçüde daha kolay dağıtım iş akışları ile karşılaştırılabilir performans sunan gelişmiş tek aşamalı modelleri kullanmaktadır. Ultralytics , veri kümelerini ve hesaplama kaynaklarını verimli bir şekilde yöneterek bu modellerin eğitimini ve dağıtımını basitleştirir.

Aşağıdaki Python , modern bir nesne algılama iş akışı kullanarak çıkarım yüklemeyi ve çalıştırmayı göstermektedir. ultralytics, geleneksel iki aşamalı yaklaşımlara benzer yüksek doğrulukta sonuçlar elde ederken, daha yüksek verimlilik sağlar:

from ultralytics import YOLO

# Load the YOLO26 model, a modern high-accuracy detector
model = YOLO("yolo26n.pt")

# Run inference on an image to detect objects
results = model("https://ultralytics.com/images/bus.jpg")

# Process results (bounding boxes, classes, and confidence scores)
for result in results:
    result.show()  # Display the detection outcomes
    print(result.boxes.conf)  # Print confidence scores

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın