Bölge önerileri ve sınıflandırmaya odaklanarak iki aşamalı nesne algılayıcıların mekanizmasını keşfedin. Ultralytics gibi modern modellerin neden şu anda lider olduğunu öğrenin.
İki aşamalı nesne algılayıcılar, bir görüntüdeki öğeleri tanımlamak ve konumlarını belirlemek için bilgisayar görüşünde kullanılan sofistike bir derin öğrenme (DL) mimarisi sınıfıdır. Tek aşamalı muadillerinden farklı olarak, tek bir geçişte algılama yapan bu modeller, görevi iki ayrı aşamaya böler: bölge önerisi ve nesne sınıflandırması. Bu iki aşamalı yaklaşım, yüksek konumlandırma doğruluğunu önceliklendirmek için geliştirilmiştir ve bu dedektörleri yapay zeka (AI) evriminde tarihsel olarak önemli hale getirmiştir. "Nerede"yi "ne"den ayırarak, iki aşamalı algılayıcılar genellikle üstün bir hassasiyet elde ederler, özellikle küçük veya örtülü nesnelerde, ancak bu genellikle artan hesaplama kaynakları ve daha yavaş çıkarım gecikmesi pahasına olur.
İki aşamalı dedektörün mimarisi, bir insanın bir sahneyi dikkatle inceleme şeklini taklit eden sıralı bir iş akışına dayanır .
Bu mimarinin öne çıkan örnekleri arasında R-CNN ailesi, özellikle de Faster R-CNN ve Mask R-CNN yer almaktadır. Bu örnekler, birkaç yıl boyunca akademik karşılaştırma ölçütleri için standartları belirlemiştir.
İki aşamalı modelleri, Single Shot MultiBox Detector (SSD) ve Ultralytics YOLO gibi tek aşamalı nesne algılayıcılardan ayırmak faydalıdır. İki aşamalı modeller, bölgeleri ayrı ayrı işleyerek doğruluğu önceliklendirirken, tek aşamalı modeller algılamayı tek bir regresyon sorunu olarak çerçeveler ve görüntü piksellerini doğrudan sınırlayıcı kutu koordinatlarına ve sınıf olasılıklarına eşler.
Tarihsel olarak, bu bir ödün verme durumu yarattı: iki aşamalı modeller daha doğruydu ancak daha yavaştı, tek aşamalı modeller ise daha hızlıydı ancak daha az hassastı. Ancak, modern gelişmeler bu çizgiyi bulanıklaştırdı. YOLO26 gibi son teknoloji modeller artık, gerçek zamanlı çıkarım için gerekli hızı korurken, iki aşamalı dedektörlerin doğruluğuna rakip olan uçtan uca mimariler kullanıyor. .
Hassasiyet ve geri çağırma özelliklerine önem verdikleri için, iki aşamalı dedektörler genellikle ham işleme hızından daha önemli olan güvenlik ve ayrıntıların olduğu senaryolarda tercih edilir.
İki aşamalı dedektörler yüksek doğruluklu görmenin temelini oluştururken, modern geliştiriciler genellikle önemli ölçüde daha kolay dağıtım iş akışları ile karşılaştırılabilir performans sunan gelişmiş tek aşamalı modelleri kullanmaktadır. Ultralytics , veri kümelerini ve hesaplama kaynaklarını verimli bir şekilde yöneterek bu modellerin eğitimini ve dağıtımını basitleştirir.
Aşağıdaki Python , modern bir nesne algılama iş akışı kullanarak çıkarım yüklemeyi ve çalıştırmayı göstermektedir.
ultralytics, geleneksel iki aşamalı yaklaşımlara benzer yüksek doğrulukta sonuçlar elde ederken, daha yüksek
verimlilik sağlar:
from ultralytics import YOLO
# Load the YOLO26 model, a modern high-accuracy detector
model = YOLO("yolo26n.pt")
# Run inference on an image to detect objects
results = model("https://ultralytics.com/images/bus.jpg")
# Process results (bounding boxes, classes, and confidence scores)
for result in results:
result.show() # Display the detection outcomes
print(result.boxes.conf) # Print confidence scores