Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Sınırlayıcı Kutu (Bounding Box)

Sınırlayıcı kutuların (bounding box) nesne tespiti, yapay zeka ve makine öğrenimi sistemlerini nasıl etkinleştirdiğini öğrenin. Bilgisayarlı görü uygulamalarındaki rollerini keşfedin!

Sınırlayıcı kutu, koordinatlarla tanımlanan dikdörtgen bir bölgedir ve bir nesnenin içindeki belirli bir özelliği veya nesneyi izole eder. görüntü veya video karesi. Bu alemde bilgisayarla görme, bu ek açıklama Farklı varlıkların lokalizasyonu için temel birim yapay zeka (AI) sistemleri Bir öğenin sadece sahnede var olduğunu bilmek yerine nerede olduğunu "görmek". Birincil olarak kullanılan nesne algılama görevleri, bir sınırlayıcı kutu ana hatları araba, kişi veya ürün gibi bir hedefin uzamsal kapsamıdır ve tipik olarak bir sınıf etiketi ve bir Modelin kesinliğini gösteren güven puanı.

Koordinat Sistemleri ve Formatları

Makine öğrenimi (ML) modellerini etkinleştirmek için Görsel verileri matematiksel olarak işlerken, sınırlayıcı kutular belirli koordinat sistemleri kullanılarak temsil edilir. Seçim formatı genellikle eğitim için kullanılan veri kümelerine veya algılama mimarisinin özel gereksinimleri.

  • XYXY (Köşe Koordinatları): Bu format sol üst köşenin mutlak piksel değerlerini kullanır ($x1, y1$) ve sağ alt köşe ($x2, y2$). Oldukça sezgiseldir ve görselleştirme kütüphanelerinde sıklıkla kullanılır gibi Matplotlib görüntülerin üzerine dikdörtgenler çizmek için.
  • XYWH (Orta Boy): Tarafından popülerleştirildi COCO veri kümesi, bu gösterim Nesnenin merkez noktası ($x_center, y_center$) ve ardından kutunun genişliği ve yüksekliği. Bu format sırasında kayıp fonksiyonlarının hesaplanması için çok önemlidir. model eğitimi.
  • Normalleştirilmiş Koordinatlar: Sağlamak için farklı görüntü çözünürlükleri arasında ölçeklenebilirlik, koordinatları genellikle görüntü boyutlarına göre 0 ile 1 arasında bir aralığa normalleştirilir. Bu, modellerin farklı boyutlardaki girdileri işlerken daha iyi genelleme yapar.

Sınırlayıcı Kutuların Türleri

Standart dikdörtgen kutu birçok senaryoya uysa da, karmaşık gerçek dünya ortamları bazen daha fazlasını gerektirir özel şekiller.

  • Eksen Hizalı Sınırlayıcı Kutu (AABB): Bunlar, kenarların eksene paralel olduğu standart kutulardır. görüntü eksenleri (dikey ve yatay). Hesaplama açısından verimlidirler ve yüksek hız için varsayılan çıktıdırlar gibi modeller YOLO11.
  • Yönlendirilmiş Sınırlayıcı Kutu (OBB): Nesneler döndürüldüğünde, inceltildiğinde veya birbirine yakın şekilde paketlendiğinde - örneğin Bir limandaki gemiler veya bir belgedeki metinler - standart bir kutu çok fazla arka plan gürültüsü içerebilir. Bir Yönlendirilmiş Sınırlayıcı Kutu ek bir açı parametresi içerir, dikdörtgenin dönmesine ve nesneye sıkıca oturmasına izin verir. Bu, aşağıdaki gibi hassas görevler için hayati önem taşır uydu görüntüsü analizi.

Gerçek Dünya Uygulamaları

Sınırlayıcı kutular, çeşitli sektörlerde sofistike karar verme sistemlerinin yapı taşları olarak işlev görür.

  1. Otonom Araçlar: Kendi kendine sürüş teknolojisi, otonom sürüşü sürdürmek için büyük ölçüde sınırlayıcı kutulara dayanır. mekansal farkındalık. Çizerek yayaların, trafik ışıklarının ve diğer araçların etrafındaki kutular, sistem mesafeleri ve yörüngeleri tahmin ederek çarpışmalar. Bu konuyu aşağıdaki genel bakışımızda daha ayrıntılı olarak inceleyebilirsiniz Otomotivde yapay zeka.
  2. Perakende ve Envanter Yönetimi: Akıllı mağazalar raflardaki ürünleri track için sınırlayıcı kutular kullanır. Sistemler stokta olmayan ürünleri belirleyebilir veya sepetteki ürünleri yerelleştirerek ödeme süreçlerini otomatikleştirebilir. Bu verimliliği artırır ve modern teknolojinin önemli bir bileşenidir. Perakende çözümlerinde yapay zeka.

Sınırlayıcı Kutu vs. Segmentasyon

Sınırlayıcı kutuları aşağıdakilerden ayırt etmek önemlidir görüntü segmentasyonu, farklı çözdükleri için ayrıntı düzeyleri.

  • Sınırlayıcı Kutu: Kaba bir konum belirleme sağlar. Kabaca nesnenin nerede olduğunu söyler. bir kutu içine almak. Ek açıklama eklemek daha hızlı ve hesaplama açısından daha ucuzdur. gerçek zamanlı çıkarım.
  • Örnek Segmentasyonu: Nesnenin tam şeklini özetleyen piksel mükemmelliğinde bir maske oluşturur. Daha hassas olsa da segmentasyon hesaplama açısından daha yoğundur. Gibi uygulamalar için tam tümörün bulunduğu tıbbi görüntü analizi sınırlar önemli olduğundan, segmentasyon genellikle basit sınırlayıcı kutulara tercih edilir.

Python ile Pratik Örnek

Aşağıdaki kod parçacığı, aşağıdakilerin nasıl kullanılacağını göstermektedir ultralytics kütüphanesini kullanarak sınırlayıcı kutular oluşturuyoruz. Yüklüyoruz önceden eğitilmiş YOLO11 modeli için koordinat verilerini yazdırın ve tespit edilen nesneler.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Run inference on an online image
results = model("https://ultralytics.com/images/bus.jpg")

# Access the bounding box coordinates (xyxy format) for the first detection
box = results[0].boxes[0]
print(f"Object Class: {box.cls}")
print(f"Coordinates: {box.xyxy}")

Bu tahminlerin doğruluğu tipik olarak aşağıdakiler adı verilen bir metrik kullanılarak değerlendirilir Birlik Üzerinden Kesişim (IoU) öngörülen kutu ile tahmin edilen kutu arasındaki örtüşmeyi ölçer. İnsan etiketleyiciler tarafından sağlanan temel gerçek ek açıklaması. Yüksek IoU puanları modelin nesneyi doğru şekilde konumlandırdığını gösterir.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın