Sınırlayıcı Kutu (Bounding Box)
Sınırlayıcı kutuların (bounding box) nesne tespiti, yapay zeka ve makine öğrenimi sistemlerini nasıl etkinleştirdiğini öğrenin. Bilgisayarlı görü uygulamalarındaki rollerini keşfedin!
Sınırlayıcı kutu, koordinatlarla tanımlanan dikdörtgen bir bölgedir ve bir nesnenin içindeki belirli bir özelliği veya nesneyi izole eder.
görüntü veya video karesi. Bu alemde
bilgisayarla görme, bu ek açıklama
Farklı varlıkların lokalizasyonu için temel birim
yapay zeka (AI) sistemleri
Bir öğenin sadece sahnede var olduğunu bilmek yerine nerede olduğunu "görmek". Birincil olarak kullanılan
nesne algılama görevleri, bir sınırlayıcı kutu ana hatları
araba, kişi veya ürün gibi bir hedefin uzamsal kapsamıdır ve tipik olarak bir sınıf etiketi ve bir
Modelin kesinliğini gösteren güven puanı.
Koordinat Sistemleri ve Formatları
Makine öğrenimi (ML) modellerini etkinleştirmek için
Görsel verileri matematiksel olarak işlerken, sınırlayıcı kutular belirli koordinat sistemleri kullanılarak temsil edilir. Seçim
formatı genellikle eğitim için kullanılan veri kümelerine veya
algılama mimarisinin özel gereksinimleri.
-
XYXY (Köşe Koordinatları): Bu format sol üst köşenin mutlak piksel değerlerini kullanır ($x1,
y1$) ve sağ alt köşe ($x2, y2$). Oldukça sezgiseldir ve görselleştirme kütüphanelerinde sıklıkla kullanılır
gibi Matplotlib görüntülerin üzerine dikdörtgenler çizmek için.
-
XYWH (Orta Boy): Tarafından popülerleştirildi
COCO veri kümesi, bu gösterim
Nesnenin merkez noktası ($x_center, y_center$) ve ardından kutunun genişliği ve yüksekliği. Bu format
sırasında kayıp fonksiyonlarının hesaplanması için çok önemlidir.
model eğitimi.
-
Normalleştirilmiş Koordinatlar: Sağlamak için
farklı görüntü çözünürlükleri arasında ölçeklenebilirlik,
koordinatları genellikle görüntü boyutlarına göre 0 ile 1 arasında bir aralığa normalleştirilir. Bu, modellerin
farklı boyutlardaki girdileri işlerken daha iyi genelleme yapar.
Sınırlayıcı Kutuların Türleri
Standart dikdörtgen kutu birçok senaryoya uysa da, karmaşık gerçek dünya ortamları bazen daha fazlasını gerektirir
özel şekiller.
-
Eksen Hizalı Sınırlayıcı Kutu (AABB): Bunlar, kenarların eksene paralel olduğu standart kutulardır.
görüntü eksenleri (dikey ve yatay). Hesaplama açısından verimlidirler ve yüksek hız için varsayılan çıktıdırlar
gibi modeller YOLO11.
-
Yönlendirilmiş Sınırlayıcı Kutu (OBB): Nesneler döndürüldüğünde, inceltildiğinde veya birbirine yakın şekilde paketlendiğinde - örneğin
Bir limandaki gemiler veya bir belgedeki metinler - standart bir kutu çok fazla arka plan gürültüsü içerebilir. Bir
Yönlendirilmiş Sınırlayıcı Kutu ek bir açı parametresi içerir,
dikdörtgenin dönmesine ve nesneye sıkıca oturmasına izin verir. Bu, aşağıdaki gibi hassas görevler için hayati önem taşır
uydu görüntüsü analizi.
Gerçek Dünya Uygulamaları
Sınırlayıcı kutular, çeşitli sektörlerde sofistike karar verme sistemlerinin yapı taşları olarak işlev görür.
-
Otonom Araçlar: Kendi kendine sürüş teknolojisi, otonom sürüşü sürdürmek için büyük ölçüde sınırlayıcı kutulara dayanır.
mekansal farkındalık. Çizerek
yayaların, trafik ışıklarının ve diğer araçların etrafındaki kutular, sistem mesafeleri ve yörüngeleri tahmin ederek
çarpışmalar. Bu konuyu aşağıdaki genel bakışımızda daha ayrıntılı olarak inceleyebilirsiniz
Otomotivde yapay zeka.
-
Perakende ve Envanter Yönetimi: Akıllı mağazalar raflardaki ürünleri track için sınırlayıcı kutular kullanır.
Sistemler stokta olmayan ürünleri belirleyebilir veya sepetteki ürünleri yerelleştirerek ödeme süreçlerini otomatikleştirebilir. Bu
verimliliği artırır ve modern teknolojinin önemli bir bileşenidir.
Perakende çözümlerinde yapay zeka.
Sınırlayıcı Kutu vs. Segmentasyon
Sınırlayıcı kutuları aşağıdakilerden ayırt etmek önemlidir
görüntü segmentasyonu, farklı çözdükleri için
ayrıntı düzeyleri.
-
Sınırlayıcı Kutu: Kaba bir konum belirleme sağlar. Kabaca nesnenin nerede olduğunu söyler.
bir kutu içine almak. Ek açıklama eklemek daha hızlı ve hesaplama açısından daha ucuzdur.
gerçek zamanlı çıkarım.
-
Örnek Segmentasyonu: Nesnenin tam şeklini özetleyen piksel mükemmelliğinde bir maske oluşturur.
Daha hassas olsa da segmentasyon hesaplama açısından daha yoğundur. Gibi uygulamalar için
tam tümörün bulunduğu tıbbi görüntü analizi
sınırlar önemli olduğundan, segmentasyon genellikle basit sınırlayıcı kutulara tercih edilir.
Python ile Pratik Örnek
Aşağıdaki kod parçacığı, aşağıdakilerin nasıl kullanılacağını göstermektedir ultralytics kütüphanesini kullanarak sınırlayıcı kutular oluşturuyoruz. Yüklüyoruz
önceden eğitilmiş YOLO11 modeli için koordinat verilerini yazdırın ve
tespit edilen nesneler.
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Run inference on an online image
results = model("https://ultralytics.com/images/bus.jpg")
# Access the bounding box coordinates (xyxy format) for the first detection
box = results[0].boxes[0]
print(f"Object Class: {box.cls}")
print(f"Coordinates: {box.xyxy}")
Bu tahminlerin doğruluğu tipik olarak aşağıdakiler adı verilen bir metrik kullanılarak değerlendirilir
Birlik Üzerinden Kesişim (IoU)
öngörülen kutu ile tahmin edilen kutu arasındaki örtüşmeyi ölçer.
İnsan etiketleyiciler tarafından sağlanan temel gerçek ek açıklaması. Yüksek IoU
puanları modelin nesneyi doğru şekilde konumlandırdığını gösterir.