Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Sınırlayıcı Kutu (Bounding Box)

Sınırlayıcı kutuların (bounding box) nesne tespiti, yapay zeka ve makine öğrenimi sistemlerini nasıl etkinleştirdiğini öğrenin. Bilgisayarlı görü uygulamalarındaki rollerini keşfedin!

Sınırlayıcı kutu, bir görüntü veya video karesi içindeki belirli bir nesneyi çevreleyen bir dizi koordinatla tanımlanan dikdörtgen bir bölgedir. Bilgisayar görme (CV) alanında, bu kutular, yapay zeka (AI) sistemlerine farklı öğeleri nasıl bulup tanıyacaklarını öğretmek için temel açıklamalar olarak Bir görüntünün tamamını "araba içeren" olarak sınıflandırmak yerine, sınırlayıcı kutu, modelin arabanın tam konumunu ve uzamsal boyutunu belirlemesine olanak tanır ve onu arka plandan ve diğer nesnelerden ayırır. Bu yerelleştirme yeteneği, hedefin aynı anda birden fazla nesneyi yüksek hassasiyetle tanımlamak olduğu nesne algılama görevleri için çok önemlidir.

Temel Kavramlar ve Koordinatlar

Görsel verileri etkili bir şekilde işlemek için, makine öğrenimi (ML) modelleri, sınırlayıcı kutuları matematiksel olarak temsil etmek için belirli koordinat sistemlerine dayanır. Seçilen format genellikle verilerin model eğitimi için nasıl hazırlanacağını ve modelin tahminlerini nasıl çıkaracağını belirler.

  • XYXY Koordinatları: Bu format, sol üst köşe ve sağ alt köşenin mutlak piksel değerlerini kullanarak bir kutu tanımlar. OpenCV gibi görselleştirme araçları için sezgiseldir OpenCV veya Matplotlib gibi görselleştirme araçları için doğrudandır.
  • XYWH Biçimi: Aşağıdaki gibi veri kümelerinde yaygın olarak kullanılır COCOgibi veri kümelerinde yaygın olan bu yöntem, nesnenin merkez noktasını ve ardından kutunun genişliğini ve yüksekliğini belirtir. Bu temsil, öğrenme sürecinde kayıp fonksiyonlarını hesaplamak için çok önemlidir.
  • Normalleştirilmiş Koordinatlar: Farklı çözünürlüklere sahip görüntüler arasında ölçeklenebilirliği sağlamak için koordinatlar genellikle 0 ile 1 arasında bir aralığa ölçeklenir. Bu, modellerin farklı boyutlardaki girdileri analiz ederken daha iyi genelleme yapmasına yardımcı olur.

Gerçek Dünya Uygulamaları

Sınırlayıcı kutular, çeşitli endüstrilerdeki sayısız AI çözümünün yapı taşlarıdır. Hassas yerelleştirme sağlayarak, sistemlerin fiziksel dünya ile akıllı bir şekilde etkileşime girmesine olanak tanırlar.

  • Otonom Araçlar: Otonom araçlar, track , diğer araçları, trafik işaretlerini ve engelleri gerçek zamanlı olarak detect track için sınırlayıcı kutular kullanır. Bu uzamsal farkındalık, navigasyon ve güvenlik sistemlerinin anlık kararlar alması için çok önemlidir.
  • Perakende Analitiği: Akıllı mağazalarda, sınırlayıcı kutular raflarındaki envanteri izlemeye ve track ürünlerle etkileşimlerini track yardımcı olur. Bu veriler, stok yenilemeyi otomatikleştirebilir ve manuel sayım yapmaya gerek kalmadan alışverişçi davranışları hakkında içgörüler sağlayabilir.

Bounding Boxes'ın Kullanımı

Modern mimariler kullanırken YOLO26, model sınırlayıcı kutuları, sınıf etiketi ve bir güven puanı. Aşağıdaki örnek, bir görüntü üzerinde çıkarım yapmayı ve ultralytics Paket.

from ultralytics import YOLO

# Load the YOLO26 model
model = YOLO("yolo26n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Access bounding box coordinates (xyxy format) for the first detected object
boxes = results[0].boxes
print(boxes.xyxy[0])  # Output: tensor([x1, y1, x2, y2, ...])

İlgili Terimler ve Farklılaşma

Sınırlayıcı kutular genel algılama için standart olmakla birlikte, daha ayrıntılı görevlerde kullanılan diğer açıklama türlerinden farklıdır. granüler görevler.

  • Örnek Segmentasyon: Dikdörtgen sınırlayıcı kutudan farklı olarak, segmentasyon bir nesnenin tam dış hatlarını izleyen piksel mükemmelliğinde bir maske oluşturur. Bu, genel konumdan daha önemli olan kesin şekil olduğunda kullanışlıdır.
  • Yönlendirilmiş Sınır Kutusu (OBB): Standart sınır kutuları eksenle hizalıdır (dik dikdörtgenler). OBB'ler, uydu görüntülerindeki gemiler veya konveyör bant üzerindeki paketler gibi açılı nesnelere uyacak şekilde dönebilir ve böylece daha sıkı bir uyum sağlar ve arka plan gürültüsünü azaltır.
  • Anahtar noktalar: Bir nesneyi çevrelemek yerine, anahtar noktalar, poz tahmini için insan vücudundaki eklemler gibi belirli referans noktaları tanımlar .

Anotasyon ve Yönetim Araçları

Yüksek kaliteli sınırlayıcı kutu açıklamaları oluşturmak, ML sürecinde kritik bir adımdır. Ultralytics , veri açıklaması ve veri kümesi yönetimi için araçlar sunarak bu süreci basitleştirir. Uygun açıklamalar, modellerin nesneleri doğru bir şekilde ayırt etmeyi öğrenmesini sağlayarak, aşırı uyum veya arka plan karışıklığı gibi hataları en aza indirir. Non-Maximum Suppression (NMS) gibi Non-Maximum Suppression (NMS) gibi gelişmiş teknikler çıkarım sırasında kullanılarak örtüşen kutuları kaldırarak bu tahminleri iyileştirir ve her nesne için yalnızca en doğru algılamanın kalmasını sağlar.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın