Bounding Box
Sınırlayıcı kutuların bilgisayarlı görüde nesne konumlarını nasıl tanımladığını öğren. Koordinat formatlarını, gerçek dünya uygulamalarını ve Ultralytics YOLO26'nın nasıl kullanılacağını keşfet.
Bir bounding box, bir resim veya video karesi içindeki belirli bir nesneyi çevreleyen, bir dizi koordinatla tanımlanmış dikdörtgen bir bölgedir. Computer vision (CV) alanında bu kutular, artificial intelligence (AI) sistemlerine farklı öğelerin yerini nasıl bulacaklarını ve onları nasıl tanıyacaklarını öğretmek için temel ek açıklamalar (annotations) görevi görür. Bir bounding box, bir resmin tamamını sadece "bir araba içeriyor" şeklinde sınıflandırmak yerine, modelin arabanın tam konumunu ve kapladığı alanı belirlemesini sağlayarak onu arka plandan ve diğer varlıklardan ayırır. Bu yerelleştirme yeteneği, birden fazla nesneyi aynı anda yüksek hassasiyetle tanımlamanın hedeflendiği object detection görevleri için esastır.
Link to this sectionTemel Kavramlar ve Koordinatlar#
Görsel verileri etkili bir şekilde işlemek için machine learning (ML) modelleri, bounding box'ları matematiksel olarak temsil etmek amacıyla belirli koordinat sistemlerine güvenir. Seçilen format, verilerin model training süreci için nasıl hazırlanacağını ve modelin tahminlerini nasıl çıktı olarak vereceğini genellikle belirler.
- XYXY Coordinates: Bu format, bir kutuyu sol üst köşe ve sağ alt köşenin mutlak piksel değerlerini kullanarak tanımlar. OpenCV veya Matplotlib gibi görselleştirme araçlarıyla doğrudan resimlerin üzerine dikdörtgen çizilirken oldukça sezgiseldir.
- XYWH Format: COCO gibi veri kümelerinde yaygın olan bu yöntem, nesnenin merkez noktasını ve ardından kutunun genişliğini ve yüksekliğini belirtir. Bu temsil, öğrenme sürecinde loss functions hesaplamaları için kritiktir.
- Normalized Coordinates: Farklı çözünürlükteki resimler arasında scalability sağlamak için koordinatlar genellikle 0 ile 1 arasındaki bir aralığa ölçeklendirilir. Bu, modellerin değişen boyutlardaki girdileri analiz ederken daha iyi genelleme yapmalarına yardımcı olur.
Link to this sectionGerçek Dünya Uygulamaları#
Bounding box'lar, çeşitli sektörlerdeki sayısız AI çözümünün yapı taşlarıdır. Hassas yerelleştirmeyi mümkün kılarak, sistemlerin fiziksel dünyayla akıllıca etkileşime girmesine olanak tanırlar.
- Autonomous Vehicles: Otonom araçlar, yayaları, diğer araçları, trafik işaretlerini ve engelleri gerçek zamanlı olarak tespit etmek ve takip etmek için bounding box'ları kullanır. Bu mekansal farkındalık, navigasyon ve güvenlik sistemlerinin anlık kararlar vermesi için çok önemlidir.
- Retail Analytics: Akıllı mağazalarda bounding box'lar, raflardaki envanterin izlenmesine ve müşterilerin ürünlerle olan etkileşimlerinin takibine yardımcı olur. Bu veriler, stok yenilemeyi otomatikleştirebilir ve manuel sayım yapmadan alışveriş davranışı hakkında içgörüler sağlayabilir.
Link to this sectionUygulamada Bounding Box'lar#
YOLO26 gibi modern mimariler kullanılırken, model bir sınıf etiketi ve bir confidence score ile birlikte bounding box'ları tahmin eder. Aşağıdaki örnek, bir resim üzerinde nasıl çıkarım (inference) yapılacağını ve ultralytics paketi kullanılarak bounding box koordinatlarına nasıl erişileceğini göstermektedir.
from ultralytics import YOLO
# Load the YOLO26 model
model = YOLO("yolo26n.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Access bounding box coordinates (xyxy format) for the first detected object
boxes = results[0].boxes
print(boxes.xyxy[0]) # Output: tensor([x1, y1, x2, y2, ...])Link to this sectionİlgili Terimler ve Farklılaşma#
Bounding box'lar genel tespit görevleri için standart olsa da, daha ayrıntılı görevlerde kullanılan diğer ek açıklama türlerinden farklıdırlar.
- Instance Segmentation: Dikdörtgen bir bounding box'ın aksine, segmentasyon, bir nesnenin tam hatlarını çizen piksel mükemmelliğinde bir maske oluşturur. Bu, kesin şeklin genel konumdan daha önemli olduğu durumlarda yararlıdır.
- Oriented Bounding Box (OBB): Standart bounding box'lar eksene hizalıdır (dik dikdörtgenler). OBB'ler, uydu görüntülerindeki gemiler veya konveyör bandındaki paketler gibi açılı olan nesnelere uyacak şekilde dönebilir, böylece daha sıkı bir uyum sağlar ve arka plan gürültüsünü azaltır.
- Keypoints: Bir nesneyi çevrelemek yerine, keypoint'ler, pose estimation için insan vücudundaki eklemler gibi belirli işaret noktalarını tanımlar.
Link to this sectionEk Açıklama ve Yönetim Araçları#
Yüksek kaliteli bounding box ek açıklamaları oluşturmak, ML hattında kritik bir adımdır. Ultralytics Platform, data annotation ve veri kümesi yönetimi için araçlar sunarak bu süreci basitleştirir. Doğru ek açıklama, modellerin nesneleri doğru bir şekilde ayırt etmeyi öğrenmesini sağlar ve overfitting veya arka plan karmaşası gibi hataları en aza indirir. Non-Maximum Suppression (NMS) gibi gelişmiş teknikler, çıkarım sırasında örtüşen kutuları kaldırarak bu tahminleri iyileştirmek için kullanılır ve her nesne için yalnızca en doğru tespitin kalmasını sağlar.






