Yönlendirilmiş sınırlayıcı kutu (OBB) tespitinin, gerçek dünya uygulamalarında görüntülerdeki döndürülmüş nesneleri hassas bir şekilde tanımlayarak nesne tespitini nasıl geliştirdiğini keşfedin.

Yönlendirilmiş sınırlayıcı kutu (OBB) tespitinin, gerçek dünya uygulamalarında görüntülerdeki döndürülmüş nesneleri hassas bir şekilde tanımlayarak nesne tespitini nasıl geliştirdiğini keşfedin.
Nesneleri nasıl düzenlendiklerinden veya hangi yöne baktıklarından bağımsız olarak tanımak, biz insanlar için doğal bir şeydir. Bir kavşaktaki arabalar veya bir limandaki tekneler olsun, ne olduklarını ve hangi yöne baktıklarını kolayca anlayabiliriz. Ancak, yapay zeka (AI) sistemleri için bu o kadar basit değil.
Örneğin, görüntü ve videoları anlamaya odaklanan bir yapay zeka dalı olan bilgisayarlı görü, makinelerin bir sahne içindeki nesneleri tanımlamasına ve konumlandırmasına yardımcı olan nesne tespiti gibi görevleri mümkün kılar. Geleneksel nesne tespiti, nesnelerin etrafına kutular çizmek için eksen hizalı sınırlayıcı kutulara dayanır. Bu kutuların düz kenarları ve sabit dik açıları vardır. Bu yaklaşım, nesneler dik durduğunda ve birbirine çok yakın olmadığında iyi sonuç verir.
Ancak nesneler eğildiğinde, döndürüldüğünde veya birbirine yakın olduğunda, geleneksel nesne algılama genellikle bunları doğru bir şekilde yakalamakta zorlanır. Bu daha karmaşık durumları ele almak için, yönlendirilmiş sınırlayıcı kutu (OBB) algılama gibi teknikler tanıtılmıştır. Standart sınırlayıcı kutulardan farklı olarak, OBB'ler nesnenin açısına ve şekline uyacak şekilde dönebilir, bu da daha sıkı ve daha doğru bir uyum sağlar.
Ultralytics YOLO11 gibi OBB (Sınırlayıcı Yönlendirilmiş Kutu) algılamayı destekleyen bilgisayarlı görü modelleri, özellikle nesne yönünün önemli olduğu hava gözetimi gibi senaryolarda çeşitli gerçek zamanlı uygulamaları mümkün kılar. Bunun ötesinde, OBB algılama sağlık hizmetlerinde, tarımda ve belge analizinde de kullanılmaktadır.
Bu makalede, OBB (Oriented Bounding Box) algılamanın ne olduğunu, nasıl çalıştığını ve gerçek dünya senaryolarında nerelerde uygulandığını inceleyeceğiz. Haydi başlayalım!
Yönlendirilmiş sınırlayıcı kutu, bir görüntüdeki algılanan nesneleri temsil etmek için bilgisayarlı görmede kullanılan bir tür dikdörtgen kutudur. Standart sınırlayıcı kutular görüntünün yatay ve dikey eksenleriyle hizalanırken, OBB'ler nesnenin gerçek açısına uyacak şekilde dönebilir.
Bu döndürme yeteneği, masaya çeşitli avantajlar getiriyor. OBB'ler, bir nesnenin yönüyle daha yakından hizalanabilir ve kutunun nesnenin şekli ve yönü etrafına sıkıca oturmasını sağlar. Sonuç olarak, algılama daha doğru ve hassas hale gelir.
OBB'ler, özellikle nesneler mükemmel şekilde dik olmadığında kullanışlıdır; örneğin, havadan çekilmiş bir görüntüde kavisli bir yolda dönen bir araba, bir masanın üzerinde eğik duran bir kitap veya tıbbi bir taramada dönmüş bir tümör. Bir nesnenin açısıyla daha doğru eşleşerek, OBB'ler tespit performansını artırır, arka plan parazitini azaltır ve özellikle bir nesnenin yönünün konumu kadar önemli olduğu uygulamalar için mükemmeldir.
OBB (Eğimli Sınırlandırma Kutusu) tespiti ve geleneksel nesne tespiti ilk bakışta benzer görünebilir, ancak farklı şekillerde ve farklı durumlar için kullanılırlar. Bir örnekle karşılaştırmalı olarak nasıl olduklarına daha yakından bakalım.
YOLO11 gibi bilgisayarlı görü modelleri, endüstriyel denetim gibi çeşitli gerçek dünya uygulamalarında nesneleri tespit etmek ve sınıflandırmak için eğitilebilir. Farklı makine parçalarının bir taşıma bandı boyunca hareket ettiği bir fabrika montaj hattını düşünün. Bazı parçalar düzgün bir şekilde yerleştirilmiş olabilir, ancak diğerleri titreşim veya hız nedeniyle hafifçe döndürülmüş, eğilmiş veya üst üste binmiş olabilir.
Geleneksel nesne tespiti, görüntünün yatay ve dikey kenarlarıyla hizalanan dik, dikdörtgen kutular kullanır. Bu nedenle, bir parça döndürüldüğünde, kutu düzgün şekilde oturmayabilir; nesnenin bir kısmını dışarıda bırakabilir veya arka planın çok fazla bölümünü içerebilir. Bu, tespitleri daha az doğru hale getirebilir ve sistemin parçayı güvenle tanımlamasını zorlaştırabilir.
Şimdi de OBB tespiti kullandığınızı varsayalım. Bu durumda, model her bir parçanın açısına uyacak şekilde dönen bir kutu çizebilir. Eğimli bir dişli veya açılı bir bileşen, şekline ve yönüne uyan bir kutu ile sıkıca çevrelenir. Bu, özellikle otomatik kalite kontrolü veya robotik ayıklama gibi kullanım durumlarında daha iyi hassasiyet, daha az hata ve daha güvenilir sonuçlar anlamına gelir.
Artık OBB algılamanın ne olduğunu daha iyi anladığımıza göre, bunu destekleyen en yaygın kullanılan Vision AI modellerinden bazılarına bir göz atalım.
Döndürülmüş veya eğimli nesneleri algılamak için özel olarak geliştirilmiş çeşitli gelişmiş bilgisayarla görme modelleri bulunmaktadır. Bunlar arasında Ultralytics YOLO modelleri, güvenilir ve verimli OBB algılama yetenekleriyle özellikle iyi bilinmektedir.
Ultralytics YOLOv5 gibi önceki sürümler standart nesne tespiti için tasarlanmıştı. Ultralytics YOLOv8 ve daha yeni YOLO11 gibi sonraki yinelemeler, OBB tespitine yerel destek getirmiştir. Özellikle YOLO11, hızdan ödün vermeden en son teknoloji doğruluğu sunarak, gerçek zamanlı uygulamalar için etkili bir seçenek haline gelmektedir.
Önceden eğitilmiş YOLO11 OBB modelleri, örneğin YOLO11n-obb, DOTAv1 gibi veri kümeleri üzerinde eğitilir. DOTAv1, çeşitli açılarda ve yönlerde görünen uçaklar, gemiler ve tenis kortları gibi bir dizi nesne sınıfıyla etiketlenmiş hava fotoğraflarından oluşur.
Ayrıca, bu modeller, farklı performans ihtiyaçlarını karşılamak için nano (n-obb) boyutundan ekstra büyük (x-obb) boyutuna kadar beş farklı boyutta mevcuttur. Bu çok yönlülük, kentsel altyapıyı izlemekten ve makineleri incelemekten, taranmış belgelerdeki eğri metinleri okumaya kadar çeşitli sektörlerde uygulanmalarına olanak tanır.
Birçok gerçek dünya durumunda, algılamanız gereken nesneler standart eğitim veri kümelerindeki nesnelerden tamamen farklı olabilir. Örneğin, bir üretim hattındaki aletler, ürün paketleri veya bir devre kartındaki bileşenler gibi nesneler döndürülmüş, düzensiz yerleştirilmiş veya farklı şekillendirilmiş olabilir.
Bu özel nesneleri, özellikle yönelimin önemli olduğu durumlarda doğru bir şekilde tespit etmek için, YOLO11 gibi modelleri kendi resimleriniz ve etiketlerinizle eğitmek önemlidir. Bu işlem özel eğitim olarak bilinir.
İşte OBB tespiti için YOLO11'i eğitme sürecine adım adım daha yakından bir bakış:
Merkezden uzak veya eğimli nesneler gerçek hayattaki senaryolarda oldukça yaygındır. OBB algılamanın bu nesneleri doğru bir şekilde algılayarak gerçek bir fark yarattığı birkaç örneği inceleyelim.
OBB tespiti, hassasiyeti artırarak tıbbi görüntü analizini bir adım öteye taşıyabilir. Tıbbi görüntüler genellikle tümörler, organlar veya kemikler gibi anatomik yapıları içerir. Bu yapılar çoğunlukla düzensiz şekillerde ve çeşitli yönlerde görünür. OBB'ler bir nesnenin açısına uyacak şekilde dönebildiğinden, tanı ve tedavi planlaması için kritik olan daha doğru lokalizasyon ve ölçüm sağlarlar.
Bu yaklaşım, kemiklerin pozisyonunun ve hizalanmasının önemli faktörler olduğu kemik kırıklarının röntgen görüntülerini analiz etmede özellikle etkilidir. Örneğin, OBB tespiti pediatrik dirsek röntgenlerini analiz etmek için kullanılmıştır. Kemiklerin yönüne uyum sağlayarak, algılama doğruluğunu artırmaya yardımcı oldu.
Hava gözetimi, kamu güvenliği, çevre izleme ve şehir planlaması gibi sektörlerde önemli bir araçtır. Dronlar veya uydular tarafından çekilen görüntüler, gemiler, araçlar ve binalar gibi nesnelerin belirlenmesine yardımcı olabilir. Ancak, bu görüntülerde nesneler genellikle küçük ve alışılmadık açılarda görünür, bu da doğru bir şekilde tespit edilmelerini zorlaştırır.
OBB tespiti, sınırlandırma kutularını her nesnenin açısına uyacak şekilde eğerek bu sorunu çözer. Bu, bir nesnenin boyutu ve yönünün daha doğru ölçülmesine yol açar ve kentsel planlama, savunma, afet müdahalesi ve çevre izleme gibi alanlarda daha iyi karar almayı destekler.
OBB tespitinin ilginç bir örneği, deniz gözetiminde gemi takibidir. Uydu görüntüleri genellikle hava durumu, aydınlatma veya hareket nedeniyle gemileri farklı açılarda ve boyutlarda yakalar. OBB'ler bu değişikliklere uyum sağlayarak, özellikle daha küçük veya kısmen gizlenmiş gemiler için tespiti iyileştirebilir.
Hasattan sonra mahsulleri ayırmak, paketlenip pazara gönderilmeden önce kaliteyi sağlamak için çok önemli bir adımdır. Birçok sistem elma ve portakal gibi yuvarlak meyveler için iyi çalışsa da, havuç veya Zizania filizleri gibi uzun ve dar mahsullerin işlenmesi çok daha zor olabilir. Şekilleri değişir ve genellikle farklı açılarda dururlar, bu da onları tespit etmeyi ve doğru bir şekilde ayırmayı zorlaştırır.
Bununla başa çıkmak için, araştırmacılar bu ekinleri daha doğru bir şekilde tanımlamak ve derecelendirmek için yönlendirilmiş sınırlayıcı kutu (OBB) algılamayı kullanan bir sistem geliştirdiler. Sistem, eğimli veya örtüşen olsa bile, tek bir görüntüde birden fazla ekin tespit edebilir ve kalitelerini ve konumlarını gerçek zamanlı olarak değerlendirebilir.
İşte OBB algılamayı kullanmanın bazı faydaları:
Karmaşık sahnelerde algılama doğruluğunu artırmaya yardımcı olmasına rağmen, OBB algılamanın dikkate alınması gereken bazı sınırlamaları vardır:
Yönlendirilmiş sınırlayıcı kutu tespiti, bilgisayarlı görü çözümlerinin mükemmel şekilde düz veya hizalı olmayan nesneleri tanımasını kolaylaştırır. Nesnelerin hem konumunu hem de yönünü yakalayarak, OBB tespiti, tıbbi görüntüleri tarama, tarım arazilerini izleme veya uydu fotoğraflarını analiz etme gibi gerçek dünya kullanım durumlarında doğruluğu artırır.
YOLO11 gibi modellerin OBB tespitini daha erişilebilir hale getirmesiyle, bu teknoloji birçok sektör için pratik bir seçim haline geliyor. Eğimli, örtüşen veya garip şekilli nesnelerle uğraşıyor olsanız da, OBB tespiti standart yöntemlerin genellikle kaçırdığı ekstra bir hassasiyet katmanı ekler.
Yapay zeka hakkında meraklı mısınız? GitHub depomuzu keşfedin, topluluğumuzla bağlantı kurun ve bilgisayarla görü projenize başlamak için lisanslama seçeneklerimize göz atın. Çözüm sayfalarımızda perakende sektöründe yapay zeka ve lojistik sektöründe bilgisayarla görü gibi yenilikler hakkında daha fazla bilgi edinin.