YOLO Vision 2025'i kaçırmayın!
25 Eylül 2025
10:00 — 18:00 BST
Hibrit etkinlik
Yolo Vision 2024

Ultralytics YOLO11'in çapa içermeyen bir dedektör olmasının faydaları

Abirami Vina

5 dakikalık okuma

5 Aralık 2024

Ultralytics YOLO11'in anchor-free nesne tespitini nasıl desteklediğini ve bu model mimarisinin çeşitli uygulamalara getirdiği faydaları anlayın.

Vizyon Yapay Zeka modellerinin geçmişine baktığımızda, bir görüntü veya video içindeki nesneleri tanımlamayı ve konumlandırmayı içeren temel bir bilgisayarlı görü görevi olan nesne tespiti kavramı 1960'lardan beri var. Ancak, günümüzdeki en son yeniliklerdeki öneminin temel nedeni, nesne tespiti tekniklerinin ve model mimarilerinin o zamandan beri gelişmesi ve hızla iyileşmesidir. 

Önceki bir makalede, nesne algılamanın evrimini ve Ultralytics YOLO modellerine yol açan yolu tartıştık. Bugün, bu yolculuktaki daha spesifik bir kilometre taşına odaklanacağız: çapa tabanlı dedektörlerden çapa içermeyen dedektörlere geçiş. 

Anchor tabanlı dedektörler, bir görüntüdeki nesnelerin yerini tahmin etmek için "anchor" adı verilen önceden tanımlanmış kutulara dayanır. Buna karşılık, anchor'suz dedektörler bu önceden tanımlanmış kutuları atlar ve bunun yerine nesne konumlarını doğrudan tahmin eder.

Bu değişim basit, mantıklı bir değişiklik gibi görünse de, aslında nesne algılama doğruluğu ve verimliliğinde büyük gelişmelere yol açmıştır. Bu makalede, Ultralytics YOLO11 gibi gelişmeler yoluyla ankrajsız dedektörlerin bilgisayarlı görüyü nasıl yeniden şekillendirdiğini anlayacağız.

Anchor tabanlı tespit ediciler nelerdir?

Anchor tabanlı dedektörler, bir görüntüdeki nesneleri bulmaya yardımcı olmak için anchor olarak bilinen önceden tanımlanmış kutular kullanır. Bu anchor'ları, görüntü üzerine yerleştirilmiş farklı boyut ve şekillerdeki kutulardan oluşan bir ızgara olarak düşünün. Model daha sonra bu kutuları algıladığı nesnelere uyacak şekilde ayarlar. Örneğin, model bir araba tespit ederse, anchor kutusunu arabanın konumuna ve boyutuna daha doğru şekilde uyacak şekilde değiştirir.

Her bir çapa, görüntüdeki olası bir nesneyle ilişkilendirilir ve eğitim sırasında model, çapa kutularını nesnenin konumuna, boyutuna ve en boy oranına daha iyi uyacak şekilde nasıl ayarlayacağını öğrenir. Bu, modelin farklı ölçeklerde ve yönlerde nesneleri algılamasını sağlar. Ancak, doğru çapa kutuları kümesini seçmek zaman alıcı olabilir ve bunları ince ayar yapma süreci hatalara açık olabilir.

__wf_reserved_inherit
Şekil 1. Anchor Box nedir?

YOLOv4 gibi anchor tabanlı dedektörler birçok uygulamada iyi çalışmış olsa da, bazı dezavantajları vardır. Örneğin, anchor kutuları her zaman farklı şekil veya boyutlardaki nesnelerle iyi hizalanmaz, bu da modelin küçük veya düzensiz şekilli nesneleri tespit etmesini zorlaştırır. Anchor kutusu boyutlarını seçme ve ince ayar yapma süreci de zaman alıcı olabilir ve çok fazla manuel çaba gerektirir. Bunun dışında, anchor tabanlı modeller genellikle örtüşen veya üst üste binen nesneleri tespit etmekte zorlanır, çünkü önceden tanımlanmış kutular bu daha karmaşık senaryolara iyi uyum sağlamayabilir.

Anchor'suz nesne algılamaya geçiş

Anchor'suz dedektörler, 2018'de CornerNet ve CenterNet gibi modellerle dikkat çekmeye başladı ve önceden tanımlanmış anchor kutularına olan ihtiyacı ortadan kaldırarak nesne tespitine yeni bir yaklaşım getirdi. Nesnelerin nerede olduğunu tahmin etmek için farklı boyut ve şekillerdeki anchor kutularına dayanan geleneksel modellerin aksine, anchor'suz modeller nesnelerin konumlarını doğrudan tahmin eder. Algılama sürecini basitleştiren ve daha hızlı ve doğru hale getiren nesnenin merkez gibi önemli noktalarına veya özelliklerine odaklanırlar.

İşte ankraj içermeyen modellerin genel olarak nasıl çalıştığı:

  • Anahtar nokta (Keypoint) tespiti: Önceden tanımlanmış kutuları kullanmak yerine, bazı modeller bir nesne üzerindeki merkez veya belirli köşeler gibi önemli noktaları tanımlar. Bu anahtar noktalar, modellerin nesnenin nerede olduğunu ve ne kadar büyük olduğunu anlamasına yardımcı olur.
  • Merkez tahmini: Bazı modeller bir nesnenin merkezini tahmin etmeye odaklanır. Merkez bulunduktan sonra, model oradan tüm nesnenin boyutunu ve konumunu tahmin edebilir.
  • Isı haritası regresyonu: Birçok ankraj içermeyen model, her pikselin bir nesnenin olası konumunu temsil ettiği ısı haritalarını kullanır. Daha güçlü ısı haritası değerleri, o noktada bir nesnenin bulunduğuna dair daha yüksek güveni gösterir.
__wf_reserved_inherit
Şekil 2. Anchor Tabanlı Algılama ve Anchor'suz Algılama Karşılaştırması.

Çapa kutularına dayanmayan çapa içermeyen modeller, daha basit bir tasarıma sahiptir. Bu, daha fazla hesaplama verimliliğine sahip oldukları anlamına gelir. Birden çok çapa kutusunu işlemek zorunda olmadıkları için, nesneleri daha hızlı tespit edebilirler - otonom sürüş ve video gözetimi gibi gerçek zamanlı uygulamalarda önemli bir avantajdır. 

Anchor'suz modeller ayrıca küçük, düzensiz veya örtülü nesneleri işlemede çok daha iyidir. Anchor kutularını sığdırmaya çalışmak yerine anahtar noktaları algılamaya odaklandıkları için çok daha esnektirler. Bu, anchor tabanlı modellerin başarısız olabileceği karmaşık veya karışık ortamlarda nesneleri doğru bir şekilde algılamalarını sağlar.

Ultralytics YOLO11: Çapa içermeyen bir dedektör

Başlangıçta hız ve verimlilik için tasarlanan YOLO modelleri, zamanla anchor tabanlı yöntemlerden anchor içermeyen algılamaya doğru kayarak YOLO11 gibi modelleri daha hızlı, daha esnek ve çok çeşitli gerçek zamanlı uygulamalar için daha uygun hale getirdi.

İşte ankraj içermeyen tasarımın farklı YOLO versiyonlarında nasıl evrimleştiğine dair kısa bir bakış:

  • Ultralytics YOLOv5u: Önceden tanımlanmış anchor kutularına olan ihtiyacı ortadan kaldıran Anchor-Free Split Ultralytics Head'i tanıttı. Bunun yerine, model nesnelerin bir görüntüde nerede olduğunu doğrudan tahmin ederek süreci basitleştirir ve esnekliği ve hızı artırır.
  • YOLOv6: Anchor-Aided Training (AAT) adı verilen yeni bir yöntem kullanıldı; burada anchor'lar yalnızca eğitim sırasında kullanıldı. Bu, modelin eğitim sırasında anchor tabanlı yöntemlerin yapısından yararlanmasını sağlarken, daha iyi hız ve uyarlanabilirlik için çalışma zamanında anchor'suz algılama kullanmaya devam etti.
  • Ultralytics YOLOv8: Anchor-Free Split Ultralytics Head kullanarak tamamen anchor-free algılamaya geçti. Bu, modeli özellikle anchor kutularına iyi uymayan küçük veya garip şekilli nesneler için daha hızlı ve daha doğru hale getirdi.
  • Ultralytics YOLO11: Tamamen anchor kutularını ortadan kaldırarak algılamayı daha da optimize eden YOLOv8'in anchor-free yaklaşımı üzerine kurulmuştur. Bu, hayvan davranışlarını izleme (animal behavior monitoring) ve perakende analitiği gibi gerçek zamanlı uygulamalar için daha hızlı, daha doğru algılama sağlar.
__wf_reserved_inherit
Şekil 3. Ultralytics YOLOv8 ve Ultralytics YOLO11'in karşılaştırılması.

YOLO11'in gerçek dünya uygulamaları

YOLO11 kullanılarak çapa kutusu içermeyen algılamanın faydalarının harika bir örneği otonom araçlardadır. Sürücüsüz arabalarda, yayaları, diğer araçları ve engelleri hızlı ve doğru bir şekilde tespit etmek güvenlik için çok önemlidir. YOLO11'in çapa kutusu içermeyen yaklaşımı, önceden tanımlanmış çapa kutularına güvenmek yerine, bir yayanın merkezi veya başka bir aracın sınırları gibi nesnelerin ana noktalarını doğrudan tahmin ederek algılama sürecini basitleştirir. 

__wf_reserved_inherit
Şekil 4. YOLO11'de Anchor-Free (Çapa Serbest) Tespitin Faydaları (Görsel: Yazar).

YOLO11, her nesneye bir dizi çapa (anchor) uydurmak veya ayarlamak zorunda değildir; bu, hesaplama açısından maliyetli ve yavaş olabilir. Bunun yerine, temel özelliklere odaklanarak daha hızlı ve verimli hale gelir. Örneğin, bir yaya aracın yoluna girdiğinde, YOLO11, kişi kısmen gizli veya hareket halinde olsa bile, temel noktaları belirleyerek konumunu hızla tespit edebilir. Çapa kutuları olmadan değişen şekil ve boyutlara uyum sağlama yeteneği, YOLO11'in nesneleri daha güvenilir ve daha yüksek hızlarda algılamasına olanak tanır; bu da otonom sürüş sistemlerinde gerçek zamanlı karar verme için hayati öneme sahiptir.

YOLO11'in anchor içermeyen yeteneklerinin gerçekten öne çıktığı diğer uygulamalar şunlardır:

  • Perakende ve envanter yönetimi: YOLO11, raflardaki ürünleri yığılmış veya kısmen engellenmiş olsalar bile izlemeyi kolaylaştırır. Bu, daha hızlı, daha doğru envanter takibine yardımcı olur ve hataları azaltır.
  • Tıbbi görüntüleme: YOLO11, tıbbi taramalarda tümörleri veya diğer anormallikleri tespit edebildiği sağlık hizmetlerinde de etkilidir. Düzensiz şekilli nesnelerle çalışma yeteneği, karmaşık durumları teşhis etmede doğruluğu artırmaya yardımcı olur.
  • Yaban hayatı izleme: Yaban hayatı araştırmalarında, YOLO11 yoğun ormanlarda veya zorlu arazilerde hayvanları izleyebilir, araştırmacıların davranışları izlemesine veya nesli tükenmekte olan türleri korumasına yardımcı olur.
  • Spor analitiği (Sports analytics): YOLO11, takımlar, antrenörler ve yayıncılar için değerli bilgiler sağlamak üzere spor etkinlikleri sırasında oyuncuları, top hareketlerini veya diğer unsurları gerçek zamanlı olarak izlemek için kullanılabilir.

Anchor içermeyen modellerle çalışırken dikkat edilmesi gerekenler

YOLO11 gibi anchor-free modeller birçok avantaj sunarken, bazı sınırlamaları da beraberinde getirir. Dikkat edilmesi gereken temel pratik hususlardan biri, anchor-free modellerin bile örtüşmeler veya yüksek oranda üst üste binen nesnelerle mücadele edebilmesidir. Bunun arkasındaki mantık, bilgisayarla görmenin insan görmesini taklit etmeyi amaçlaması ve tıpkı bizim bazen örtüşen nesneleri tanımlamakta zorlanmamız gibi, yapay zeka modellerinin de benzer zorluklarla karşılaşabilmesidir.

Bir diğer ilginç faktör de model tahminlerinin işlenmesiyle ilgilidir. Bağlantısız modellerin mimarisi bağlantılı modellere göre daha basit olmasına rağmen, bazı durumlarda ek iyileştirme gerekli hale gelir. Örneğin, kalabalık sahnelerde örtüşen tahminleri temizlemek veya doğruluğu artırmak için maksimum olmayan bastırma (NMS) gibi işlem sonrası teknikler gerekebilir.

YOLO11 ile yapay zekanın geleceğine demir atmak

Anchor tabanlıdan anchor'suz algılamaya geçiş, nesne algılamada önemli bir ilerleme olmuştur. YOLO11 gibi anchor'suz modellerle süreç basitleştirilir ve hem doğruluk hem de hızda iyileşmeler sağlanır.

YOLO11 aracılığıyla, ankrajsız nesne algılamanın, hızlı ve hassas algılamanın çok önemli olduğu otonom sürüşlü arabalar, video gözetimi ve tıbbi görüntüleme gibi gerçek zamanlı uygulamalarda nasıl başarılı olduğunu gördük. Bu yaklaşım, YOLO11'in değişen nesne boyutlarına ve karmaşık sahnelere daha kolay uyum sağlamasına olanak tanıyarak çeşitli ortamlarda daha iyi performans sağlar.

Bilgisayarlı görü gelişmeye devam ettikçe, nesne tespiti daha hızlı, daha esnek ve daha verimli hale gelecektir.

Tüm yapay zeka gelişmelerinden haberdar olmak için GitHub depomuzu keşfedin ve aktif topluluğumuza katılın. Görüntü İşleme Yapay Zekasının üretim ve tarım gibi sektörleri nasıl etkilediğini inceleyin.

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın
Bağlantı panoya kopyalandı