YOLO Vision 2025'i kaçırmayın!
25 Eylül 2025
10:00 — 18:00 BST
Hibrit etkinlik
Yolo Vision 2024
Sözlük

Özellik Piramidi Ağı (FPN)

Özellik Piramidi Ağlarının (FPN) YOLO11 ve modern CV sistemlerinde küçük ve büyük nesneler için doğruluğu artıran çok ölçekli nesne algılamayı nasıl sağladığını öğrenin.

Özellik Piramidi Ağı (FPN), derin öğrenme modellerinde, özellikle de nesne algılama mimarilerinde, çeşitli ölçeklerdeki nesnelerin algılanmasını iyileştirmek için tasarlanmış bir bileşendir. Herhangi bir görüntüde nesneler, boyutlarına ve kameraya olan uzaklıklarına bağlı olarak büyük veya küçük görünebilir. FPN, özelliklerin çok ölçekli bir temsilini verimli bir şekilde oluşturarak bu zorluğun üstesinden gelir ve bir modelin aynı anda küçük, uzaktaki bir arabayı ve büyük, yakındaki bir kamyonu yüksek doğrulukla tanımasını sağlar. Ana özellik çıkarıcı ile bir ağın nihai tahmin bileşeni arasında bir köprü veya "boyun" görevi görür.

Özellik Piramidi Ağı Nasıl Çalışır?

Bir FPN, düşük çözünürlüklü, anlamsal olarak güçlü özellikleri yüksek çözünürlüklü, anlamsal olarak zayıf özelliklerle birleştirerek çalışır. Bu işlem tipik olarak iki yollu ve yanal bağlantıları olan bir yapı aracılığıyla gerçekleştirilir.

  1. Aşağıdan Yukarıya Yol: Bu, modelin omurgası olarak hizmet veren bir Evrişimsel Sinir Ağının (CNN) standart ileri geçişidir. Bir görüntü ardışık katmanlardan geçtikçe, ortaya çıkan özellik haritaları uzamsal boyutta azalır, ancak anlamsal derinlikte artar, yani daha soyut kavramları yakalarlar.
  2. Yukarıdan Aşağıya Yol: Ağ daha sonra en derin katmandan (küçük ama bilgi açısından zengin olan) özellik haritasını alır ve onu yukarı doğru örneklemeye başlar.
  3. Yanal Bağlantılar: Yukarıdan aşağıya yol daha büyük özellik haritalarını yeniden oluşturdukça, bunları aşağıdan yukarıya yolundaki ilgili özellik haritalarıyla birleştirir. Bu birleştirme, yukarı örneklenmiş katmanları daha önceki katmanlardan gelen daha ince, daha yerelleştirilmiş ayrıntılarla zenginleştirir. Sonuç, her biri hem anlam hem de uzamsal ayrıntı açısından zengin olan ve daha sonra tahmin için algılama kafasına beslenen bir özellik haritaları "piramidi "dir. Orijinal FPN araştırma makalesi bu sürecin ayrıntılı bir teknik açıklamasını sunmaktadır.

Nesne Tespitinde FPN'nin Rolü

Tipik bir nesne algılama modelinde, mimari omurga, boyun ve kafaya bölünmüştür. FPN boyun bileşeni için popüler bir seçimdir. Birincil rolü, son algılama görevi için kullanılmadan önce omurga tarafından çıkarılan özellikleri toplamaktır. FPN'ler zengin, çok ölçekli bir özellik temsili sağlayarak YOLO11 gibi modellerin çok çeşitli nesne boyutlarında sağlam bir performans göstermesini sağlar. Bu yaklaşım, omurganın tek ileri geçişinde hesaplanan özellikleri yeniden kullandığından, bir görüntüyü birden fazla çözünürlükte ayrı ayrı işlemekten hesaplama açısından daha verimlidir. Çeşitli YOLO model karşılaştırmalarında görüldüğü gibi, birçok son teknoloji model bu konseptten yararlanmaktadır.

Gerçek Dünya Uygulamaları

FPN'ler, çok ölçekli nesne algılamanın kritik olduğu birçok modern bilgisayarla görme (CV) uygulamasının ayrılmaz bir parçasıdır.

  • Otonom Araçlar: Sürücüsüz araçlar çeşitli mesafelerdeki yayaları, araçları, trafik işaretlerini ve şerit işaretlerini tespit etmelidir. Bir FPN, Carnegie Mellon Üniversitesi gibi kurumların kaynaklarında ayrıntılı olarak açıklanan aracın algılama sisteminin uzaktaki bir yayayı ve yakındaki bir arabayı aynı çerçeve içinde tanımlamasına yardımcı olur, bu da güvenli navigasyon için gereklidir.
  • Tıbbi Görüntü Analizi: Radyolojide FPN'ler, küçük lezyonlar ve büyük tümörler gibi farklı boyutlardaki anomalileri tespit etmek için tıbbi taramaların analiz edilmesine yardımcı olabilir. Bu çok ölçekli yetenek, Ulusal Sağlık Enstitüleri (NIH) tarafından yayınlanan araştırmada tartışıldığı gibi, patoloji ve onkoloji gibi alanlarda daha kapsamlı ve doğru otomatik teşhislere olanak tanır.

FPN vs. BiFPN

FPN önemli bir ilerlemeye işaret ederken, daha yeni mimariler bu konsepti geliştirmiştir. Kayda değer bir örnek, Google Research tarafından EfficientDet makalesinde tanıtılan Çift Yönlü Özellik Piramidi Ağıdır (BiFPN). FPN'nin basit yukarıdan aşağıya yolunun aksine, BiFPN çift yönlü bağlantılar (hem yukarıdan aşağıya hem de aşağıdan yukarıya) sunar ve ağın farklı giriş özelliklerinin önemini öğrenmesine olanak tanıyan ağırlıklı özellik füzyonu kullanır. EfficientDet ve YOLO11 gibi karşılaştırmalarda vurgulandığı gibi, bu genellikle daha iyi performans ve verimlilik sağlar. FPN temel bir kavram olsa da, BiFPN çok ölçekli özellik füzyonuna yönelik daha gelişmiş ve optimize edilmiş bir yaklaşımı temsil etmektedir.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın
Bağlantı panoya kopyalandı