Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Özellik Piramidi Ağı (FPN)

Özellik Piramidi Ağları'nın (FPN) çok ölçekli nesne algılamayı nasıl geliştirdiğini keşfedin. Ultralytics detect ve büyük nesneleri detect için gelişmiş FPN'leri nasıl kullandığını öğrenin.

Özellik Piramidi Ağı (FPN), modern bilgisayar görme (CV) sistemlerinde çeşitli ölçeklerde nesnelerin algılanmasını iyileştirmek için kullanılan özel bir mimari bileşendir. Görüntü analizinde uzun süredir devam eden bir sorunu etkili bir şekilde çözer: aynı görüntü içinde hem büyük, belirgin yapıları hem de küçük, uzak detayları tanıma. Girişin piramide kavramsal olarak benzer çok ölçekli bir temsilini oluşturarak, FPN'ler sinir ağlarının her çözünürlük düzeyinde zengin anlamsal bilgiler çıkarmasına olanak tanır. Bu mimari genellikle backboneve algılama kafasıarasında yer alır.

Özellik Piramidi Ağları Nasıl Çalışır?

FPN'nin temel yeniliği, bilgileri işleme biçiminde yatmaktadır. Geleneksel Konvolüsyonel Sinir Ağları (CNN'ler) girdi görüntüsünün aşamalı olarak aşağı örneklemesi ile doğal olarak bir özellik hiyerarşisi oluşturur. Bu, anlamsal anlayışı (görüntüde ne olduğunu bilmek) derinleştirirken, genellikle uzamsal çözünürlüğü (tam olarak nerede olduğunu bilmek) bozar ve küçük nesnelerin kaybolmasına neden olur.

FPN'ler bunu üç aşamalı bir süreçle ele alır:

  1. Aşağıdan Yukarıya Yol: Bu, ağın standart ileri besleme geçişidir, örneğin Kalan Ağ (ResNet). Ağ görüntüyü işlerken, özellik haritaları oluşturur. Bu haritaların boyutu azalırken semantik değeri artar.
  2. Yukarıdan Aşağıya Yolu: Ağ, daha derin katmanlardan anlamsal olarak zengin özellikleri yukarı örnekleyerek daha yüksek çözünürlüklü bir piramit oluşturur. Bu adım, güçlü bağlamı daha büyük uzamsal haritalara "halüsinasyon" olarak geri getirir. .
  3. Yanal Bağlantılar: Aşağı örnekleme sırasında kaybolan net ayrıntıları geri kazanmak için, FPN'ler yukarı örneklemlenen özellikleri, yanal bağlantılar aracılığıyla aşağıdan yukarıya yol üzerinden orijinal, yüksek çözünürlüklü haritalarla birleştirir.

Bu kombinasyon, her seviyenin güçlü semantik ve iyi yerelleştirmeye sahip olduğu bir piramit oluşturur ve hassasiyeti önemli ölçüde artırır hassasiyeti ve geri çağırmayı önemli ölçüde artırır.

Nesne Algılama Mimarilerinde Önemi

FPN'ler, modern nesne algılama mimarilerinin. FPN'ler, her iki dünyanın en iyisini sunan bir çözüm sunarak gerçek zamanlı çıkarım gerçek zamanlı çıkarım sağlayarak küçük nesne algılama yeteneklerinden ödün vermeden.

Bu verimlilik, YOLO26 gibi gelişmiş modeller için çok önemlidir. YOLO26gibi gelişmiş modeller için çok önemlidir. Bu modeller, FPN ilkelerinden (PANet gibi) esinlenerek geliştirilmiş sofistike toplama ağlarını kullanarak en son teknoloji performansı elde ederler. Mimari, modelin kenar cihazlarda veya güçlü sunucularda Ultralytics üzerinden güçlü sunuculara dağıtılsa da, çeşitli veri kümelerinde yüksek doğruluğu korumasını sağlar.

Gerçek Dünya Uygulamaları

FPN'lerin çok ölçekli yetenekleri, güvenlik ve hassasiyetin öncelikli olduğu endüstrilerde onları vazgeçilmez kılar.

  • Otomotiv Sektöründe Yapay Zeka: Otonom araçlar, yakınlarındaki track kamyonları ve uzaktaki küçük trafik ışıklarını veya yayaları aynı anda track etmelidir. FPN'ler, algılama yığınının bu farklı ölçekleri tek bir geçişte işlemesine olanak tanıyarak zamanında karar alınmasını sağlar. nuScenes gibi veri kümeleri genellikle bu yetenekleri karşılaştırmak için kullanılır.
  • Tıbbi Görüntü Analizi: Teşhis amaçlı görüntüleme sırasında, patolojileri tespit etmek için boyutları büyük farklılıklar gösteren anomalileri tespit etmek gerekir. FPN donanımlı bir model, büyük organ yapılarının yanı sıra küçük, erken evre tümörleri de , radyologların doğru teşhis koymalarına yardımcı olur., radyologların doğru tanı koymasına yardımcı olur.
  • Tarımda Yapay Zeka: Hassas tarım, drone görüntülerinden mahsul ve zararlıları tespit etmeye dayanır. Drone'un irtifası değişebildiğinden, görüntüdeki bitkilerin boyutu da değişir. FPN'ler, modellerin iyi bir şekilde genelleme yapmasına yardımcı olur ve nesne sayımını daha iyi genelleme yapmasına ve kamera yüksekliğinden bağımsız olarak

FPN ve Diğer Özellik Toplayıcıları

Standart FPN'yi, yeni mimarilerde bulunan gelişmiş varyantlarından ayırmak yararlıdır.

  • FPN ve PANet: FPN, özellikleri zenginleştirmek için yukarıdan aşağıya bir yol eklerken, Yol Toplama Ağı (PANet) FPN'nin üzerine ekstra bir aşağıdan yukarıya yol ekler. Bu, düşük seviyeli özellikler için bilgi yolunu kısaltarak, YOLO sıklıkla kullanılan bir teknik olan yerelleştirmeyi daha da iyileştirir.
  • FPN ve BiFPN: EfficientDet'te bulunan Çift Yönlü Özellik Piramidi Ağı (BiFPN) farklı özelliklere öğrenilebilir ağırlıklar getirir ve yalnızca bir girişi olan düğümleri kaldırarak ağı verimlilik açısından optimize eder .

Pratik Örnek

Gelişmiş kütüphaneler gibi ultralytics FPN yapısının karmaşıklığını dahili olarak ele alır. YOLO26 gibi bir modeli yüklediğinizde, mimari performansı en üst düzeye çıkarmak için bu özellik toplama katmanlarını otomatik olarak içerir.

from ultralytics import YOLO

# Load the YOLO26 model, which uses advanced feature pyramid principles internally
# The 'n' suffix indicates the nano version, optimized for speed
model = YOLO("yolo26n.pt")

# Perform inference on an image containing objects of various sizes
# The model's neck (FPN-based) aggregates features to detect small and large items
results = model("https://ultralytics.com/images/bus.jpg")

# Display results to see bounding boxes around buses (large) and people (small)
results[0].show()

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın