Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Özellik Piramidi Ağı (FPN)

Özellik Piramidi Ağlarının (FPN) YOLO11 ve modern CV sistemlerinde küçük ve büyük nesneler için doğruluğu artıran çok ölçekli nesne algılamayı nasıl sağladığını öğrenin.

Özellik Piramidi Ağı (FPN), bilgisayar görme (CV) alanında kullanılan özel bir mimaridir. farklı ölçeklerdeki nesnelerin algılanmasını iyileştirmek farklı ölçeklerdeki nesnelerin algılanmasını iyileştirmek için kullanılan özel bir mimaridir. Birçok modern nesne algılama mimarisinde nesne algılama mimarilerinde, küçük öğeleri tanımakta zorlanan geleneksel dedektörlerin sınırlamalarını aşmak için tasarlanmıştır. Tek bir çözünürlüklü giriş görüntüsünden çok ölçekli bir özellik piramidi oluşturarak, FPN'ler modellerin detect büyük yapıları hem de küçük ayrıntıları yüksek doğrulukla detect sağlar. Bu mimari genellikle backbone (özellikleri çıkarır) ile algılama algılama kafası (sınıfları ve kutuları tahmin eder) arasında yer alır ve son katmanlara aktarılan anlamsal bilgileri etkili bir şekilde zenginleştirir.

FPN Mimarisini Anlamak

FPN'nin temel amacı, derin Konvolüsyonel Sinir Ağlarının (CNN) gerekli olan hesaplama maliyetini azaltmaktır. Mimari görsel verileri işleyen üç ana yoldan oluşur:

  1. Aşağıdan Yukarıya Yolbackbone Bu, Kalan Ağlar (ResNet)gibi omurga ağının ileri beslemeli hesaplamasıdır. Görüntü katmanlar arasında ilerledikçe, uzamsal çözünürlük azalır (görüntü küçülür) ve anlamsal değer (görüntüdeki içeriğin bağlamı) artar.
  2. Yukarıdan Aşağıya Yöntem: Bu aşama, uzamsal olarak daha kaba, ancak anlamsal olarak daha güçlü olan özellik haritalarını yukarı örnekleme yoluyla daha yüksek çözünürlüklü özellikler olarak hayal eder. Özellik haritaları, özellik haritalarını yüksek piramit seviyelerinden. Bu, aşağıdan yukarıya süreçte kaybolan uzamsal ayrıntıları geri kazanır.
  3. Yanal Bağlantılar: Bu bağlantılar, yukarıdan aşağıya doğru yolun yukarı örneklemeli özellik haritalarını aşağıdan yukarıya doğru yolun karşılık gelen özellik haritalarıyla birleştirir. Bu birleştirme, üst düzey anlamsal bağlamı alt düzey doku ve kenar bilgileriyle birleştirerek .. Orijinal FPN araştırma makalesi , bu tekniğin standart karşılaştırmalarda nasıl en gelişmiş sonuçları elde ettiğini göstermektedir.

Modern Yapay Zekada Önemi

FPN'lerden önce, nesne algılayıcılar genellikle yalnızca en üst katmanı kullanmak (büyük nesneler için iyi, küçük nesneler için kötü) veya bir görüntü piramidini işlemek (yavaş ve hesaplama açısından pahalı) arasında seçim yapmak zorundaydı. FPN'ler "her iki dünyanın en iyisini" birleştiren bir çözüm sunar. Bu özellik, gerçek zamanlı çıkarımiçin hayati önem taşır ve YOLO26 ve YOLO11 gibi gelişmiş modellerin yüksek kare hızlarını korurken ekranın sadece birkaç pikselini kaplayan nesneleri doğru bir şekilde tanımlamasını sağlar.

Gerçek Dünya Uygulamaları

Çok ölçekli verileri işleme yeteneği, FPN'leri aşağıdakilere dayanan çeşitli sektörlerde vazgeçilmez kılmaktadır yapay zeka (AI).

  • Otonom Araçlar: Otonom sürüş sistemleri, yakınlardaki track araçları ve uzaktaki trafik ışıklarını veya yayaları aynı anda track etmelidir. FPN'ler, algılama yığınının bu unsurları aynı çıkarım geçişinde işlemesi ve güvenlik kararlarının anında alınmasını sağlar. Waymo Açık Veri Kümesi sıklıkla bu çok ölçekli yetenekleri eğitmek için kullanılır. .
  • Tıbbi Görüntü Analizi: Tanı amaçlı görüntülemede, anomalileri tespit etmek için tüm ölçeklerde hassasiyet gerekir. Bir tümör büyük bir kitle veya küçük, erken evre bir nodül olabilir. FPN'ler görüntü segmentasyon modellerini geliştirerek, klinisyenlerin X-ışınları ve MRI taramalarında çeşitli boyutlardaki detect sıklıkla detect yardımcı olur. tartışıldığı Radyoloji AI dergilerinde.

FPN ile BiFPN ve PANet karşılaştırması

FPN özellik çıkarma konusunda devrim yaratırken, yeni mimariler bu kavramı daha da geliştirmiştir.

  • BiFPN (Çift Yönlü Özellik Piramit Ağı): EfficientDet'te kullanılan bu ağ, farklı girdi özelliklerinin önemini öğrenmek için öğrenilebilir ağırlıklar getirir ve mevcut yukarıdan aşağıya yollara aşağıdan yukarıya yollar ekler.
  • PANet (Yol Toplama Ağı): Genellikle YOLO kullanılan PANet, FPN yapısına ekstra bir aşağıdan yukarıya yol ekleyerek düşük seviyeli özellikler için bilgi yolunu kısaltır ve konum belirleme doğruluğunu daha da artırır.
  • Ultralytics YOLO : YOLO26 gibi modern yinelemeler, hız ve ortalama hassasiyet (mAP) arasındaki dengeyi en üst düzeye çıkarmak için bu toplama ağlarının gelişmiş varyantlarını kullanır ortalama ortalama hassasiyet (mAP)arasındaki

Uygulama Örneği

Derin öğrenme kütüphaneleri ve Ultralytics , FPN'lerin karmaşıklıklarını dahili olarak yönetir. Aşağıdaki örnek, detect için özellik piramidi yapısını kullanan bir modeli nasıl yükleyeceğinizi gösterir.

from ultralytics import YOLO

# Load the YOLO26 model, which utilizes an advanced feature pyramid architecture
# The 'n' suffix stands for nano, a lightweight version of the model
model = YOLO("yolo26n.pt")

# Run inference on an image to detect objects ranging from small to large
# The model internally uses its FPN neck to aggregate features at multiple scales
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the resulting bounding boxes and class labels
results[0].show()

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın