Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Özellik Piramidi Ağı (FPN)

Özellik Piramidi Ağlarının (FPN) YOLO11 ve modern CV sistemlerinde küçük ve büyük nesneler için doğruluğu artıran çok ölçekli nesne algılamayı nasıl sağladığını öğrenin.

Özellik Piramidi Ağı (FPN), modern teknolojide temel bir mimaridir. bilgisayarla görme (CV) tasarlanmış Farklı ölçeklerdeki nesneleri yüksek hassasiyetle detect etmek için. Geleneksel derin öğrenme (DL) modeller genellikle uzamsal çözünürlüğün kaybolduğu derin katmanlara dayandıkları için küçük nesneleri tanımakta zorlanmışlardır. FPN adresleri piramidal bir yapı inşa ederek özellik haritaları birleştiren düşük çözünürlüklü, anlamsal olarak güçlü özellikler ile yüksek çözünürlüklü, uzamsal olarak ayrıntılı özellikler. Bu tasarım bir birçoğunda önemli "boyun" nesne algılama mimarileriolarak bilinen ilk özellik çıkarıcıyı bağlayan backbone-son tahmin katmanlarına veya algılama kafası. FPN'ler farklı seviyeler arasında etkin bilgi paylaşımı sağlayarak aşağıdaki gibi modelleri mümkün kılar YOLO11 her iki küçüğü de doğru bir şekilde tanımlamak için, Tek bir görüntü içinde uzak ayrıntılar ve büyük, öne çıkan konular.

Mimariyi Anlamak

Özellik Piramidi Ağının temel yeniliği, görsel bilgiyi üç farklı yolla işlemesinde yatar aşamaları. Bu yapı, ağın birden fazla çözünürlükte görüntünün zengin bir temsilini korumasını sağlar büyük bir hesaplama maliyetine katlanmadan.

  1. Aşağıdan Yukarıya Yol: Bu aşama, standart bir makinenin ileri geçişine karşılık gelir Evrişimsel Sinir Ağı (CNN)gibi ResNet. Görüntü ağdan geçerken, uzamsal boyutlar azalırken, anlamsal değer (bağlamsal anlayış) artar.
  2. Yukarıdan Aşağıya Yol: Kaybedilen uzamsal detayı geri kazanmak için ağ, uzamsal olarak kaba olan ancak daha derin katmanlardan anlamsal olarak zengin özellik haritaları. Bu süreç daha yüksek çözünürlüklü haritaları etkili bir şekilde yeniden yapılandırır. güçlü bağlam içeren haritalar.
  3. Yanal Bağlantılar: Önemli adım, yukarıdan aşağıya yolaktan yukarı örneklenmiş haritaların birleştirilmesini içerir aşağıdan yukarıya yolaktan gelen karşılık gelen haritalar ile. Bu yanal bağlantılar üst düzey anlamsal daha önceki katmanlarda bulunan düşük seviyeli dokular ve kenarlarla bağlam oluşturarak çok ölçekli bir özellik piramidi oluşturur. Bu orijinal FPN araştırma makalesi bu füzyonun nasıl gerçekleştiğini gibi kıyaslama veri kümelerinde performansı önemli ölçüde artırır. COCO.

Çok Ölçekli Algılama Neden Önemlidir?

Gerçek dünya senaryolarında nesneler, kameraya olan uzaklıklarına bağlı olarak çok farklı boyutlarda görünür. A Standart sınıflandırıcı çerçeveyi dolduran bir arabayı kolayca tespit edebilir ancak arka plandaki bir yayayı detect edemeyebilir. FPN'ler bunu piramidin farklı seviyelerine tahmin görevleri atayarak çözer. Büyük nesneler en üstte algılanır düşük çözünürlüklü, derin özellik haritaları, küçük nesneler ise yüksek çözünürlüklü, birleştirilmiş özellik haritaları üzerinde tespit edilir. Bu kabiliyeti yüksek performansa ulaşmak için gereklidir. doğruluk ve geri çağırma farklı ortamlarda, FPN donanımlı modelleri eski tek ölçekli dedektörlerden ayırır.

Gerçek Dünya Uygulamaları

Çok ölçekli verileri işleme yeteneği, FPN'leri aşağıdakilere dayanan çeşitli sektörlerde vazgeçilmez kılmaktadır yapay zeka (AI).

  • Otonom Araçlar: Kendi kendine sürüş sistemleri yakındaki araçları ve uzaktaki trafik ışıklarını aynı anda track etmelidir. Bir FPN aşağıdakilere izin verir Bu unsurları aynı çıkarım geçişinde işlemek için algı yığını, kritik güvenlik kararlarının gerçek zamanlı olarak yapılmıştır. gibi kuruluşların önde gelen araştırmaları Waymo bu tür çoklu ölçeklerin önemini vurgulamaktadır. navigasyon için anlayış.
  • Tıbbi Görüntü Analizi: İçinde Teşhis amaçlı görüntülemede anomalilerin belirlenmesi ölçekler arasında hassasiyet gerektirir. Bir tümör büyük bir kitle ya da küçük bir tümör olabilir, erken evre nodül. FPN'ler geliştirir görüntü segmentasyonu modeller 'de tartışıldığı gibi, radyolojide kullanılır ve klinisyenlerin X-ışınlarında ve MRI taramalarında değişen boyutlardaki patolojileri detect etmelerine yardımcı olur. Radyoloji AI dergileri.

FPN vs. BiFPN

FPN özellik çıkarma konusunda devrim yaratırken, yeni mimariler bu kavramı geliştirmiştir. Dikkate değer bir evrim tarafından tanıtılan Çift Yönlü Özellik Piramidi Ağı (BiFPN) Google Araştırma EfficientDet mimarisinde. Aksine Tek yönlü (yukarıdan aşağıya) akan standart FPN'de BiFPN aşağıdan yukarıya yollar ekler ve her bir yol için belirli ağırlıklar öğrenir. bağlantı, daha önemli özelliklere öncelik verme. Bununla birlikte, standart FPN tasarımları ve bunların varyantları gibi yüksek performanslı modeller için temel YOLO11çoğu için hız ve doğruluğu etkili bir şekilde dengelemek gerçek zamanlı çıkarım görevler.

Uygulama Örneği

Modern kütüphaneler FPN'lerin karmaşıklığını dahili olarak ele alır. Aşağıdaki örnek, aşağıdakilerin kullanımını göstermektedir Ultralytics YOLO içeren paket Her boyuttaki nesneyi sorunsuz bir şekilde detect etmek için gelişmiş özellik piramidi yapıları.

from ultralytics import YOLO

# Load the YOLO11 model, which utilizes a feature pyramid architecture for multi-scale detection
model = YOLO("yolo11n.pt")

# Run inference on an image to detect objects ranging from small to large
results = model.predict("path/to/street_scene.jpg")

# Display the resulting bounding boxes and class labels
results[0].show()

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın