Feature Pyramid Network (FPN)
Özellik Piramidi Ağlarının (FPN) çok ölçekli nesne tespitini nasıl geliştirdiğini keşfet. Ultralytics YOLO26'nın küçük ve büyük nesneleri tespit etmek için gelişmiş FPN'leri nasıl kullandığını öğren.
Feature Pyramid Network (FPN), modern bilgisayarlı görü (CV) sistemlerinde çeşitli ölçeklerdeki nesnelerin tespitini iyileştirmek için kullanılan özel bir mimari bileşendir. Görüntü analizindeki uzun süreli bir zorluğu etkili bir şekilde çözer: aynı görüntü içindeki hem büyük, belirgin yapıları hem de küçük, uzak detayları tanımak. Girişin bir piramide kavramsal olarak benzer çok ölçekli bir temsilini oluşturarak, FPN'ler sinir ağlarının her çözünürlük seviyesinde zengin anlamsal bilgiler çıkarmasına olanak tanır. Bu mimari tipik olarak, ham özellikleri çıkaran backbone ile nesne sınıflarını ve sınırlayıcı kutuları tahmin eden detection head arasında yer alır.
Link to this sectionFeature Pyramid Network'ler Nasıl Çalışır#
FPN'in temel yeniliği, bilgiyi işleme biçiminde yatar. Geleneksel Evrişimli Sinir Ağları (CNN'ler), giriş görüntüsünün kademeli olarak örneklemesinin düşürüldüğü (downsampled) doğal bir özellik hiyerarşisi oluşturur. Bu, anlamsal anlayışı derinleştirirken (görüntüde ne olduğunu bilmek), genellikle uzamsal çözünürlüğü düşürür (tam olarak nerede olduğunu bilmek) ve küçük nesnelerin kaybolmasına neden olur.
FPN'ler bunu üç adımlı bir süreçle ele alır:
-
Aşağıdan Yukarıya Yol (Bottom-Up Pathway): Bu, Residual Network (ResNet) gibi ağın standart ileri beslemeli geçişidir. Ağ görüntüyü işlerken, boyutu küçülen ancak anlamsal değeri artan özellik haritaları (feature maps) oluşturur.
-
Yukarıdan Aşağıya Yol (Top-Down Pathway): Ağ, daha derin katmanlardan gelen anlamsal açıdan zengin özellikleri yukarı örnekleyerek (upsampling) daha yüksek çözünürlüklü bir piramit oluşturur. Bu adım, daha geniş uzamsal haritalara güçlü bir bağlamı "halüsinasyon" yoluyla geri ekler.
-
Yanal Bağlantılar (Lateral Connections): Örnekleme düşürme sırasında kaybolan net detayları geri kazanmak için FPN'ler, yukarı örneklenmiş özellikleri, aşağıdan yukarıya yoldaki orijinal, yüksek çözünürlüklü haritalarla yanal bağlantılar aracılığıyla birleştirir.
Bu kombinasyon, her seviyenin güçlü anlamsal özelliklere ve iyi bir yerelleştirmeye sahip olduğu bir piramit ile sonuçlanır, bu da tüm nesne boyutlarında hassasiyeti (precision) ve duyarlılığı (recall) önemli ölçüde artırır.
Link to this sectionNesne Tespiti Mimarilerinde Önemi#
FPN'ler, modern nesne tespiti mimarilerinin temel taşıdır. Bunların tanıtılmasından önce modeller, hız (sadece son katmanı kullanarak) veya doğruluk (çok yavaş olan bir görüntü piramidini işleyerek) arasında seçim yapmak zorundaydı. FPN'ler, küçük nesne tespit yeteneklerinden ödün vermeden gerçek zamanlı çıkarım (real-time inference) sağlayarak her iki dünyanın da en iyisini sunan bir çözüm sağlar.
Bu verimlilik, FPN prensiplerinden (PANet gibi) ilham alan gelişmiş toplama ağlarını kullanarak en üst düzey performansa ulaşan YOLO26 gibi gelişmiş modeller için hayati öneme sahiptir. Bu mimari, modelin uç cihazlarda veya Ultralytics Platform aracılığıyla güçlü sunucularda konuşlandırılıp konuşlandırılmadığına bakılmaksızın, çeşitli veri setlerinde yüksek doğruluk oranını korumasını sağlar.
Link to this sectionGerçek Dünya Uygulamaları#
FPN'lerin çok ölçekli yeteneği, onları güvenliğin ve hassasiyetin çok önemli olduğu endüstrilerde vazgeçilmez kılar.
- Otomotivde Yapay Zeka: Otonom araçlar, yakındaki büyük kamyonları ve uzaktaki küçük trafik ışıklarını veya yayaları aynı anda takip edebilmelidir. FPN'ler, algı yığınının bu farklı ölçekleri tek bir geçişte işlemesine olanak tanır ve zamanında karar verilmesini sağlar. nuScenes gibi veri setleri, bu yetenekleri kıyaslamak için sıklıkla kullanılır.
- Tıbbi Görüntü Analizi: Tanısal görüntülemede, patolojileri tespit etmek boyutu çok değişkenlik gösteren anormallikleri fark etmeyi gerektirir. FPN donanımlı bir model, MRI taramalarında hem büyük organ yapılarını hem de küçük, erken evre tümörleri tanımlayarak radyologların doğru teşhis koymalarına yardımcı olabilir.
- Tarımda Yapay Zeka: Hassas tarım, dron görüntülerinden mahsulleri ve zararlıları tespit etmeye dayanır. Dronun irtifası değişebildiği için, görüntüdeki bitkilerin boyutu da değişir. FPN'ler, kamera yüksekliğinden bağımsız olarak doğru bir şekilde nesne sayımı gerçekleştirerek modellerin iyi genelleme yapmasına yardımcı olur.
Link to this sectionFPN vs. Diğer Özellik Toplayıcılar#
Standart FPN'i daha yeni mimarilerde bulunan gelişmiş varyantlarından ayırmak faydalıdır.
- FPN vs. PANet: FPN, özellikleri zenginleştirmek için yukarıdan aşağıya bir yol eklerken, Path Aggregation Network (PANet), FPN'in üzerine fazladan bir aşağıdan yukarıya yol ekler. Bu, düşük seviyeli özellikler için bilgi yolunu kısaltarak yerelleştirmeyi daha da iyileştirir; bu teknik YOLO modellerinde sıklıkla uyarlanır.
- FPN vs. BiFPN: EfficientDet'te bulunan Bi-directional Feature Pyramid Network (BiFPN), farklı özelliklere öğrenilebilir ağırlıklar ekler ve yalnızca bir girişi olan düğümleri kaldırarak ağı verimlilik için optimize eder.
Link to this sectionPratik Örnek#
ultralytics gibi gelişmiş kütüphaneler, FPN yapısının karmaşıklığını dahili olarak yönetir. YOLO26 gibi bir model yüklediğinde, mimari performansı en üst düzeye çıkarmak için bu özellik toplama katmanlarını otomatik olarak içerir.
from ultralytics import YOLO
# Load the YOLO26 model, which uses advanced feature pyramid principles internally
# The 'n' suffix indicates the nano version, optimized for speed
model = YOLO("yolo26n.pt")
# Perform inference on an image containing objects of various sizes
# The model's neck (FPN-based) aggregates features to detect small and large items
results = model("https://ultralytics.com/images/bus.jpg")
# Display results to see bounding boxes around buses (large) and people (small)
results[0].show()





