Özellik Piramidi Ağlarının (FPN) YOLO11 ve modern CV sistemlerinde küçük ve büyük nesneler için doğruluğu artıran çok ölçekli nesne algılamayı nasıl sağladığını öğrenin.
Özellik Piramidi Ağı (FPN), bilgisayar görme (CV) alanında kullanılan özel bir mimaridir. farklı ölçeklerdeki nesnelerin algılanmasını iyileştirmek farklı ölçeklerdeki nesnelerin algılanmasını iyileştirmek için kullanılan özel bir mimaridir. Birçok modern nesne algılama mimarisinde nesne algılama mimarilerinde, küçük öğeleri tanımakta zorlanan geleneksel dedektörlerin sınırlamalarını aşmak için tasarlanmıştır. Tek bir çözünürlüklü giriş görüntüsünden çok ölçekli bir özellik piramidi oluşturarak, FPN'ler modellerin detect büyük yapıları hem de küçük ayrıntıları yüksek doğrulukla detect sağlar. Bu mimari genellikle backbone (özellikleri çıkarır) ile algılama algılama kafası (sınıfları ve kutuları tahmin eder) arasında yer alır ve son katmanlara aktarılan anlamsal bilgileri etkili bir şekilde zenginleştirir.
FPN'nin temel amacı, derin Konvolüsyonel Sinir Ağlarının (CNN) gerekli olan hesaplama maliyetini azaltmaktır. Mimari görsel verileri işleyen üç ana yoldan oluşur:
FPN'lerden önce, nesne algılayıcılar genellikle yalnızca en üst katmanı kullanmak (büyük nesneler için iyi, küçük nesneler için kötü) veya bir görüntü piramidini işlemek (yavaş ve hesaplama açısından pahalı) arasında seçim yapmak zorundaydı. FPN'ler "her iki dünyanın en iyisini" birleştiren bir çözüm sunar. Bu özellik, gerçek zamanlı çıkarımiçin hayati önem taşır ve YOLO26 ve YOLO11 gibi gelişmiş modellerin yüksek kare hızlarını korurken ekranın sadece birkaç pikselini kaplayan nesneleri doğru bir şekilde tanımlamasını sağlar.
Çok ölçekli verileri işleme yeteneği, FPN'leri aşağıdakilere dayanan çeşitli sektörlerde vazgeçilmez kılmaktadır yapay zeka (AI).
FPN özellik çıkarma konusunda devrim yaratırken, yeni mimariler bu kavramı daha da geliştirmiştir.
Derin öğrenme kütüphaneleri ve Ultralytics , FPN'lerin karmaşıklıklarını dahili olarak yönetir. Aşağıdaki örnek, detect için özellik piramidi yapısını kullanan bir modeli nasıl yükleyeceğinizi gösterir.
from ultralytics import YOLO
# Load the YOLO26 model, which utilizes an advanced feature pyramid architecture
# The 'n' suffix stands for nano, a lightweight version of the model
model = YOLO("yolo26n.pt")
# Run inference on an image to detect objects ranging from small to large
# The model internally uses its FPN neck to aggregate features at multiple scales
results = model.predict("https://ultralytics.com/images/bus.jpg")
# Display the resulting bounding boxes and class labels
results[0].show()