Özellik Piramidi Ağlarının (FPN) YOLO11 ve modern CV sistemlerinde küçük ve büyük nesneler için doğruluğu artıran çok ölçekli nesne algılamayı nasıl sağladığını öğrenin.
Özellik Piramidi Ağı (FPN), modern teknolojide temel bir mimaridir. bilgisayarla görme (CV) tasarlanmış Farklı ölçeklerdeki nesneleri yüksek hassasiyetle detect etmek için. Geleneksel derin öğrenme (DL) modeller genellikle uzamsal çözünürlüğün kaybolduğu derin katmanlara dayandıkları için küçük nesneleri tanımakta zorlanmışlardır. FPN adresleri piramidal bir yapı inşa ederek özellik haritaları birleştiren düşük çözünürlüklü, anlamsal olarak güçlü özellikler ile yüksek çözünürlüklü, uzamsal olarak ayrıntılı özellikler. Bu tasarım bir birçoğunda önemli "boyun" nesne algılama mimarileriolarak bilinen ilk özellik çıkarıcıyı bağlayan backbone-son tahmin katmanlarına veya algılama kafası. FPN'ler farklı seviyeler arasında etkin bilgi paylaşımı sağlayarak aşağıdaki gibi modelleri mümkün kılar YOLO11 her iki küçüğü de doğru bir şekilde tanımlamak için, Tek bir görüntü içinde uzak ayrıntılar ve büyük, öne çıkan konular.
Özellik Piramidi Ağının temel yeniliği, görsel bilgiyi üç farklı yolla işlemesinde yatar aşamaları. Bu yapı, ağın birden fazla çözünürlükte görüntünün zengin bir temsilini korumasını sağlar büyük bir hesaplama maliyetine katlanmadan.
Gerçek dünya senaryolarında nesneler, kameraya olan uzaklıklarına bağlı olarak çok farklı boyutlarda görünür. A Standart sınıflandırıcı çerçeveyi dolduran bir arabayı kolayca tespit edebilir ancak arka plandaki bir yayayı detect edemeyebilir. FPN'ler bunu piramidin farklı seviyelerine tahmin görevleri atayarak çözer. Büyük nesneler en üstte algılanır düşük çözünürlüklü, derin özellik haritaları, küçük nesneler ise yüksek çözünürlüklü, birleştirilmiş özellik haritaları üzerinde tespit edilir. Bu kabiliyeti yüksek performansa ulaşmak için gereklidir. doğruluk ve geri çağırma farklı ortamlarda, FPN donanımlı modelleri eski tek ölçekli dedektörlerden ayırır.
Çok ölçekli verileri işleme yeteneği, FPN'leri aşağıdakilere dayanan çeşitli sektörlerde vazgeçilmez kılmaktadır yapay zeka (AI).
FPN özellik çıkarma konusunda devrim yaratırken, yeni mimariler bu kavramı geliştirmiştir. Dikkate değer bir evrim tarafından tanıtılan Çift Yönlü Özellik Piramidi Ağı (BiFPN) Google Araştırma EfficientDet mimarisinde. Aksine Tek yönlü (yukarıdan aşağıya) akan standart FPN'de BiFPN aşağıdan yukarıya yollar ekler ve her bir yol için belirli ağırlıklar öğrenir. bağlantı, daha önemli özelliklere öncelik verme. Bununla birlikte, standart FPN tasarımları ve bunların varyantları gibi yüksek performanslı modeller için temel YOLO11çoğu için hız ve doğruluğu etkili bir şekilde dengelemek gerçek zamanlı çıkarım görevler.
Modern kütüphaneler FPN'lerin karmaşıklığını dahili olarak ele alır. Aşağıdaki örnek, aşağıdakilerin kullanımını göstermektedir Ultralytics YOLO içeren paket Her boyuttaki nesneyi sorunsuz bir şekilde detect etmek için gelişmiş özellik piramidi yapıları.
from ultralytics import YOLO
# Load the YOLO11 model, which utilizes a feature pyramid architecture for multi-scale detection
model = YOLO("yolo11n.pt")
# Run inference on an image to detect objects ranging from small to large
results = model.predict("path/to/street_scene.jpg")
# Display the resulting bounding boxes and class labels
results[0].show()