Özellik Piramidi Ağlarının (FPN) YOLO11 ve modern CV sistemlerinde küçük ve büyük nesneler için doğruluğu artıran çok ölçekli nesne algılamayı nasıl sağladığını öğrenin.
Özellik Piramidi Ağı (FPN), derin öğrenme modellerinde, özellikle de nesne algılama mimarilerinde, çeşitli ölçeklerdeki nesnelerin algılanmasını iyileştirmek için tasarlanmış bir bileşendir. Herhangi bir görüntüde nesneler, boyutlarına ve kameraya olan uzaklıklarına bağlı olarak büyük veya küçük görünebilir. FPN, özelliklerin çok ölçekli bir temsilini verimli bir şekilde oluşturarak bu zorluğun üstesinden gelir ve bir modelin aynı anda küçük, uzaktaki bir arabayı ve büyük, yakındaki bir kamyonu yüksek doğrulukla tanımasını sağlar. Ana özellik çıkarıcı ile bir ağın nihai tahmin bileşeni arasında bir köprü veya "boyun" görevi görür.
Bir FPN, düşük çözünürlüklü, anlamsal olarak güçlü özellikleri yüksek çözünürlüklü, anlamsal olarak zayıf özelliklerle birleştirerek çalışır. Bu işlem tipik olarak iki yollu ve yanal bağlantıları olan bir yapı aracılığıyla gerçekleştirilir.
Tipik bir nesne algılama modelinde, mimari omurga, boyun ve kafaya bölünmüştür. FPN boyun bileşeni için popüler bir seçimdir. Birincil rolü, son algılama görevi için kullanılmadan önce omurga tarafından çıkarılan özellikleri toplamaktır. FPN'ler zengin, çok ölçekli bir özellik temsili sağlayarak YOLO11 gibi modellerin çok çeşitli nesne boyutlarında sağlam bir performans göstermesini sağlar. Bu yaklaşım, omurganın tek ileri geçişinde hesaplanan özellikleri yeniden kullandığından, bir görüntüyü birden fazla çözünürlükte ayrı ayrı işlemekten hesaplama açısından daha verimlidir. Çeşitli YOLO model karşılaştırmalarında görüldüğü gibi, birçok son teknoloji model bu konseptten yararlanmaktadır.
FPN'ler, çok ölçekli nesne algılamanın kritik olduğu birçok modern bilgisayarla görme (CV) uygulamasının ayrılmaz bir parçasıdır.
FPN önemli bir ilerlemeye işaret ederken, daha yeni mimariler bu konsepti geliştirmiştir. Kayda değer bir örnek, Google Research tarafından EfficientDet makalesinde tanıtılan Çift Yönlü Özellik Piramidi Ağıdır (BiFPN). FPN'nin basit yukarıdan aşağıya yolunun aksine, BiFPN çift yönlü bağlantılar (hem yukarıdan aşağıya hem de aşağıdan yukarıya) sunar ve ağın farklı giriş özelliklerinin önemini öğrenmesine olanak tanıyan ağırlıklı özellik füzyonu kullanır. EfficientDet ve YOLO11 gibi karşılaştırmalarda vurgulandığı gibi, bu genellikle daha iyi performans ve verimlilik sağlar. FPN temel bir kavram olsa da, BiFPN çok ölçekli özellik füzyonuna yönelik daha gelişmiş ve optimize edilmiş bir yaklaşımı temsil etmektedir.