Backbone
Derin öğrenmede backbone'ların rolünü keşfedin, ResNet ve ViT gibi en iyi mimarileri inceleyin ve gerçek dünya yapay zeka uygulamalarını öğrenin.
backbone , bir backbone sisteminin temel bileşenidir.
derin öğrenme modeli, özellikle
bilgisayar görüşü (CV). Olarak işlev görür
için tasarlanmış birincil özellik çıkarma ağı
görüntü gibi ham girdi verilerini alır ve bunları bir dizi üst düzey özelliğe dönüştürür. Bunlar
özellik haritaları, kenarlar gibi temel kalıpları yakalar,
dokular ve şekiller. Bu zengin temsil daha sonra ağın sonraki bölümleri tarafından aşağıdaki gibi görevleri yerine getirmek için kullanılır
nesne algılama,
görüntü segmentasyonu veya
görüntü sınıflandırması. backbone , bir şirketin temelidir.
öğrenen sinir ağı (NN)
Bir görüntüdeki temel görsel unsurları "görmek".
Backbone'lar Nasıl Çalışır?
Tipik olarak, backbone derin bir
Evrişimsel Sinir Ağı (CNN)
gibi büyük ölçekli bir sınıflandırma veri kümesi üzerinde önceden eğitilmiş olan
ImageNet. Bu ön eğitim, bir çeşit
transfer öğrenmesi, ağın bir
genel görsel özelliklerden oluşan geniş bir kütüphane. Yeni, özel bir görev için bir model geliştirirken, geliştiriciler genellikle bir
Sıfırdan başlamak yerine önceden eğitilmiş backbone . Bu yaklaşım, aşağıdakiler için gereken süreyi önemli ölçüde kısaltır
özel modelleri eğitir ve veri gereksinimlerini azaltır, genellikle
daha iyi performansa yol açar. backbone tarafından çıkarılan özellikler daha sonra "boyun "a aktarılır ve
Ağın "başı", daha fazla arıtma gerçekleştirir ve nihai çıktıyı oluşturur. Seçim
backbone genellikle doğruluk, model boyutu ve
için kritik bir faktör olan çıkarım gecikmesi
başarmak
gerçek zamanlı performans.
Aşağıdaki kod, önceden eğitilmiş bir
Ultralytics YOLO11 etkin bir model içeren
backbone, bir görüntü üzerinde çıkarım yapmak için yüklenebilir ve kullanılabilir.
from ultralytics import YOLO
# Load a pre-trained YOLO11 model. Its architecture includes a powerful backbone.
model = YOLO("yolo11n.pt")
# Run inference. The backbone processes the image to extract features for detection.
results = model("https://ultralytics.com/images/bus.jpg")
# Display the detection results
results[0].show()
Yaygın Backbone Mimarileri
Omurgaların tasarımı önemli ölçüde gelişmiştir ve her yeni mimari performans ve
verimlilik. En etkili backbone mimarilerinden bazıları şunlardır:
-
Artık Ağlar (ResNet):
Microsoft Research tarafından tanıtılan ResNet modelleri şunları kullanır
Kaybolan gradyanı azaltarak çok daha derin ağların eğitilmesini sağlamak için "atlama bağlantıları"
Sorun.
-
EfficientNet: Google AI tarafından geliştirilen bu model ailesi
modeller oluşturmak için ağ derinliğini, genişliğini ve çözünürlüğünü eşit olarak dengeleyen bileşik bir ölçeklendirme yöntemi kullanır.
hem son derece doğru hem de hesaplama açısından verimlidir.
-
Vision Transformer (ViT):
Bu mimari, son derece başarılı olan
Transformatör modeli
doğal dil işleme (NLP)
görme görevleri için. ViT'ler görüntüleri yama dizileri olarak işler ve
küresel bağlamı yakalamak için öz dikkat, bir
geleneksel CNN'lerin yerel alıcı alanlarından ayrılır.
-
CSPNet (Çapraz Aşamalı Kısmi Ağ): Raporda ayrıntılı olarak açıklandığı üzere
orijinal makalede, bu mimari öğrenme verimliliğini şu şekilde artırmaktadır
Hesaplama darboğazlarını azaltmak için özellik haritalarını bölümleme. Birçok Ultralytics YOLO
'da önemli bir bileşendir
modeller.
Backbone vs. Baş ve Boyun
Modern
nesne algılama mimarileri
model tipik olarak üç ana bölüme ayrılır:
-
Backbone: Temel olarak rolü, girdiden çeşitli ölçeklerde özellik haritaları çıkarmaktır
görüntü.
-
Boyun: Bu bileşen backbone kafaya bağlar. Aşağıdaki özellikleri rafine eder ve bir araya getirir
backbone, genellikle daha zengin bir temsil oluşturmak için farklı katmanlardan gelen bilgileri birleştirir. Yaygın bir örnek
Özellik Piramidi Ağıdır (FPN).
-
Algılama Kafası: Bu son
ağın bir parçasıdır. Boyundan rafine edilmiş özellikleri alır ve ana görevi gerçekleştirir, örneğin
sınırlayıcı kutular, sınıf etiketleri ve güven puanları
her nesne için.
Bu nedenle backbone , tüm modelin temel yapı taşıdır. Çeşitli keşfedebilirsiniz
Farklı mimari seçimlerin nasıl olduğunu görmek için YOLO model karşılaştırmaları
performansı etkiler.
Gerçek Dünya Uygulamaları
Omurgalar, çeşitli sektörlerdeki sayısız yapay zeka uygulamasının temel bileşenleridir:
-
Otonom Araçlar: İçinde
sürücüsüz arabalar, ResNet gibi sağlam omurgalar
veya EfficientNet varyantları, diğer araçları, yayaları ve diğer araçları detect etmek ve classify için kameralardan gelen görüntüleri işler.
trafik sinyalleri. Bu özellik çıkarımı, aracın navigasyonu ve karar verme süreci için kritik öneme sahiptir.
Waymo gibi şirketler tarafından geliştirilen sistemlerde gösterilmiştir.
-
Tıbbi Görüntü Analizi:
Sağlık hizmetleri yapay zeka çözümlerinde omurgalar kullanılır
X-ışınları ve MRI'lar gibi tıbbi taramaları analiz etmek için. Örneğin, bir backbone göğüs röntgeninden özellikleri çıkararak
araştırmasında vurgulandığı gibi, pnömoni belirtilerini belirlemeye yardımcı olur veya potansiyel tümörleri bulmak için bir CT taramasından
Radyoloji: Yapay Zeka. Bu, radyologlara şu konularda yardımcı olur
daha hızlı ve daha doğru teşhisler yapmak ve YOLO11 gibi modeller, aşağıdaki gibi özel görevler için ince ayar yapılabilir
tümör tespiti.