Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Backbone

Derin öğrenmede backbone'ların rolünü keşfedin, ResNet ve ViT gibi en iyi mimarileri inceleyin ve gerçek dünya yapay zeka uygulamalarını öğrenin.

backbone , bir backbone sisteminin temel bileşenidir. derin öğrenme modeli, özellikle bilgisayar görüşü (CV). Olarak işlev görür için tasarlanmış birincil özellik çıkarma ağı görüntü gibi ham girdi verilerini alır ve bunları bir dizi üst düzey özelliğe dönüştürür. Bunlar özellik haritaları, kenarlar gibi temel kalıpları yakalar, dokular ve şekiller. Bu zengin temsil daha sonra ağın sonraki bölümleri tarafından aşağıdaki gibi görevleri yerine getirmek için kullanılır nesne algılama, görüntü segmentasyonu veya görüntü sınıflandırması. backbone , bir şirketin temelidir. öğrenen sinir ağı (NN) Bir görüntüdeki temel görsel unsurları "görmek".

Backbone'lar Nasıl Çalışır?

Tipik olarak, backbone derin bir Evrişimsel Sinir Ağı (CNN) gibi büyük ölçekli bir sınıflandırma veri kümesi üzerinde önceden eğitilmiş olan ImageNet. Bu ön eğitim, bir çeşit transfer öğrenmesi, ağın bir genel görsel özelliklerden oluşan geniş bir kütüphane. Yeni, özel bir görev için bir model geliştirirken, geliştiriciler genellikle bir Sıfırdan başlamak yerine önceden eğitilmiş backbone . Bu yaklaşım, aşağıdakiler için gereken süreyi önemli ölçüde kısaltır özel modelleri eğitir ve veri gereksinimlerini azaltır, genellikle daha iyi performansa yol açar. backbone tarafından çıkarılan özellikler daha sonra "boyun "a aktarılır ve Ağın "başı", daha fazla arıtma gerçekleştirir ve nihai çıktıyı oluşturur. Seçim backbone genellikle doğruluk, model boyutu ve için kritik bir faktör olan çıkarım gecikmesi başarmak gerçek zamanlı performans.

Aşağıdaki kod, önceden eğitilmiş bir Ultralytics YOLO11 etkin bir model içeren backbone, bir görüntü üzerinde çıkarım yapmak için yüklenebilir ve kullanılabilir.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model. Its architecture includes a powerful backbone.
model = YOLO("yolo11n.pt")

# Run inference. The backbone processes the image to extract features for detection.
results = model("https://ultralytics.com/images/bus.jpg")

# Display the detection results
results[0].show()

Yaygın Backbone Mimarileri

Omurgaların tasarımı önemli ölçüde gelişmiştir ve her yeni mimari performans ve verimlilik. En etkili backbone mimarilerinden bazıları şunlardır:

  • Artık Ağlar (ResNet): Microsoft Research tarafından tanıtılan ResNet modelleri şunları kullanır Kaybolan gradyanı azaltarak çok daha derin ağların eğitilmesini sağlamak için "atlama bağlantıları" Sorun.
  • EfficientNet: Google AI tarafından geliştirilen bu model ailesi modeller oluşturmak için ağ derinliğini, genişliğini ve çözünürlüğünü eşit olarak dengeleyen bileşik bir ölçeklendirme yöntemi kullanır. hem son derece doğru hem de hesaplama açısından verimlidir.
  • Vision Transformer (ViT): Bu mimari, son derece başarılı olan Transformatör modeli doğal dil işleme (NLP) görme görevleri için. ViT'ler görüntüleri yama dizileri olarak işler ve küresel bağlamı yakalamak için öz dikkat, bir geleneksel CNN'lerin yerel alıcı alanlarından ayrılır.
  • CSPNet (Çapraz Aşamalı Kısmi Ağ): Raporda ayrıntılı olarak açıklandığı üzere orijinal makalede, bu mimari öğrenme verimliliğini şu şekilde artırmaktadır Hesaplama darboğazlarını azaltmak için özellik haritalarını bölümleme. Birçok Ultralytics YOLO 'da önemli bir bileşendir modeller.

Backbone vs. Baş ve Boyun

Modern nesne algılama mimarileri model tipik olarak üç ana bölüme ayrılır:

  1. Backbone: Temel olarak rolü, girdiden çeşitli ölçeklerde özellik haritaları çıkarmaktır görüntü.
  2. Boyun: Bu bileşen backbone kafaya bağlar. Aşağıdaki özellikleri rafine eder ve bir araya getirir backbone, genellikle daha zengin bir temsil oluşturmak için farklı katmanlardan gelen bilgileri birleştirir. Yaygın bir örnek Özellik Piramidi Ağıdır (FPN).
  3. Algılama Kafası: Bu son ağın bir parçasıdır. Boyundan rafine edilmiş özellikleri alır ve ana görevi gerçekleştirir, örneğin sınırlayıcı kutular, sınıf etiketleri ve güven puanları her nesne için.

Bu nedenle backbone , tüm modelin temel yapı taşıdır. Çeşitli keşfedebilirsiniz Farklı mimari seçimlerin nasıl olduğunu görmek için YOLO model karşılaştırmaları performansı etkiler.

Gerçek Dünya Uygulamaları

Omurgalar, çeşitli sektörlerdeki sayısız yapay zeka uygulamasının temel bileşenleridir:

  1. Otonom Araçlar: İçinde sürücüsüz arabalar, ResNet gibi sağlam omurgalar veya EfficientNet varyantları, diğer araçları, yayaları ve diğer araçları detect etmek ve classify için kameralardan gelen görüntüleri işler. trafik sinyalleri. Bu özellik çıkarımı, aracın navigasyonu ve karar verme süreci için kritik öneme sahiptir. Waymo gibi şirketler tarafından geliştirilen sistemlerde gösterilmiştir.
  2. Tıbbi Görüntü Analizi: Sağlık hizmetleri yapay zeka çözümlerinde omurgalar kullanılır X-ışınları ve MRI'lar gibi tıbbi taramaları analiz etmek için. Örneğin, bir backbone göğüs röntgeninden özellikleri çıkararak araştırmasında vurgulandığı gibi, pnömoni belirtilerini belirlemeye yardımcı olur veya potansiyel tümörleri bulmak için bir CT taramasından Radyoloji: Yapay Zeka. Bu, radyologlara şu konularda yardımcı olur daha hızlı ve daha doğru teşhisler yapmak ve YOLO11 gibi modeller, aşağıdaki gibi özel görevler için ince ayar yapılabilir tümör tespiti.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın