Uzamsal hiyerarşilerde ve özellik ilişkilerinde öne çıkan, çığır açan bir sinir ağı mimarisi olan Capsule Networks'ü (CapsNets) keşfedin.
Kapsül Ağları (CapsNets), kapsül ağları alanında sofistike bir evrimi temsil etmektedir. derin öğrenme (DL) belirli konuları ele almak için tasarlanmıştır geleneksel olarak bulunan sınırlamalar Evrişimsel Sinir Ağları (CNN'ler). İlk olarak ünlü araştırmacı Geoffrey Hinton ve ekibi tarafından Meslektaşlarım, bu mimari nöronları "kapsül" olarak bilinen gruplar halinde organize eder. Standart nöronların aksine tek bir skaler aktivasyon değeri çıktısı verirken, bir kapsül bir vektör çıktısı verir. Bu vektör yönü ve uzunluğu bir nesne hakkında kesin konumu, boyutu, yönü ve dokusu gibi daha zengin bilgileri kodlamak için ağ. Bu yetenek, modelin özellikler arasındaki hiyerarşik ilişkileri daha iyi anlamasını sağlar, esasen görsel bir sahnenin yapısını bozmak için "ters grafikler" gerçekleştiriyor.
Bir CapsNet'in tanımlayıcı özelliği, farklı parçalar arasındaki mekansal ilişkileri koruma yeteneğidir bir nesnenin. Standart bir CNN'ler, katmanlar kullanarak bilgisayarla görme (CV) iş akışı genellikle boyutluluğu azaltmak için havuzlama işlemlerini kullanır, bu da tipik olarak kesin uzamsal verileri elde etmek için atar değişmezlik. Bununla birlikte, CapsNets "eşdeğişmezliği" hedefler, yani bir nesne hareket ederse veya dönerse görüntüde, kapsülün vektör temsili tanınmaz hale gelmek yerine orantılı olarak değişir.
Bu, "dinamik yönlendirme" veya "anlaşmaya göre yönlendirme" adı verilen bir süreçle gerçekleştirilir. Bunun yerine basitçe sinyalleri bir sonraki katmandaki tüm nöronlara iletirken, daha düşük seviyeli kapsüller çıktılarını daha yüksek seviyeli nöronlara gönderir. tahminleriyle "aynı fikirde" olan kapsüller. Örneğin, burnu tespit eden bir kapsül güçlü bir sinyal verecektir. mekansal yönelim hizalanırsa kapsülle yüzleşir, bu da kapsülün yapısal anlayışını güçlendirir. özellik çıkarma işlemi. Bu kavram ile ilgili araştırma makalesinde ayrıntılı olarak açıklanmıştır. Kapsüller Arası Dinamik Yönlendirme.
Her iki mimarinin de önemli bir yeri olsa da makine öğrenimi (ML), ayrışırlar görsel verileri nasıl işledikleri konusunda önemli ölçüde farklılık göstermektedir:
CapsNets hesaplama açısından yoğun olmasına ve aşağıdaki gibi optimize edilmiş mimarilerden daha az yaygın olarak benimsenmesine rağmen YOLO11belirli yüksek riskli alanlarda umut vaat ettiklerini göstermişlerdir. etki alanları:
CapsNets teorik avantajlar sunarken, modern endüstri standartları genellikle yüksek düzeyde optimize edilmiş CNN veya
Hız için dönüştürücü tabanlı modeller. Bununla birlikte, sınıflandırma görevlerini deneyebilirsiniz.
CapsNets-kullanarak ultralytics kütüphane. Aşağıdaki örnekte bir YOLO11
'in eğitimi gösterilmektedir
Hiyerarşik özellik tanımayı test etmek için yaygın bir oyun alanı olan MNIST veri kümesi üzerinde sınıflandırma modeli.
from ultralytics import YOLO
# Load a pretrained YOLO11 classification model
model = YOLO("yolo11n-cls.pt")
# Train on the MNIST dataset (automatically downloaded)
# This task parallels classic CapsNet benchmarks
results = model.train(data="mnist", epochs=5, imgsz=64)
# Run inference on a sample digit image
predict_results = model.predict("path/to/digit_image.png")
Kapsül Ağları üzerine yapılan araştırma, Kapsül Ağlarının gelişimini etkilemeye devam ediyor. Yapay zeka güvenliği ve yorumlanabilirlik. Açıkça modelleyerek parça-bütün ilişkileri, YZ'nin "kara kutu" doğasına kıyasla daha açıklanabilir bir yol sunarlar. bazı derin ağlar. Gelecekteki gelişmeler, bu kavramları aşağıdakilere entegre etmeye odaklanabilir 3 boyutlu nesne algılama ve gibi modellerin verimliliğini potansiyel olarak birleştirerek yönlendirme algoritmalarının hesaplama maliyetini YOLO26 ile kapsüllerin sağlam mekansal anlayışı.

.webp)