YOLO Vision 2025'i kaçırmayın!
25 Eylül 2025
10:00 — 18:00 BST
Hibrit etkinlik
Yolo Vision 2024
Sözlük

Kapsül Ağları (CapsNet)

Uzamsal hiyerarşilerde ve özellik ilişkilerinde öne çıkan, çığır açan bir sinir ağı mimarisi olan Capsule Networks'ü (CapsNets) keşfedin.

Genellikle CapsNet olarak kısaltılan Kapsül Ağları, Evrişimli Sinir Ağları'nın (CNN'ler) bazı temel sınırlamalarının üstesinden gelmek için tasarlanmış bir sinir ağı (NN) mimarisidir. Geoffrey Hinton ve ekibi tarafından tanıtılan CapsNet'ler, bir görüntüdeki özellikler arasındaki hiyerarşik ilişkileri daha iyi tanımayı amaçlar. Standart bir CNN'deki tek bir skaler değer çıkaran nöronların aksine, bir CapsNet'teki "kapsüller" bir vektör çıkarır ve bu da bir nesnenin duruşu (konum, boyut, yön), deformasyon ve doku gibi özellikleri hakkında daha ayrıntılı bilgi kodlamalarına olanak tanır. Bu yapı, onları bakış açısı ve yön değişikliklerine karşı doğal olarak daha dayanıklı hale getirir.

Kapsül Ağları Nasıl Çalışır?

CapsNet'lerin ardındaki temel yenilik, özellikler arasındaki uzamsal hiyerarşileri koruma yetenekleridir. Bir CNN bir yüzün ağız, burun ve göz gibi bileşenlerini tanıyabilirken, uzamsal ilişkilerini açıkça anlamaz. Ancak CapsNet'ler, bu parçaları ve göreli yönlerini tanımlamak için kapsüller adı verilen nöron gruplarını kullanır. Bu, alt düzey kapsüllerin çıktılarını, bulgularını en iyi şekilde açıklayabilen daha yüksek düzeydeki kapsüllere gönderdiği "dinamik yönlendirme" adı verilen bir süreç aracılığıyla elde edilir. Bu yaklaşım, genellikle önemli uzamsal bilgileri atan CNN'lerdeki havuzlama katmanlarından temelde farklıdır. Orijinal konsept, Kapsüller Arasında Dinamik Yönlendirme adlı makalede ayrıntılı olarak açıklanmıştır.

CapsNet'ler ve Evrişimli Sinir Ağları Karşılaştırması

CapsNet'ler ve CNN'ler arasındaki temel ayrım, uzamsal bilgileri ve soyutlamayı nasıl ele aldıklarında yatmaktadır.

  • Konumsal Değişmezlik: CNN'ler, havuzlama katmanları aracılığıyla konumsal değişmezliğe ulaşır, bu da kesin konum verilerinin kaybına yol açabilir. CapsNet'ler ise, bir nesnenin çerçeve boyunca hareket ederken poz bilgilerini anlayıp koruyabildikleri anlamına gelen "eşdeğişken" olacak şekilde tasarlanmıştır.
  • Veri Verimliliği: Gelişmiş iç yapıları sayesinde, CapsNet'ler genellikle veri açlığı çeken derin öğrenme (DL) modellerine kıyasla önemli ölçüde daha az eğitim verisi ile yüksek doğruluk elde edebilir.
  • Hiyerarşik Gösterim: CapsNet'ler, görsel varlıkların açık bir ayrıştırma ağacını oluşturur ve bu da bütünün parçalarının birleşimi olarak anlaşılmasını sağlar. Bu, standart CNN'lerin sunduğundan daha sezgisel bir nesne algılama gibi görevleri gerçekleştirme yoludur.

Ultralytics YOLO gibi modeller pratik bilgisayarlı görü (BG) görevlerinde hız ve doğruluk için son derece optimize edilmiş olsa da, CapsNet'ler görsel sahnelerin temel anlayışını geliştirmeye odaklanan alternatif bir mimari felsefesini temsil eder. Mevcut durumu anlamak için farklı nesne algılama modelleri arasındaki karşılaştırmaları keşfedebilirsiniz.

Gerçek Dünya Uygulamaları

CapsNet'ler hala öncelikle aktif bir araştırma alanı olmasına ve YOLO11 gibi yerleşik modellere göre daha az yaygın olarak dağıtılmasına rağmen, çeşitli alanlarda umut vaat etmiştir:

  1. Karakter Tanıma: CapsNet'ler, el yazısıyla yazılmış rakamlardan oluşan MNIST veri kümesinde son teknoloji sonuçlar elde ederek, yönlendirme ve stil varyasyonlarını etkili bir şekilde ele alma yeteneklerini sergiledi ve bazı kıyaslamalarda geleneksel görüntü sınıflandırma yaklaşımlarını geride bıraktı.
  2. Tıbbi Görüntü Analizi: Mekansal yapılandırmaları anlama konusundaki güçleri, onları tıbbi taramaları analiz etmek için uygun hale getirir. Örneğin, araştırmalar CapsNet'lerin beyin tümörü segmentasyonu gibi görevler için kullanımını araştırmıştır; burada anormalliklerin kesin şeklini ve konumunu belirlemek kritik öneme sahiptir. Bu, daha geniş tıbbi görüntü analizi alanına girer.

Diğer potansiyel uygulamalar arasında özellikle karmaşık sahneler için nesne tespitini iyileştirmek, robotikte sahne anlamayı geliştirmek ve otonom araçlar için daha sağlam algılama sistemlerine katkıda bulunmak yer almaktadır. Hesaplama talepleri bir zorluk olmaya devam ederken, devam eden araştırmalar CapsNet verimliliğini daha geniş makine öğrenimi (ML) uygulamaları ve PyTorch veya TensorFlow gibi çerçevelere potansiyel entegrasyon için optimize etmeyi amaçlamaktadır.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın
Bağlantı panoya kopyalandı