Sözlük

Artık Ağlar (ResNet)

ResNets'in kaybolan gradyanları çözerek, görüntü analizi, NLP ve daha fazlası için ultra derin ağlar sağlayarak derin öğrenmede nasıl devrim yarattığını keşfedin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Genellikle ResNet olarak bilinen Artık Ağlar, Kaiming He ve Microsoft Research'teki meslektaşları tarafından geliştirilen çığır açan bir konvolüsyonel sinir ağı (CNN) mimarisini temsil etmektedir. 2015 yılında yayınladıkları"Görüntü Tanıma için Derin Artık Öğrenme" başlıklı makalede tanıtılan ResNet, derin öğrenmede (DL) karşılaşılan büyük bir zorluğu ele almıştır: bozulma sorunu. Bu sorun, çok derin bir ağa daha fazla katman eklendiğinde, daha derin modellerin daha iyi performans göstermesi beklentisinin aksine, daha yüksek eğitim hatasına yol açtığında ortaya çıkar. ResNet'in yeniliği, daha önce mümkün olandan çok daha derin ağların başarılı bir şekilde eğitilmesini sağlayarak çeşitli bilgisayarla görme (CV) görevlerinde en son teknolojiyi önemli ölçüde ilerletti.

ResNets Nasıl Çalışır? Bağlantıları Atla

ResNet'in arkasındaki temel fikir "atlama bağlantıları" ya da "kısayol bağlantıları "nın devreye sokulmasıdır. Geleneksel derin ağlarda her katman bir sonrakini sırayla besler. ResNet bunu, bir katman bloğunun girdisinin o bloğun çıktısına eklenmesine izin vererek değiştirir. Bu, katmanların altta yatan tüm eşlemeyi doğrudan öğrenmeye çalışmak yerine bir artık eşleme (girdi ile istenen çıktı arasındaki fark) öğrendiği bir "artık blok" oluşturur. Optimum fonksiyon bir kimlik eşlemesine (çıktının girdiyle aynı olması gereken) daha yakınsa, ağın kalıntıyı sıfır yapmayı öğrenmesi (yığılmış katmanların ağırlıklarını sıfıra doğru sürerek), doğrusal olmayan katmanlar aracılığıyla kimlik eşlemesinin kendisini öğrenmekten daha kolaydır.

Bu atlama bağlantıları , geriye yayılma sırasında gradyan akışını kolaylaştırarak genellikle çok derin ağları rahatsız eden kaybolan gradyan sorununu hafifletir. Bu, yüzlerce hatta binlerce katmana sahip ağların oluşturulmasına ve etkili bir şekilde eğitilmesine olanak tanıyarak ImageNet gibi zorlu karşılaştırmalı veri kümelerinde dikkate değer doğruluk iyileştirmeleri elde edilmesini sağlar.

Anahtar Kavramlar

  • Artık Blok: Bir ResNet'in temel yapı birimi olup birkaç evrişimli katman ve bloğun girişini çıkışına ekleyen bir atlama bağlantısından oluşur.
  • Atlama Bağlantısı (Kısayol): Bir veya daha fazla katmanı atlayarak daha kolay gradyan akışı ve kimlik eşleme öğrenimi sağlayan doğrudan bir bağlantı.
  • Kimlik Eşleme: Bir katman veya blok girdisini değiştirmeden geçirdiğinde. Atlama bağlantıları, gerektiğinde artık blokların kimlik eşlemelerine yaklaşmasını kolaylaştırır.
  • Bozulma Problemi: ResNet'in artık öğrenimi ile ele alınan, daha derin ağların daha sığ muadillerine göre daha kötü performans gösterdiği (daha yüksek eğitim ve test hatası) olgusu.

Bilgisayarlı Görüde Uygunluk

ResNet mimarileri, görüntü sınıflandırmanın ötesinde birçok bilgisayarla görme görevi için hızla standart bir omurga haline geldi:

  • Nesne Algılama: Faster R-CNN ve sistemlerde kullanılan bazı varyantlar gibi birçok algılama modeli Ultralytics YOLO modelleri (örn, RT-DETR), özellik çıkarımı için ResNet omurgalarını kullanır(Nesne Algılama sözlüğü).
  • Görüntü Segmentasyonu: Mask R-CNN gibi mimariler, piksel düzeyinde sınıflandırma için gerekli zengin uzamsal özellikleri çıkarmak için genellikle ResNet kullanır(Görüntü Segmentasyonu sözlüğü).

Görüntülerden güçlü özellikler çıkarma yeteneği, onu çok yönlü ve yaygın olarak benimsenen bir mimari haline getirmiştir.

Gerçek Dünya Uygulamaları

  1. Tıbbi Görüntü Analizi: ResNet'ler, tümörler veya diyabetik retinopati gibi anomalileri tespit etmek için tıbbi taramaların (X-ışınları, CT, MRI) analizinde yaygın olarak kullanılmaktadır. ResNet'in sağladığı derinlik, modelin hastalıkların göstergesi olan karmaşık kalıpları öğrenmesini sağlayarak radyologlara tanı koymada yardımcı olur. Radyolojide Yapay Zeka 'daki ilgili uygulamaları keşfedebilir ve tıbbi görüntü analizindeki alan hakkında daha fazla bilgi edinebilirsiniz. NIH'in Bridge2AI programı gibi girişimler genellikle bu tür gelişmiş modellerden yararlanır.
  2. Otonom Sürüş: Sürücüsüz araçlardaki algılama sistemleri genellikle yayaların, araçların, trafik ışıklarının ve yol işaretlerinin gerçek zamanlı nesne tespiti ve tanınması için ResNet tabanlı mimarilere dayanır. Derin ResNet modellerinin sağlamlığı ve doğruluğu, karmaşık sürüş senaryolarında güvenlik için çok önemlidir(Otomotiv çözümlerinde yapay zeka). Waymo gibi şirketler, sağlam algılama sistemlerinin önemini detaylandırıyor.

Diğer Mimarilerle Karşılaştırma

  • VGGNet: VGGNet, basit 3x3 konvolüsyonlar kullanarak derinliğin faydasını gösterirken, kaybolan gradyanlar nedeniyle çok derin ağlar için yakınsama ile mücadele etti. ResNet bu sınırlamayı doğrudan ele aldı(Vision AI History blogu, VGG makalesi).
  • DenseNet: DenseNet'ler her katmanı diğer tüm katmanlara ileri beslemeli bir şekilde bağlayarak özelliklerin yeniden kullanımını teşvik eder. Bu, ResNet'in eklemeli atlama bağlantılarından farklıdır. Her ikisi de bilgi akışını iyileştirmeyi amaçlar ancak farklı mekanizmalar kullanır(DenseNet makalesi).
  • Görme Dönüştürücüler (ViT): ViT gibi daha yeni mimariler, ResNet'in evrişimsel yaklaşımından farklı olarak dikkat mekanizmalarını kullanır ve ResNet'ler etkili ve yaygın olarak kullanılmaya devam etse de birçok kıyaslamada rekabetçi veya üstün performans göstermiştir.

Araçlar ve Uygulama

ResNet mimarileri, aşağıdaki gibi büyük derin öğrenme çerçevelerinde kolayca kullanılabilir PyTorchPyTorch resmi sitesi) ve TensorFlowTensorFlow resmi sitesi). Genellikle ImageNet üzerinde eğitilen önceden eğitilmiş modellere torchvision gibi kütüphaneler aracılığıyla erişilebilir ve bu da etkili transfer öğrenimini mümkün kılar. Ultralytics HUB gibi platformlar, kullanıcıların özel modelleri eğitmek ve dağıtmak için ResNet tabanlı olanlar da dahil olmak üzere çeşitli mimarilerden yararlanmasına olanak tanırUltralytics HUB belgeleri). CNN'ler hakkında daha fazla eğitim kaynağını Stanford CS231n 'de veya DeepLearning.AI tarafından sunulanlar gibi kurslarda bulabilirsiniz.

Tümünü okuyun