Evrişimin bilgisayarlı görüde yapay zekayı nasıl güçlendirdiğini, nesne tespiti, görüntü tanıma ve tıbbi görüntüleme gibi görevleri hassasiyetle nasıl mümkün kıldığını öğrenin.
Evrişim, özellikle bilgisayar görüşü (CV) alanında, derin öğrenme (DL)'de temel bir işlemdir. Evrişimsel Sinir Ağları'nın (CNN'ler) birincil yapı taşı olarak hizmet eder ve modellerin görüntüler gibi ızgara benzeri verilerden hiyerarşik özellikleri otomatik ve verimli bir şekilde öğrenmesini sağlar. İşlem, kenarlar, dokular veya şekiller gibi belirli desenleri vurgulayan özellik haritaları üretmek için bir çekirdek olarak bilinen küçük bir filtrenin bir giriş görüntüsü üzerinde kaydırılmasını içerir. Bu yöntem, hayvan görsel korteksinin organizasyonundan esinlenmiştir ve veri noktaları arasındaki mekansal ilişkilerin önemli olduğu görevler için oldukça etkilidir.
Temelinde, evrişim iki bilgi kümesini birleştiren matematiksel bir işlemdir. Bir CNN bağlamında, girdi verilerini (bir görüntünün piksel değerleri) bir çekirdekle birleştirir. Çekirdek, bir özellik dedektörü görevi gören küçük bir ağırlık matrisidir. Bu çekirdek, girdi görüntüsünün yüksekliği ve genişliği boyunca kayar ve her konumda, görüntünün örtüşen kısmı ile öğe bazında bir çarpım gerçekleştirir. Sonuçlar, çıktı özellik haritasında tek bir piksel oluşturmak için toplanır. Bu kaydırma işlemi tüm görüntü boyunca tekrarlanır.
Bir CNN, farklı çekirdekler kullanarak çok çeşitli özellikleri tespit etmeyi öğrenebilir. Erken katmanlar kenarlar ve renkler gibi basit desenleri tanımayı öğrenebilirken, daha derin katmanlar gözler, tekerlekler veya metin gibi daha karmaşık yapıları tanımlamak için bu temel özellikleri birleştirebilir. Bir görsel özellikler hiyerarşisi oluşturma yeteneği, CNN'lere görüntü görevlerinde güç veren şeydir. Bu süreç, iki temel ilke sayesinde hesaplama açısından verimli hale getirilmiştir:
Evrişim, modern bilgisayar görüşünün temel taşıdır. Ultralytics YOLO gibi modeller, güçlü özellik çıkarımı için omurga mimarilerinde evrişimsel katmanları yoğun bir şekilde kullanır. Bu, nesne tespiti ve görüntü segmentasyonundan daha karmaşık görevlere kadar geniş bir uygulama yelpazesini mümkün kılar. Evrişimin verimliliği ve etkinliği, onu görüntüleri ve diğer mekansal verileri işlemek için başvurulan yöntem haline getirmiş ve vizyon modellerinin tarihi gibi kaynaklarda ayrıntılı olarak açıklanan birçok son teknoloji mimarinin temelini oluşturmuştur.
Evrişimi diğer sinir ağı işlemlerinden ayırmak faydalıdır:
Evrişimi kullanan modelleri uygulamak ve eğitmek, çeşitli derin öğrenme çerçeveleri tarafından kolaylaştırılır. PyTorch (PyTorch resmi sitesi) ve TensorFlow (TensorFlow resmi sitesi) gibi kütüphaneler, CNN'ler oluşturmak için sağlam araçlar sağlar. Keras gibi üst düzey API'ler, geliştirmeyi daha da basitleştirir.
Kolaylaştırılmış bir deneyim için, Ultralytics HUB gibi platformlar, kullanıcıların veri kümelerini yönetmelerine, model eğitimi gerçekleştirmelerine ve YOLO11 gibi güçlü modelleri kolaylıkla dağıtmalarına olanak tanır. Evrişim, çekirdek boyutu, adım aralığı, dolgu ve ortaya çıkan alıcı alan gibi temel kavramları anlamak, etkili model eğitimi ve mimari tasarımı için çok önemlidir.