Evrişimin bilgisayarlı görüde yapay zekayı nasıl güçlendirdiğini, nesne tespiti, görüntü tanıma ve tıbbi görüntüleme gibi görevleri hassasiyetle nasıl mümkün kıldığını öğrenin.
Konvolüsyon, modern teknolojinin temel yapı taşı olarak hizmet veren özel bir matematiksel işlemdir. bilgisayarla görme (CV) sistemleri. Bu bağlamda yapay zeka (AI), konvolüsyon, modellerin görüntüler gibi ızgara benzeri verileri, girdileri sistematik olarak filtreleyerek işlemesini sağlar anlamlı modeller. Manuel kural belirleme gerektiren geleneksel algoritmaların aksine, konvolüsyon otomatik olarak öğrenmek için sinir ağı Basit kenarlar ve dokulardan karmaşık nesne şekillerine kadar değişen özellik hiyerarşileri, biyolojik Beynin görsel korteksinde gözlemlenen süreçler.
İşlem, küçük bir sayı matrisini kaydırarak çalışır. çekirdek veya filtre, bir giriş görüntüsü boyunca. Her birinde konumunda, çekirdek örtüşen piksel değerleriyle eleman bazında bir çarpma işlemi gerçekleştirir ve sonuçları toplayarak tek bir çıkış pikseli üretir. Bu süreç bir belirli alanların altını çizen özellik haritası desenleri tespit edilir.
Bir konvolüsyonun nasıl davrandığını tanımlayan temel parametreler şunlardır:
Konvolüsyon, birincil motorun arkasındaki Evrişimsel Sinir Ağları (CNN'ler). Önemi iki ana özellikte yatmaktadır: parametre paylaşımı ve mekansal yerellik. Aynı şeyi kullanarak model ağırlıkları (kernel) tüm görüntü boyunca ağ hesaplama açısından verimli olmaya devam eder ve çeviri değişmezliği, Yani bir nesneyi karenin neresinde göründüğüne bakmaksızın tanıyabilir. Bu verimlilik, sofistike gibi mimariler YOLO11 üzerinde gerçek zamanlı çıkarım yapmak için güçlü GPU'lardan kısıtlı kaynaklara kadar çeşitli donanımlar Edge AI cihazları.
Konvolüsyonun faydası, görsel verilerin kullanıldığı neredeyse tüm sektörleri kapsar:
Konvolüsyonu tam bağlı (yoğun) katmanlardan ayırt etmek önemlidir. Tam bağlantılı bir katmanında, her giriş nöronu her çıkış nöronuna bağlanır, bu da hesaplama açısından pahalıdır ve uzamsal görüntülerin yapısı. Tersine, konvolüsyon uzamsal ilişkileri korur ve büyük ölçüde yüksek boyutlu parametrelerde aşırı uyumu önler veri. Yoğun katmanlar genellikle son sınıflandırma için kullanılırken, konvolüsyonel katmanlar ağır işlerin üstesinden gelir. özellik çıkarma.
Modern nesne dedektörlerinin konvolüsyonel mimarisini şu şekilde görselleştirebilirsiniz
ultralytics paketi. Aşağıdaki kod bir
YOLO11 modelini ve yapısını yazdırarak
Conv2d işleme için kullanılan katmanlar.
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Print the model architecture to observe Conv2d layers
# These layers perform the convolution operations to extract features
print(model.model)
