YOLO Vision 2025'i kaçırmayın!
25 Eylül 2025
10:00 — 18:00 BST
Hibrit etkinlik
Yolo Vision 2024
Sözlük

Evrişim

Evrişimin bilgisayarlı görüde yapay zekayı nasıl güçlendirdiğini, nesne tespiti, görüntü tanıma ve tıbbi görüntüleme gibi görevleri hassasiyetle nasıl mümkün kıldığını öğrenin.

Evrişim, özellikle bilgisayar görüşü (CV) alanında, derin öğrenme (DL)'de temel bir işlemdir. Evrişimsel Sinir Ağları'nın (CNN'ler) birincil yapı taşı olarak hizmet eder ve modellerin görüntüler gibi ızgara benzeri verilerden hiyerarşik özellikleri otomatik ve verimli bir şekilde öğrenmesini sağlar. İşlem, kenarlar, dokular veya şekiller gibi belirli desenleri vurgulayan özellik haritaları üretmek için bir çekirdek olarak bilinen küçük bir filtrenin bir giriş görüntüsü üzerinde kaydırılmasını içerir. Bu yöntem, hayvan görsel korteksinin organizasyonundan esinlenmiştir ve veri noktaları arasındaki mekansal ilişkilerin önemli olduğu görevler için oldukça etkilidir.

Evrişim (Convolution) Nasıl Çalışır?

Temelinde, evrişim iki bilgi kümesini birleştiren matematiksel bir işlemdir. Bir CNN bağlamında, girdi verilerini (bir görüntünün piksel değerleri) bir çekirdekle birleştirir. Çekirdek, bir özellik dedektörü görevi gören küçük bir ağırlık matrisidir. Bu çekirdek, girdi görüntüsünün yüksekliği ve genişliği boyunca kayar ve her konumda, görüntünün örtüşen kısmı ile öğe bazında bir çarpım gerçekleştirir. Sonuçlar, çıktı özellik haritasında tek bir piksel oluşturmak için toplanır. Bu kaydırma işlemi tüm görüntü boyunca tekrarlanır.

Bir CNN, farklı çekirdekler kullanarak çok çeşitli özellikleri tespit etmeyi öğrenebilir. Erken katmanlar kenarlar ve renkler gibi basit desenleri tanımayı öğrenebilirken, daha derin katmanlar gözler, tekerlekler veya metin gibi daha karmaşık yapıları tanımlamak için bu temel özellikleri birleştirebilir. Bir görsel özellikler hiyerarşisi oluşturma yeteneği, CNN'lere görüntü görevlerinde güç veren şeydir. Bu süreç, iki temel ilke sayesinde hesaplama açısından verimli hale getirilmiştir:

  • Parametre Paylaşımı: Aynı çekirdek tüm görüntü boyunca kullanılır, bu da tamamen bağlı bir ağa kıyasla öğrenilebilir parametrelerin toplam sayısını önemli ölçüde azaltır. Bu verimli parametre kullanımı kavramı, modelin daha iyi genellemesine de yardımcı olur.
  • Konumsal Yerellik: İşlem, birbirine yakın piksellerin uzak olanlardan daha güçlü bir şekilde ilişkili olduğunu varsayar; bu, doğal görüntüler için oldukça etkili olan güçlü bir endüktif önyargıdır.

Derin Öğrenmede Önemi

Evrişim, modern bilgisayar görüşünün temel taşıdır. Ultralytics YOLO gibi modeller, güçlü özellik çıkarımı için omurga mimarilerinde evrişimsel katmanları yoğun bir şekilde kullanır. Bu, nesne tespiti ve görüntü segmentasyonundan daha karmaşık görevlere kadar geniş bir uygulama yelpazesini mümkün kılar. Evrişimin verimliliği ve etkinliği, onu görüntüleri ve diğer mekansal verileri işlemek için başvurulan yöntem haline getirmiş ve vizyon modellerinin tarihi gibi kaynaklarda ayrıntılı olarak açıklanan birçok son teknoloji mimarinin temelini oluşturmuştur.

Gerçek Dünya Uygulamaları

  • Tıbbi Görüntü Analizi: Sağlık hizmetleri için yapay zekada, CNN'ler MR veya BT gibi tıbbi taramaları analiz etmek için evrişimler kullanır. Çekirdekler, radyologların daha hızlı ve daha doğru teşhisler koymasına yardımcı olarak, tümörlerin veya diğer anormalliklerin karakteristik spesifik dokularını ve şekillerini tespit etmek için eğitilebilir. Radiology: Artificial Intelligence gibi dergilerde bu gelişmeler hakkında daha fazla bilgi edinebilirsiniz.
  • Otonom Araçlar: Sürücüsüz otomobiller, çevrelerini algılamak için CNN'lere güvenir. Evrişimler, yayaları, diğer araçları, trafik şeritlerini ve yol işaretlerini belirlemek için kameralardan gelen girdiyi gerçek zamanlı olarak işler. Bu, otomobilin sisteminin çevresini kapsamlı bir şekilde anlamasını ve Waymo gibi şirketler tarafından geliştirilen teknolojide görüldüğü gibi güvenli bir şekilde gezinmesini sağlar.

Evrişim ve İlgili Kavramlar

Evrişimi diğer sinir ağı işlemlerinden ayırmak faydalıdır:

  • Tam Bağlantılı Katmanlar: Tam bağlantılı bir katmanda, her nöron önceki katmandaki her nörona bağlıdır. Görüntüler için bu, uzamsal yapıyı göz ardı ettiği ve çok sayıda parametreye yol açtığı için oldukça verimsizdir. Yerel bağlantısı ve parametre paylaşımı ile evrişim, çok daha ölçeklenebilir ve görüntü verileri için daha uygundur.
  • Görüntü İşleme Dönüştürücüleri (ViT): CNN'lerin yerel özellik tespitinden farklı olarak, Görüntü İşleme Dönüştürücüleri, farklı görüntü parçaları arasındaki küresel ilişkileri modellemek için bir kendiliğinden dikkat mekanizması kullanır. Güçlü olmasına rağmen, ViT'ler tipik olarak bu ilişkileri sıfırdan öğrenmek için daha büyük veri kümeleri gerektirirken, evrişimlerin endüktif önyargısı onları daha veri açısından verimli hale getirir. RT-DETR gibi hibrit modeller, her iki yaklaşımın güçlü yönlerini birleştirmeyi amaçlar.

Araçlar ve Eğitim

Evrişimi kullanan modelleri uygulamak ve eğitmek, çeşitli derin öğrenme çerçeveleri tarafından kolaylaştırılır. PyTorch (PyTorch resmi sitesi) ve TensorFlow (TensorFlow resmi sitesi) gibi kütüphaneler, CNN'ler oluşturmak için sağlam araçlar sağlar. Keras gibi üst düzey API'ler, geliştirmeyi daha da basitleştirir.

Kolaylaştırılmış bir deneyim için, Ultralytics HUB gibi platformlar, kullanıcıların veri kümelerini yönetmelerine, model eğitimi gerçekleştirmelerine ve YOLO11 gibi güçlü modelleri kolaylıkla dağıtmalarına olanak tanır. Evrişim, çekirdek boyutu, adım aralığı, dolgu ve ortaya çıkan alıcı alan gibi temel kavramları anlamak, etkili model eğitimi ve mimari tasarımı için çok önemlidir.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın
Bağlantı panoya kopyalandı