Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Evrişimsel Sinir Ağı (CNN)

Evrişimsel Sinir Ağlarının (CNN'ler) sağlık hizmetlerinde, sürücüsüz arabalarda ve daha fazlasında yapay zekayı güçlendirerek bilgisayarlı görüşte nasıl devrim yarattığını keşfedin.

Convolutional Neural Network (CNN), ızgara benzeri bir topolojiye sahip verileri, özellikle dijital görüntüleri işlemek için tasarlanmış özel bir derin öğrenme mimarisidir. Görsel korteksin biyolojik yapısından esinlenerek geliştirilen CNN'ler, girdi verileri içindeki uzamsal ilişkileri benzersiz bir şekilde koruma yeteneğine sahiptir. Görüntüyü uzun bir sayı listesine dönüştüren geleneksel sinir ağlarının aksine, CNN'ler görüntünün küçük, üst üste binen bölgelerini analiz ederek basit kenar ve dokulardan karmaşık şekil ve nesnelere kadar özelliklerin hiyerarşisini otomatik olarak öğrenir. Bu yetenek, CNN'leri modern bilgisayar görme (CV) sistemlerinin temel teknolojisi haline getirir. CNN'ler, görüntüleri ve diğer görsel verileri işleyen sistemlerde yaygın olarak kullanılır.

Evrişimsel Sinir Ağları Nasıl Çalışır?

The power of a CNN lies in its ability to reduce a complex image into a form that is easier to process without losing features critical for getting a good prediction. This is achieved through a pipeline of distinct layers that transform the input volume into an output class or value:

  • Convolution Layer: This is the core building block. It uses a set of learnable filters (or kernels) that slide over the input image like a flashlight. At each position, the filter performs a mathematical operation called convolution, creating a feature map that highlights specific patterns such as horizontal lines or color gradients.
  • Activation Function: After convolution, a non-linear function is applied to the output. The most common choice is the ReLU (Rectified Linear Unit), which turns negative pixel values to zero. This introduces non-linearity, allowing the network to learn complex patterns beyond simple linear relationships.
  • Havuzlama Katmanı: Aşağı örnekleme olarak da bilinen bu katman, özellik haritalarının boyutunu azaltır. Maksimum havuzlama gibi teknikler, bir bölgedeki yalnızca en önemli özellikleri (en yüksek değerleri) tutar, bu da hesaplama yükünü azaltır ve aşırı uyumlamayı önlemeye yardımcı olur. Özellik Haritalama Katmanı: Bu katman, özellik haritalarını birleştirir ve
  • Tam Bağlantılı Katman: Son aşamada, işlenen özellikler düzleştirilir ve standart bir sinir ağına (NN) beslenir. Bu katman, önceki katmanlar tarafından tanımlanan üst düzey özellikleri kullanarak "kedi" veya "köpek" gibi nihai bir sınıflandırma veya tahmin yapar.

Gerçek Dünya Uygulamaları

CNN'ler, görsel görevleri insanüstü bir doğrulukla otomatikleştirerek endüstrileri dönüştürdü. .

  • Medical Diagnostics: In healthcare, CNNs assist radiologists by identifying anomalies in medical scans faster than the human eye. For example, deep learning models analyze MRI and CT scans to detect early signs of tumors or fractures. Research involving AI in radiology highlights how these tools improve diagnostic consistency and speed.
  • Otonom Sistemler: Otonom araçlar, çevrelerini algılamak için büyük ölçüde CNN'lere güvenmektedir. YOLO26 gibi modeller, verimli CNN omurgalarını kullanarak gerçek zamanlı nesne algılama gerçekleştirir, yayaları, trafik işaretlerini ve diğer araçları tanımlayarak anlık sürüş kararları verir.

CNN'ler ve Görme Dönüştürücüler (ViT)

CNN'ler uzun süredir görme görevleri için standart olsa da, Vision Transformer (ViT) adlı yeni bir mimari ortaya çıkmıştır.

  • CNNs process images using local features and are highly efficient on smaller datasets due to their "inductive bias" (they assume nearby pixels are related). They excel in scenarios requiring real-time inference on edge devices.
  • ViT'ler görüntüleri parçalara ayırır ve bunları global self-attention mekanizmaları kullanarak işler. Bu, görüntüdeki uzun menzilli bağımlılıkları yakalamalarını sağlar, ancak genellikle etkili bir şekilde eğitmek için büyük veri setleri ve daha fazla hesaplama gücü gerektirir.

Uygulama Örneği

Modern kütüphaneler, CNN tabanlı modellerin kullanımını kolaylaştırır. ultralytics paket, hızlı çıkarım için yüksek düzeyde optimize edilmiş CNN mimarileri içeren YOLO26 gibi son teknoloji modellere erişim sağlar.

Aşağıdaki örnek, önceden eğitilmiş bir CNN modelini yüklemeyi ve bir tahmin çalıştırmayı göstermektedir:

from ultralytics import YOLO

# Load a YOLO26 model, which uses an advanced CNN architecture
model = YOLO("yolo26n.pt")

# Run inference on an image to identify objects
results = model("https://ultralytics.com/images/bus.jpg")

# Display the prediction results
results[0].show()

Gelişim Araçları

Developing CNNs is supported by a robust ecosystem of open-source tools. Engineers typically use frameworks such as PyTorch or TensorFlow to build custom architectures. These libraries provide the low-level tensor operations required for convolution and backpropagation.

For teams looking to streamline the lifecycle of computer vision projects—from data collection to deployment—the Ultralytics Platform offers a comprehensive solution. It simplifies complex workflows, allowing developers to focus on applying CNNs to solve business problems rather than managing infrastructure. Additionally, models can be exported to formats like ONNX or TensorRT for high-performance deployment on edge devices.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın