YOLO26 ile tanış: yeni nesil görsel AI.
Ultralytics
Ultralytics Sözlüğüne dön

Exploding Gradient

Patlayan gradyanların (exploding gradients) derin öğrenmeyi nasıl etkilediğini öğren ve Ultralytics YOLO26 için istikrarlı bir eğitim sağlamak üzere gradyan kırpma (gradient clipping) gibi kanıtlanmış azaltma tekniklerini keşfet.

Patlayan gradyanlar, yapay sinir ağlarının eğitimi sırasında, ağın ağırlıklarını güncellemek için kullanılan değerler olan gradyanların birikip aşırı büyümesiyle ortaya çıkar. Bu fenomen genellikle, ağın hatayı hesapladığı ve doğruluğu artırmak için kendini ayarladığı süreç olan backpropagation sırasında meydana gelir. Bu hata sinyalleri derin katmanlar boyunca tekrar tekrar çarpıldığında, üstel olarak büyüyebilirler ve bu da model weights üzerinde devasa güncellenmelere yol açar. Bu istikrarsızlık, modelin yakınsamasını engeller, öğrenme sürecini etkili bir şekilde bozar ve genellikle kayıp fonksiyonunun NaN (Sayı Değil) değerleri döndürmesine neden olur.

Link to this sectionİstikrarsızlığın Mekaniği#

Gradyanların neden patladığını anlamak için deep learning mimarilerinin yapısına bakmak faydalıdır. Recurrent Neural Networks (RNNs) veya çok derin Convolutional Neural Networks (CNNs) gibi derin ağlarda, erken katmanlar için gradyan, sonraki tüm katmanlardan gelen terimlerin çarpımıdır. Eğer bu terimler 1.0'dan büyükse, tekrarlanan çarpma işlemi bir kartopu etkisi yaratır.

Bu, optimizer aracının hata düzlemindeki en uygun çözümü ıskalayarak çok büyük adımlar attığı bir senaryo yaratır. Bu, Stochastic Gradient Descent (SGD) gibi standart algoritmalarla karmaşık veriler üzerinde eğitim yaparken karşılaşılan yaygın bir zorluktur.

Link to this sectionÖnleme ve Azaltma Teknikleri#

Modern yapay zeka geliştirme süreci, gradyanların kontrolden çıkmasını önlemek ve güvenilir bir model training sağlamak için birkaç standart teknik kullanır.

  • Gradyan Kırpma (Gradient Clipping): Bu en doğrudan müdahaledir. Bir eşik değeri belirlemeyi içerir. Eğer gradyan vektör normu bu eşiği aşarsa, limit değerle eşleşecek şekilde küçültülür (kırpılır). Bu teknik, natural language processing çerçevelerinde standarttır ve modelin istikrarlı bir şekilde öğrenmeye devam etmesini sağlar.
  • Batch Normalization: Her katmanın girdilerini sıfır ortalamalı ve bir varyanslı olacak şekilde normalleştirerek, Batch Normalization değerlerin çok büyümesini veya küçülmesini engeller. Bu yapısal değişiklik, optimizasyon düzlemini önemli ölçüde pürüzsüzleştirir.
  • Ağırlık Başlatma (Weight Initialization): Xavier initialization (veya Glorot başlatma) gibi uygun başlatma stratejileri, aktivasyonların varyansının katmanlar boyunca aynı kalması için başlangıç ağırlıklarını ayarlar.
  • Artık Bağlantılar (Residual Connections): Residual Networks (ResNets) gibi mimariler, atlama bağlantıları (skip connections) kullanır. Bu yollar, gradyanların her doğrusal olmayan aktivasyon fonksiyonundan geçmeden ağ boyunca akmasına olanak tanıyarak çarpımsal etkiyi hafifletir.
  • Gelişmiş İyileştiriciler (Advanced Optimizers): Adam optimizer gibi algoritmalar, bireysel parametreler için uyarlanabilir öğrenme oranları kullanır ve bu, değişken gradyan ölçeklerini temel SGD'den daha iyi yönetebilir.

Link to this sectionPatlayan ve Kaybolan Gradyanlar Karşılaştırması#

Patlayan gradyan sorunu genellikle onun karşıtı olan vanishing gradient ile birlikte tartışılır. Her ikisi de backpropagation'da kullanılan kalkülüsün zincir kuralından kaynaklanır, ancak zıt şekillerde tezahür ederler.

  • Patlayan Gradyan: Gradyanlar çok büyür (1.0'dan büyük). Bu, istikrarsız ağırlık güncellemelerine, sayısal taşmalara ve ıraksamaya yol açar. Genellikle gradyan kırpma ile düzeltilir.
  • Kaybolan Gradyan: Gradyanlar çok küçülür (1.0'dan küçük) ve sıfıra yaklaşır. Bu, ağın daha önceki katmanlarının öğrenmeyi tamamen durdurmasına neden olur. Bu durum genellikle ReLU gibi aktivasyon fonksiyonları veya sızdıran türevleri kullanılarak düzeltilir.

Link to this sectionGerçek Dünya Uygulamaları#

Gradyan büyüklüğünü yönetmek, çeşitli endüstrilerde sağlam yapay zeka çözümleri geliştirmek için kritik öneme sahiptir.

  1. Üretken Yapay Zeka ve Dil Modelleme: Large Language Models (LLMs) veya GPT-4 gibi modellerin eğitimi, son derece uzun metin dizilerinin işlenmesini gerektirir. Gradyan kırpma ve Katman Normalizasyonu gibi mekanizmalar olmasaydı, yüzlerce zaman adımı boyunca biriken gradyanlar eğitimin anında başarısız olmasına neden olurdu. İstikrarlı gradyanlar, modelin karmaşık dilbilgisi yapılarını ve bağlamı öğrenmesini sağlar.

  2. Gelişmiş Bilgisayarlı Görü: object detection gibi görevlerde, YOLO26 gibi modern modeller yüzlerce katmanlı derin mimariler kullanır. Ultralytics YOLO26, gelişmiş normalizasyon ve artık blokları yerel olarak içerir; bu sayede kullanıcılar COCO gibi devasa veri setlerinde, gradyan eşiklerini manuel olarak ayarlamak zorunda kalmadan eğitim yapabilirler. Bu istikrar, otomatik eğitim iş akışları için Ultralytics Platform kullanılırken vazgeçilmezdir.

Link to this sectionPython Kod Örneği#

Üst düzey kütüphaneler genellikle bunu otomatik olarak yönetse de, özel bir eğitim döngüsü sırasında PyTorch içinde gradyan kırpmayı açıkça uygulayabilirsin. Bu kod parçası, gradyanların optimizer ağırlıkları güncellemeden önce nasıl kırpılacağını gösterir.

import torch
import torch.nn as nn

# Define a simple model and optimizer
model = nn.Linear(10, 1)
optimizer = torch.optim.SGD(model.parameters(), lr=0.1)

# Simulate a training step
loss = torch.tensor(100.0, requires_grad=True)  # Simulated high loss
loss.backward()

# Clip gradients in place to a maximum norm of 1.0
# This prevents the weight update from being too drastic
torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=1.0)

# Update weights using the safe, clipped gradients
optimizer.step()

Explore solutions

Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.

Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.

Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.

Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.

Daha fazla bilgi edin
Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.

Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.

Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.

Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.

Daha fazla bilgi edin
Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.

Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.

Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.

Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.

Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.

Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.

Daha fazla bilgi edin

Yapay zekanın geleceğini birlikte inşa edelim!

Yolculuğuna makine öğreniminin geleceğiyle başla