Ultralytics YOLO26, ProgLoss, STAL ve MuSGD ile nasıl daha akıllı eğitilir
Ultralytics YOLO26'nın ProgLoss (Progressive Loss Balancing), STAL (Small-Target-Aware Label Assignment) ve MuSGD optimize edicisi kullanarak nasıl daha güvenilir bir şekilde eğitildiğini öğren.

Last week, we released Ultralytics YOLO26, setting a new standard for edge-first, real-time computer vision models. Similar to previous Ultralytics YOLO models, such as Ultralytics YOLO11, YOLO26 supports the core computer vision tasks users are familiar with, including object detection, instance segmentation, and pose estimation.

Şekil 1. YOLO26'nın bir görüntüdeki nesneleri segmentlere ayırmak için kullanıldığına dair bir örnek.
Ancak YOLO26 sadece artımlı bir güncelleme değil. Desteklenen görevler tanıdık gelse de bu yeni model, bilgisayarlı görü modellerinin nasıl eğitildiği konusunda yenilikçi bir adım temsil ediyor. YOLO26 ile odak noktası, çıkarım verimliliğinin ötesine geçerek eğitimin daha kararlı hale getirilmesine uzanıyor.
YOLO26, tüm eğitim yaşam döngüsü dikkate alınarak tasarlandı. Bu, daha hızlı yakınsama, daha güvenilir eğitim süreçleri ve tutarlı model davranışı anlamına gelir. Bu iyileştirmeler, eğitim güvenilirliğinin modellerin ne kadar hızlı yinelenebileceğini ve devreye alınabileceğini doğrudan etkilediği gerçek dünya iş akışlarında özellikle önemlidir.
Bunu sağlamak için YOLO26; Progressive Loss Balancing (ProgLoss), Small-Target-Aware Label Assignment (STAL) ve MuSGD optimize edicisi gibi çeşitli hedeflenmiş eğitim yeniliklerini tanıtır. Bu değişiklikler birlikte, öğrenme kaybının nasıl dengelendiğini, etiketlerin nasıl atandığını ve optimizasyonun zaman içinde nasıl davrandığını geliştirir.
Bu makalede, bu mekanizmaların her birinin nasıl çalıştığını ve neden Ultralytics YOLO26'yı eğitmenin daha kolay ve ölçekte daha güvenilir kıldığını keşfedeceğiz. Haydi başlayalım!
Link to this sectionUltralytics YOLO26: Sadece daha hızlı çalışmak için değil, daha akıllı eğitilmek için tasarlandı#
Ultralytics YOLO26, NMS (Non-Maximum Suppression) gibi işlem sonrası adımlara olan bağımlılığı kaldırarak tüm çıkarım hattını yerel olarak kolaylaştırır. Birbiriyle örtüşen birçok tahmini oluşturup bunları sonradan filtrelemek yerine YOLO26, nihai algılamaları doğrudan ağdan üretir.
Bu, YOLO26'yı uçtan uca bir model haline getirir; burada tahmin, yineleme çözünürlüğü ve nihai çıktılar ağın kendi içinde öğrenilir. Bu, devreye almayı basitleştirir ve çıkarım verimliliğini artırırken aynı zamanda modelin eğitim sırasında nasıl öğrendiğini şekillendirir.

Şekil 2. YOLO26, son teknoloji uçtan uca, NMS içermeyen bir çıkarım sunar (Kaynak)
Bunun gibi uçtan uca bir sistemde eğitim ve çıkarım birbirine sıkı sıkıya bağlıdır. Tahminleri daha sonra düzeltmek için harici bir işlem sonrası aşama olmadığından, modelin eğitim sırasında net ve kendinden emin kararlar almayı öğrenmesi gerekir.
Bu, eğitim hedefleri ile çıkarım davranışı arasındaki uyumu özellikle önemli kılar. Modelin nasıl eğitildiği ile çıkarım zamanında nasıl kullanıldığı arasındaki herhangi bir uyumsuzluk, kararsız öğrenmeye veya daha yavaş yakınsamaya yol açabilir.
YOLO26, eğitim sürecini en başından itibaren gerçek dünya kullanımına göre tasarlayarak bu sorunu çözer. Eğitim sistemi sadece çıkarım hızına odaklanmak yerine, uzun süreli çalışmalarda kararlı öğrenmeyi, Nano'dan Extra Large'a kadar model boyutlarında tutarlı yakınsamayı ve çeşitli veri kümelerinde sağlam performansı destekleyecek şekilde oluşturulmuştur.
Link to this sectionİki eğitim başlığı Ultralytics YOLO26'da öğrenmeyi nasıl geliştirir?#
Ultralytics YOLO26'daki temel eğitim yeniliklerinden biri, önceki YOLO modellerinde kullanılan iki başlıklı bir eğitim yaklaşımına dayanır. Nesne algılama modellerinde başlık (head), ağın tahmin yapmaktan sorumlu kısmını ifade eder.
Diğer bir deyişle, algılama başlıkları nesnelerin bir görüntüde nerede bulunduğunu ve bu nesnelerin ne olduğunu tahmin etmeyi öğrenir. Bunu sınırlayıcı kutu (bounding box) koordinatlarını regresyona tabi tutarak yaparlar, yani giriş görüntüsündeki her bir nesnenin konumunu ve boyutunu tahmin etmeyi öğrenirler.
Eğitim sırasında model, tahminlerinin doğru cevaplardan veya temel gerçeğinden (ground truth) ne kadar uzak olduğunu sayısal bir ölçü olan bir kaybı minimize ederek öğrenir. Daha düşük bir kayıp, modelin tahminlerinin temel gerçeğe daha yakın olduğu anlamına gelirken, daha yüksek bir kayıp daha büyük hataları gösterir. Kayıp hesaplaması, modelin eğitim sırasında parametrelerini nasıl güncelleyeceğini yönlendirir.
YOLO26, eğitim sırasında aynı temel modeli paylaşan ancak farklı amaçlara hizmet eden iki algılama başlığı kullanır. Bire bir (one-to-one) başlık, çıkarım zamanında kullanılan başlıktır. Her nesneyi tek bir kendinden emin tahminle ilişkilendirmeyi öğrenir ki bu, YOLO26'nın uçtan uca, NMS içermeyen tasarımı için esastır.
Bu arada, bire çok (one-to-many) başlık yalnızca eğitim sırasında kullanılır. Aynı nesneyle birden fazla tahminin ilişkilendirilmesine izin vererek daha yoğun bir denetim sağlar. Bu daha zengin öğrenme sinyali, özellikle ilk aşamalarda eğitimi stabilize etmeye ve doğruluğu artırmaya yardımcı olur.
YOLO26'da her iki başlık da kutu regresyonu ve sınıflandırma için aynı kayıp hesaplamasını kullanır. Önceki uygulamalar, eğitim boyunca bu iki kayıp sinyali arasında sabit bir denge uyguluyordu.
Ancak pratikte her başlığın önemi zamanla değişir. Yoğun denetim erken aşamalarda en faydalı olanıyken, çıkarım davranışıyla uyum eğitimin ilerleyen aşamalarında daha önemli hale gelir. YOLO26 bu içgörü etrafında tasarlanmıştır ve bu da eğitim ilerledikçe öğrenme sinyallerini nasıl yeniden dengelediğine doğrudan yol açar.
Link to this sectionUltralytics YOLO26, Progressive Loss Balancing kullanır#
Peki, Ultralytics YOLO26 eğitim sırasındaki bu değişen öğrenme ihtiyaçlarını nasıl yönetiyor? Öğrenme sinyallerinin zaman içinde nasıl ağırlıklandırılacağını ayarlamak için Progressive Loss Balancing (İlerici Kayıp Dengeleme) yöntemini kullanır.
ProgLoss, eğitim ilerledikçe her başlığın toplam kayba ne kadar katkıda bulunduğunu dinamik olarak değiştirerek çalışır. Başlangıçta, öğrenmeyi stabilize etmek ve hatırlamayı iyileştirmek için bire çok başlığa daha fazla ağırlık verilir. Eğitim devam ettikçe denge kademeli olarak bire bir başlığa kayar ve eğitimi çıkarım davranışıyla daha yakından uyumlu hale getirir.
Bu kademeli geçiş, YOLO26'nın doğru sırada öğrenmesini sağlar. Modeli rekabet eden hedefleri aynı anda optimize etmeye zorlamak yerine Progressive Loss Balancing, eğitimin her aşamasında en yararlı öğrenme sinyaline öncelik verir. Sonuç; daha pürüzsüz yakınsama, daha az kararsız eğitim çalışması ve daha tutarlı nihai performanstır.
Link to this sectionSTAL, Ultralytics YOLO26'nın küçük nesnelerden öğrenmesine nasıl yardımcı olur?#
Ultralytics YOLO26'daki bir diğer ilginç eğitim iyileştirmesi, modelin eğitim hedeflerini tahminlere nasıl atadığından gelir; bu süreç etiket atama olarak bilinir. Bu, temel gerçek nesneleri genellikle çapalar (anchors) olarak adlandırılan aday tahminlerle eşleştirmekten sorumludur.
Bu eşleşmeler, hangi tahminlerin denetim alacağını ve kayba katkıda bulunacağını belirler. YOLO26, eğitim sırasında sınıflandırma ve yerelleştirmeyi daha iyi uyumlu hale getirmek için tasarlanmış Task Alignment Learning (TAL) adlı mevcut bir etiket atama yönteminin üzerine inşa edilmiştir.
TAL çoğu nesne için iyi çalışsa da, eğitim önemli bir sınırlamayı ortaya çıkardı. Eşleştirme işlemi sırasında çok küçük nesneler tamamen devre dışı bırakılabiliyordu. Pratikte, 640 piksellik bir giriş görüntüsünde 8 pikselden küçük nesneler genellikle hiçbir çapa ataması alamazdı. Bu olduğunda model, bu nesneler için çok az denetim alır veya hiç almaz, bu da onları güvenilir bir şekilde algılamayı öğrenmeyi zorlaştırır.
Bu sorunu gidermek için YOLO26, Small-Target-Aware Label Assignment (STAL) özelliğini sunar. STAL, küçük nesnelerin eğitim sırasında göz ardı edilmemesini sağlamak için atama sürecini değiştirir. Özellikle, 8 pikselden küçük nesneler için en az dört çapa ataması zorunlu tutar. Bu, küçük nesnelerin bile eğitim kaybına tutarlı bir şekilde katkıda bulunmasını garanti eder.
Küçük hedefler için denetimi güçlendirerek STAL, küçük veya uzak nesnelerin yaygın olduğu senaryolarda öğrenme kararlılığını ve algılama performansını artırır. Bu iyileştirme; hava görüntüleri, robotik ve nesnelerin genellikle küçük, uzak veya kısmen görünür olduğu ve güvenilir algılamanın kritik olduğu Nesnelerin İnterneti (IoT) sistemleri gibi uç birim odaklı YOLO26 uygulamaları için özellikle önemlidir.
Link to this sectionUltralytics YOLO26, MuSGD optimize edicisini sunar#
Daha kararlı ve tahmin edilebilir eğitimi desteklemek için Ultralytics YOLO26 ayrıca MuSGD adlı yeni bir optimize edici sunar. Bu optimize edici, özellikle model boyutu ve eğitim karmaşıklığı arttıkça uçtan uca algılama modellerinde yakınsamayı ve eğitim güvenilirliğini artırmak için tasarlanmıştır.
Bir sinir ağının öğrenmesi ve buna bağlı olarak ağırlıkları uygun şekilde değiştirmesi için eğitim sırasında bir hata (aynı zamanda "kayıp" olarak da adlandırılır) hesaplarız. Model, tahminlerinin ne kadar yanlış olduğunu bir kayıp değeri kullanarak ölçer, parametrelerinin nasıl değişmesi gerektiğini belirten gradyanları hesaplar ve ardından hatayı azaltmak için bu parametreleri günceller. Stochastic Gradient Descent (SGD), bu güncellemeleri gerçekleştiren, eğitimi verimli ve ölçeklenebilir kılan yaygın olarak kullanılan bir optimize edicidir.

Şekil 3. Stokastik gradyan inişi ve gradyan inişi karşılaştırması (Kaynak)
MuSGD, büyük dil modeli eğitiminde kullanılan bir yöntem olan Muon'dan ilham alan optimizasyon fikirlerini birleştirerek bu tanıdık temel üzerine inşa edilir. Bu fikirler, daha yapılandırılmış parametre güncellemeleri yoluyla gelişmiş eğitim davranışı sergileyen Moonshot AI'nın Kimi K2'si gibi son gelişmelerden etkilenmiştir.
YOLO26, hibrit bir güncelleme stratejisi kullanır. Bazı parametreler, Muon'dan ilham alan güncellemeler ve SGD'nin bir kombinasyonu kullanılarak güncellenirken diğerleri yalnızca SGD kullanır. Bu, YOLO26'nın optimizasyon sürecine ek yapı kazandırmasını sağlarken SGD'yi etkili kılan sağlamlık ve genelleme özelliklerini korumasını mümkün kılar.
Sonuç; daha pürüzsüz optimizasyon, daha hızlı yakınsama ve model boyutlarında daha tahmin edilebilir eğitim davranışıdır; bu da MuSGD'yi YOLO26'nın neden eğitilmesinin daha kolay ve ölçekte daha güvenilir olduğunun anahtarlarından biri yapar.
Link to this sectionUltralytics YOLO26'nın eğitim yeniliklerinin önemi#
Ultralytics YOLO26'nın eğitim yenilikleri; uçtan uca, NMS içermeyen ve uç birim odaklı tasarımı gibi temel özelliklerle birleştiğinde modeli eğitilmesi daha kolay ve ölçekte daha güvenilir kılar. Bunun bilgisayarlı görü uygulamaları için gerçekte ne anlama geldiğini merak ediyor olabilirsiniz.

Şekil 4. YOLO26'nın temel özelliklerine bir bakış (Kaynak)
Uygulamada, bilgisayarlı görüyü gerçekte çalıştığı yere getirmeyi çok daha kolaylaştırır. Modeller daha tahmin edilebilir bir şekilde eğitilir, boyutlar arasında daha tutarlı bir şekilde ölçeklenir ve yeni veri kümelerine uyarlanması daha basittir. Bu, özellikle güvenilirlik ve verimliliğin ham performans kadar önemli olduğu ortamlarda deney ve devreye alma arasındaki sürtünmeyi azaltır.
Örneğin; robotik ve endüstriyel görüntü uygulamalarında ortamlar, sensörler veya görevler değiştikçe modellerin genellikle sık sık yeniden eğitilmesi gerekir. YOLO26 ile ekipler, kararsız eğitim çalışmaları veya model boyutları arasındaki tutarsız davranışlar konusunda endişelenmeden daha hızlı yineleme yapabilirler.
Link to this sectionÖne çıkanlar#
Güvenilir bilgisayarlı görü sistemleri, modellerin çıkarım zamanında nasıl performans gösterdiği kadar nasıl eğitildiklerine de bağlıdır. Öğrenme sinyallerinin nasıl dengelendiğini, küçük nesnelerin nasıl ele alındığını ve optimizasyonun nasıl ilerlediğini iyileştirerek YOLO26, eğitimi daha kararlı ve ölçeklendirmeyi daha kolay hale getirir. Güvenilir eğitime odaklanan bu yaklaşım, ekiplerin özellikle uç birim odaklı uygulamalarda deney aşamasından gerçek dünya devreye alımına daha sorunsuz bir şekilde geçmelerine yardımcı olur.
Yapay zeka hakkında bilgi edinmek mi istiyorsun? Daha fazlasını keşfetmek için GitHub depomuzu ziyaret et. Aktif topluluğumuza katıl ve lojistikte yapay zeka ve otomotiv endüstrisinde görü yapay zekası gibi sektörlerdeki yenilikler hakkında bilgi edin. Bilgisayarlı görü ile bugün başlamak için lisanslama seçeneklerimize göz at.






