"Tüm Çerezleri Kabul Et" seçeneğine tıklayarak, sitede gezinmeyi geliştirmek, site kullanımını analiz etmek ve pazarlama çabalarımıza yardımcı olmak için cihazınızda çerezlerin saklanmasını kabul edersiniz. Daha fazla bilgi
Çerez Ayarları
"Tüm Çerezleri Kabul Et" seçeneğine tıklayarak, sitede gezinmeyi geliştirmek, site kullanımını analiz etmek ve pazarlama çabalarımıza yardımcı olmak için cihazınızda çerezlerin saklanmasını kabul edersiniz. Daha fazla bilgi
Ultralytics Progressive Loss Balancing, Small-Target-Aware Label Assignment ve MuSGD optimizer kullanarak nasıl daha güvenilir bir şekilde eğitim verdiğini öğrenin.
Geçen hafta, kenar öncelikli, gerçek zamanlı bilgisayar görme modelleri için yeni bir standart belirleyen Ultralytics piyasaya sürdük. Önceki Ultralytics YOLO benzer şekilde, örneğin Ultralytics YOLO11gibi önceki Ultralytics YOLO modellerine benzer şekilde, YOLO26 da nesne algılama, örnek segmentasyonu ve poz tahmini gibi kullanıcıların aşina olduğu temel bilgisayar görme görevlerini desteklemektedir.
Şekil 1. YOLO26'nın bir görüntüdeki segment için kullanıldığı bir örnek.
Ancak YOLO26 sadece bir güncelleme değildir. Desteklenen görevler tanıdık gelse de, bu yeni model bilgisayar görme modellerinin eğitilme biçiminde yenilikçi bir adımdır. YOLO26 ile odak noktası, çıkarım verimliliğinin ötesine geçerek eğitimi daha istikrarlı hale getirmeye uzanmaktadır.
YOLO26, tam eğitim döngüsü göz önünde bulundurularak tasarlanmıştır. Bu, daha hızlı yakınsama, daha güvenilir eğitim çalıştırmaları ve tutarlı model davranışı anlamına gelir. Bu iyileştirmeler, eğitimin güvenilirliğinin modellerin ne kadar hızlı yinelenebileceğini ve dağıtılabileceğini doğrudan etkilediği gerçek dünya iş akışlarında özellikle önemlidir.
Bunu mümkün kılmak için YOLO26, Progressive Loss Balancing (ProgLoss), Small-Target-Aware Label Assignment (STAL) ve MuSGD optimizer gibi birkaç hedefli eğitim yeniliği sunar. Bu değişiklikler bir araya gelerek öğrenme kaybının dengelenme şeklini, etiketlerin atanma şeklini ve optimizasyonun zaman içindeki davranışını iyileştirir.
Bu makalede, bu mekanizmaların her birinin nasıl çalıştığını ve Ultralytics neden daha kolay eğitilebilir ve ölçeklendirilebilir hale getirdiğini inceleyeceğiz. Hadi başlayalım!
Ultralytics : Daha hızlı çalışmak için değil, daha akıllı eğitim için tasarlandı
Ultralytics , Non-Maximum Suppression gibi son işlem adımlarına olan bağımlılığı ortadan kaldırarak tüm çıkarım sürecini doğal olarak kolaylaştırır. YOLO26, birçok çakışan tahmin üretip bunları sonradan filtrelemek yerine, doğrudan ağdan nihai tespitler üretir.
Bu, YOLO26'yı uçtan uca bir model haline getirir; tahmin, yinelenen çözümleme ve nihai çıktılar ağın kendi içinde öğrenilir. Bu, dağıtımı basitleştirir ve çıkarım verimliliğini artırırken, modelin eğitim sırasında nasıl öğrendiğini de şekillendirir.
Şekil 2. YOLO26, son teknoloji ürünü uçtan uca, NMS çıkarım sağlar (Kaynak)
Böyle bir uçtan uca sistemde, eğitim ve çıkarım birbiriyle sıkı bir şekilde bağlantılıdır. Tahminleri daha sonra düzeltmek için harici bir son işlem aşaması olmadığından, model eğitim sırasında net ve güvenilir kararlar vermeyi öğrenmek zorundadır.
Bu, eğitim hedefleri ile çıkarım davranışı arasındaki uyumu özellikle önemli hale getirir. Modelin eğitilme şekli ile çıkarım sırasında kullanılış şekli arasındaki herhangi bir uyumsuzluk, öğrenmenin dengesizleşmesine veya daha yavaş yakınsamaya neden olabilir.
YOLO26, başlangıçtan itibaren gerçek dünya kullanımına göre eğitim sürecini tasarlayarak bu sorunu çözmektedir. Yalnızca çıkarım hızına odaklanmak yerine, eğitim sistemi uzun vadede istikrarlı öğrenmeyi, Nano'dan Ekstra Büyük'e kadar tüm model boyutlarında tutarlı yakınsamayı ve çeşitli veri kümelerinde sağlam performansı destekleyecek şekilde oluşturulmuştur.
Ultralytics YOLO26'da iki eğitim başlığı öğrenmeyi nasıl iyileştirir?
Ultralytics daki en önemli eğitim yeniliklerinden biri, önceki YOLO kullanılan iki başlı eğitim yaklaşımını temel almaktadır. Nesne algılama modellerinde, baş, tahminlerde bulunmaktan sorumlu ağın bir parçasını ifade eder.
Diğer bir deyişle, algılama başlıkları, nesnelerin bir görüntüde nerede bulunduğunu ve bu nesnelerin ne olduğunu tahmin etmeyi öğrenir. Bunu, sınırlayıcı kutu koordinatlarını gerileterek yaparlar, yani giriş görüntüsündeki her nesnenin konumunu ve boyutunu tahmin etmeyi öğrenirler.
Eğitim sırasında model, tahminlerinin doğru cevaplardan veya temel gerçeklerden ne kadar uzak olduğunu gösteren sayısal bir ölçü olan kaybı en aza indirerek öğrenir. Daha düşük bir kayıp, modelin tahminlerinin temel gerçeğe daha yakın olduğu anlamına gelirken, daha yüksek bir kayıp daha büyük hatalar olduğunu gösterir. Kayıp hesaplaması, modelin eğitim sırasında parametrelerini nasıl güncelleyeceğini belirler.
YOLO26, eğitim sırasında aynı temel modeli paylaşan ancak farklı amaçlara hizmet eden iki algılama kafası kullanır. Bire bir kafa, çıkarım sırasında kullanılan kafadır. Her nesneyi tek bir güvenilir tahminle ilişkilendirmeyi öğrenir, bu da YOLO26'nın uçtan uca, NMS tasarımı için çok önemlidir.
Bu arada, tek-çok başlığı sadece eğitim sırasında kullanılır. Aynı nesneyle birden fazla tahmin ilişkilendirilmesini sağlayarak daha yoğun denetim sağlar. Bu daha zengin öğrenme sinyali, özellikle erken aşamalarda eğitimi dengelemeye ve doğruluğu artırmaya yardımcı olur.
YOLO26'da, her iki başlık da kutu regresyonu ve sınıflandırma için aynı kayıp hesaplamasını kullanır. Daha önceki uygulamalarda, eğitim süresince bu iki kayıp sinyali arasında sabit bir denge uygulanıyordu.
Ancak pratikte, her bir başlığın önemi zamanla değişir. Yoğun denetim, başlangıçta en yararlıdır, ancak eğitim ilerledikçe çıkarım davranışıyla uyum daha önemli hale gelir. YOLO26, bu anlayışa dayalı olarak tasarlanmıştır ve bu, eğitimin ilerlemesiyle öğrenme sinyallerinin nasıl yeniden dengelendiğini doğrudan gösterir.
Ultralytics , Aşamalı Kayıp Dengeleme özelliğini kullanır.
Peki, Ultralytics eğitim sırasında bu değişen öğrenme ihtiyaçlarını nasıl ele alıyor? Zaman içinde öğrenme sinyallerinin ağırlıklandırılmasını ayarlamak için Aşamalı Kayıp Dengeleme yöntemini kullanıyor.
ProgLoss, eğitim ilerledikçe her bir kafanın toplam kayba katkısını dinamik olarak değiştirerek çalışır. Başlangıçta, öğrenmeyi stabilize etmek ve hatırlamayı iyileştirmek için bir-çok kafaya daha fazla ağırlık verilir. Eğitim devam ettikçe, denge yavaş yavaş bir-bir kafaya doğru kayar ve eğitimi çıkarım davranışıyla daha yakından uyumlu hale getirir.
Bu kademeli geçiş, YOLO26'nın doğru sırayla öğrenmesini sağlar. Progressive Loss Balancing, modeli birden fazla hedefi aynı anda optimize etmeye zorlamak yerine, eğitimin her aşamasında en yararlı öğrenme sinyaline öncelik verir. Sonuç olarak, daha düzgün bir yakınsama, daha az dengesiz eğitim çalışması ve daha tutarlı bir nihai performans elde edilir.
STAL, Ultralytics küçük nesnelerden öğrenmesine nasıl yardımcı oluyor?
Ultralytics daki bir diğer ilginç eğitim iyileştirmesi, modelin tahminlere eğitim hedeflerini atama şeklinden kaynaklanmaktadır. Bu süreç, etiket atama olarak bilinir. Bu süreç, gerçek nesneleri genellikle bağlantı noktası olarak adlandırılan aday tahminlerle eşleştirme görevini üstlenir.
Bu eşleşmeler, hangi tahminlerin denetime tabi tutulacağını ve kayba katkıda bulunacağını belirler. YOLO26, eğitim sırasında sınıflandırma ve yerelleştirmeyi daha iyi uyumlu hale getirmek için tasarlanmış olan Task Alignment Learning (TAL) adlı mevcut bir etiket atama yöntemini temel alır.
TAL çoğu nesne için iyi çalışsa da, eğitim sırasında önemli bir sınırlama ortaya çıktı. Eşleştirme işlemi sırasında, çok küçük nesneler tamamen düşülebiliyordu. Uygulamada, 640 piksel giriş görüntüsünde yaklaşık 8 pikselden daha küçük nesneler genellikle herhangi bir bağlantı ataması alamıyordu. Bu durumda, model bu nesneler için çok az denetim alıyor veya hiç almıyor, bu da detect güvenilir bir şekilde detect öğrenmeyi zorlaştırıyor.
Bu sorunu çözmek için YOLO26, Küçük Hedef Farkındalıklı Etiket Atama (STAL) özelliğini sunar. STAL, eğitim sırasında küçük nesnelerin göz ardı edilmemesini sağlamak için atama sürecini değiştirir. Özellikle, 8 pikselden küçük nesneler için en az dört bağlantı ataması uygular. Bu, küçük nesnelerin bile eğitim kaybına tutarlı bir şekilde katkıda bulunmasını garanti eder.
Küçük hedefler için denetimi güçlendirerek, STAL küçük veya uzak nesnelerin yaygın olduğu senaryolarda öğrenme kararlılığını ve algılama performansını iyileştirir. Bu iyileştirme, nesnelerin genellikle küçük, uzak veya kısmen görünür olduğu ve güvenilir algılama kritik öneme sahip olan hava görüntüleme, robotik ve Nesnelerin İnterneti (IoT) sistemleri gibi kenar öncelikli YOLO26 uygulamaları için özellikle önemlidir.
Ultralytics , MuSGD optimizer'ı tanıttı
Daha istikrarlı ve öngörülebilir bir eğitim sürecini desteklemek için Ultralytics , MuSGD adlı yeni bir optimize edici de sunuyor. Bu optimize edici, özellikle model boyutu ve eğitim karmaşıklığı arttıkça, uçtan uca algılama modellerinde yakınsama ve eğitim güvenilirliğini artırmak için tasarlanmıştır.
Bir sinir ağının öğrenmesi ve sonuç olarak ağırlıkları buna göre değiştirmesi için, eğitim sırasında bir hata (aynı zamanda "kayıp" olarak da adlandırılır) hesaplarız. Bu nedenle model, tahminlerinin ne kadar yanlış olduğunu bir kayıp değeri kullanarak ölçer, parametrelerinin nasıl değişmesi gerektiğini gösteren gradyanları hesaplar ve ardından hatayı azaltmak için bu parametreleri günceller. Stokastik Gradyan İndirgeme (SGD), bu güncellemeleri gerçekleştiren, eğitimi verimli ve ölçeklenebilir hale getiren, yaygın olarak kullanılan bir optimize edicidir.
Şekil 3. Stokastik gradyan inişi ile gradyan inişi karşılaştırması (Kaynak)
MuSGD, büyük dil modeli eğitiminde kullanılan bir yöntem olan Muon'dan esinlenen optimizasyon fikirlerini dahil ederek bu tanıdık temeli geliştirir. Bu fikirler, daha yapılandırılmış parametre güncellemeleriyle gelişmiş eğitim davranışı sergileyen Moonshot AI'nın Kimi K2 gibi son gelişmelerden etkilenmiştir.
YOLO26, hibrit bir güncelleme stratejisi kullanır. Bazı parametreler, Muon'dan esinlenen güncellemeler ve SGD bir kombinasyonu kullanılarak güncellenirken, diğerleri SGD kullanır. Bu, YOLO26'nın SGD kılan sağlamlık ve genelleme özelliklerini korurken optimizasyon sürecine ek bir yapı getirmesini mümkün kılar.
Sonuç olarak, model boyutları arasında daha sorunsuz optimizasyon, daha hızlı yakınsama ve daha öngörülebilir eğitim davranışı elde edilir. Bu da MuSGD'yi, YOLO26'nın eğitiminin daha kolay ve ölçeklendirmede daha güvenilir olmasının temel unsurlarından biri haline getirir.
Ultralytics eğitim yeniliklerinin önemi
Ultralytics eğitim yenilikleri, uçtan uca, NMS ve kenar öncelikli tasarım gibi temel özelliklerle birleştiğinde, modelin eğitilmesini kolaylaştırır ve ölçeklendirmede daha güvenilir hale getirir. Bunun bilgisayar görme uygulamaları için gerçekte ne anlama geldiğini merak ediyor olabilirsiniz.
Şekil 4. YOLO26'nın temel özelliklerine bir bakış (Kaynak)
Uygulamada, bilgisayar görüşünü gerçekte çalıştığı yere taşımayı çok daha kolay hale getirir. Modeller daha öngörülebilir şekilde eğitilir, boyutlar arasında daha tutarlı bir şekilde ölçeklenir ve yeni veri kümelerine daha kolay uyarlanır. Bu, özellikle güvenilirlik ve verimliliğin ham performans kadar önemli olduğu ortamlarda, deneme ve dağıtım arasındaki sürtünmeyi azaltır.
Örneğin, robotik ve endüstriyel görüntüleme uygulamalarında, ortamlar, sensörler veya görevler değiştikçe modellerin sık sık yeniden eğitilmesi gerekir. YOLO26 ile ekipler, dengesiz eğitim süreçleri veya model boyutları arasında tutarsız davranışlar konusunda endişelenmeden daha hızlı yineleme yapabilirler.
Önemli çıkarımlar
Güvenilir bilgisayar görme sistemleri, modellerin nasıl eğitildiğine olduğu kadar, çıkarım sırasında nasıl performans gösterdiğine de bağlıdır. YOLO26, öğrenme sinyallerinin dengelenmesi, küçük nesnelerin işlenmesi ve optimizasyonun ilerlemesi konusunda iyileştirmeler yaparak eğitimi daha istikrarlı ve ölçeklendirilmesi daha kolay hale getirir. Güvenilir eğitime odaklanılması, ekiplerin özellikle uç öncelikli uygulamalarda denemelerden gerçek dünya uygulamalarına daha sorunsuz bir şekilde geçmelerine yardımcı olur.