Etiket düzeltmenin aşırı uyumu nasıl önlediğini ve model genelleştirmesini nasıl iyileştirdiğini öğrenin. Daha iyi sonuçlar elde etmek için bu tekniği Ultralytics ile nasıl uygulayabileceğinizi keşfedin.
Etiket düzeltme, makine öğreniminde model genelleştirmeyi iyileştirmek ve aşırı uyumu önlemek için yaygın olarak kullanılan bir düzenleme tekniğidir. Sinir ağlarını eğitirken, amaç genellikle tahminler ile gerçek değerler arasındaki hatayı en aza indirmektir. Ancak, bir model tahminlerinde çok fazla güvenilir hale gelirse (tek bir sınıfa %100'e yakın olasılık atarsa), genellikle sağlam kalıpları öğrenmek yerine eğitim verilerindeki belirli gürültüyü ezberlemeye başlar. Aşırı uyum olarak bilinen bu fenomen, yeni ve görülmemiş örneklerde performansı düşürür. Etiket yumuşatma, modeli mutlak kesinlikte tahmin yapmaktan caydırarak bu sorunu çözer; esasen ağa her zaman küçük bir hata payı olduğunu söyler.
Etiket yumuşatmanın nasıl çalıştığını anlamak için, bunu standart "sert" hedeflerle karşılaştırmak yardımcı olur. Geleneksel
yöntemde denetimli öğrenme, sınıflandırma
etiketleri genellikle şu şekilde temsil edilir: tekli kodlama. Örneğin,
kediler ve köpekleri ayırt eden bir görevde, bir "köpek" görüntüsünün hedef vektörü
[0, 1]Buna mükemmel bir şekilde uymak için, model iç puanlarını, yani
logitler, sonsuza doğru, bu da
kararsız gradyanlara ve uyum sağlayamama durumuna yol açabilir.
Etiket yumuşatma, bu katı 1 ve 0'ları "yumuşak" hedeflerle değiştirir. Hedef olasılık yerine
1.0, doğru sınıf atanabilir 0.9, kalan olasılık kütlesi ise
(0.1) yanlış sınıflar arasında eşit olarak dağıtılır. Bu ince değişiklik,
hedefin kayıp fonksiyonu, örneğin
çapraz entropi, önlemek
aktivasyon fonksiyonu (genellikle
Softmax) doygunluğa ulaşmasını engeller. Sonuç olarak, özellik uzayında
daha sıkı sınıf kümeleri öğrenen ve daha iyi
model kalibrasyonu, yani tahmin edilen
olasılıklar, doğruluğun gerçek olasılığını daha doğru bir şekilde yansıtır.
Bu teknik, veri belirsizliğinin doğal olduğu veya veri kümelerinin etiketleme hatalarına eğilimli olduğu alanlarda özellikle önemlidir .
Modern derin öğrenme çerçeveleri, bu tekniğin uygulanmasını basitleştirir. Kullanarak
ultralytics paketini kullanarak, etiket yumuşatmayı eğitim boru hattınıza kolayca entegre edebilirsiniz.
görüntü sınıflandırma veya algılama görevleri. Bu
genellikle, en son teknolojiye sahip modellerden ekstra performans elde etmek için yapılır.
YOLO26.
Aşağıdaki örnek, etiket yumuşatma özelliği etkinleştirilmiş bir sınıflandırma modelinin nasıl eğitileceğini göstermektedir:
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Train with label_smoothing set to 0.1
# The target for the correct class becomes 1.0 - 0.5 * 0.1 = 0.95 (depending on implementation specifics)
model.train(data="mnist", epochs=5, label_smoothing=0.1)
Etiket düzeltmeyi diğer düzenleme stratejilerinden ayırmak, ne zaman kullanılması gerektiğini anlamak için yararlıdır.
Son katmanlarda kaybolan gradyan sorununu hafifleterek ve modelin daha sağlam özellikleri öğrenmesini teşvik ederek, etiket yumuşatma modern derin öğrenme mimarilerinde temel bir unsur olmaya devam etmektedir.