Sözlük

Etiket Düzgünleştirme

Genellemeyi iyileştirmek ve aşırı güveni azaltmak için kanıtlanmış bir teknik olan etiket yumuşatma ile yapay zeka modelinin doğruluğunu ve sağlamlığını artırın.

Etiket Düzeltme, makine öğrenimi modellerinin eğitimi sırasında, özellikle sınıflandırma görevlerinde kullanılan bir düzenleme tekniğidir. Modelin doğru sınıfa tam 1.0 olasılığını atamasını engelleyerek modelin aşırı güven sorununu ele alır. Etiket Yumuşatma, "sert" etiketler (doğru sınıfın 1 ve diğerlerinin 0 olduğu) kullanmak yerine, olasılık kütlesinin küçük bir kısmını diğer sınıflara dağıtarak "yumuşak" etiketler oluşturur. Bu, modeli tahminleri hakkında daha az emin olmaya teşvik eder, bu da daha iyi genelleme ve görünmeyen veriler üzerinde daha iyi performans sağlayabilir. Bu teknik özellikle yüksek performanslı modellerde kullanılmıştır ve Etiket Düzeltme Ne Zaman Yardımcı Olur?

Etiket Düzleştirme Nasıl Çalışır?

Tipik bir denetimli öğrenme sınıflandırma probleminde, eğitim verileri girdilerden ve bunlara karşılık gelen doğru etiketlerden oluşur. Örneğin, bir görüntü sınıflandırma görevinde, bir kedinin görüntüsü, [kedi, köpek, kuş] sınıfları için olduğu gibi tek vuruşlu kodlanmış bir vektör olarak temsil edilen "kedi" etiketine sahip olacaktır. Kayıp fonksiyonu hesaplanırken model, tahmininin bu zor hedeften ne kadar uzak olduğuna bağlı olarak cezalandırılır.

Etiket Düzgünleştirme bu hedefi değiştirir. Doğru sınıf için hedef olasılığı biraz azaltır (örneğin 0,9'a) ve kalan küçük olasılığı (bu durumda 0,1) yanlış sınıflar arasında eşit olarak dağıtır. Dolayısıyla, yeni "yumuşak" hedef [0,9, 0,05, 0,05] gibi görünebilir. Bu küçük değişiklik, sinir ağının son logit katmanının bir sınıf için aşırı büyük değerler üretmesini engelleyerek aşırı uyumu önlemeye yardımcı olur. Bu süreç, Ultralytics HUB gibi platformlar kullanılarak model eğitimi sırasında yönetilebilir.

Etiket Yumuşatmanın Faydaları

Etiket Düzeltmenin birincil avantajı model kalibrasyonunu iyileştirmesidir. İyi kalibre edilmiş bir modelin öngörülen güven puanları gerçek doğruluk olasılığını daha doğru bir şekilde yansıtır. Bu, tıbbi görüntü analizi gibi modelin kesinliğini anlamanın önemli olduğu uygulamalar için çok önemlidir. Aşırı güveni önleyerek, modelin yeni verilere genelleme yeteneğini de geliştirir, bu da herhangi bir makine öğrenimi projesinin temel hedefidir. Bu genellikle doğrulukta hafif bir artışla sonuçlanır. Daha iyi genelleme, gerçek zamanlı çıkarım ve nihai model dağıtımı için daha sağlam modellere yol açar.

Gerçek Dünya Uygulamaları

Etiket Düzeltme, çeşitli son teknoloji modellerde uygulanan basit ama etkili bir tekniktir.

  1. Büyük Ölçekli Görüntü Sınıflandırma: ImageNet gibi büyük veri kümelerinde görüntü sınıflandırma görevleri için eğitilen Ultralytics YOLO gibi modeller genellikle Etiket Düzgünleştirme kullanır. Bu veri kümeleri bazen veri etiketleme işleminden kaynaklanan gürültülü veya yanlış etiketler içerebilir. Etiket Yumuşatma, modeli bu etiket gürültüsüne karşı daha dayanıklı hale getirerek potansiyel olarak yanlış etiketler konusunda aşırı güven duymayı öğrenmesini önler. Projeleriniz için çeşitli sınıflandırma veri kümelerini keşfedebilirsiniz.
  2. Doğal Dil İşleme (NLP): Makine çevirisi gibi görevlerde, tek bir cümle için birden fazla geçerli çeviri olabilir. Transformer gibi modellerde kullanılan Label Smoothing, modelin kelime dağarcığındaki tek bir doğru kelimeye 1.0 olasılık atamasını engeller ve başka kelimelerin de uygun olabileceğini kabul eder. Bu kavram modern NLP 'nin temelini oluşturur ve Stanford NLP Group gibi kurumların kaynaklarında tartışılmaktadır.

Etiket Düzgünleştirme ve İlgili Kavramlar

Etiket Düzgünleştirmeyi diğer düzenli hale getirme tekniklerinden ayırmak önemlidir.

  • Sabit Etiketler: Bu, modelin mutlak kesinlikle (doğru sınıf için %100) eğitildiği standart yaklaşımdır. Etiket Düzgünleştirme buna doğrudan bir alternatiftir.
  • Veri Büyütme: Bu, mevcut verilere dönüşümler uygulayarak yeni eğitim örnekleri oluşturan başka bir düzenlileştirme tekniğidir. Etiket Düzeltme hedef değerlerin kendisini değiştirirken veri kümesi çeşitliliğini artırır. Ultralytics belgelerinde YOLO veri artırımı için kılavuzlar bulabilirsiniz.
  • Bırakma: Bu yöntem, karmaşık ortak adaptasyonları önlemek için her eğitim adımı sırasında nöronların bir kısmını rastgele devre dışı bırakır. Eğitim sırasında modelin mimarisini değiştirirken, Etiket Düzeltme kayıp hesaplamasını değiştirir. Dropout ile ilgili daha ayrıntılı bilgi GeeksforGeeks'in konuyla ilgili makalesinde bulunabilir.
  • Bilgi Damıtma: Bu teknikte, daha küçük bir "öğrenci" modeli, daha büyük, önceden eğitilmiş bir "öğretmen" modeli tarafından üretilen yumuşak etiketler kullanılarak eğitilir. Bu yöntemde de yumuşak etiketler kullanılmakla birlikte, bu etiketlerin kaynağı Etiket Düzeltme'de olduğu gibi temel gerçek etiketlerine uygulanan basit bir sezgisel yöntem değil, başka bir modelin tahminleridir. Orijinal Distilling the Knowledge in a Neural Network makalesi bu kavrama ilişkin temel bir anlayış sunmaktadır.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve büyüyün

Şimdi katılın
Panoya kopyalanan bağlantı