Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Softmax

Softmax'ın yapay zekadaki sınıflandırma görevleri için puanları olasılıklara nasıl dönüştürdüğünü, görüntü tanıma ve NLP başarısını güçlendirdiğini keşfedin.

Yapay zeka alanında, Softmax fonksiyonu ham sayısal veriler ile aşağıdaki veriler arasında önemli bir köprü görevi görür yorumlanabilir sonuçlar. Gerçek sayılardan oluşan bir vektörü olasılığa dönüştüren matematiksel bir işlemdir dağıtımının temel bir bileşeni haline getirmektedir. sinir ağları. Karmaşık modeli dönüştürerek çıktıları, tüm değerlerin toplamının bir olduğu okunabilir bir formata dönüştüren Softmax, sistemlerin çeşitli sonuçlar. Bu yetenek özellikle şu alanlarda hayati önem taşımaktadır makine öğrenimi (ML) görevlerinde bir modelin Birden fazla farklı kategori arasından tek bir doğru yanıt seçin.

Softmax'in Mekaniği

Softmax'ın nasıl çalıştığını anlamak için öncelikle "logit" kavramını anlamak gerekir. Ne zaman bir derin öğrenme (DL) modeli bir girdiyi işler Son katman tipik olarak logit olarak bilinen ham puanların bir listesini üretir. Bu puanlar negatif sonsuzdan pozitif sonsuzdur ve doğrudan sezgisel değildir. Softmax bu logitleri alır ve iki temel işlem gerçekleştirir:

  1. Genişletme: Şunları uygular her bir girdi puanına üstel fonksiyon. Bu adımı tüm çıktı değerlerinin negatif olmamasını sağlar ve daha büyük puanları vurgulayarak modelin en güçlü tahminler daha belirgin bir şekilde öne çıkmaktadır.
  2. Normalleştirme: Üslendirilmiş değerleri toplar ve her bir değeri bu toplam değere böler toplamı. Bu normalleştirme süreci çıktıları, topluca tam olarak 1,0 (veya %100) değerine ulaşacak şekilde ölçeklendirir.

Sonuç, her bir değerin girdinin bir girdiye ait olma olasılığını temsil ettiği bir olasılık dağılımıdır. belirli bir sınıf. Bu dönüşüm, geliştiricilerin çıktıyı %95 gibi bir güven puanı olarak yorumlamasına olanak tanır belirli bir görüntünün belirli bir nesne içerdiğini gösterir.

Yapay Zekada Gerçek Dünya Uygulamaları

Softmax, çok sınıflı sınıflandırma problemlerinde çıktı katmanı için standart aktivasyon fonksiyonudur. Onun yeteneği Birbirini dışlayan sınıfları idare etmek için çeşitli Yapay zeka çözümleri.

  • Görüntü Sınıflandırma: Bilgisayarla görmede, aşağıdaki gibi modeller Ultralytics YOLO11 görüntüleri kategorize etmek için Softmax kullanır. Örneğin, bir güvenlik kamerası bir aracı yakalarsa, model görsel özellikleri analiz eder ve çıktıları verir "Araba", "Kamyon", "Otobüs" ve "Motosiklet" gibi sınıflar için olasılıklar. Bu En yüksek Softmax puanına sahip sınıf nihai etiketi belirler. Bu mekanizma, aşağıdakilere kadar değişen görevlerin merkezinde yer alır otonom için tıbbi görüntü analizi Araba sürmek.
  • Doğal Dil İşleme (NLP): Softmax, aşağıdakilerin metin oluşturma yeteneklerine güç verir Büyük Dil Modelleri (LLM'ler) ve sohbet robotları. Bir Transformer modeli bir cümlesinde, hangi kelimenin sonra gelmesi gerektiğini belirlemek için kelime dağarcığındaki her kelime için bir puan hesaplar. Softmax bu puanları olasılıklara dönüştürerek modelin bir sonraki en olası kelimeyi seçmesini sağlar ve akışkanlığı kolaylaştırır. makine çevirisi ve konuşma.

Python Kod Örneği

Aşağıdaki örnekte, önceden eğitilmiş bir sınıflandırma modelinin nasıl yükleneceği ve olasılık puanlarına nasıl erişileceği gösterilmektedir kullanılarak Softmax aracılığıyla oluşturulur. ultralytics Paket.

from ultralytics import YOLO

# Load a pre-trained YOLO11 classification model
model = YOLO("yolo11n-cls.pt")

# Run inference on a sample image URL
results = model("https://ultralytics.com/images/bus.jpg")

# The model applies Softmax internally for classification tasks
# Display the top predicted class and its confidence score
top_class = results[0].probs.top1
print(f"Predicted Class: {results[0].names[top_class]}")
print(f"Confidence: {results[0].probs.top1conf.item():.4f}")

Softmax ile Diğer Aktivasyon Fonksiyonlarının Karşılaştırılması

Softmax çok sınıflı görevler için çıktı katmanında baskın olsa da, onu diğerlerinden ayırmak önemlidir kullanılan aktivasyon fonksiyonları bağlamlar:

  • Sigmoid: Softmax gibi, Sigmoid fonksiyonu 0 ile 1 arasındaki değerleri sıkıştırır. Ancak Sigmoid her çıktıyı bağımsız olarak ele alır, bu da onu ikili sınıflandırma (evet/hayır kararları) veya Bir görüntünün hem "Köpek" hem de "Top" içerebileceği çok etiketli sınıflandırma. Softmax, tersine, bir sınıfın olasılığındaki artışın diğer sınıfın olasılığını azalttığı sınıflar arasında bir rekabeti zorlar. Diğerleri.
  • ReLU (Doğrultulmuş Doğrusal Birim): ReLU öncelikle bir sinir ağının gizli katmanlarında doğrusal olmama özelliğini tanıtmak ve hızlandırmak için kullanılır model eğitimi. Softmax'ın aksine, ReLU çıktı vermez olasılıklar ve çıktıyı belirli bir aralığa bağlamaz (negatif olmama dışında).
  • Tanh (Hiperbolik Tanjant): Tanh -1 ile 1 arasında değerler verir. Genellikle eski mimarilerde veya Tekrarlayan Sinir Ağları (RNN'ler) ancak bir olasılık dağılımı üretmediği için sınıflandırma için nihai bir çıktı işlevi olarak nadiren kullanılır.

Eğitim için Pratik Hususlar

Uygulamada, Softmax eğitim aşamasında nadiren tek başına kullanılır. Neredeyse her zaman belirli bir Çapraz Entropi Kaybı olarak bilinen kayıp fonksiyonu (veya Log Kayıp). Bu kombinasyon, tahmin edilen olasılıklar ile gerçek arasındaki mesafeyi etkili bir şekilde ölçer etiketler.

Ayrıca, büyük sayıların üstelini hesaplamak sayısal kararsızlığa (taşma) yol açabilir. Modern gibi çerçeveler PyTorch ve TensorFlow sap kayıp hesaplamalarında kararlı sürümleri (genellikle "LogSoftmax") uygulayarak bunu otomatik olarak işlevleri vardır. Bu nüansları anlamak, etkili bir yönetim için çok önemlidir. model dağıtımı ve aşağıdaki gibi metriklerin sağlanması doğruluğu model performansını doğru bir şekilde yansıtır. Bakmak İleride, yakında çıkacak olan YOLO26 gibi gelişmiş mimariler, bu olasılıkların nasıl iyileştirileceğini geliştirmeye devam edecektir. dağılımları uçtan uca algılama ve sınıflandırma için kullanılır.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın