Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

Softmax

اكتشف كيف تحول Softmax الدرجات إلى احتمالات لمهام التصنيف في الذكاء الاصطناعي، مما يدعم التعرف على الصور ونجاح معالجة اللغة الطبيعية.

في مجال الذكاء الاصطناعي، تعمل دالة Softmax كجسر حاسم بين البيانات العددية الخام و والنتائج القابلة للتفسير. إنها عملية رياضية تحوّل متجه من الأعداد الحقيقية إلى توزيع احتمالي التوزيع، مما يجعلها عنصراً أساسياً في الشبكات العصبية الحديثة. من خلال تحويل النماذج المعقدة المعقدة إلى صيغة قابلة للقراءة حيث مجموع كل القيم يساوي واحداً، تمكن سوفت ماكس الأنظمة من التعبير عن مستويات الثقة للنتائج المختلفة. هذه القدرة حيوية بشكل خاص في في مهام التعلم الآلي (ML) حيث يجب على النموذج اختيار إجابة واحدة صحيحة من عدة فئات مختلفة.

ميكانيكا سوفت ماكس

لفهم كيفية عمل Softmax، يجب أولاً فهم مفهوم "اللوغاريتمات". عندما يعالج نموذج نموذج التعلّم العميق (DL) بمعالجة مدخلات، تنتج الطبقة تنتج الطبقة النهائية عادةً قائمة من الدرجات الأولية المعروفة باللوغاريتمات. يمكن أن تتراوح هذه الدرجات من اللانهاية السالبة إلى إلى ما لا نهاية موجبة وليست بديهية بشكل مباشر. تأخذ Softmax هذه اللوغاريتمات وتنفذ عمليتين أساسيتين:

  1. الأس: يطبّق الدالة الدالة الأسية على كل درجة مُدخَلة. تضمن هذه الخطوة هذه الخطوة تضمن أن جميع قيم المُخرَجات غير سالبة وتؤكّد على الدرجات الأكبر، مما يجعل تنبؤات النموذج الأقوى أقوى تنبؤات النموذج بشكل أكثر وضوحًا.
  2. التطبيع: يجمع القيم المعادلة أسياً ويقسم كل قيمة على حدة على هذا المجموع الكلي المجموع. هذه العملية التطبيع هذه تحجّم النواتج بحيث يصبح مجموعها مجتمعةً 1.0 بالضبط (أو 100%).

والنتيجة هي توزيع احتمالي حيث تمثل كل قيمة احتمال انتماء المدخلات إلى لفئة محددة. يسمح هذا التحويل للمطوّرين بتفسير المخرجات على أنها درجة ثقة، مثل أن تكون 95% متأكدين من أن الصورة تحتوي على كائن معين.

تطبيقات العالم الحقيقي في الذكاء الاصطناعي

Softmax هي دالة التفعيل القياسية لطبقة الخرج في مشاكل التصنيف متعدد الفئات. قدرتها على التعامل مع الفئات الحصرية المتبادلة تجعلها لا غنى عنها في مختلف حلول الذكاء الاصطناعي المختلفة.

  • تصنيف الصور: في الرؤية الحاسوبية، نماذج مثل Ultralytics YOLO11 تستخدم Softmax لتصنيف الصور. على سبيل المثال، إذا التقطت كاميرا أمنية صورة لمركبة، يقوم النموذج بتحليل الميزات المرئية والمخرجات احتمالات لفئات مثل "سيارة" و"شاحنة" و"حافلة" و"دراجة نارية". الفئة الفئة ذات أعلى درجة سوفت ماكس تحدد التسمية النهائية. هذه الآلية أساسية لمهام تتراوح بين تحليل الصور الطبية إلى القيادة الذاتية القيادة الذاتية.
  • معالجة اللغة الطبيعية (NLP): يدعم Softmax قدرات توليد النصوص في نماذج اللغات الكبيرة (LLMs) و وروبوتات الدردشة الآلية. عندما يُنشئ نموذج المحول جملة، فإنه يحسب درجة لكل كلمة في مفرداته لتحديد الكلمة التي يجب أن تأتي بعد ذلك. سوفت ماكس بتحويل هذه الدرجات إلى احتمالات، مما يسمح للنموذج باختيار الكلمة التالية الأكثر احتمالاً، مما يسهل الترجمة الآلية والمحادثة السلسة.

مثال على كود Python

يوضح المثال التالي كيفية تحميل نموذج تصنيف مدرب مسبقًا والوصول إلى درجات الاحتمالية التي تم إنشاؤها عبر Softmax باستخدام ultralytics الحزمة.

from ultralytics import YOLO

# Load a pre-trained YOLO11 classification model
model = YOLO("yolo11n-cls.pt")

# Run inference on a sample image URL
results = model("https://ultralytics.com/images/bus.jpg")

# The model applies Softmax internally for classification tasks
# Display the top predicted class and its confidence score
top_class = results[0].probs.top1
print(f"Predicted Class: {results[0].names[top_class]}")
print(f"Confidence: {results[0].probs.top1conf.item():.4f}")

مقارنة سوفت ماكس بوظائف التنشيط الأخرى

في حين أن Softmax مهيمنة في طبقة الخرج للمهام متعددة الفئات، فمن المهم تمييزها عن دوال التنشيط الأخرى دوال التنشيط الأخرى المستخدمة في سياقات مختلفة:

  • السيجمي: مثل Softmax، تقوم دالة Sigmoid تسحق القيم بين 0 و1. ومع ذلك، تتعامل الدالة السيجويدية مع كل مخرج بشكل مستقل، مما يجعلها مثالية ل تصنيف ثنائي (قرارات نعم/لا) أو أو التصنيف متعدد التسميات حيث يمكن أن تحتوي الصورة على "كلب" و "كرة". سوفت ماكس, على العكس، يفرض تنافسًا بين الفئات حيث تؤدي الزيادة في احتمال فئة واحدة إلى تقليل احتمالية الفئات الفئات الأخرى.
  • ReLU (الوحدة الخطية المعدلة): تُستخدم ReLU بشكل أساسي في الطبقات المخفية للشبكة العصبية لإدخال اللاخطية وتسريع تدريب النموذج. على عكس Softmax، لا تقوم ReLU بإخراج الاحتمالات ولا تقيد المخرجات بنطاق محدد (بخلاف كونها غير سالبة).
  • تانه (الظل الزائدي): يخرج تانه قيمًا تتراوح بين -1 و1. غالبًا ما توجد في البنى القديمة أو الشبكات العصبية المتكررة (RNNs) ولكن نادرًا ما تُستخدم كدالة مخرجات نهائية للتصنيف لأنها لا تنتج توزيعًا احتماليًا.

الاعتبارات العملية للتدريب

في الممارسة العملية، نادرًا ما يتم استخدام سوفت ماكس بمعزل عن التدريب. فهي تقترن دائمًا تقريبًا بدالة خسارة محددة دالة خسارة محددة تُعرف باسم الخسارة المتقاطعة (أو لوغاريتم الخسارة الخسارة). يقيس هذا المزيج بشكل فعّال المسافة بين الاحتمالات المتوقعة والحقيقة الفعلية التسميات.

علاوةً على ذلك، يمكن أن يؤدي حساب الأسي للأعداد الكبيرة إلى عدم الاستقرار العددي (تجاوز الحد). الأطر الحديثة الحديثة مثل PyTorch و TensorFlow يعالجان هذا تلقائيًا عن طريق تنفيذ إصدارات ثابتة (غالبًا "LogSoftmax") ضمن دالات حساب الخسارة الخاصة بهم الخاصة بهم. يعد فهم هذه الفروق الدقيقة أمرًا ضروريًا لنشر النشر الفعال للنموذج وضمان أن مقاييس مثل الدقة تعكس بدقة أداء النموذج. بالنظر إلى في المستقبل، ستستمر البنى المتقدمة مثل YOLO26 القادم في تحسين كيفية استخدام توزيعات الاحتمالات هذه للكشف والتصنيف من البداية إلى النهاية.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن