Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

Softmax

استكشف وظيفة Softmax في الذكاء الاصطناعي. تعرف على كيفية تحويلها للقيم اللوغاريتمية إلى احتمالات للتصنيف متعدد الفئات باستخدام Ultralytics والشبكات العصبية.

Softmax هي دالة رياضية محورية في مجال الذكاء الاصطناعي، وتستخدم على وجه التحديد كخطوة أخيرة في العديد من خوارزميات التصنيف. وهي تحول متجهًا من الأرقام الأولية، التي تسمى غالبًا logits، إلى متجه من الاحتمالات. يضمن هذا التحويل أن تكون قيم المخرجات جميعها موجبة وأن مجموعها يساوي واحدًا بالضبط، مما يؤدي إلى إنشاء توزيع احتمالات صالح بشكل فعال. وبسبب هذه الخاصية، فإن Softmax هي دالة التنشيط القياسية المستخدمة في طبقة المخرجات من الشبكات العصبية المصممة للتصنيف متعدد الفئات ، حيث يجب على النظام اختيار فئة واحدة من بين أكثر من خيارين متعارضين.

ميكانيكا سوفت ماكس

في سير عمل التعلم العميق (DL) النموذجي، تقوم طبقات الشبكة بإجراء عمليات ضرب وإضافة معقدة للمصفوفات. يتكون ناتج الطبقة النهائية، قبل التنشيط، من درجات أولية تُعرف باسم logits. يمكن أن تتراوح هذه القيم من اللانهاية السالبة إلى اللانهاية الموجبة، مما يجعل من الصعب تفسيرها مباشرةً على أنها مستويات ثقة.

يعالج Softmax هذه المشكلة من خلال تنفيذ عمليتين رئيسيتين:

  1. الأس: يحسب الأسي لكل رقم مدخل. تضمن هذه الخطوة أن تكون جميع القيم غير سالبة (نظرًا لأن $e^x$ دائمًا ما يكون موجبًا) وتعاقب القيم الأقل بكثير من الحد الأقصى، مع إبراز أعلى الدرجات.
  2. التطبيع: يجمع هذه القيم الأسية ويقسم كل أسي فردي على هذا المجموع الإجمالي. تعمل عملية التطبيع هذه على قياس الأرقام بحيث تمثل أجزاء من الكل، مما يسمح للمطورين بتفسيرها على أنها درجات ثقة مئوية.

تطبيقات واقعية

إن القدرة على إخراج احتمالات واضحة تجعل Softmax لا غنى عنه في مختلف الصناعات ومهام التعلم الآلي (ML).

  • تصنيف الصور: في الرؤية الحاسوبية، تستخدم النماذج Softmax لتصنيف الصور. على سبيل المثال، عندما يحلل نموذج التصنيف Ultralytics صورة ما، قد ينتج عنه درجات لفئات مثل "جولدن ريتريفر" و"الراعي الألماني" و "البودل". يقوم Softmax بتحويل هذه الدرجات إلى احتمالات (على سبيل المثال، 0.85، 0.10، 0.05)، مما يشير إلى ثقة عالية في أن الصورة تحتوي على كلب من فصيلة Golden Retriever. وهذا أمر بالغ الأهمية للتطبيقات التي تتراوح من تنظيم الصور تلقائيًا إلى التشخيص الطبي في الذكاء الاصطناعي في الرعاية الصحية.
  • معالجة اللغة الطبيعية (NLP): Softmax هو المحرك وراء إنشاء النصوص في نماذج اللغة الكبيرة (LLMs). عندما ينشئ نموذج مثل Transformer جملة، فإنه يتنبأ بالكلمة التالية (الرمز) عن طريق حساب درجة لكل كلمة في مفرداته. يحول Softmax هذه الدرجات إلى احتمالات، مما يسمح للنموذج باختيار الكلمة التالية الأكثر احتمالاً، مما يتيح ترجمة آلية سلسة وذكاء اصطناعي للمحادثات.
  • التعلم المعزز: غالبًا ما يستخدم الوكلاء في التعلم المعزز Softmax لاختيار الإجراءات. بدلاً من اختيار الإجراء ذي القيمة الأعلى دائمًا، قد يستخدم الوكيل الاحتمالات لاستكشاف استراتيجيات مختلفة، وتحقيق التوازن بين الاستكشاف والاستغلال في بيئات مثل التحكم الآلي أو ممارسة الألعاب.

مثال على كود Python

يوضح المثال التالي كيفية تحميل نموذج تصنيف YOLO26 المدرب مسبقًا والوصول إلى درجات الاحتمالية التي تم إنشاؤها عبر Softmax.

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Run inference on a sample image
results = model("https://ultralytics.com/images/bus.jpg")

# The model applies Softmax internally. Access the top prediction:
# The 'probs' attribute contains the probability distribution.
top_prob = results[0].probs.top1conf.item()
top_class = results[0].names[results[0].probs.top1]

print(f"Predicted Class: {top_class}")
print(f"Confidence (Softmax Output): {top_prob:.4f}")

التمييز بين Softmax والمفاهيم ذات الصلة

في حين أن Softmax هو الأكثر شيوعًا في السيناريوهات متعددة الفئات، من المهم تمييزه عن الدوال الرياضية الأخرى المستخدمة في تدريب النماذج وتصميم الهندسة المعمارية:

  • السيغمويد: تقوم دالة السيغمويد أيضًا بتحجيم القيم بين 0 و 1، ولكنها تعامل كل مخرج بشكل مستقل. وهذا يجعل السيغمويد مثاليًا للتصنيف الثنائي (نعم/لا) أو التصنيف متعدد العلامات حيث لا تستبعد الفئات بعضها بعضًا (على سبيل المثال، يمكن أن تحتوي الصورة على كل من "شخص" و "حقيبة ظهر"). تجبر Softmax الاحتمالات على أن يبلغ مجموعها واحدًا، مما يجعل الفئات تتنافس مع بعضها البعض.
  • ReLU (وحدة خطية مصححة): تُستخدم ReLU بشكل أساسي في الطبقات المخفية للشبكة لإدخال عدم الخطية. على عكس Softmax، لا تربط ReLU النتائج بنطاق محدد (فهي ببساطة تنتج صفرًا للمدخلات السالبة والمدخلات نفسها للمدخلات الموجبة) ولا تولد توزيعًا احتماليًا.
  • Argmax: بينما توفر Softmax الاحتمالات لجميع الفئات، غالبًا ما تُستخدم دالة Argmax بالاقتران معها لاختيار المؤشر الفردي ذي الاحتمال الأعلى. توفر Softmax الثقة "الناعمة" ، بينما توفر Argmax القرار النهائي "الصعب".

التكامل المتقدم

في خطوط أنابيب ML الحديثة، غالبًا ما يتم حساب Softmax ضمناً ضمن وظائف الخسارة. على سبيل المثال، تجمع خسارة التقاطع بين Softmax والاحتمالية السلبية في خطوة رياضية واحدة لتحسين الاستقرار العددي أثناء التدريب. تتعامل منصات مثل Ultralytics مع هذه التعقيدات تلقائيًا، مما يتيح للمستخدمين تدريب نماذج قوية دون تنفيذ هذه العمليات الرياضية يدويًا .

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن