Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

سيجمويد (Sigmoid)

اكتشف قوة دالة Sigmoid في الذكاء الاصطناعي. تعلم كيف تتيح اللاخطية، وتساعد في التصنيف الثنائي، وتقود تطورات التعلم الآلي!

الدالة السينغمية هي دالة تنشيط أساسية أساسية تستخدم على نطاق واسع في مجالات التعلّم الآلي (ML) و والتعلم العميق (DL). يتم تمثيلها رياضياً على شكل دالة لوجستية، وتتميز بمنحنى مميز على شكل حرف منحنى مميز على شكل حرف "S" يُعرف باسم المنحنى السيني. وتتمثل الوظيفة الأساسية للدالة المنجلية في تحويل أي رقم مُدخل ذي قيمة حقيقية إلى قيمة ضمن نطاق 0 و1. خاصية السحق هذه تجعلها مفيدة بشكل استثنائي مفيدة بشكل استثنائي للنماذج التي تحتاج إلى التنبؤ الاحتمالات، حيث يمكن أن يكون الناتج مباشرةً تفسر مباشرة على أنها احتمال وقوع حدث معين. من خلال إدخال خاصية اللاخطية في الشبكة العصبونية (NN)، تسمح الدالة السيجميّة للنماذج للنماذج بتعلم أنماط البيانات المعقدة التي تتجاوز مجرد الانحدار الخطي البسيط.

التطبيقات الأساسية في الذكاء الاصطناعي

تلعب الدالة المنجلية دورًا حاسمًا في بنيات ومهام محددة للشبكة، خاصةً عندما تحتاج المخرجات تحتاج إلى تفسيرها كاحتمالات مستقلة. في حين أن الدوال الأحدث قد حلت محلها في الطبقات المخفية للشبكات العميقة الشبكات العميقة، إلا أنها تبقى معيارًا في طبقات الخرج للعديد من التطبيقات الرئيسية.

  • التصنيف الثنائي: في المهام التي يكون فيها الهدف هو تصنيف المدخلات إلى واحدة من فئتين متنافيتين - مثل تحديد ما إذا كان البريد الإلكتروني "غير مرغوب فيه" أو "غير مرغوب فيه" - فإن الدالة السيجمائية هي الخيار المثالي للطبقة النهائية للطبقة النهائية. فهي تُخرِج قيمة قياسية واحدة بين 0 و 1، تمثل احتمال الفئة الإيجابية. على سبيل المثال، في تحليل الصور الطبية قد يُخرِج النموذج 0.95، مما يشير إلى ثقة بنسبة 95% بأن الحالة الشاذة المكتشفة خبيثة.
  • التصنيف متعدد التسميات: على عكس المهام متعددة الفئات حيث تنتمي المدخلات إلى فئة واحدة فقط، تسمح المهام متعددة التسميات بأن يكون للمدخلات علامات متعددة في وقت واحد. على سبيل المثال، نموذج نموذج اكتشاف كائن مثل Ultralytics YOLO11 قد يحتاج إلى detect "شخص" و"دراجة" و"خوذة" في صورة واحدة. هنا، يتم تطبيق سيغمويد بشكل مستقل على كل عقدة إخراج، مما يسمح للنموذج بالتنبؤ بوجود أو عدم وجود كل فئة دون إجبار مجموع الاحتمالات على واحد.
  • الشبكة العصبية المتكررة (RNN) البوابات يعد السيجيمي مكونًا حاسمًا في آليات البوابات لنماذج التسلسل المتقدمة مثل الذاكرة طويلة المدى قصيرة المدى (LSTM) الشبكات. وضمن هذه البنى، تستخدم "بوابات النسيان" و"بوابات الإدخال" نظام سيغمويد لإخراج قيمًا بين 0 (نسيان/حظر تام) و1 (تذكر/تمرير تام)، مما ينظم بشكل فعال تدفق المعلومات مع مرور الوقت. تم شرح هذه الآلية بعمق في الكلاسيكية على LSTMs.

مقارنة مع وظائف التنشيط ذات الصلة

لتصميم البنى العصبية بفعالية، من المهم التمييز بين دوال التنشيط السيجمائية ودوال التنشيط الأخرى، حيث أن كل منها يخدم غرضًا مميزًا.

  • سوفت ماكس: بينما تتعلق كلتا الدالتين بالاحتمالات، تُستخدم Softmax للتصنيف متعدد الفئات حيث تكون الفئات متنافية. يضمن Softmax أن مجموع المخرجات عبر جميع الفئات يساوي 1 بالضبط، مما يخلق توزيعًا احتماليًا توزيع احتمالي. على النقيض من ذلك، يعامل Sigmoid كل مخرج بشكل مستقل، مما يجعله مناسبًا للمهام الثنائية أو متعددة التصنيفات أو متعددة التسميات.
  • ReLU (الوحدة الخطية المعدلة): ReLU هي دالة التفعيل المفضلة للطبقات المخفية في الشبكات العميقة الحديثة. على عكس الدالة السيجمائية، والتي التي تتشبع عند 0 و1 مسببةً مشكلة مشكلة تلاشي التدرج أثناء التدرج العكسي، تسمح دالة ReLU بتدفق التدرجات بحرية أكبر للمدخلات الإيجابية. هذا يسرّع التدريب والتقارب، كما هو مذكور في ملاحظات دورة ستانفورد CS231n.
  • تانه (الظل الزائد): تشبه دالة تانه دالة Sigmoid لكنّها تربط المدخلات بمدى من -1 إلى 1. ولأنّ مخرجاتها تكون غالباً ما تُفضّل دالة تانه على دالة سيغمويد في الطبقات المخفية في البنى القديمة وبعض شبكات الشبكات الشبكية العصبية الشبكية ذات الشبكة العصبية الروبوتية يساعد في توسيط البيانات للطبقات اللاحقة.

مثال على التنفيذ

يوضّح مقتطف Python التالي كيفية تطبيق دالة سيغمويد باستخدام PyTorch. هذه عملية شائعة تُستخدم لتحويل مخرجات النموذج الخام (اللوغاريتمات) إلى احتمالات قابلة للتفسير.

import torch
import torch.nn as nn

# Raw outputs (logits) from a model for a binary or multi-label task
logits = torch.tensor([0.1, -2.5, 4.0])

# Apply the Sigmoid activation function
sigmoid = nn.Sigmoid()
probabilities = sigmoid(logits)

# Output values are squashed between 0 and 1
print(probabilities)
# Output: tensor([0.5250, 0.0759, 0.9820])

يعد فهم وقت استخدام Sigmoid أمرًا أساسيًا لبناء أنظمة ذكاء اصطناعي فعالة. بينما لديه قيود في الطبقات المخفية العميقة بسبب تشبُّع التدرج، إلا أن قدرته على نمذجة الاحتمالات المستقلة تبقيه مناسبًا في حسابات دالة الخسارة وطبقات الخرج النهائية لمجموعة واسعة من المهام.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن