Optimization Algorithm
اكتشف كيف تدفع خوارزميات التحسين مثل SGD و AdamW تدريب تعلم الآلة. تعلم كيفية تقليل الخسارة وتحسين أداء Ultralytics YOLO26 لتطبيقات الذكاء الاصطناعي.
تعمل خوارزمية التحسين كالمحرك الحسابي الأساسي الذي يوجه عملية تدريب نماذج تعلم الآلة (ML) والتعلم العميق (DL). وتتمثل مسؤوليتها الأساسية في تعديل أوزان النموذج والتحيزات الداخلية بشكل متكرر لتقليل الخطأ بين النتائج المتوقعة والأهداف الفعلية. يمكنك تصور هذه العملية كمتنزه يحاول النزول من جبل ضبابي للوصول إلى أدنى نقطة في الوادي. تعمل خوارزمية التحسين كمرشد، حيث تحدد الاتجاه وحجم الخطوة التي يجب أن يتخذها المتنزه للوصول إلى القاع، وهو ما يتوافق مع الحالة التي يتم فيها تقليل دالة الخسارة إلى الحد الأدنى وتعظيم دقة تنبؤات النموذج.
Link to this sectionكيف تعمل خوارزميات التحسين#
يتضمن تدريب الشبكة العصبية دورة متكررة من التنبؤ وحساب الخطأ وتحديث المعلمات. تتحكم خوارزمية التحسين في مرحلة "التحديث" من هذه الحلقة. بمجرد معالجة دفعة من بيانات التدريب، يقوم النظام بحساب التدرج - وهو متجه يشير إلى اتجاه الزيادة الأكبر في الخطأ - باستخدام طريقة تسمى الانتشار العكسي.
يقوم المحسن بعد ذلك بتحديث معلمات النموذج في الاتجاه المعاكس للتدرج لتقليل الخطأ. يخضع حجم هذا التحديث لمعامل فائق حاسم يُعرف باسم معدل التعلم. إذا كانت الخطوة كبيرة جدًا، فقد يتجاوز النموذج الحد الأدنى العالمي؛ وإذا كانت صغيرة جدًا، فقد يصبح التدريب بطيئًا بشكل مفرط أو قد يعلق في حد أدنى محلي. تقدم الموارد المتقدمة مثل ملاحظات التحسين لـ Stanford CS231n رؤى تقنية أعمق حول هذه الديناميكيات.
Link to this sectionالأنواع الشائعة لخوارزميات التحسين#
تتطلب المشكلات المختلفة استراتيجيات مختلفة. وعلى الرغم من وجود العديد من الاختلافات، إلا أن هناك عددًا قليلاً من الخوارزميات الرئيسية التي تهيمن على تطوير الذكاء الاصطناعي الحديث:
- انحدار التدرج العشوائي (SGD): نهج كلاسيكي يقوم بتحديث المعلمات باستخدام مثال واحد أو دفعة صغيرة بدلاً من مجموعة البيانات بأكملها. هذه الطريقة فعالة حاسوبيًا وتستخدم على نطاق واسع في مكتبات مثل Scikit-learn.
- محسن Adam: اختصار لـ Adaptive Moment Estimation، حيث يقوم Adam بضبط معدل التعلم لكل معلمة على حدة. تم تفصيل ذلك في ورقة بحث Adam بواسطة Kingma and Ba وغالبًا ما يكون الخيار الافتراضي للتدريب للأغراض العامة نظرًا لسرعته وخصائص التقارب التي يتمتع بها.
- AdamW: تنويع من Adam يقوم بفصل اضمحلال الوزن عن تحديث التدرج، مما يؤدي إلى تعميم أفضل. غالبًا ما يكون هذا هو المحسن المفضل لتدريب الهياكل المتطورة مثل Transformers ونماذج Ultralytics YOLO26 عالية الأداء.
Link to this sectionتطبيقات العالم الحقيقي#
تعمل خوارزميات التحسين بصمت خلف كواليس كل حل ذكاء اصطناعي ناجح تقريبًا، حيث تحول البيانات إلى معلومات قابلة للتنفيذ.
-
المركبات ذاتية القيادة: في تقنية القيادة الذاتية، يجب أن تتعرف أنظمة اكتشاف الكائنات فورًا على المشاة وإشارات المرور والسيارات الأخرى. أثناء تدريب هذه الأنظمة لـ الذكاء الاصطناعي في السيارات، تعالج خوارزمية التحسين ملايين صور الطرق، مما يعمل على ضبط الشبكة لتقليل أخطاء الاكتشاف. وهذا يضمن توقف السيارة بشكل موثوق عندما ترى شخصًا، مما يمنع وقوع الحوادث.
-
تحليل الصور الطبية: بالنسبة للتطبيقات في الذكاء الاصطناعي في الرعاية الصحية، مثل تحديد الأورام في فحوصات التصوير بالرنين المغناطيسي، فإن الدقة أمر لا غنى عنه. توجه المحسنات تدريب الشبكات العصبية التلافيفية (CNNs) للتمييز بين الأنسجة الخبيثة والأنسجة السليمة بحساسية عالية، مما يقلل من مخاطر النتائج السلبية الكاذبة في التشخيصات الحرجة.
Link to this sectionالتمييز بين المفاهيم ذات الصلة#
من المهم التمييز بين خوارزمية التحسين والمكونات الأخرى لعملية التعلم لفهم سير العمل بفعالية.
- خوارزمية التحسين مقابل دالة الخسارة: تعمل دالة الخسارة كـ "لوحة النتائج"، حيث تحسب قيمة رقمية (مثل متوسط مربع الخطأ) التي تمثل مدى خطأ تنبؤات النموذج. خوارزمية التحسين هي "الاستراتيجي" الذي يستخدم هذه النتيجة لتعديل الأوزان وتحسين الأداء في الجولة التالية.
- خوارزمية التحسين مقابل ضبط المعاملات الفائقة: تتعلم خوارزمية التحسين المعلمات الداخلية (الأوزان) أثناء حلقات التدريب. يتضمن ضبط المعاملات الفائقة اختيار أفضل الإعدادات الخارجية - مثل اختيار المحسن نفسه، أو حجم الدفعة، أو معدل التعلم الأولي - قبل بدء التدريب. غالبًا ما تُستخدم أدوات آلية مثل Ray Tune للعثور على المزيج الأمثل من هذه الإعدادات الخارجية.
Link to this sectionتنفيذ التحسين في Python#
في الأطر الحديثة، غالبًا ما يتم اختيار خوارزمية التحسين عبر وسيطة واحدة. يوضح المثال التالي كيفية تدريب نموذج YOLO26 باستخدام محسن AdamW ضمن حزمة ultralytics. يمكن للمستخدمين أيضًا الاستفادة من منصة Ultralytics لنهج بدون كود لإدارة جلسات التدريب هذه.
from ultralytics import YOLO
# Load the latest YOLO26 model (recommended for new projects)
model = YOLO("yolo26n.pt")
# Train the model using the 'AdamW' optimization algorithm
# The optimizer iteratively updates weights to minimize loss on the dataset
results = model.train(data="coco8.yaml", epochs=5, optimizer="AdamW")بالنسبة للمهتمين بالآليات منخفضة المستوى، توفر أطر عمل مثل PyTorch Optimizers وTensorFlow Keras Optimizers وثائق مكثفة حول كيفية تنفيذ وتخصيص هذه الخوارزميات لهياكل البحث المخصصة.






