كيف يتدرب Ultralytics YOLO26 بذكاء أكبر مع ProgLoss و STAL و MuSGD
تعرف على كيفية تدريب Ultralytics YOLO26 بشكل أكثر موثوقية باستخدام موازنة الخسارة التدريجية (ProgLoss)، وتعيين التسميات المدرك للأهداف الصغيرة (STAL)، ومحسن MuSGD.

في الأسبوع الماضي، أصدرنا Ultralytics YOLO26، مما يضع معياراً جديداً لنماذج الرؤية الحاسوبية الموجهة للحافة وفي الوقت الفعلي. ومثل نماذج Ultralytics YOLO السابقة، مثل Ultralytics YOLO11، يدعم YOLO26 مهام الرؤية الحاسوبية الأساسية التي يألفها المستخدمون، بما في ذلك اكتشاف الكائنات، وتجزئة الحالات (instance segmentation)، وتقدير وضعية الجسم.

الشكل 1. مثال لـ YOLO26 يُستخدم لتجزئة الكائنات في صورة.
ومع ذلك، YOLO26 ليس مجرد تحديث تدريجي. فبينما قد تبدو المهام المدعومة مألوفة، يمثل هذا النموذج الجديد خطوة مبتكرة إلى الأمام في كيفية تدريب نماذج الرؤية الحاسوبية. مع YOLO26، يمتد التركيز إلى ما هو أبعد من كفاءة الاستدلال ليشمل جعل التدريب أكثر استقراراً.
تم تصميم YOLO26 مع الأخذ في الاعتبار دورة حياة التدريب الكاملة. وهذا يعني تقارباً أسرع، وعمليات تدريب أكثر موثوقية، وسلوكاً ثابتاً للنموذج. هذه التحسينات مهمة بشكل خاص في سير العمل الواقعي، حيث تؤثر موثوقية التدريب بشكل مباشر على سرعة تكرار النماذج ونشرها.
لتمكين ذلك، يقدم YOLO26 العديد من ابتكارات التدريب المستهدفة مثل موازنة الخسارة التدريجية (ProgLoss)، وتعيين التسميات المدرك للكائنات الصغيرة (STAL)، ومحسّن MuSGD. تعمل هذه التغييرات معاً على تحسين كيفية موازنة خسارة التعلم، وكيفية تعيين التسميات، وكيفية سلوك التحسين بمرور الوقت.
في هذه المقالة، سوف نستكشف كيفية عمل كل آلية من هذه الآليات وسبب جعلها Ultralytics YOLO26 أسهل في التدريب وأكثر موثوقية على نطاق واسع. لنبدأ!
Link to this sectionUltralytics YOLO26: مصمم للتدريب بذكاء أكبر، وليس فقط للعمل بشكل أسرع#
يعمل Ultralytics YOLO26 على تبسيط خط أنابيب الاستدلال بالكامل محلياً من خلال إزالة الاعتماد على خطوات ما بعد المعالجة مثل NMS. بدلاً من إنشاء العديد من التنبؤات المتداخلة وتصفيتها بعد ذلك، ينتج YOLO26 اكتشافات نهائية مباشرة من الشبكة.
هذا يجعل YOLO26 نموذجاً شاملاً، حيث يتم تعلم التنبؤ، وحل التكرار، والمخرجات النهائية داخل الشبكة نفسها. وهذا يبسط النشر ويحسن كفاءة الاستدلال، بينما يشكل أيضاً كيفية تعلم النموذج أثناء التدريب.

الشكل 2. يقدم YOLO26 استدلالاً متطوراً وشاملاً وخالياً من NMS (المصدر)
في نظام شامل كهذا، يكون التدريب والاستدلال مرتبطين بشكل وثيق. ونظراً لعدم وجود مرحلة خارجية لما بعد المعالجة لتصحيح التنبؤات لاحقاً، يجب أن يتعلم النموذج اتخاذ قرارات واضحة وواثقة أثناء التدريب نفسه.
هذا يجعل المواءمة بين أهداف التدريب وسلوك الاستدلال مهمة بشكل خاص. أي عدم تطابق بين كيفية تدريب النموذج وكيفية استخدامه في وقت الاستدلال يمكن أن يؤدي إلى تعلم غير مستقر أو تقارب أبطأ.
يتعامل YOLO26 مع هذا من خلال تصميم عملية التدريب الخاصة به حول الاستخدام الواقعي منذ البداية. بدلاً من التركيز فقط على سرعة الاستدلال، تم بناء نظام التدريب لدعم التعلم المستقر عبر المدى الطويل، وتقارب متسق عبر أحجام النماذج من Nano إلى Extra Large، وأداء قوي على مجموعات بيانات متنوعة.
Link to this sectionكيف يعمل رأسا تدريب على تحسين التعلم في Ultralytics YOLO26#
أحد ابتكارات التدريب الرئيسية في Ultralytics YOLO26 يعتمد على نهج التدريب برأسين المستخدم في نماذج YOLO السابقة. في نماذج اكتشاف الكائنات، يشير الرأس إلى جزء الشبكة المسؤول عن إجراء التنبؤات.
بمعنى آخر، تتعلم رؤوس الاكتشاف التنبؤ بمكان وجود الكائنات في الصورة وما هي هذه الكائنات. إنهم يفعلون ذلك من خلال تراجع إحداثيات BBox، مما يعني أنهم يتعلمون تقدير موضع وحجم كل كائن في صورة الإدخال.
أثناء التدريب، يتعلم النموذج عن طريق تقليل الخسارة، وهو مقياس رقمي لمدى بعد تنبؤاته عن الإجابات الصحيحة أو الحقيقة الأساسية (ground truth). تعني الخسارة الأقل أن تنبؤات النموذج أقرب إلى الحقيقة الأساسية، بينما تشير الخسارة الأعلى إلى أخطاء أكبر. يوجه حساب الخسارة كيفية تحديث النموذج لمعلماته أثناء التدريب.
يستخدم YOLO26 رأسي اكتشاف أثناء التدريب يتشاركان نفس النموذج الأساسي لكنهما يخدمان أغراضاً مختلفة. رأس واحد لواحد (one-to-one) هو الرأس المستخدم في وقت الاستدلال. وهو يتعلم ربط كل كائن بتنبؤ واحد واثق، وهو أمر ضروري لتصميم YOLO26 الشامل والخالي من NMS.
في الوقت نفسه، يُستخدم رأس واحد للكثير (one-to-many) أثناء التدريب فقط. وهو يسمح بربط تنبؤات متعددة بنفس الكائن، مما يوفر إشرافاً أكثر كثافة. تساعد إشارة التعلم الأكثر ثراءً هذه على استقرار التدريب وتحسين الدقة، خاصة في المراحل المبكرة.
في YOLO26، يستخدم كلا الرأسين نفس حساب الخسارة لتراجع الصندوق والتصنيف. طبقت عمليات التنفيذ السابقة توازناً ثابتاً بين إشارتي الخسارة هاتين طوال فترة التدريب.
من الناحية العملية، ومع ذلك، تتغير أهمية كل رأس بمرور الوقت. يكون الإشراف الكثيف أكثر فائدة في البداية، بينما تصبح المواءمة مع سلوك الاستدلال أكثر أهمية لاحقاً في التدريب. تم تصميم YOLO26 حول هذه الرؤية، مما يؤدي مباشرة إلى كيفية إعادة موازنة إشارات التعلم مع تقدم التدريب.
Link to this sectionUltralytics YOLO26 يستخدم موازنة الخسارة التدريجية#
إذن، كيف يتعامل Ultralytics YOLO26 مع احتياجات التعلم المتغيرة هذه أثناء التدريب؟ إنه يستخدم موازنة الخسارة التدريجية لضبط كيفية ترجيح إشارات التعلم بمرور الوقت.
يعمل ProgLoss من خلال التحول الديناميكي لمقدار مساهمة كل رأس في الخسارة الإجمالية مع تقدم التدريب. في البداية، يتم وضع وزن أكبر على رأس واحد للكثير لتحقيق استقرار التعلم وتحسين الاستدعاء (recall). مع استمرار التدريب، يتحول التوازن تدريجياً نحو رأس واحد لواحد، مما يتماشى مع التدريب بشكل أوثق مع سلوك الاستدلال.
يسمح هذا الانتقال التدريجي لـ YOLO26 بالتعلم بالترتيب الصحيح. بدلاً من إجبار النموذج على تحسين أهداف متنافسة في وقت واحد، تعطي موازنة الخسارة التدريجية الأولوية لإشارة التعلم الأكثر فائدة في كل مرحلة من مراحل التدريب. النتيجة هي تقارب أكثر سلاسة، وعدد أقل من عمليات التدريب غير المستقرة، وأداء نهائي أكثر اتساقاً.
Link to this sectionكيف يساعد STAL نموذج Ultralytics YOLO26 في التعلم من الكائنات الصغيرة#
تحسين تدريبي آخر مثير للاهتمام في Ultralytics YOLO26 يأتي من كيفية تعيين النموذج لأهداف التدريب للتنبؤات، وهي عملية تُعرف بتعيين التسميات. وهي مسؤولة عن مطابقة كائنات الحقيقة الأساسية مع تنبؤات المرشحين، والتي غالباً ما تسمى anchors.
تحدد هذه التطابقات التنبؤات التي تتلقى الإشراف وتساهم في الخسارة. يعتمد YOLO26 على طريقة موجودة لتعيين التسميات تسمى تعلم مواءمة المهام (TAL)، والتي تم تصميمها لتحسين مواءمة التصنيف والتوطين أثناء التدريب.
بينما يعمل TAL بشكل جيد لمعظم الكائنات، كشف التدريب عن قيد مهم. أثناء عملية المطابقة، يمكن إسقاط الكائنات الصغيرة جداً تماماً. من الناحية العملية، غالباً ما تفشل الكائنات الأصغر من حوالي 8 بكسل في صورة إدخال بحجم 640 بكسل في تلقي أي تعيينات anchor. عندما يحدث هذا، يتلقى النموذج القليل أو لا يتلقى أي إشراف لتلك الكائنات، مما يجعل من الصعب تعلم اكتشافها بشكل موثوق.
لمعالجة هذه المشكلة، يقدم YOLO26 تعيين التسميات المدرك للكائنات الصغيرة (STAL). يعدل STAL عملية التعيين لضمان عدم تجاهل الكائنات الصغيرة أثناء التدريب. على وجه التحديد، فإنه يفرض حداً أدنى من أربعة تعيينات anchor للكائنات الأصغر من 8 بكسل. يضمن هذا أن الكائنات الصغيرة جداً تساهم باستمرار في خسارة التدريب.
من خلال تعزيز الإشراف على الأهداف الصغيرة، يحسن STAL استقرار التعلم وأداء الاكتشاف في السيناريوهات التي تكون فيها الكائنات الصغيرة أو البعيدة شائعة. هذا التحسين مهم بشكل خاص لتطبيقات YOLO26 الموجهة للحافة مثل الصور الجوية، والروبوتات، وأنظمة إنترنت الأشياء (IoT)، حيث غالباً ما تكون الكائنات صغيرة أو بعيدة أو مرئية جزئياً ويكون الاكتشاف الموثوق أمراً بالغ الأهمية.
Link to this sectionUltralytics YOLO26 يقدم محسّن MuSGD#
لدعم تدريب أكثر استقراراً وقابلية للتنبؤ، يقدم Ultralytics YOLO26 أيضاً محسّناً جديداً يسمى MuSGD. تم تصميم هذا المحسّن لتحسين التقارب وموثوقية التدريب في نماذج الاكتشاف الشاملة، خاصة مع زيادة حجم النموذج وتعقيد التدريب.
لكي تتعلم الشبكة العصبية، وبالتالي تغيير الأوزان وفقاً لذلك، أثناء التدريب، نقوم بحساب خطأ (يسمى أيضاً "الخسارة"). لذلك، يقيس النموذج مدى خطأ تنبؤاته باستخدام قيمة الخسارة، ويحسب التدرجات التي تشير إلى كيفية تغيير معلماته، ثم يقوم بتحديث تلك المعلمات لتقليل الخطأ. يعد SGD محسّناً مستخدماً على نطاق واسع يقوم بهذه التحديثات، مما يجعل التدريب فعالاً وقابلاً للتوسع.

الشكل 3. التدرج العشوائي مقابل انحدار التدرج (المصدر)
يبني MuSGD على هذا الأساس المألوف من خلال دمج أفكار التحسين المستوحاة من Muon، وهي طريقة مستخدمة في تدريب النماذج اللغوية الكبيرة. تأثرت هذه الأفكار بالتطورات الأخيرة مثل Kimi K2 من Moonshot AI، والتي أثبتت سلوك تدريب محسّن من خلال تحديثات أكثر تنظيماً للمعلمات.
يستخدم YOLO26 استراتيجية تحديث هجينة. يتم تحديث بعض المعلمات باستخدام مزيج من تحديثات مستوحاة من Muon و SGD، بينما يستخدم البعض الآخر SGD وحده. هذا يجعل من الممكن لـ YOLO26 إدخال هيكل إضافي في عملية التحسين مع الحفاظ على خصائص المتانة والتعميم التي جعلت SGD فعالاً.
النتيجة هي تحسين أكثر سلاسة، وتقارب أسرع، وسلوك تدريب أكثر قابلية للتنبؤ عبر أحجام النماذج، مما يجعل MuSGD جزءاً رئيسياً من سبب سهولة تدريب YOLO26 وموثوقيته على نطاق واسع.
Link to this sectionأهمية ابتكارات التدريب في Ultralytics YOLO26#
ابتكارات التدريب في Ultralytics YOLO26، جنباً إلى جنب مع الميزات الرئيسية مثل تصميمها الشامل والخالي من NMS والموجه للحافة، تجعل النموذج أسهل في التدريب وأكثر موثوقية على نطاق واسع. قد تتساءل عما يعنيه ذلك حقاً لتطبيقات الرؤية الحاسوبية.

الشكل 4. نظرة على الميزات الرئيسية لـ YOLO26 (المصدر)
عملياً، يجعل هذا جلب الرؤية الحاسوبية إلى حيث تعمل فعلياً أسهل بكثير. تتدرب النماذج بشكل أكثر قابلية للتنبؤ، وتتوسع بشكل أكثر اتساقاً عبر الأحجام، وهي أبسط في التكيف مع مجموعات البيانات الجديدة. هذا يقلل من الاحتكاك بين التجريب والنشر، خاصة في البيئات التي تكون فيها الموثوقية والكفاءة مهمتين بقدر الأداء الخام.
على سبيل المثال، في تطبيقات الرؤية الروبوتية والصناعية، غالباً ما تحتاج النماذج إلى إعادة التدريب بشكل متكرر مع تغير البيئات أو أجهزة الاستشعار أو المهام. مع YOLO26، يمكن للفرق التكرار بشكل أسرع دون القلق بشأن عمليات التدريب غير المستقرة أو السلوك غير المتسق عبر أحجام النماذج.
Link to this sectionأبرز النقاط#
تعتمد أنظمة الرؤية الحاسوبية الموثوقة على كيفية تدريب النماذج بقدر اعتمادها على كيفية أدائها في وقت الاستدلال. من خلال تحسين كيفية موازنة إشارات التعلم، وكيفية التعامل مع الكائنات الصغيرة، وكيفية تقدم التحسين، يجعل YOLO26 التدريب أكثر استقراراً وأسهل في التوسع. يساعد هذا التركيز على التدريب الموثوق الفرق على الانتقال بسلاسة أكبر من التجريب إلى النشر الواقعي، خاصة في التطبيقات الموجهة للحافة.
هل تريد التعرف على الذكاء الاصطناعي؟ قم بزيارة مستودع GitHub الخاص بنا لاكتشاف المزيد. انضم إلى مجتمعنا النشط واكتشف الابتكارات في قطاعات مثل الذكاء الاصطناعي في الخدمات اللوجستية ورؤية الذكاء الاصطناعي في صناعة السيارات. للبدء في الرؤية الحاسوبية اليوم، تحقق من خيارات الترخيص الخاصة بنا.






