لماذا يزيل Ultralytics YOLO26 الـ NMS وكيف يغير ذلك النشر
اكتشف كيف يتيح Ultralytics YOLO26 استدلالاً حقيقياً من البداية إلى النهاية بدون NMS، ولماذا تبسط إزالة المعالجة اللاحقة التصدير والنشر على الحافة.

في 14 يناير، أطلقنا Ultralytics YOLO26، وهو أحدث جيل من نماذج الرؤية الحاسوبية لدينا. مع YOLO26، لم يكن هدفنا مجرد تحسين الدقة أو السرعة، بل إعادة التفكير في كيفية بناء نماذج اكتشاف الكائنات ونشرها في الأنظمة الواقعية.
بينما تنتقل الرؤية الحاسوبية من البحث إلى الإنتاج، يزداد التوقع بأن تعمل النماذج على وحدات المعالجة المركزية (CPUs)، وأجهزة الحافة (edge devices)، والكاميرات، والروبوتات، والأجهزة المدمجة. في هذه البيئات، تعد الموثوقية وزمن الوصول المنخفض وسهولة النشر أموراً تضاهي في أهميتها الأداء.
صُمم YOLO26 مع وضع هذا الواقع في الاعتبار، باستخدام بنية انسيابية شاملة (end-to-end) تزيل التعقيد غير الضروري من مسار الاستنتاج. أحد أهم الابتكارات في YOLO26 هو إزالة قمع غير الحد الأقصى، المعروف باسم NMS.
لسنوات عديدة، كان NMS جزءاً قياسياً من أنظمة اكتشاف الكائنات، حيث يُستخدم كخطوة معالجة لاحقة لتنظيف الاكتشافات المتكررة. وعلى الرغم من فعاليته، إلا أنه أدخل عمليات حسابية إضافية وتحديات في النشر، خاصة على أجهزة الحافة.
مع YOLO26، اتخذنا نهجاً مختلفاً. من خلال إعادة التفكير في كيفية توليد التوقعات وتدريبها، مكنّا الاستنتاج الشامل الحقيقي والخالي من NMS. ينتج النموذج الاكتشافات النهائية مباشرة، دون الاعتماد على خطوات تنظيف خارجية أو قواعد مصممة يدوياً. هذا يجعل YOLO26 أسرع، وأسهل في التصدير، وأكثر موثوقية للنشر عبر مجموعة واسعة من منصات الأجهزة.

الشكل 1. اكتشاف الكائنات في صورة باستخدام Ultralytics YOLO26.
في هذه المقالة، سنلقي نظرة فاحصة على سبب اعتماد اكتشاف الكائنات التقليدي على NMS، وكيف أصبح عنق زجاجة في النشر، وكيف يلغي YOLO26 الحاجة إلى الحلول المؤقتة. لنبدأ!
Link to this sectionاكتشاف الكائنات التقليدي ينتج اكتشافات متكررة#
قبل أن نتعمق في ماهية NMS وسبب إزالته في YOLO26، دعونا نتراجع خطوة للوراء وننظر في كيفية توليد نماذج اكتشاف الكائنات التقليدية لتوقعاتها.
غالباً ما تنتج نماذج اكتشاف الكائنات التقليدية صناديق إحاطة (bounding boxes) متعددة ومتداخلة لنفس الكائن. يأتي كل صندوق من هذه الصناديق مع درجة ثقة خاصة به، على الرغم من أنها تشير جميعها إلى نفس الكائن في الصورة.
يحدث هذا لعدة أسباب. أولاً، يقوم النموذج بعمل توقعات في العديد من المواقع المكانية وبمقياسات مختلفة في وقت واحد. يساعد هذا النموذج على اكتشاف كائنات بأحجام مختلفة، ولكنه يعني أيضاً أن المواقع القريبة يمكنها جميعاً تحديد نفس الكائن بشكل مستقل.
ثانياً، تستخدم العديد من أنظمة اكتشاف الكائنات مناهج قائمة على الركائز (anchor-based)، والتي تولد عدداً كبيراً من صناديق الترشيح حول كل موقع. وعلى الرغم من أن هذا يحسن فرصة العثور على الكائنات بدقة، إلا أنه يزيد أيضاً من عدد التوقعات المتداخلة.
أخيراً، يؤدي الاكتشاف القائم على الشبكة (grid-based) بطبيعته إلى التكرار. عندما يجلس كائن بالقرب من حدود خلايا شبكية متعددة، قد تتوقع عدة خلايا صندوقاً لهذا الكائن، مما يؤدي إلى اكتشافات متداخلة متعددة.
بسبب هذا، غالباً ما تحتوي المخرجات الخام للنموذج على عدة صناديق لكائن واحد. لجعل النتائج قابلة للاستخدام، يجب تصفية هذه التوقعات الزائدة بحيث لا يتبقى سوى اكتشاف نهائي واحد.
Link to this sectionفهم قمع غير الحد الأقصى (NMS)#
بمجرد أن ينتج نموذج اكتشاف الكائنات صناديق إحاطة متداخلة متعددة لنفس الكائن، يجب تنظيف تلك النتائج قبل أن تصبح جاهزة للاستخدام. وهنا يتم تطبيق قمع غير الحد الأقصى.
قمع غير الحد الأقصى هو خطوة معالجة لاحقة تعمل بعد انتهاء النموذج من إجراء توقعاته. هدفها هو تقليل الاكتشافات المتكررة بحيث يتم تمثيل كل كائن بصندوق إحاطة نهائي واحد.

الشكل 2. نظرة عامة على NMS. الصورة بواسطة المؤلف.
تعمل العملية من خلال مقارنة صناديق الإحاطة بناءً على درجات الثقة ومدى تداخلها. يتم إزالة التوقعات ذات الثقة المنخفضة جداً أولاً.
يتم بعد ذلك ترتيب الصناديق المتبقية حسب الثقة، ويتم اختيار الصندوق ذو النتيجة الأعلى كأفضل اكتشاف. يُقارن ذلك الصندوق المختار بالصناديق الأخرى.
إذا تداخل صندوق آخر معه بشكل كبير، يتم قمع ذلك الصندوق وإزالته. يُقاس التداخل عادةً باستخدام التقاطع فوق الاتحاد، وهو مقياس يحسب النسبة بين المساحة المشتركة بين صندوقين والمساحة الإجمالية التي يغطيها كلاهما. تتكرر هذه العملية حتى تبقى فقط الاكتشافات الأكثر ثقة وغير المتداخلة.
Link to this sectionلماذا يعقد NMS عملية النشر؟#
بينما يساعد قمع غير الحد الأقصى في تصفية الاكتشافات المتكررة، فإنه يطرح أيضاً تحديات تصبح أكثر وضوحاً بمجرد انتقال النماذج من البحث إلى النشر في العالم الحقيقي.
إحدى أكبر المشكلات هي الأداء. يعمل NMS بعد الاستنتاج ويتطلب مقارنة صناديق الإحاطة ببعضها البعض لتقرير أي منها سيتم الاحتفاظ به.
هذه العملية مكلفة حسابياً ويصعب تنفيذها بالتوازي بكفاءة. على أجهزة الحافة والأنظمة القائمة على وحدة المعالجة المركزية، يمكن لهذا العمل الإضافي أن يضيف تأخيراً ملحوظاً، مما يجعل من الصعب تلبية متطلبات الوقت الفعلي.
يزيد NMS أيضاً من تعقيد النشر. نظراً لأنه ليس جزءاً من النموذج نفسه، يجب تنفيذه بشكل منفصل ككود معالجة لاحقة.
تتعامل بيئات التشغيل والمنصات المختلفة مع NMS بطرق مختلفة، مما يعني غالباً صيانة عمليات تنفيذ مخصصة لكل بيئة مستهدفة. ما يعمل في إعداد واحد قد يتصرف بشكل مختلف قليلاً في إعداد آخر، مما يجعل النشر أكثر هشاشة ويصعب توسيع نطاقه.
تحسين الأجهزة هو تحدٍ آخر. لا يتوافق NMS بشكل جيد مع مسرعات الذكاء الاصطناعي المتخصصة، المصممة لتشغيل عمليات الشبكة العصبية بكفاءة. ونتيجة لذلك، حتى عندما يعمل النموذج بسرعة على أجهزة محسنة، يمكن أن يصبح NMS عنق زجاجة يحد من الأداء العام.
بالإضافة إلى هذه العوامل، يعتمد NMS على معايير مختارة يدوياً مثل عتبات الثقة وعتبات التداخل. يمكن لهذه الإعدادات أن تؤثر على النتائج بشكل كبير وغالباً ما تحتاج إلى ضبط لمجموعات البيانات أو التطبيقات أو الأجهزة المختلفة. هذا يجعل السلوك أقل قابلية للتنبؤ في أنظمة الإنتاج ويضيف عبئاً إضافياً في التكوين.
Link to this sectionشرح استنتاج اكتشاف الكائنات الشامل (End-to-end)#
أدت قيود قمع غير الحد الأقصى إلى إعادة تفكيرنا في كيفية تصرف نماذج اكتشاف الكائنات في وقت الاستنتاج. بدلاً من توليد العديد من التوقعات المتداخلة وتنظيفها بعد ذلك، طرحنا سؤالاً أكثر جوهرية.
ماذا لو كان بإمكان النموذج إنتاج اكتشافات نهائية مباشرة؟ يكمن هذا السؤال في قلب استنتاج اكتشاف الكائنات الشامل. في نظام شامل، يتم تدريب النموذج للتعامل مع عملية الاكتشاف بأكملها من البداية إلى النهاية، دون الاعتماد على خطوات تنظيف خارجية.
بدلاً من إنتاج العديد من الصناديق المرشحة وتصفيتها بعد الاستنتاج، يتعلم النموذج توليد مجموعة صغيرة من التوقعات الواثقة وغير المتداخلة من تلقاء نفسه. يتم حل الاكتشافات المتكررة داخل الشبكة بدلاً من إزالتها بواسطة المعالجة اللاحقة.
أظهرت معماريات النماذج الأحدث أن هذا النهج كان ممكناً وعملياً. مع استراتيجية التدريب الصحيحة، يمكن للنماذج أن تتعلم ربط كل كائن بتوقع واحد بدلاً من العديد من التوقعات المتنافسة، مما يقلل التكرار من مصدره.

الشكل 3. مثال على اكتشاف الكائنات باستخدام Ultralytics YOLO26.
لكي ينجح هذا، يجب أن يتغير التدريب أيضاً. بدلاً من السماح للعديد من التوقعات بالتنافس على نفس الكائن، يتعلم النموذج اتخاذ قرار واحد واضح، مما ينتج عنه اكتشافات أقل وأكثر ثقة.
النتيجة الإجمالية هي مسار استنتاج أبسط. نظراً لأن التكرارات يتم حلها بالفعل داخلياً، فلا حاجة لقمع غير الحد الأقصى في وقت الاستنتاج. مخرجات النموذج هي بالفعل المجموعة النهائية من الاكتشافات.
يجعل هذا التصميم الشامل النشر أسهل أيضاً. بدون خطوات معالجة لاحقة أو عمليات تنفيذ NMS خاصة بالمنصة، يكون النموذج المصدر مكتفياً ذاتياً بالكامل ويعمل بشكل متسق عبر أطر عمل استنتاج وأهداف أجهزة مختلفة.
كما يوضح مهندس الشراكات الرئيسي لدينا، فرانشيسكو ماتيولي، "التعلم الشامل الحقيقي يعني أن النموذج يجب أن يتعامل مع كل شيء من البكسلات إلى التوقعات، دون خطوات معالجة لاحقة مصممة يدوياً تكسر القدرة على الاشتقاق وتعقد النشر."
Link to this sectionكيف تزيل Ultralytics YOLO26 تقنية NMS#
يزيل YOLO26 قمع غير الحد الأقصى عن طريق تغيير كيفية تعلم الاكتشافات وإنتاجها، بدلاً من الاعتماد على المعالجة اللاحقة لتنظيفها. بدلاً من السماح للعديد من التوقعات بالتنافس على نفس الكائن، يتم تدريب YOLO26 على تعلم علاقة واضحة واحد لواحد بين الكائنات والمخرجات.
يتم تمكين هذا جزئياً من خلال الاكتشاف القائم على الاستعلام القابل للتعلم، مما يساعد النموذج على التركيز على إنتاج توقع واحد واثق لكل كائن بدلاً من العديد من المرشحين المتداخلين. يرتبط كل كائن بتوقع واحد، مما يقلل الاكتشافات المتكررة بشكل طبيعي.
يتم تعزيز هذا السلوك من خلال استراتيجيات مطابقة متسقة أثناء التدريب، مما يشجع النموذج على اتخاذ قرار واحد واثق لكل كائن بدلاً من توليد توقعات متداخلة. في النهاية، ينتج النموذج توقعات أقل، لكن كل واحدة تمثل اكتشافاً نهائياً.
Link to this sectionلماذا جعلت إزالة DFL الاكتشاف الخالي من NMS ممكناً#
ابتكار مهم آخر يتيح الاستنتاج الخالي من NMS في YOLO26 هو إزالة خسارة التوزيع البؤرية (Distribution Focal Loss)، أو DFL. في نماذج YOLO السابقة، تم استخدام DFL لتحسين انحدار صندوق الإحاطة من خلال التنبؤ بتوزيع لمواقع الصناديق المحتملة بدلاً من قيمة واحدة.
بينما أدى هذا النهج إلى تحسين دقة التوطين، إلا أنه أضاف أيضاً تعقيداً إلى مسار الاكتشاف. أصبح هذا التعقيد قيداً عند الانتقال نحو استنتاج شامل حقيقي.
أدخلت DFL حسابات إضافية ونطاقات انحدار ثابتة، مما جعل من الصعب على النموذج تعلم تعيينات كائنات نظيفة (واحد لواحد) وزاد من الاعتماد على خطوات المعالجة اللاحقة مثل قمع غير الحد الأقصى. مع YOLO26، أزلنا DFL وأعدنا تصميم انحدار صندوق الإحاطة ليكون أبسط وأكثر مباشرة.
بدلاً من الاعتماد على المخرجات القائمة على التوزيع، يتعلم النموذج التنبؤ بإحداثيات صندوق دقيقة بطريقة تدعم اكتشافات أقل وأكثر ثقة. يساعد هذا التغيير في تقليل التوقعات المتداخلة من مصدرها ويجعل انحدار صندوق الإحاطة متوافقاً مع تصميم YOLO26 الشامل والخالي من NMS.
Link to this sectionUltralytics YOLO26 خالي من NMS وسهل النشر#
يجعل التصميم الخالي من NMS من YOLO26 نموذجاً شاملاً حقاً. لهذا تأثير مهم على تصدير النماذج.
يعني التصدير تحويل نموذج مدرب إلى تنسيق يمكن تشغيله خارج بيئة التدريب، مثل ONNX أو TensorRT أو CoreML أو OpenVINO. في المسارات التقليدية، غالباً ما تنهار هذه العملية لأن قمع غير الحد الأقصى ليس جزءاً من النموذج نفسه.
من خلال إزالة NMS، يتجنب YOLO26 هذه المشكلة تماماً. يتضمن النموذج المصدر بالفعل كل ما يلزم لإنتاج اكتشافات نهائية.
هذا يجعل النموذج المصدر مكتفياً ذاتياً بالكامل وأكثر قابلية للنقل عبر أطر عمل الاستنتاج وأهداف الأجهزة. يتصرف نفس النموذج بشكل متسق سواء تم نشره على خوادم أو أنظمة تعتمد على وحدة المعالجة المركزية فقط أو أجهزة مدمجة أو مسرعات الحافة. يصبح النشر أكثر وضوحاً لأن ما تصدره هو بالضبط ما تشغله.
تعتبر هذه البساطة مهمة بشكل خاص لتطبيقات الحافة. على سبيل المثال، يمكن نشر YOLO26 بسهولة على أجهزة مثل الطائرات بدون طيار لحالات استخدام مثل مراقبة المحاصيل، وفحص الحقول، وتحليل صحة النباتات، حيث تجعل ميزانيات الحوسبة والطاقة المحدودة مسارات المعالجة اللاحقة المعقدة غير عملية. نظراً لأن النموذج يخرج اكتشافات نهائية مباشرة، فإنه يعمل بشكل موثوق على الأجهزة خفيفة الوزن دون خطوات معالجة إضافية.

الشكل 4. Ultralytics YOLO26 سهل النشر على أجهزة الحافة مثل الطائرات بدون طيار.
باختصار، يزيل الاستنتاج الخالي من NMS الاحتكاك من التصدير والنشر ويتيح أنظمة رؤية أنظف وأكثر موثوقية. كان NMS حلاً مؤقتاً. لم يعد YOLO26 بحاجة إلى حلول مؤقتة بعد الآن.
Link to this sectionأبرز النقاط#
يزيل YOLO26 قمع غير الحد الأقصى من خلال حل المشكلة الأساسية للاكتشافات المتكررة، بدلاً من تنظيفها بعد وقوعها. يسمح تصميمه الشامل للنموذج بإنتاج اكتشافات نهائية مباشرة، مما يجعل التصدير والنشر أبسط وأكثر اتساقاً عبر الأجهزة المختلفة. كان NMS حلاً مؤقتاً مفيداً للأنظمة السابقة، لكن YOLO26 لم يعد بحاجة إليه.
انضم إلى مجتمعنا وتحقق من مستودع GitHub الخاص بنا لمعرفة المزيد حول الذكاء الاصطناعي. استكشف صفحات حلولنا حول الذكاء الاصطناعي في الزراعة والرؤية الحاسوبية في التجزئة. اكتشف خيارات الترخيص لدينا وابدأ مع الرؤية بالذكاء الاصطناعي اليوم!






