اكتشف الكبت غير الأقصى (NMS) لاكتشاف الأجسام. تعرّف على كيفية تحسين النتائج وتعزيز الدقة وتشغيل تطبيقات الذكاء الاصطناعي مثل YOLO.
يُعد الكبت غير الأقصى (NMS) تقنية حاسمة لما بعد المعالجة تُستخدم على نطاق واسع في الرؤية الحاسوبية، خاصةً ضمن خطوط أنابيب اكتشاف الأجسام. ويتمثل دورها الرئيسي في تنقيح المخرجات الأولية الناتجة عن نماذج الكشف، والتي غالبًا ما تحدد مربعات حدية متعددة ومتداخلة لنفس مثيل الكائن. من خلال تصفية هذه المربعات الزائدة عن الحاجة بذكاء، يضمن نظام NMS تمثيل كل كائن مميز في صورة أو إطار فيديو بمربع واحد ومثالي. يعمل هذا على تحسين وضوح ودقة نتائج الكشف النهائية بشكل كبير، مما يجعلها أكثر فائدة للمهام اللاحقة.
نماذج اكتشاف الأجسام، مثل Ultralytics YOLO عادةً ما تفحص صورة ما وتقترح العديد من المربعات المحيطة المحتملة حول الأجسام المكتشفة. يأتي كل مربع مقترح مع درجة ثقة، مما يشير إلى يقين النموذج من أن المربع يحتوي على كائن وينتمي إلى فئة معينة. تعمل NMS من خلال تقليل هذه المقترحات بشكل منهجي بناءً على درجات الثقة والتداخل المكاني.
تتبع العملية بشكل عام الخطوات التالية
يضمن ذلك بقاء المربعات الأكثر ثقة وغير المتداخلة فقط، مما يوفر مخرجات أنظف بكثير وأكثر قابلية للتفسير، كما هو موضح في العديد من البرامج التعليمية للرؤية الحاسوبية.
في المجالات الأوسع نطاقًا للذكاء الاصطناعي (AI) والتعلم الآلي (ML)، يعد نظام إدارة الشبكة أساسيًا لتحقيق أداء موثوق به في اكتشاف الأجسام. بدون NMS، فإن مخرجات كاشف مثل YOLO11 سيكون مزدحمًا بمربعات متعددة للأجسام المفردة. يمكن أن يؤدي هذا التكرار إلى حدوث أخطاء في التطبيقات النهائية، مثل عد الكائنات(دليل عد الكائنات) أو تتبع الكائنات أو فهم المشهد المعقد في الروبوتات.
من خلال التخلص من هذه الاكتشافات الزائدة عن الحاجة (التي غالبًا ما تساهم في النتائج الإيجابية الخاطئة)، يعزز نظام إدارة النماذج بشكل كبير من دقة تنبؤات النموذج. يعد هذا التحسين أمرًا بالغ الأهمية للتطبيقات التي تتطلب موثوقية ودقة عالية. ينعكس تأثير نظام إدارة النماذج في مقاييس التقييم مثل متوسط الدقة المتوسطة (mAP)، والتي يتم حسابها عادةً بعد تطبيق نظام إدارة النماذج، كما هو مفصل في دليل مقاييس أداءYOLO .
تُعد NMS تقنية أساسية تتيح العديد من تطبيقات الذكاء الاصطناعي العملية:
إن NMS هي على وجه التحديد خطوة ما بعد المعالجة يتم تطبيقها بعد أن يكون نموذج الكشف عن الكائن قد أنشأ مجموعته الأولية من المربعات المحدودة المرشحة. لا ينبغي الخلط بينه وبين بنية الكشف نفسها، مثل الفرق بين أجهزة الكشف القائمة على المرساة وأجهزة الكشف الخالية من المرساة. وتحدد هذه البنى كيفية اقتراح المربعات المحتملة، بينما يقوم نظام الرصد الوطني بتحسين هذه المقترحات.
ومن المثير للاهتمام، أن التكلفة الحسابية والاختناقات المحتملة المرتبطة بنظام تحديد المربعات غير المتناسقة قد حفزت البحث في أجهزة الكشف عن الأجسام الخالية من نظام تحديد المربعات غير المتناسقة. تدمج نماذج مثل YOLOv10 آليات أثناء التدريب (مثل التعيينات المزدوجة المتسقة) لتجنب التنبؤ بالمربعات الزائدة عن الحاجة، بهدف تقليل زمن الاستجابة للاستدلال وتمكين الكشف الشامل الحقيقي(نهج YOLOv10 الخالي من NMS). يتناقض هذا مع المقاربات التقليدية مثل Ultralytics YOLOv8 أو YOLOv5حيث لا يزال نظام إدارة المحتوى NMS جزءًا قياسيًا وأساسيًا من خط أنابيب الاستدلال. يمكنك استكشاف المقارنات التقنية، مثل YOLOv10 مقابل YOLOv8 في وثائقنا. تُقدّم متغيرات مثل Soft-NMS(ورقة عن Soft-NMS) مناهج بديلة تُقلل من درجات المربعات المتداخلة بدلاً من إزالتها بالكامل.
يتم دمج NMS بسلاسة في نظام Ultralytics البيئي. تطبق نماذج Ultralytics YOLO تلقائيًا نظام إدارة المحتوى الوطني أثناء التنبؤ (predict
) و التحقق من الصحة (val
) أوضاع، مما يضمن حصول المستخدمين على مخرجات كشف نظيفة ودقيقة بشكل افتراضي. يمكن في كثير من الأحيان ضبط المعلمات التي تتحكم في سلوك نظام إدارة الشبكة (مثل عتبة وحدة الكشف عن الهوية وعتبة الثقة) لتلبية احتياجات تطبيق معين.
تعمل المنصات مثل Ultralytics HUB على تجريد هذه التفاصيل بشكل أكبر، مما يسمح للمستخدمين بتدريب النماذج(دليل التدريب السحابي) ونشرها حيث يتم التعامل مع نظام إدارة الشبكة تلقائيًا كجزء من خط الأنابيب المحسّن. ويضمن هذا التكامل إمكانية استفادة المستخدمين، بغض النظر عن خبرتهم الفنية العميقة في مجال MLOps، من أحدث نتائج اكتشاف الأجسام لمختلف مهام الرؤية الحاسوبية. يمكن استكشاف تفاصيل التنفيذ المحددة داخل إطار عمل Ultralytics في مرجع أدواتUltralytics المساعدة. لمزيد من التعريفات، راجع مسرد مصطلحاتUltralytics الرئيسي.