Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

الكبت غير الأقصىNMS

اكتشف الكبت غير الأقصىNMS) لاكتشاف الأجسام. تعرّف على كيفية تحسين النتائج وتعزيز الدقة وتشغيل تطبيقات الذكاء الاصطناعي مثل YOLO.

يعد الكبت غير الأقصىNMS) تقنية حيوية لما بعد المعالجة تُستخدم في الرؤية الحاسوبية لتحسين نتائج خوارزميات اكتشاف الأجسام. عندما يحلل النموذج صورة ما، فإنه كثيرًا ما يتنبأ بعدة مربعات متداخلة متعددة متداخلة لجسم واحد، كل منها له احتمالية مميزة لكل منها. تقوم NMS بتصفية هذه التنبؤات الزائدة عن الحاجة لضمان تحديد كل كائن فريد من نوعه مرة واحدة فقط، مع الاحتفاظ فقط بالمربع الأكثر دقة بينما يتم تجاهل البقية. هذه العملية ضرورية لتحقيق دقة عالية عالية الدقة في تطبيقات العالم الحقيقي، مما يمنع الأنظمة من اكتشاف التكرارات "الشبحية" لنفس الهدف.

آليات القمع

تعمل خوارزمية NMS كمرشح يقوم بتنظيف المخرجات الأولية لنموذج نموذج التعلم العميق. تعتمد بشكل كبير على مقياسين رئيسيين رئيسيين: درجة الثقة، والتي تشير إلى مدى مدى تأكد النموذج من احتواء المربع على كائن ما، ومقياس التقاطع على الاتحاد (IoU)، والذي الذي يقيس التداخل المكاني بين صندوقين.

تتبع خوارزمية الجشع القياسية NMS بشكل عام هذه الخطوات:

  1. تحديد العتبة: يتم استبعاد جميع المربعات المرشحة التي حصلت على درجة ثقة أقل من عتبة معينة على الفور لإزالة التنبؤات الضعيفة.
  2. الفرز: يتم فرز المربعات المتبقية بترتيب تنازلي بناءً على درجات الثقة الخاصة بها.
  3. التحديد: يتم تحديد المربع الذي حصل على أعلى الدرجات كاكتشاف صالح.
  4. قمع: تقارن الخوارزمية المربع المحدد مع جميع المربعات الأخرى المتبقية. إذا تجاوز IoU بين المربع المحدد ومربع آخر يتجاوز حدًا محددًا (على سبيل المثال، 0.5)، يتم كبت المربع الأقل درجة (محذوف) لأنه يُفترض أنه يمثل نفس الكائن.
  5. التكرار: تتكرر هذه العملية للمربع التالي الذي حصل على أعلى الدرجات حتى تتم معالجة جميع المرشحين جميع المرشحين.

تعمل الاختلافات المتقدمة، مثل NMS على تقليل درجات الكشف عن المربعات المتداخلة بدلًا من إزالتها بالكامل، وهو ما يمكن أن يكون مفيدًا في المشاهد المزدحمة حيث الأجسام تحجب بعضها البعض بشكل طبيعي.

تطبيقات واقعية

ينتشر NMS في كل مكان في الأنظمة التي تعتمد على الذكاء الاصطناعي لتفسير البيانات المرئية. ويكتسب دوره أهمية خاصة في البيئات الحرجة للسلامة والبيئات عالية الدقة.

  • الذكاء الاصطناعي في السيارات: في مكدسات الإدراك في السيارات ذاتية القيادة، فإن اكتشاف المركبات الأخرى والمشاة بدقة أمر غير قابل للتفاوض. فبدون NMS الإدراك التلقائي للمركبة قد detect نظام الإدراك التلقائي للمركبة أن أحد المشاة قد detect مشاةً واحداً على أنه ثلاثة أو أربعة أشخاص منفصلين بسبب التنبؤات المتداخلة. قد يؤدي ذلك إلى إرباك خوارزميات تخطيط الحركة، مما يؤدي إلى كبح أو توجيه غير منتظم أو التوجيه الخاطئ. يضمن NMS تمثيلاً نظيفاً وموحداً للعوائق، كما هو الحال في تقنيات مثل NVIDIA DRIVE.
  • تحليل الصور الطبية: عند استخدام الذكاء الاصطناعي لتحديد الأورام أو الآفات في صور الأشعة السينية والتصوير بالرنين المغناطيسي، فإن الدقة أمر بالغ الأهمية. ويستخدم الذكاء الاصطناعي في أنظمة الرعاية الصحية NMS لضمان أن عدم تسبب حالة شاذة واحدة في إطلاق تنبيهات متعددة، مما يساعد أخصائيي الأشعة على التركيز على النتائج المميزة. موثوقة من النتائج الإيجابية الكاذبة، مما يؤدي إلى تبسيط سير العمل التشخيصي الموصوف في أبحاث التصوير الطبي.

NMS في Ultralytics YOLO

في Ultralytics YOLO11 تم دمج NMS مباشرةً في خط أنابيب التنبؤ. يمكن للمستخدمين بسهولة ضبط معلمات NMS مثل عتبة IoU لتحقيق التوازن بين إزالة التكرارات وفصل الكائنات المتقاربة.

يوضح مقتطف التعليمات البرمجية التالية كيفية تشغيل الاستدلال وتخصيص إعدادات NMS باستخدام ultralytics الحزمة:

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Run inference on an image
# 'iou=0.5' sets the NMS threshold; boxes with >50% overlap are suppressed
# 'conf=0.25' filters out boxes with low confidence before NMS runs
results = model.predict("https://ultralytics.com/images/bus.jpg", iou=0.5, conf=0.25)

# Display the number of detected objects after NMS
print(f"Objects detected: {len(results[0].boxes)}")

مقارنة مع المفاهيم ذات الصلة

من المهم التمييز بين NMS والمصطلحات الأخرى الموجودة في خطوط أنابيب الكشف.

  • صناديق التثبيت مقابل صناديق التثبيت: المراسي هي أشكال محددة مسبقًا تُستخدم كنقاط بداية للتنبؤات أثناء معالجة النموذج. NMS هي خطوة ما بعد المعالجة تحدث بعد أن يخرج النموذج تنبؤاته النهائية.
  • NMS مقابل عتبة الثقة: A تقوم عتبة الثقة بتصفية المربعات بناءً على درجات الاحتمالات الفردية فقط. أما NMS فتقوم بتصفية المربعات بناءً على علاقتها (تداخلها) مع المربعات الأخرى.
  • NMS مقابل الكشف من النهاية إلى النهاية: تضيف NMS التقليدية كمون الاستدلال لأنها عملية متسلسلة. متتابعة. أما البنى القادمة، مثل YOLO26، فهي تتجه نحو التصاميم المتكاملة أصلاً. تهدف هذه النماذج إلى إخراج المجموعة النهائية من الكائنات الفريدة مباشرةً من من الشبكة العصبية، مما قد يجعل خوارزميات NMS الخارجية عتيقة في الأجيال المستقبلية من من نماذج التعلم الآلي.

بالنسبة للمطوّرين الذين يتطلعون إلى نشر هذه النماذج بكفاءة، فإن فهم تأثير NMS على الاستدلال في الوقت الحقيقي أمر بالغ الأهمية. أدوات مثل TensorRT غالبًا ما تتضمن مكونات إضافية محسّنة ل NMS لتسريع هذه الخطوة هذه الخطوة أثناء نشر النموذج.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن