تعرّف على ماهية التقاطع على الاتحاد (IoU)، وكيفية حسابه، ودوره الحاسم في اكتشاف الأجسام وتقييم نموذج الذكاء الاصطناعي.
التقاطع على الاتحاد (IoU) هو مقياس تقييم أساسي يُستخدم في الرؤية الحاسوبية، خاصةً في مهام اكتشاف الأجسام. يقيس هذا المقياس التداخل بين حدين: المربع المحدود المتوقع الذي تم إنشاؤه بواسطة نموذج ما والمربع المحدود الحقيقي الأرضي، وهو المخطط المحدد يدويًا والصحيح. تقيس الدرجة الناتجة، وهي قيمة تتراوح بين 0 و 1، مدى دقة النموذج في تحديد موقع الجسم في الصورة. تمثل الدرجة 1 تطابقًا تامًا، بينما تشير الدرجة 0 إلى عدم وجود تداخل على الإطلاق. هذا المقياس مهم لتقييم دقة تحديد موقع نماذج مثل Ultralytics YOLO11.
في جوهره، يحسب IoU نسبة التقاطع (المساحة المتداخلة) إلى الاتحاد (المساحة الإجمالية التي يغطيها كلا المربعين) للمربعات المتوقعة والمربعات المحددة الحقيقية. تخيل مربعين متداخلين. "التقاطع" هو المساحة المشتركة التي يتداخلان فيها. "الاتحاد" هو المساحة الكلية التي يغطيها كلا المربعين معًا، مع احتساب الجزء المتداخل مرة واحدة فقط. من خلال قسمة التقاطع على الاتحاد، يوفر IoU مقياسًا موحدًا لمدى محاذاة المربع المتوقع مع الجسم الفعلي. هذا المفهوم البسيط والقوي في الوقت نفسه هو حجر الزاوية في التعلّم العميق الحديث لاكتشاف الأجسام.
يتمثل أحد الأجزاء الرئيسية لاستخدام وحدة التوقع المستقل في تحديد "عتبة وحدة التوقع المستقل". هذه العتبة هي قيمة محددة مسبقًا (على سبيل المثال، 0.5) تحدد ما إذا كان التنبؤ صحيحًا أم لا. إذا كانت درجة IoU لمربع متوقع أعلى من هذه العتبة، يتم تصنيفه على أنه "إيجابي صحيح". أما إذا كانت النتيجة أقل من ذلك، فهي "إيجابية خاطئة". تؤثر هذه العتبة تأثيرًا مباشرًا على مقاييس الأداء الأخرى مثل الدقة والاسترجاع، وهي عنصر حاسم في حساب متوسط متوسط الدقة (mAP)، وهو مقياس قياسي لتقييم نماذج اكتشاف الكائنات على مجموعات البيانات المعيارية مثل COCO.
تُعد IoU ضرورية للتحقق من صحة أداء عدد لا يحصى من أنظمة الذكاء الاصطناعي. إليك بعض الأمثلة:
IoU ليس مجرد مقياس تقييم؛ بل هو أيضًا جزء لا يتجزأ من عملية التدريب نفسها. تستخدم العديد من البنى الحديثة للكشف عن الأجسام، بما في ذلك متغيرات Ultralytics YOLOv8 و YOLO11، وحدة IoU أو أشكالها المختلفة مباشرةً ضمن وظائف الخسارة الخاصة بها. تساعد هذه الخسائر المتقدمة المستندة إلى IoU، مثل IoU المعمم (GIoU) أو IoU-IoU عن بُعد (DIoU) أو IoU الكامل (CIoU)، النموذج على تعلم التنبؤ بالمربعات المحدودة التي لا تتداخل بشكل جيد فحسب، بل تأخذ في الاعتبار أيضًا عوامل مثل المسافة بين المراكز واتساق نسبة العرض إلى الارتفاع. يؤدي ذلك إلى تقارب أسرع وأداء توطين أفضل مقارنةً بخسائر الانحدار التقليدية. يمكنك العثور على مقارنات مفصلة بين نماذج YOLO المختلفة في وثائقنا.
تساعد مراقبة IoU أثناء تدريب النموذج وضبط المعلمة الفائقة المطورين على تحسين النماذج من أجل توطين أفضل. تسمح أدوات مثل Ultralytics HUB بتتبع IoU وغيرها من المقاييس الأخرى، مما يسهل دورة تحسين النموذج. على الرغم من فائدتها الواسعة الانتشار، إلا أن وحدة التوطين القياسية قد تكون غير حساسة في بعض الأحيان، خاصةً بالنسبة للمربعات غير المتداخلة. دفع هذا القيد إلى تطوير متغيرات IoU المذكورة أعلاه. وعلى الرغم من ذلك، تظل وحدة قياس الإبصار الدولي حجر الزاوية في تقييم الرؤية الحاسوبية.
على الرغم من أهمية وحدة قياس الأداء، إلا أنه من المهم فهم علاقتها بالمقاييس الأخرى: