تعرف على ما هو تقاطع الاتحاد (IoU)، وكيف يتم حسابه، ودوره الحاسم في الكشف عن الكائنات وتقييم نماذج الذكاء الاصطناعي.
يعد Intersection over Union (IoU) مقياس تقييم أساسي يستخدم في رؤية الكمبيوتر (CV)، خاصةً لمهام اكتشاف الكائنات. يقيس التداخل بين حدودين: مربع الإحاطة المتوقع الذي تم إنشاؤه بواسطة نموذج ومربع الإحاطة ذي الحقيقة الأرضية، وهو المخطط التفصيلي الصحيح الذي تم تصنيفه يدويًا. تحدد النتيجة الناتجة، وهي قيمة بين 0 و 1، مدى دقة تحديد النموذج لموقع كائن في صورة. تمثل النتيجة 1 تطابقًا مثاليًا، بينما تشير النتيجة 0 إلى عدم وجود تداخل على الإطلاق. هذا المقياس ضروري لتقييم دقة تحديد الموقع لنماذج مثل Ultralytics YOLO11.
في جوهرها، تحسب IoU نسبة التقاطع (المنطقة المتداخلة) إلى الاتحاد (إجمالي المنطقة التي تغطيها كلتا المربعين) للمربعات المحيطة المتوقعة والحقيقية. تخيل مربعين متداخلين. "التقاطع" هو المنطقة المشتركة حيث يتداخلان. "الاتحاد" هو إجمالي المنطقة التي يغطيها كلا المربعين معًا، مع احتساب الجزء المتداخل مرة واحدة فقط. من خلال قسمة التقاطع على الاتحاد، توفر IoU مقياسًا موحدًا لمدى توافق المربع المتوقع مع الكائن الفعلي. هذا المفهوم البسيط ولكنه قوي هو حجر الزاوية في التعلم العميق (DL) الحديث للكشف عن الكائنات.
جزء أساسي من استخدام IoU هو تحديد "عتبة IoU". هذه العتبة هي قيمة محددة مسبقًا (مثل 0.5) تحدد ما إذا كان التوقع صحيحًا. إذا كانت نتيجة IoU لمربع متوقع أعلى من هذه العتبة، فسيتم تصنيفها على أنها "إيجابية حقيقية". إذا كانت النتيجة أقل، فهي "إيجابية خاطئة". تؤثر هذه العتبة بشكل مباشر على مقاييس الأداء الأخرى مثل الدقة و الاسترجاع، وهي عنصر حاسم في حساب متوسط الدقة المتوسطة (mAP)، وهو مقياس قياسي لتقييم نماذج الكشف عن الكائنات على مجموعات البيانات المعيارية مثل COCO.
يعد مقياس IoU ضروريًا للتحقق من أداء عدد لا يحصى من أنظمة الذكاء الاصطناعي. فيما يلي مثالان:
إنّ مقياس IoU ليس مجرد مقياس تقييم؛ بل هو جزء لا يتجزأ من عملية التدريب نفسها. تستخدم العديد من بنى الكشف عن الكائنات الحديثة، بما في ذلك متغيرات Ultralytics YOLOv8 و YOLO11، مقياس IoU أو متغيراته مباشرةً داخل دوال الخسارة الخاصة بها. تساعد خسائر IoU المتقدمة هذه، مثل Generalized IoU (GIoU) أو Distance-IoU (DIoU) أو Complete-IoU (CIoU)، النموذج على تعلم التنبؤ بالمربعات المحيطة التي لا تتداخل بشكل جيد فحسب، بل تراعي أيضًا عوامل مثل المسافة بين المراكز واتساق نسبة العرض إلى الارتفاع. يؤدي هذا إلى تقارب أسرع وأداء تحديد موقع أفضل مقارنة بخسائر الانحدار التقليدية. يمكنك العثور على مقارنات تفصيلية بين نماذج YOLO المختلفة في وثائقنا.
تساعد مراقبة IoU أثناء تدريب النموذج و ضبط المعلمات الفائقة المطورين على تحسين النماذج لتحسين التوطين. تسمح أدوات مثل Ultralytics HUB بتتبع IoU والمقاييس الأخرى، مما يبسط دورة تحسين النموذج. على الرغم من فائدته الواسعة النطاق، يمكن أن يكون IoU القياسي غير حساس في بعض الأحيان، خاصة بالنسبة للمربعات غير المتداخلة. أدى هذا القيد إلى تطوير متغيرات IoU المذكورة أعلاه. ومع ذلك، يظل IoU حجر الزاوية في تقييم رؤية الكمبيوتر.
في حين أن IoU أمر حيوي، فمن المهم فهم علاقته بالمقاييس الأخرى: