متوسط الدقة (mAP) في اكتشاف الأشياء
افهم متوسط الدقة (mAP) في اكتشاف الأشياء. تعرَّف على معناها، وحسابها، ولماذا يُعد mAP مفتاحاً لتقييم أداء النموذج.

ينمو تبني الذكاء الاصطناعي بسرعة، ويتم دمجه في ابتكارات متنوعة، بدءاً من السيارات ذاتية القيادة وصولاً إلى أنظمة البيع بالتجزئة التي يمكنها تحديد المنتجات على الأرفف. تعتمد هذه التقنيات على الرؤية الحاسوبية، وهو فرع من الذكاء الاصطناعي (AI) يُمكّن الآلات من تحليل البيانات المرئية.
أحد مقاييس التقييم الرئيسية المستخدمة لقياس دقة أنظمة وخوارزميات الرؤية الحاسوبية هو متوسط متوسط الدقة (mAP). يشير مقياس mAP إلى مدى قرب توقع نموذج الذكاء الاصطناعي للرؤية من النتائج الواقعية.
من مهام الرؤية الحاسوبية الشائعة اكتشاف الكائنات، حيث يحدد النموذج كائنات متعددة في صورة ويرسم صناديق إحاطة حولها. يُعد mAP المقياس المعياري المستخدم لتقييم أداء نماذج اكتشاف الكائنات ويستخدم على نطاق واسع لتقييم أداء نماذج التعلم العميق مثل Ultralytics YOLO11.
في هذه المقالة، سنرى كيف يتم حساب متوسط متوسط الدقة ولماذا هو ضروري لأي شخص يقوم بتدريب أو تقييم نماذج اكتشاف الكائنات. لنبدأ!
Link to this sectionما هو متوسط متوسط الدقة (mAP)؟#
متوسط متوسط الدقة هو درجة تظهر مدى دقة نموذج التعلم العميق عندما يتعلق الأمر بالمهام المتعلقة باسترجاع المعلومات المرئية، مثل اكتشاف وتحديد كائنات مختلفة في صورة. على سبيل المثال، ضع في اعتبارك نموذج اكتشاف الكائنات الذي يحلل صورة تحتوي على كلب وقطة وسيارة. يمكن للنموذج الموثوق إجراء اكتشاف الكائنات من خلال التعرف على كل كائن ورسم صناديق إحاطة وتسميات حوله، مع تسليط الضوء على مكانه وماهيته.
يشير mAP إلى مدى جودة أداء النموذج لهذه المهمة عبر العديد من الصور وأنواع مختلفة من الكائنات. وهو يتحقق مما إذا كان النموذج يحدد بدقة كل كائن وموقعه داخل الصورة. تتراوح الدرجة من 0 إلى 1، حيث يعني الرقم واحد أن النموذج وجد كل شيء بشكل مثالي، بينما يعني الصفر أنه فشل في اكتشاف أي كائنات.
Link to this sectionالمفاهيم الرئيسية في متوسط متوسط الدقة (mAP)#
قبل استكشاف المفاهيم الكامنة وراء متوسط متوسط الدقة في تعلم الآلة، دعونا نفهم بشكل أفضل مصطلحين أساسيين: الحقيقة الأرضية (ground truth) والتوقعات.
تشير الحقيقة الأرضية إلى بيانات مرجعية دقيقة، حيث يتم تصنيف الكائنات ومواقعها في الصورة بعناية من قبل البشر من خلال عملية تُعرف بالتعليق التوضيحي (annotation). وفي الوقت نفسه، التوقعات هي النتائج التي تعطيها نماذج الذكاء الاصطناعي بعد تحليل صورة. من خلال مقارنة توقعات نموذج الذكاء الاصطناعي بالحقيقة الأرضية، يمكننا قياس مدى قرب النموذج من الوصول إلى النتائج الصحيحة.

شكل 1. توقعات النموذج وصناديق إحاطة الحقيقة الأرضية. الصورة من المؤلف.
Link to this sectionمصفوفة الارتباك (Confusion matrix)#
غالباً ما تُستخدم مصفوفة الارتباك لفهم مدى دقة نموذج اكتشاف الكائنات. إنها جدول يوضح كيف تتطابق توقعات النموذج مع الإجابات الصحيحة الفعلية (الحقيقة الأرضية). من هذا الجدول، يمكننا الحصول على تفصيل لأربعة مكونات أو نتائج رئيسية: الإيجابيات الحقيقية، الإيجابيات الخاطئة، السلبيات الخاطئة، والسلبيات الحقيقية.
إليك ما تمثله هذه المكونات في مصفوفة الارتباك:
- إيجابي حقيقي (TP): يتم اكتشاف كائن وموقعه بشكل صحيح من قبل النموذج.
- إيجابي خاطئ (FP): قام النموذج باكتشاف، لكنه كان غير صحيح.
- سلبي خاطئ (FN): كائن كان موجوداً بالفعل في الصورة، لكن النموذج فشل في اكتشافه.
- سلبي حقيقي (TN): تحدث السلبيات الحقيقية عندما يحدد النموذج بشكل صحيح غياب كائن ما.
السلبيات الحقيقية ليست شائعة الاستخدام في اكتشاف الكائنات، حيث نتجاهل عادةً العديد من المناطق الفارغة في الصورة. ومع ذلك، فهي ضرورية في مهام الرؤية الحاسوبية الأخرى، مثل تصنيف الصور، حيث يعين النموذج تسمية للصورة. على سبيل المثال، إذا كانت المهمة هي اكتشاف ما إذا كانت الصورة تحتوي على قطة أم لا، وقام النموذج بتحديد "لا توجد قطة" بشكل صحيح عندما لا تحتوي الصورة على واحدة، فهذا سلبي حقيقي.

شكل 2. نتائج التصنيف في مصفوفة الارتباك. الصورة من المؤلف.
Link to this sectionالتقاطع فوق الاتحاد (IoU)#
مقياس حيوي آخر في تقييم نماذج اكتشاف الكائنات هو التقاطع فوق الاتحاد (IoU). بالنسبة لنماذج رؤية الذكاء الاصطناعي هذه، لا يكفي مجرد اكتشاف وجود كائن في صورة؛ بل يجب أيضاً تحديد مكانه في الصورة لرسم صناديق إحاطة.
يقيس مقياس IoU مدى تطابق الصندوق المتوقع للنموذج مع الصندوق الصحيح الفعلي (الحقيقة الأرضية). تتراوح الدرجة بين 0 و1، حيث يعني الرقم 1 تطابقاً مثالياً، ويعني 0 عدم وجود أي تداخل على الإطلاق.
على سبيل المثال، يعني IoU أعلى (مثل 0.80 أو 0.85) أن الصندوق المتوقع يطابق بشكل وثيق صندوق الحقيقة الأرضية، مما يشير إلى توطين دقيق. يعني IoU أقل (مثل 0.30 أو 0.25) أن النموذج لم يحدد موقع الكائن بدقة.
لتحديد ما إذا كان الاكتشاف ناجحاً، نستخدم عتبات مختلفة. عتبة IoU الشائعة هي 0.5، مما يعني أن الصندوق المتوقع يجب أن يتداخل مع صندوق الحقيقة الأرضية بنسبة 50% على الأقل ليتم اعتباره إيجابياً حقيقياً. أي تداخل أقل من هذه العتبة يعتبر إيجابياً خاطئاً.

شكل 3. فهم التقاطع فوق الاتحاد. الصورة من المؤلف.
Link to this sectionالدقة والاستدعاء (Precision and recall)#
حتى الآن، استكشفنا بعض مقاييس التقييم الأساسية لفهم أداء نماذج اكتشاف الكائنات. بناءً على ذلك، اثنان من أهم المقاييس هما الدقة والاستدعاء. فهي تعطينا صورة واضحة عن مدى دقة اكتشافات النموذج. دعونا نلقي نظرة على ماهيتها.
تخبرنا قيم الدقة بعدد توقعات النموذج التي كانت صحيحة بالفعل. فهي تجيب على السؤال: من بين جميع الكائنات التي ادعى النموذج اكتشافها، كم منها كان موجوداً حقاً؟
من ناحية أخرى، تقيس قيم الاستدعاء مدى نجاح النموذج في العثور على جميع الكائنات الفعلية الموجودة في الصورة. فهي تجيب على السؤال: من بين جميع الكائنات الحقيقية الموجودة، كم منها اكتشف النموذج بشكل صحيح؟
معاً، تعطينا الدقة والاستدعاء صورة أوضح عن مدى جودة أداء النموذج. على سبيل المثال، إذا توقع نموذج وجود 10 سيارات في صورة وكان 9 منها سيارات بالفعل، فإن دقته تبلغ 90% (توقع إيجابي).
غالباً ما ينطوي هذان المقياسان للتقييم على مقايضة: يمكن للنموذج تحقيق قيمة دقة عالية من خلال إجراء التوقعات التي يثق بها تماماً فقط، ولكن هذا قد يؤدي إلى تفويت العديد من الكائنات، مما يقلل من مستوى الاستدعاء. في الوقت نفسه، يمكنه أيضاً الوصول إلى استدعاء عالٍ جداً من خلال التنبؤ بصندوق إحاطة في كل مكان تقريباً، ولكن هذا سيقلل من الدقة.

شكل 4. الدقة والاستدعاء. الصورة من المؤلف.
Link to this sectionمتوسط الدقة (Average precision)#
بينما تساعدنا الدقة والاستدعاء في فهم كيفية أداء النموذج في التوقعات الفردية، يمكن لمتوسط الدقة (AP) توفير رؤية أوسع. فهو يوضح كيف تتغير دقة النموذج عندما يحاول اكتشاف المزيد من الكائنات، ويلخص أداءه في رقم واحد.
لحساب درجة متوسط الدقة، يمكننا أولاً إنشاء مقياس مدمج يشبه الرسم البياني يسمى منحنى الدقة والاستدعاء (أو منحنى PR) لكل نوع من الكائنات. يوضح هذا المنحنى ما يحدث عندما يقوم النموذج بإجراء المزيد من التوقعات.
ضع في اعتبارك سيناريو يبدأ فيه النموذج باكتشاف الكائنات الأكثر سهولة أو وضوحاً فقط. في هذه المرحلة، تكون الدقة عالية لأن معظم التوقعات صحيحة، ولكن الاستدعاء منخفض لأن العديد من الكائنات لا تزال مفقودة. عندما يحاول النموذج اكتشاف المزيد من الكائنات، بما في ذلك الكائنات الأكثر صعوبة أو ندرة، فإنه عادةً ما يقدم المزيد من الأخطاء. وهذا يؤدي إلى انخفاض الدقة بينما يزداد الاستدعاء.
متوسط الدقة هو المساحة تحت المنحنى (AUC لمنحنى PR). تعني المساحة الأكبر أن النموذج أفضل في الحفاظ على دقة توقعاته، حتى عندما يكتشف المزيد من الكائنات. يتم حساب AP بشكل منفصل لكل تسمية فئة.
على سبيل المثال، في نموذج يمكنه اكتشاف السيارات والدراجات والمشاة، يمكننا حساب قيم AP بشكل فردي لكل من تلك الفئات الثلاث. يساعدنا هذا في معرفة الكائنات التي يجيد النموذج اكتشافها وأين قد لا يزال يحتاج إلى تحسين.

شكل 5. منحنى PR لخمس فئات مختلفة. (المصدر)
Link to this sectionمتوسط متوسط الدقة#
بعد حساب متوسط الدقة لكل فئة من الكائنات، لا نزال بحاجة إلى درجة واحدة تعكس الأداء العام للنموذج عبر جميع الفئات. يمكن تحقيق ذلك باستخدام صيغة متوسط متوسط الدقة. وهي تحسب متوسط درجات AP لكل فئة.
على سبيل المثال، لنفترض أن نموذج رؤية حاسوبية مثل YOLO11 يحقق AP يبلغ 0.827 للسيارات، و0.679 للدراجات النارية، و0.355 للشاحنات، و0.863 للحافلات، و0.982 للدراجات الهوائية. باستخدام صيغة mAP، يمكننا إضافة هذه الأرقام والقسمة على العدد الإجمالي للفئات كما يلي:
mAP = (0.827 + 0.679 + 0.355 + 0.863 + 0.982) ÷ 5 = 0.7432 ≈ 0.743
توفر درجة mAP البالغة 0.743 حلاً مباشراً للحكم على مدى جودة أداء النموذج عبر جميع فئات الكائنات. تعني القيمة القريبة من 1 أن النموذج دقيق لمعظم الفئات، بينما تشير القيمة الأقل إلى أنه يعاني مع بعضها.
Link to this sectionأهمية AP و mAP في الرؤية الحاسوبية#
الآن بعد أن أصبح لدينا فهم أفضل لكيفية حساب AP و mAP وما هي مكوناتهما، إليك نظرة عامة على أهميتهما في الرؤية الحاسوبية:
-
AP منخفض لفئة معينة: غالباً ما يعني AP منخفض لفئة واحدة أن النموذج يعاني مع فئة الكائنات تلك. قد يكون هذا بسبب عدم كفاية بيانات التدريب أو تحديات بصرية في الصور، مثل التغطية (occlusion).
-
أخطاء التوطين: تشير قيمة mAP أعلى عند عتبة IoU أقل (مثل mAP@0.50) مدمجة مع انخفاض كبير عند عتبة IoU أعلى (مثل mAP@0.75) إلى أن النموذج يمكنه اكتشاف الكائنات ولكنه يعاني من توطينها بدقة.
-
الفرط في التخصيص (Overfitting): قيمة mAP أعلى في مجموعة البيانات الخاصة بالتدريب ولكن قيمة mAP أقل في مجموعة بيانات التحقق هي علامة على الفرط في التخصيص، مما يجعل النموذج غير موثوق به للصور الجديدة.
Link to this sectionتطبيقات العالم الحقيقي لمتوسط متوسط الدقة#
بعد ذلك، دعونا نستكشف كيف يمكن لمقاييس رئيسية مثل mAP المساعدة عند بناء حالات استخدام للرؤية الحاسوبية في العالم الحقيقي.
Link to this sectionالمركبات ذاتية القيادة: لماذا تعني قيمة mAP أعلى طرقاً أكثر أماناً#
عندما يتعلق الأمر بـ السيارات ذاتية القيادة، فإن اكتشاف الكائنات أمر بالغ الأهمية لتحديد المشاة، وعلامات الطريق، وراكبي الدراجات، وعلامات الحارات. على سبيل المثال، إذا ركض طفل فجأة عبر الشارع، فلدى السيارة ثوانٍ لاكتشاف الكائن (الطفل)، وتحديد مكانه، وتتبع حركته، واتخاذ الإجراء اللازم (استخدام المكابح).
تم تصميم نماذج مثل YOLO11 لاكتشاف الكائنات في الوقت الفعلي في مثل هذه السيناريوهات عالية المخاطر. في هذه الحالات، يصبح mAP مقياساً حاسماً للسلامة.
تضمن درجة mAP العالية اكتشاف النظام للطفل بسرعة، وتحديد موقعه بدقة، وتشغيل المكابح بأقل تأخير. قد يعني انخفاض mAP اكتشافات مفقودة أو تصنيفات خاطئة خطيرة، مثل الخلط بين الطفل وكائن صغير آخر.

شكل 6. مثال على استخدام YOLO11 لاكتشاف المشاة على الطريق. (المصدر)
Link to this sectionاستخدام mAP لاكتشاف دقيق للمنتجات#
وبالمثل، في البيع بالتجزئة، يمكن استخدام نماذج اكتشاف الكائنات لأتمتة مهام مثل مراقبة المخزون وعمليات الدفع. عندما يمسح العميل منتجاً عند الدفع الذاتي، يمكن أن يتسبب خطأ في الاكتشاف في الإحباط.
تضمن درجة mAP العالية أن النموذج يميز بدقة بين المنتجات المتشابهة ويرسم صناديق إحاطة دقيقة، حتى عندما تكون العناصر معبأة بإحكام. يمكن أن تؤدي درجة mAP المنخفضة إلى خلط الأمور. على سبيل المثال، إذا أخطأ النموذج في اعتبار زجاجة عصير برتقال زجاجة عصير تفاح متشابهة بصرياً، فقد يؤدي ذلك إلى فوترة غير صحيحة وتقارير مخزون غير دقيقة.
يمكن لأنظمة البيع بالتجزئة المدمجة مع نماذج مثل YOLO11 اكتشاف المنتجات في الوقت الفعلي، والتحقق منها مقابل المخزون، وتحديث أنظمة الواجهة الخلفية على الفور. في بيئات البيع بالتجزئة سريعة الوتيرة، يلعب mAP دوراً حاسماً في الحفاظ على دقة وموثوقية العمليات.
Link to this sectionتعزيز دقة التشخيص مع mAP عالٍ في الرعاية الصحية#
يبدأ تحسين دقة التشخيص في الرعاية الصحية بالاكتشاف الدقيق في التصوير الطبي. يمكن لنماذج مثل YOLO11 مساعدة أخصائيي الأشعة في اكتشاف الأورام، أو الكسور، أو غيرها من الشذوذ في تلك الفحوصات الطبية. هنا، متوسط متوسط الدقة هو مقياس أساسي لتقييم الموثوقية السريرية للنموذج.
يشير mAP العالي إلى أن النموذج يحقق استدعاءً عالياً (تحديد معظم المشكلات الفعلية) ودقة عالية (تجنب الإنذارات الكاذبة)، وهو أمر بالغ الأهمية في اتخاذ القرار السريري. أيضاً، غالباً ما يتم ضبط عتبة IoU في الرعاية الصحية على مستوى عالٍ جداً (0.85 أو 0.90) لضمان اكتشاف دقيق للغاية.
ومع ذلك، يمكن أن تثير درجة mAP المنخفضة مخاوف. لنفترض أن نموذجاً فشل في اكتشاف ورم؛ فقد يؤدي ذلك إلى تأخير التشخيص أو يؤدي إلى علاج غير صحيح.
Link to this sectionإيجابيات وسلبيات استخدام mAP#
إليك المزايا الرئيسية لاستخدام متوسط متوسط الدقة لتقييم نماذج اكتشاف الكائنات:
-
مقياس معياري: mAP هو معيار الصناعة لتقييم نماذج اكتشاف الكائنات. تتيح قيمة mAP إجراء مقارنات عادلة ومتسقة بين نماذج مختلفة.
-
يعكس الأداء الواقعي: يشير mAP العالي إلى أن النموذج يتفوق في اكتشاف فئات كائنات متنوعة ويحافظ على أداء قوي في سيناريوهات العالم الحقيقي المعقدة.
-
تشخيصات على مستوى الفئة: تقوم درجة mAP بتقييم أداء الاكتشاف لكل فئة على حدة. وهذا يجعل من السهل تحديد الفئات ذات الأداء الضعيف (مثل الدراجات أو علامات الشوارع) وضبط النموذج وفقاً لذلك.
على الرغم من وجود فوائد متنوعة لاستخدام مقياس mAP، إلا أن هناك بعض القيود التي يجب مراعاتها. إليك بعض العوامل التي يجب أخذها في الاعتبار:
-
صعوبة بالنسبة لأصحاب المصلحة غير التقنيين: قد يجد فرق العمل أو الفرق السريرية قيم mAP مجردة، على عكس المقاييس الأكثر سهولة ووضوحاً.
-
لا يعكس قيود الوقت الفعلي: لا يأخذ mAP في الاعتبار سرعة الاستدلال أو زمن الوصول، وهو أمر بالغ الأهمية للنشر في التطبيقات الحساسة للوقت.
Link to this sectionأبرز النقاط#
لقد رأينا أن متوسط متوسط الدقة ليس مجرد درجة تقنية بل انعكاس للأداء الواقعي المحتمل للنموذج. سواء في نظام مركبة ذاتية القيادة أو عند الدفع في متجر تجزئة، تعمل درجة mAP العالية كمؤشر موثوق لأداء النموذج وجاهزيته العملية.
بينما يعد mAP مقياساً أساسياً ومؤثراً، يجب اعتباره جزءاً من استراتيجية تقييم شاملة. بالنسبة للتطبيقات الحرجة مثل الرعاية الصحية والقيادة الذاتية، لا يكفي الاعتماد فقط على mAP.
يجب أيضاً مراعاة عوامل إضافية مثل سرعة الاستدلال (مدى سرعة إجراء النموذج للتوقعات)، وحجم النموذج (الذي يؤثر على النشر على أجهزة الحافة)، وتحليل الأخطاء النوعية (فهم أنواع الأخطاء التي يرتكبها النموذج) لضمان أن النظام آمن وفعال ومناسب حقاً للغرض المقصود منه.
انضم إلى مجتمعنا المتنامي و مستودع GitHub الخاص بنا لمعرفة المزيد عن الرؤية الحاسوبية. استكشف صفحات الحلول الخاصة بنا للتعرف على تطبيقات الرؤية الحاسوبية في الزراعة و الذكاء الاصطناعي في اللوجستيات. تحقق من خيارات الترخيص الخاصة بنا للبدء مع نموذج الرؤية الحاسوبية الخاص بك اليوم!






