استعدوا لـ YOLO Vision 2025!
25 سبتمبر، 2025
10:00 — 18:00 بتوقيت بريطانيا الصيفي
حدث هجين
مؤتمر Yolo Vision 2024

متوسط الدقة المتوسطة (mAP) في الكشف عن الأجسام

أبيرامي فينا

6 دقائق قراءة

28 أغسطس، 2025

فهم متوسط الدقة (mAP) في اكتشاف الكائنات. تعرف على معناه وحسابه ولماذا mAP هو المفتاح لتقييم أداء النموذج.

يتزايد تبني الذكاء الاصطناعي بسرعة، ويتم دمجه في العديد من الابتكارات، من السيارات ذاتية القيادة إلى أنظمة البيع بالتجزئة التي يمكنها تحديد المنتجات على الرف. تعتمد هذه التقنيات على رؤية الحاسوب، وهو فرع من فروع الذكاء الاصطناعي (AI) يمكّن الآلات من تحليل البيانات المرئية. 

أحد مقاييس التقييم الرئيسية المستخدمة لقياس دقة أنظمة وخوارزميات رؤية الكمبيوتر هو متوسط الدقة (mAP). يشير مقياس mAP إلى مدى تطابق توقعات نموذج Vision AI مع نتائج العالم الحقيقي.

تتمثل إحدى مهام رؤية الحاسوب الشائعة في الكشف عن الكائنات، حيث يحدد النموذج كائنات متعددة في صورة ويرسم مربعات محيطة حولها. mAP هو المقياس القياسي المستخدم لتقييم أداء نماذج الكشف عن الكائنات ويستخدم على نطاق واسع لتقييم نماذج التعلم العميق مثل Ultralytics YOLO11.

في هذه المقالة، سنرى كيف يتم حساب متوسط الدقة المتوسطة وسبب أهميته لأي شخص يقوم بتدريب أو تقييم نماذج الكشف عن الكائنات. هيا بنا نبدأ!

ما هو متوسط الدقة (mAP)؟

متوسط الدقة المتوسطة هو درجة توضح مدى دقة نموذج التعلم العميق عندما يتعلق الأمر بالمهام المتعلقة باسترجاع المعلومات المرئية، مثل اكتشاف وتحديد الكائنات المختلفة في الصورة. على سبيل المثال، ضع في اعتبارك نموذج اكتشاف الكائنات الذي يحلل صورة تحتوي على كلب وقطة وسيارة. يمكن للنموذج الموثوق به إجراء اكتشاف الكائنات من خلال التعرف على كل كائن ورسم مربعات محيطة وملصقات حوله، مع تسليط الضوء على مكانه وما هو.

يشير mAP إلى مدى جودة أداء النموذج لهذه المهمة عبر العديد من الصور وأنواع مختلفة من الكائنات. وهو يتحقق مما إذا كان النموذج يحدد بدقة كل كائن وموقعه داخل الصورة. تتراوح النتيجة من 0 إلى 1، حيث تعني واحد أن النموذج وجد كل شيء بشكل مثالي، ويعني صفر أنه فشل في اكتشاف أي كائنات.

المفاهيم الأساسية في متوسط الدقة (mAP)

قبل أن نستكشف المفاهيم الكامنة وراء متوسط الدقة في التعلم الآلي، دعنا نحصل على فهم أفضل لمصطلحين أساسيين: الحقيقة الأساسية والتنبؤات. 

تشير الحقيقة الأساسية إلى البيانات المرجعية الدقيقة، حيث يتم تصنيف الكائنات ومواقعها في الصورة بعناية من قبل البشر من خلال عملية تعرف باسم التعليق التوضيحي. وفي الوقت نفسه، فإن التنبؤات هي النتائج التي تقدمها نماذج الذكاء الاصطناعي بعد تحليل الصورة. من خلال مقارنة تنبؤات نموذج الذكاء الاصطناعي بالحقيقة الأساسية، يمكننا قياس مدى قرب النموذج من الحصول على النتائج الصحيحة. 

الشكل 1. تنبؤ النموذج والصناديق المحيطة بالحقيقة الأساسية. صورة من إعداد المؤلف.

مصفوفة الارتباك

غالبًا ما تستخدم مصفوفة الارتباك (confusion matrix) لفهم مدى دقة نموذج الكشف عن الكائنات. إنه جدول يوضح كيف تتطابق تنبؤات النموذج مع الإجابات الصحيحة الفعلية (الحقيقة الأساسية). من هذا الجدول، يمكننا الحصول على تفصيل للمكونات أو النتائج الرئيسية الأربعة: الإيجابيات الحقيقية، والإيجابيات الخاطئة، والسلبيات الخاطئة، والسلبيات الحقيقية.

فيما يلي ما تمثله هذه المكونات في مصفوفة الالتباس:

  • النتيجة الإيجابية الصحيحة (TP): يتم الكشف عن كائن وموقعه بشكل صحيح بواسطة النموذج.
  • إيجابي كاذب (FP): أجرى النموذج اكتشافًا، لكنه كان غير صحيح.
  • سلبي كاذب (FN): كائن كان موجودًا بالفعل في الصورة، لكن النموذج فشل في اكتشافه.
  • النتيجة السلبية الصحيحة (TN): تحدث النتائج السلبية الصحيحة عندما يحدد النموذج بشكل صحيح عدم وجود كائن.

لا يتم استخدام السلبيات الحقيقية بشكل شائع في الكشف عن الكائنات، لأننا عادةً ما نتجاهل المناطق الفارغة العديدة في الصورة. ومع ذلك، فهو ضروري في مهام رؤية الكمبيوتر الأخرى، مثل تصنيف الصور، حيث يقوم النموذج بتعيين تسمية للصورة. على سبيل المثال، إذا كانت المهمة هي اكتشاف ما إذا كانت الصورة تحتوي على قطة أم لا، وإذا حدد النموذج بشكل صحيح “لا توجد قطة” عندما لا تحتوي الصورة على واحدة، فهذا سلبي حقيقي.

الشكل 2. نتائج التصنيف في مصفوفة الارتباك. الصورة من إعداد المؤلف.

تقاطع الاتحاد (IoU)

هناك مقياس حيوي آخر في تقييم نماذج الكشف عن الكائنات وهو تقاطع الاتحاد (IoU). بالنسبة لنماذج رؤية الذكاء الاصطناعي هذه، فإن مجرد اكتشاف وجود كائن في صورة ما ليس كافيًا؛ بل يجب أيضًا تحديد مكانه في الصورة لرسم مربعات محيطة. 

يقيس مقياس IoU مدى تطابق المربع المتوقع للنموذج مع المربع الفعلي الصحيح (الحقيقة الأساسية). تتراوح النتيجة بين 0 و 1، حيث 1 تعني تطابقًا مثاليًا و 0 تعني عدم وجود تداخل على الإطلاق.

على سبيل المثال، يعني ارتفاع IoU (مثل 0.80 أو 0.85) أن الصندوق المتوقع يطابق الصندوق ذي الحقيقة الأرضية بشكل وثيق، مما يشير إلى تحديد موقع دقيق. يعني انخفاض IoU (مثل 0.30 أو 0.25) أن النموذج لم يحدد موقع الكائن بدقة.

لتحديد ما إذا كان الاكتشاف ناجحًا، نستخدم عتبات مختلفة. عتبة IoU الشائعة هي 0.5، مما يعني أن الصندوق المتوقع يجب أن يتداخل مع صندوق الحقيقة الأساسية بنسبة 50٪ على الأقل ليتم اعتباره إيجابيًا حقيقيًا. يعتبر أي تداخل أقل من هذه العتبة إيجابيًا خاطئًا.

الشكل 3. فهم مفهوم التقاطع على الاتحاد (Intersection over Union). صورة من إعداد المؤلف.

الدقة والاسترجاع

حتى الآن، استكشفنا بعض مقاييس التقييم الأساسية لفهم أداء نماذج الكشف عن الكائنات. بناءً على ذلك، فإن اثنين من أهم المقاييس هما الدقة والاسترجاع (Precision and Recall). إنهما يعطياننا صورة واضحة عن مدى دقة عمليات الكشف التي يقوم بها النموذج. دعونا نلقي نظرة على ماهيتهما.

تخبرنا قيم الدقة عن عدد التنبؤات التي قدمها النموذج والتي كانت صحيحة بالفعل. يجيب على السؤال: من بين جميع الكائنات التي زعم النموذج أنه اكتشفها، كم عدد الكائنات الموجودة بالفعل؟

من ناحية أخرى، تقيس قيم الاسترجاع مدى جودة عثور النموذج على جميع الكائنات الفعلية الموجودة في الصورة. يجيب على السؤال: من بين جميع الكائنات الحقيقية الموجودة، كم عدد الكائنات التي اكتشفها النموذج بشكل صحيح؟

معًا، تعطينا الدقة والاسترجاع صورة أوضح عن مدى جودة أداء النموذج. على سبيل المثال، إذا تنبأ نموذج بوجود 10 سيارات في صورة ما، وكانت 9 منها بالفعل سيارات، فإنه يتمتع بدقة 90٪ (توقع إيجابي). 

غالبًا ما تنطوي مقاييس التقييم هاتين على مفاضلة: يمكن للنموذج تحقيق قيمة دقة عالية من خلال إجراء تنبؤات يثق بها تمامًا فقط، ولكن هذا قد يتسبب في فقد العديد من الكائنات، مما يقلل من مستوى الاسترجاع. وفي الوقت نفسه، يمكن أن يصل أيضًا إلى استرجاع عالٍ جدًا من خلال التنبؤ بمربع إحاطة في كل مكان تقريبًا، ولكن هذا سيقلل من الدقة.

الشكل 4. الدقة والاسترجاع. صورة بواسطة المؤلف.

متوسط الدقة

في حين أن الدقة والاسترجاع يساعداننا في فهم كيفية أداء النموذج في التنبؤات الفردية، إلا أن متوسط الدقة (AP) يمكن أن يوفر رؤية أوسع. فهو يوضح كيف تتغير دقة النموذج أثناء محاولته اكتشاف المزيد من الكائنات، ويلخص أدائه في رقم واحد.

لحساب متوسط ​​درجة الدقة، يمكننا أولاً إنشاء مقياس مدمج يشبه الرسم البياني يسمى منحنى الدقة والاسترجاع (أو منحنى PR) لكل نوع من أنواع الكائنات. يوضح هذا المنحنى ما يحدث عندما يقدم النموذج المزيد من التنبؤات. 

ضع في اعتبارك سيناريو يبدأ فيه النموذج بالكشف عن أسهل الكائنات أو أكثرها وضوحًا فقط. في هذه المرحلة، تكون الدقة عالية لأن معظم التوقعات صحيحة، ولكن الاسترجاع منخفض لأن العديد من الكائنات لا تزال مفقودة. بينما يحاول النموذج اكتشاف المزيد من الكائنات، بما في ذلك الأصعب أو الأندر منها، فإنه عادة ما يقدم المزيد من الأخطاء. يتسبب هذا في انخفاض الدقة بينما يزداد الاسترجاع.

متوسط الدقة هو المساحة الواقعة أسفل المنحنى (AUC لمنحنى PR). تعني المساحة الأكبر أن النموذج أفضل في الحفاظ على دقة تنبؤاته، حتى مع اكتشافه المزيد من الكائنات. يتم حساب AP بشكل منفصل لكل تسمية فئة. 

على سبيل المثال، في نموذج يمكنه اكتشاف السيارات والدراجات والمشاة، يمكننا حساب قيم AP بشكل فردي لكل فئة من هذه الفئات الثلاث. يساعدنا هذا في معرفة الكائنات التي يجيد النموذج اكتشافها وأين قد يحتاج إلى تحسين.

الشكل 5. منحنى PR لخمس فئات مختلفة. (المصدر)

متوسط الدقة المتوسطة (Mean Average Precision)

بعد حساب الدقة المتوسطة لكل فئة من فئات الكائنات، ما زلنا بحاجة إلى درجة واحدة تعكس الأداء العام للنموذج عبر جميع الفئات. يمكن تحقيق ذلك باستخدام صيغة متوسط الدقة المتوسطة. وهي تحسب متوسط درجات AP لكل فئة.

على سبيل المثال، لنفترض أن نموذج رؤية حاسوبية مثل YOLO11 يحقق AP بمقدار 0.827 للسيارات، و 0.679 للدراجات النارية، و 0.355 للشاحنات، و 0.863 للحافلات، و 0.982 للدراجات الهوائية. باستخدام صيغة mAP، يمكننا جمع هذه الأرقام وقسمتها على العدد الإجمالي للفئات على النحو التالي: 

mAP = (0.827 + 0.679 + 0.355 + 0.863 + 0.982) ÷ 5 = 0.7432 ≈ 0.743

توفر درجة mAP البالغة 0.743 حلاً مباشرًا للحكم على مدى جودة أداء النموذج عبر جميع فئات الكائنات. تعني القيمة القريبة من 1 أن النموذج دقيق لمعظم الفئات، بينما تشير القيمة الأقل إلى أنه يعاني من بعض الفئات.

أهمية AP و mAP في رؤية الكمبيوتر

الآن بعد أن أصبح لدينا فهم أفضل لكيفية حساب AP و mAP وما هي مكوناتهما، إليك نظرة عامة على أهميتهما في الرؤية الحاسوبية:

  • AP منخفض لفئة معينة: غالبًا ما يعني AP المنخفض لفئة واحدة أن النموذج يعاني من هذه الفئة المحددة من الكائنات. يمكن أن يكون هذا بسبب عدم كفاية بيانات التدريب أو التحديات المرئية في الصور، مثل الانسداد.
  • أخطاء التوطين: تشير قيمة mAP الأعلى عند عتبة IoU أقل (مثل mAP@0.50) جنبًا إلى جنب مع انخفاض كبير عند عتبة IoU أعلى (مثل mAP@0.75) إلى أن النموذج يمكنه اكتشاف الكائنات ولكنه يكافح لتحديد موقعها بدقة.
  • المبالغة في التوفيق: تشير قيمة mAP الأعلى في مجموعة بيانات التدريب ولكن قيمة mAP الأقل في مجموعة بيانات التحقق إلى المبالغة في التوفيق، مما يجعل النموذج غير موثوق به للصور الجديدة.

تطبيقات عملية لمتوسط الدقة الحسابي

بعد ذلك، لنتعرف على كيف يمكن أن تساعد المقاييس الرئيسية مثل mAP عند إنشاء حالات استخدام للرؤية الحاسوبية في العالم الحقيقي.

المركبات ذاتية القيادة: لماذا تعني قيمة mAP الأعلى طرقًا أكثر أمانًا

عندما يتعلق الأمر بالسيارات ذاتية القيادة، فإن اكتشاف الكائنات أمر بالغ الأهمية لتحديد المشاة وإشارات المرور وراكبي الدراجات وعلامات المسارات. على سبيل المثال، إذا ركض طفل فجأة عبر الشارع، فإن السيارة لديها ثوانٍ لاكتشاف الكائن (الطفل)، وتحديد مكانه، وتتبع حركته، واتخاذ الإجراء اللازم (تطبيق المكابح). 

تم تصميم نماذج مثل YOLO11 للكشف عن الكائنات في الوقت الفعلي في مثل هذه السيناريوهات عالية المخاطر. في هذه الحالات، يصبح mAP مقياسًا حاسمًا للسلامة.

تضمن درجة mAP العالية أن النظام يكتشف الطفل بسرعة، ويحدد مكانه بدقة، ويقوم بتشغيل المكابح بأقل قدر من التأخير. يمكن أن يعني انخفاض mAP عمليات كشف مفقودة أو تصنيفات خاطئة خطيرة، مثل الخلط بين الطفل وجسم صغير آخر.

الشكل 6. مثال على استخدام YOLO11 لاكتشاف المشاة على الطريق. (المصدر)

استخدام mAP للكشف الدقيق عن المنتج

وبالمثل، في البيع بالتجزئة، يمكن استخدام نماذج الكشف عن الكائنات لأتمتة مهام مثل مراقبة المخزون وعمليات الدفع. عندما يقوم العميل بمسح منتج ضوئيًا عند الدفع الذاتي، يمكن أن يتسبب خطأ في الاكتشاف في الإحباط.

تضمن درجة mAP العالية أن النموذج يميز بدقة بين المنتجات المتشابهة ويرسم مربعات إحاطة دقيقة، حتى عندما تكون العناصر معبأة بإحكام. يمكن أن يؤدي انخفاض درجة mAP إلى حدوث أخطاء. على سبيل المثال، إذا أخطأ النموذج في التعرف على زجاجة عصير برتقال على أنها زجاجة عصير تفاح مشابهة بصريًا، فقد يؤدي ذلك إلى فوترة غير صحيحة وتقارير مخزون غير دقيقة.

يمكن لأنظمة البيع بالتجزئة المدمجة مع نماذج مثل YOLO11 اكتشاف المنتجات في الوقت الفعلي، والتحقق منها مقابل المخزون، وتحديث الأنظمة الخلفية على الفور. في بيئات البيع بالتجزئة سريعة الخطى، يلعب mAP دورًا حاسمًا في الحفاظ على دقة العمليات وموثوقيتها.

تحسين دقة التشخيص مع ارتفاع mAP في الرعاية الصحية

يبدأ تحسين دقة التشخيص في الرعاية الصحية بالكشف الدقيق في التصوير الطبي. يمكن لنماذج مثل YOLO11 أن تساعد أخصائيي الأشعة في اكتشاف الأورام أو الكسور أو التشوهات الأخرى من تلك الفحوصات الطبية. هنا، يعد متوسط الدقة المتوسطة مقياسًا أساسيًا لتقييم الموثوقية السريرية للنموذج.

يشير ارتفاع mAP إلى أن النموذج يحقق استرجاعًا عاليًا (تحديد معظم المشكلات الفعلية) ودقة عالية (تجنب الإنذارات الكاذبة)، وهو أمر بالغ الأهمية في اتخاذ القرارات السريرية. أيضًا، غالبًا ما يتم تعيين عتبة IoU في الرعاية الصحية على مستوى عالٍ جدًا (0.85 أو 0.90) لضمان اكتشاف دقيق للغاية.

ومع ذلك، يمكن أن يثير انخفاض درجة mAP مخاوف. لنفترض أن النموذج يفوته ورم؛ فقد يؤخر التشخيص أو يؤدي إلى علاج غير صحيح. 

إيجابيات وسلبيات استخدام mAP

فيما يلي المزايا الرئيسية لاستخدام متوسط الدقة لتقييم نماذج الكشف عن الكائنات:

  • مقياس موحد: mAP هو معيار الصناعة لتقييم نماذج الكشف عن الكائنات. تتيح قيمة mAP إجراء مقارنات عادلة ومتسقة بين النماذج المختلفة.
  • يعكس الأداء في العالم الحقيقي: يشير mAP العالي إلى أن النموذج يتفوق في اكتشاف فئات الكائنات المختلفة ويحافظ على أداء قوي في السيناريوهات المعقدة في العالم الحقيقي.
  • التشخيصات حسب الفئة: تقوم درجة mAP بتقييم أداء الكشف لكل فئة على حدة. هذا يجعل من السهل تحديد الفئات ذات الأداء الضعيف (مثل الدراجات أو لافتات الشوارع) وضبط النموذج وفقًا لذلك.

في حين أن هناك فوائد مختلفة لاستخدام مقياس mAP، إلا أن هناك بعض القيود التي يجب مراعاتها. فيما يلي بعض العوامل التي يجب أخذها في الاعتبار:

  • صعب على أصحاب المصلحة غير التقنيين: قد تجد الفرق التجارية أو السريرية قيم mAP مجردة، على عكس المقاييس الأكثر سهولة وفهمًا.
  • لا يعكس قيود الوقت الفعلي: لا يأخذ mAP في الاعتبار سرعة الاستدلال أو زمن الوصول، وهما أمران حاسمان للنشر في التطبيقات الحساسة للوقت.

النقاط الرئيسية

لقد رأينا أن متوسط الدقة ليس مجرد درجة تقنية ولكنه انعكاس لإمكانات أداء النموذج في العالم الحقيقي. سواء كان ذلك في نظام مركبة ذاتية القيادة أو في نقطة بيع بالتجزئة، فإن درجة mAP العالية تعمل كمؤشر موثوق لأداء النموذج وجاهزيته العملية.

في حين أن mAP هو مقياس أساسي ومؤثر، إلا أنه يجب اعتباره جزءًا من إستراتيجية تقييم شاملة. بالنسبة للتطبيقات الهامة مثل الرعاية الصحية والقيادة الذاتية، لا يكفي الاعتماد فقط على mAP. 

يجب أيضًا مراعاة عوامل إضافية مثل سرعة الاستدلال (مدى سرعة إجراء النموذج للتنبؤات)، وحجم النموذج (الذي يؤثر على النشر على الأجهزة الطرفية)، وتحليل الأخطاء النوعية (فهم أنواع الأخطاء التي يرتكبها النموذج) لضمان أن النظام آمن وفعال ومناسب حقًا للغرض المقصود منه.

انضم إلى مجتمعنا المتنامي ومستودع GitHub لمعرفة المزيد حول رؤية الحاسوب. استكشف صفحات الحلول الخاصة بنا للتعرف على تطبيقات رؤية الحاسوب في الزراعة والذكاء الاصطناعي في مجال الخدمات اللوجستية. تحقق من خيارات الترخيص لدينا لتبدأ في استخدام نموذج رؤية الحاسوب الخاص بك اليوم!

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا
تم نسخ الرابط إلى الحافظة