فهم متوسط الدقة المتوسطة (mAP) في اكتشاف الكائنات. تعرف على معناه وحسابه وسبب أهمية متوسط الدقة المتوسطة في تقييم أداء النموذج.

فهم متوسط الدقة المتوسطة (mAP) في اكتشاف الكائنات. تعرف على معناه وحسابه وسبب أهمية متوسط الدقة المتوسطة في تقييم أداء النموذج.
يتنامى اعتماد الذكاء الاصطناعي بسرعة، ويتم دمج الذكاء الاصطناعي في العديد من الابتكارات، من السيارات ذاتية القيادة إلى أنظمة البيع بالتجزئة التي يمكنها تحديد المنتجات على الرفوف. تعتمد هذه التقنيات على الرؤية الحاسوبية، وهو فرع من فروع الذكاء الاصطناعي (AI) الذي يُمكِّن الآلات من تحليل البيانات المرئية.
أحد مقاييس التقييم الرئيسية المستخدمة لقياس دقة أنظمة وخوارزميات الرؤية الحاسوبية هو متوسط الدقة (mAP). يشير مقياس mAP إلى مدى تطابق تنبؤ نموذج الذكاء الاصطناعي للرؤية مع نتائج العالم الحقيقي.
تتمثل إحدى مهام الرؤية الحاسوبية الشائعة في اكتشاف الأجسام، حيث يقوم النموذج بتحديد أجسام متعددة في الصورة ورسم مربعات محددة حولها. mAP هو المقياس القياسي المستخدم لتقييم أداء نماذج اكتشاف الأجسام، ويُستخدم على نطاق واسع لقياس نماذج التعلم العميق مثل Ultralytics YOLO11.
في هذه المقالة، سنرى كيف يتم حساب متوسط الدقة المتوسطة ولماذا هو ضروري لأي شخص يقوم بتدريب أو تقييم نماذج اكتشاف الأجسام. لنبدأ!
متوسط الدقة المتوسطة هي درجة تُظهر مدى دقة نموذج التعلم العميق عندما يتعلق الأمر بالمهام المتعلقة باسترجاع المعلومات المرئية، مثل اكتشاف وتحديد الأجسام المختلفة في الصورة. على سبيل المثال، ضع في اعتبارك نموذجًا للكشف عن الكائنات يقوم بتحليل صورة تحتوي على كلب وقطة وسيارة. يمكن للنموذج الموثوق أن يقوم بالكشف عن الكائنات من خلال التعرف على كل كائن ورسم مربعات وعلامات حوله مع إبراز مكانه وماهيته.
يشير mAP إلى مدى جودة أداء النموذج لهذه المهمة عبر العديد من الصور وأنواع مختلفة من الأجسام. وهو يتحقق مما إذا كان النموذج يحدد بدقة كل كائن وموقعه داخل الصورة. تتراوح الدرجة من 0 إلى 1، حيث يعني الرقم واحد أن النموذج عثر على كل شيء بشكل مثالي، ويعني الصفر أنه فشل في اكتشاف أي كائن.
قبل أن نستكشف المفاهيم الكامنة وراء متوسط الدقة المتوسطة في التعلم الآلي، دعونا نفهم بشكل أفضل مصطلحين أساسيين: الحقيقة الأساسية والتنبؤات.
تشير الحقيقة الأساسية إلى البيانات المرجعية الدقيقة، حيث يتم تصنيف الكائنات ومواقعها في الصورة بعناية من قِبل البشر من خلال عملية تُعرف باسم التعليق التوضيحي. أما التنبؤات فهي النتائج التي تعطيها نماذج الذكاء الاصطناعي بعد تحليل الصورة. بمقارنة تنبؤات نموذج الذكاء الاصطناعي بالحقيقة الأرضية، يمكننا قياس مدى اقتراب النموذج من الحصول على النتائج الصحيحة.
غالبًا ما تُستخدم مصفوفة الارتباك لفهم مدى دقة نموذج اكتشاف الكائنات. وهو عبارة عن جدول يوضح كيفية تطابق تنبؤات النموذج مع الإجابات الصحيحة الفعلية (الحقيقة الأرضية). من هذا الجدول، يمكننا الحصول على تفصيل لأربعة مكونات أو نتائج رئيسية: الإيجابيات الصحيحة، والإيجابيات الخاطئة، والسلبيات الخاطئة، والسلبيات الخاطئة، والسلبيات الصحيحة.
إليك ما تمثله هذه المكونات في مصفوفة الارتباك:
لا يتم استخدام السلبيات الحقيقية بشكل شائع في اكتشاف الأجسام، لأننا عادةً ما نتجاهل العديد من المناطق الفارغة في الصورة. ومع ذلك، فهي ضرورية في مهام الرؤية الحاسوبية الأخرى، مثل تصنيف الصور، حيث يقوم النموذج بتعيين تسمية للصورة. على سبيل المثال، إذا كانت المهمة هي اكتشاف ما إذا كانت الصورة تحتوي على قطة أم لا، ويحدد النموذج بشكل صحيح "لا توجد قطة" عندما لا تحتوي الصورة على قطة، فهذا يعتبر سلبيًا حقيقيًا.
هناك مقياس حيوي آخر في تقييم نماذج اكتشاف الأجسام وهو التقاطع على الاتحاد (IoU). فبالنسبة لنماذج الذكاء الاصطناعي المرئي هذه، لا يكفي مجرد اكتشاف وجود كائن في الصورة؛ بل يحتاج أيضًا إلى تحديد مكان وجوده في الصورة لرسم المربعات المحدودة.
يقيس مقياس IoU مدى تطابق المربع المتوقع للنموذج مع المربع الفعلي الصحيح (الحقيقة الأرضية). تتراوح الدرجة بين 0 و 1، حيث 1 تعني تطابقًا تامًا و 0 تعني عدم وجود تداخل على الإطلاق.
على سبيل المثال، يعني ارتفاع وحدة تعريض داخلي أعلى (مثل 0.80 أو 0.85) أن المربع المتوقّع مطابق تمامًا للمربع الحقيقي الأرضي، مما يشير إلى دقة تحديد الموقع. بينما يعني انخفاض وحدة التوقع الأدنى (مثل 0.30 أو 0.25) أن النموذج لم يحدد موقع الجسم بدقة.
لتحديد ما إذا كان الاكتشاف ناجحًا، نستخدم عتبات مختلفة. عتبة IoU الشائعة هي 0.5، وهو ما يعني أن المربع المتوقع يجب أن يتداخل مع المربع الحقيقي الأرضي بنسبة 50% على الأقل ليتم اعتباره إيجابيًا صحيحًا. أي تداخل أقل من هذه العتبة يُعتبر إيجابيًا كاذبًا.
لقد استكشفنا حتى الآن بعض مقاييس التقييم الأساسية لفهم أداء نماذج اكتشاف الأجسام. بناءً على ذلك، فإن اثنين من أهم المقاييس هما الدقة والاستدعاء. فهما يعطياننا صورة واضحة عن مدى دقة اكتشافات النموذج. لنلقِ نظرة على ماهيتهما.
تخبرنا قيم الدقة بعدد تنبؤات النموذج التي كانت صحيحة بالفعل. إنها تجيب على السؤال: من بين جميع الأجسام التي ادعى النموذج اكتشافها، كم منها كان موجودًا بالفعل؟
من ناحية أخرى، تقيس قيم الاسترجاع مدى نجاح النموذج في العثور على جميع الأجسام الفعلية الموجودة في الصورة. وهي تجيب على السؤال التالي: من بين جميع الأجسام الحقيقية الموجودة، كم عدد الأجسام الحقيقية التي اكتشفها النموذج بشكل صحيح؟
تعطينا الدقة والاستدعاء معاً صورة أوضح عن مدى جودة أداء النموذج. على سبيل المثال، إذا تنبأ أحد النماذج بوجود 10 سيارات في صورة ما وكانت 9 منها سيارات بالفعل، فإن دقة النموذج تبلغ 90% (تنبؤ إيجابي).
غالبًا ما ينطوي هذان المقياسان للتقييم على مفاضلة: يمكن للنموذج أن يحقق قيمة دقة عالية من خلال إجراء تنبؤات يثق بها تمامًا، ولكن هذا قد يؤدي إلى تفويت العديد من الكائنات، مما يقلل من مستوى الاستدعاء. وفي الوقت نفسه، يمكن أن يصل النموذج أيضًا إلى مستوى استدعاء عالٍ جدًا من خلال التنبؤ بالمربع المحدود في كل مكان تقريبًا، ولكن هذا من شأنه أن يقلل من الدقة.
بينما تساعدنا الدقة والاستدعاء على فهم كيفية أداء النموذج في التنبؤات الفردية، يمكن أن يوفر متوسط الدقة (AP) رؤية أوسع. فهو يوضح كيف تتغير دقة النموذج عندما يحاول اكتشاف المزيد من الكائنات، ويلخص أداءه في رقم واحد.
ولحساب متوسط درجة الدقة، يمكننا أولاً إنشاء مقياس مدمج يشبه الرسم البياني يسمى منحنى دقة التذكر (أو منحنى الدقة والتنبؤ) لكل نوع من أنواع الكائنات. يوضح هذا المنحنى ما يحدث عندما يقوم النموذج بعمل المزيد من التنبؤات.
ضع في اعتبارك سيناريو يبدأ فيه النموذج باكتشاف أسهل أو أوضح الأجسام فقط. في هذه المرحلة، تكون الدقة عالية لأن معظم التنبؤات صحيحة، لكن التذكّر يكون منخفضًا لأن العديد من الأجسام لا تزال تُخطئ في اكتشافها. عندما يحاول النموذج اكتشاف المزيد من الأجسام، بما في ذلك الأجسام الأصعب أو الأكثر ندرة، فإنه عادةً ما يُدخل المزيد من الأخطاء. يؤدي هذا إلى انخفاض الدقة بينما يزداد الاستدعاء.
متوسط الدقة هو المساحة تحت المنحنى (AUC لمنحنى العلاقات العامة). تعني المساحة الأكبر أن النموذج أفضل في الحفاظ على دقة تنبؤاته، حتى عندما يكتشف المزيد من الكائنات. تُحسب المساحة تحت المنحنى (AP) بشكل منفصل لكل تسمية فئة.
على سبيل المثال، في نموذج يمكنه اكتشاف السيارات والدراجات والمشاة يمكننا حساب قيم نقاط الوصول لكل فئة من هذه الفئات الثلاث على حدة. يساعدنا ذلك في معرفة الأجسام التي يجيد النموذج اكتشافها والأماكن التي قد تحتاج إلى تحسين.
بعد حساب متوسط الدقة لكل فئة من فئات الكائنات، ما زلنا بحاجة إلى درجة واحدة تعكس الأداء الكلي للنموذج في جميع الفئات. يمكن تحقيق ذلك باستخدام معادلة متوسط متوسط الدقة . حيث يتم حساب متوسط درجات الدقة المتوسطة لكل فئة.
على سبيل المثال، دعنا نفترض أن نموذج رؤية حاسوبية مثل YOLO11 يحقق معدل وصول سريع يبلغ 0.827 للسيارات، و0.679 للدراجات النارية، و0.355 للشاحنات، و0.863 للحافلات، و0.982 للدراجات الهوائية. باستخدام معادلة mAP، يمكننا جمع هذه الأرقام والقسمة على إجمالي عدد الفئات على النحو التالي:
mAP = (0.827 + 0.679 + 0.679 + 0.355 + 0.863 + 0.982) ÷ 5 = 0.7432 ≈ 0.743
توفر درجة mAP البالغة 0.743 حلاً مباشرًا للحكم على مدى جودة أداء النموذج في جميع فئات الكائنات. تعني القيمة القريبة من 1 أن النموذج دقيق لمعظم الفئات، بينما تشير القيمة الأقل إلى أنه يعاني من بعض الفئات.
والآن بعد أن أصبح لدينا فهم أفضل لكيفية حساب AP و mAP ومكوناتهما، إليك نظرة عامة على أهميتهما في الرؤية الحاسوبية:
بعد ذلك، دعنا نستكشف كيف يمكن أن تساعد المقاييس الرئيسية مثل mAP عند بناء حالات استخدام الرؤية الحاسوبية في العالم الحقيقي.
عندما يتعلق الأمر بالسيارات ذاتية القيادة، فإن اكتشاف الأجسام أمر بالغ الأهمية لتحديد المشاة وعلامات الطريق وراكبي الدراجات وعلامات الحارات. على سبيل المثال، إذا ركض طفل فجأة عبر الشارع، فإن السيارة لديها ثوانٍ لاكتشاف الجسم (الطفل)، وتحديد مكانه، وتتبع حركته، واتخاذ الإجراء اللازم (الضغط على المكابح).
تم تصميم نماذج مثل YOLO11 للكشف عن الأجسام في الوقت الفعلي في مثل هذه السيناريوهات عالية المخاطر. في هذه الحالات، تصبح MAP مقياسًا حاسمًا للسلامة.
تضمن درجة mAP العالية أن يكتشف النظام الطفل بسرعة، ويحدد موقعه بدقة، ويطلق الكبح بأقل قدر من التأخير. يمكن أن تعني درجة mAP المنخفضة عدم اكتشافه أو تصنيفات خاطئة خطيرة، مثل الخلط بين الطفل وجسم صغير آخر.
وبالمثل، في مجال البيع بالتجزئة، يمكن استخدام نماذج الكشف عن الكائنات لأتمتة مهام مثل مراقبة المخزون وعمليات الدفع. عندما يقوم العميل بمسح أحد المنتجات عند الخروج الذاتي، يمكن أن يتسبب خطأ في الكشف في إحباط العميل.
تتأكد درجة mAP المرتفعة من أن النموذج يميز بدقة بين المنتجات المتشابهة ويرسم مربعات حدية دقيقة، حتى عندما تكون العناصر معبأة بإحكام. يمكن أن تؤدي درجة mAP المنخفضة إلى حدوث خلط. على سبيل المثال، إذا أخطأ النموذج في زجاجة عصير برتقال مع زجاجة عصير تفاح مشابهة لها بصريًا، فقد يؤدي ذلك إلى فواتير غير صحيحة وتقارير مخزون غير دقيقة.
يمكن لأنظمة البيع بالتجزئة المدمجة مع نماذج مثل YOLO11 اكتشاف المنتجات في الوقت الفعلي، والتحقق منها مقابل المخزون، وتحديث الأنظمة الخلفية على الفور. في إعدادات البيع بالتجزئة سريعة الوتيرة، تلعب mAP دورًا حاسمًا في الحفاظ على دقة العمليات وموثوقيتها.
يبدأ تحسين دقة التشخيص في مجال الرعاية الصحية بالكشف الدقيق في التصوير الطبي. يمكن لنماذج مثل YOLO11 أن تساعد أخصائيي الأشعة في اكتشاف الأورام أو الكسور أو غيرها من الحالات الشاذة من تلك الأشعة الطبية. وهنا، يُعد متوسط الدقة المتوسطة مقياساً أساسياً لتقييم الموثوقية السريرية للنموذج.
يشير ارتفاع mAP إلى أن النموذج يُحقق كلاً من الاستدعاء العالي (تحديد معظم المشكلات الفعلية) والدقة العالية (تجنب الإنذارات الكاذبة)، وهو أمر بالغ الأهمية في اتخاذ القرارات السريرية. بالإضافة إلى ذلك، غالبًا ما يتم تعيين عتبة IoU في مجال الرعاية الصحية عالية جدًا (0.85 أو 0.90) لضمان دقة عالية جدًا في الكشف.
ومع ذلك، يمكن أن تثير درجة MAP المنخفضة المخاوف. لنفترض أن النموذج يغفل ورماً؛ فقد يؤخر التشخيص أو يؤدي إلى علاج غير صحيح.
فيما يلي المزايا الرئيسية لاستخدام متوسط الدقة المتوسطة لتقييم نماذج اكتشاف الأجسام:
على الرغم من وجود العديد من الفوائد لاستخدام مقياس mAP، إلا أن هناك بعض القيود التي يجب مراعاتها. فيما يلي بعض العوامل التي يجب أخذها في الاعتبار:
لقد رأينا أن متوسط متوسط الدقة ليس مجرد درجة تقنية بل هو انعكاس للأداء المحتمل للنموذج في العالم الحقيقي. سواءً في نظام المركبات ذاتية القيادة أو في عمليات البيع بالتجزئة، تُعد درجة متوسط الدقة المتوسطة العالية مؤشراً موثوقاً لأداء النموذج وجاهزيته العملية.
على الرغم من أن mAP مقياس أساسي ومؤثر، إلا أنه يجب النظر إليه كجزء من استراتيجية تقييم شاملة. بالنسبة للتطبيقات الحرجة مثل الرعاية الصحية والقيادة الذاتية، لا يكفي الاعتماد فقط على mAP.
كما يجب النظر في عوامل إضافية مثل سرعة الاستدلال (مدى سرعة النموذج في إجراء التنبؤات)، وحجم النموذج (التأثير على النشر على الأجهزة الطرفية)، وتحليل الأخطاء النوعية (فهم أنواع الأخطاء التي يرتكبها النموذج) لضمان أن يكون النظام آمنًا وفعالًا ومناسبًا حقًا للغرض المقصود منه.
انضم إلى مجتمعنا المتنامي ومستودع GitHub لمعرفة المزيد عن الرؤية الحاسوبية. استكشف صفحات الحلول الخاصة بنا للتعرف على تطبيقات الرؤية الحاسوبية في الزراعة والذكاء الاصطناعي في مجال الخدمات اللوجستية. اطلع على خيارات الترخيص لدينا لبدء استخدام نموذج الرؤية الحاسوبية الخاص بك اليوم!