متوسط الدقة المتوسطةmAP): اكتشاف الكائنات

يتزايد تبني الذكاء الاصطناعي بسرعة، ويتم دمجه في العديد من الابتكارات، من السيارات ذاتية القيادة إلى أنظمة البيع بالتجزئة التي يمكنها تحديد المنتجات على الرف. تعتمد هذه التقنيات على رؤية الحاسوب، وهو فرع من فروع الذكاء الاصطناعي (AI) يمكّن الآلات من تحليل البيانات المرئية.

أحد مقاييس التقييم الرئيسية المستخدمة لقياس دقة أنظمة وخوارزميات الرؤية الحاسوبية هو متوسط الدقةmAP). يشير مقياس mAP إلى مدى تطابق تنبؤ نموذج الذكاء الاصطناعي للرؤية مع نتائج العالم الحقيقي.

تتمثل إحدى مهام الرؤية الحاسوبية الشائعة في اكتشاف الأجسام، حيث يقوم النموذج بتحديد أجسام متعددة في الصورة ورسم مربعات محددة حولها. mAP هو المقياس القياسي المستخدم لتقييم أداء نماذج اكتشاف الأجسام، ويُستخدم على نطاق واسع لقياس نماذج التعلم العميق مثل Ultralytics YOLO11.

في هذه المقالة، سنرى كيف يتم حساب متوسط الدقة المتوسطة وسبب أهميته لأي شخص يقوم بتدريب أو تقييم نماذج الكشف عن الكائنات. هيا بنا نبدأ!

ما هو متوسط الدقة المتوسطةmAP)؟

متوسط الدقة المتوسطة هو درجة توضح مدى دقة نموذج التعلم العميق عندما يتعلق الأمر بالمهام المتعلقة باسترجاع المعلومات المرئية، مثل اكتشاف وتحديد الكائنات المختلفة في الصورة. على سبيل المثال، ضع في اعتبارك نموذج اكتشاف الكائنات الذي يحلل صورة تحتوي على كلب وقطة وسيارة. يمكن للنموذج الموثوق به إجراء اكتشاف الكائنات من خلال التعرف على كل كائن ورسم مربعات محيطة وملصقات حوله، مع تسليط الضوء على مكانه وما هو.

يشير mAP إلى مدى جودة أداء النموذج لهذه المهمة عبر العديد من الصور وأنواع مختلفة من الأجسام. وهو يتحقق مما إذا كان النموذج يحدد بدقة كل كائن وموقعه داخل الصورة. تتراوح الدرجة من 0 إلى 1، حيث يعني الرقم واحد أن النموذج عثر على كل شيء بشكل مثالي، ويعني الصفر أنه فشل في detect أي كائن.

المفاهيم الرئيسية في متوسط الدقة المتوسطةmAP

قبل أن نستكشف المفاهيم الكامنة وراء متوسط الدقة في التعلم الآلي، دعنا نحصل على فهم أفضل لمصطلحين أساسيين: الحقيقة الأساسية والتنبؤات.

تشير الحقيقة الأساسية إلى البيانات المرجعية الدقيقة، حيث يتم تصنيف الكائنات ومواقعها في الصورة بعناية من قبل البشر من خلال عملية تعرف باسم التعليق التوضيحي. وفي الوقت نفسه، فإن التنبؤات هي النتائج التي تقدمها نماذج الذكاء الاصطناعي بعد تحليل الصورة. من خلال مقارنة تنبؤات نموذج الذكاء الاصطناعي بالحقيقة الأساسية، يمكننا قياس مدى قرب النموذج من الحصول على النتائج الصحيحة.

الشكل 1. تنبؤ النموذج والصناديق المحيطة بالحقيقة الأساسية. صورة من إعداد المؤلف.

‍

مصفوفة الارتباك

غالبًا ما تستخدم مصفوفة الارتباك (confusion matrix) لفهم مدى دقة نموذج الكشف عن الكائنات. إنه جدول يوضح كيف تتطابق تنبؤات النموذج مع الإجابات الصحيحة الفعلية (الحقيقة الأساسية). من هذا الجدول، يمكننا الحصول على تفصيل للمكونات أو النتائج الرئيسية الأربعة: الإيجابيات الحقيقية، والإيجابيات الخاطئة، والسلبيات الخاطئة، والسلبيات الحقيقية.

فيما يلي ما تمثله هذه المكونات في مصفوفة الالتباس:

النتيجة الإيجابية الصحيحة (TP): يتم الكشف عن كائن وموقعه بشكل صحيح بواسطة النموذج.
‍
إيجابي كاذب (FP): أجرى النموذج اكتشافًا، لكنه كان غير صحيح.
‍
سلبي كاذب (FN): جسم كان موجودًا بالفعل في الصورة، لكن النموذج فشل في detect .
‍
النتيجة السلبية الصحيحة (TN): تحدث النتائج السلبية الصحيحة عندما يحدد النموذج بشكل صحيح عدم وجود كائن.

لا يتم استخدام السلبيات الحقيقية بشكل شائع في اكتشاف الأجسام، لأننا عادةً ما نتجاهل العديد من المناطق الفارغة في الصورة. ومع ذلك، فهي ضرورية في مهام الرؤية الحاسوبية الأخرى، مثل تصنيف الصور، حيث يقوم النموذج بتعيين تسمية للصورة. على سبيل المثال، إذا كانت المهمة هي detect ما إذا كانت الصورة تحتوي على قطة أم لا، ويحدد النموذج بشكل صحيح "لا توجد قطة" عندما لا تحتوي الصورة على قطة، فهذا يعتبر سلبيًا حقيقيًا.

الشكل 2. نتائج التصنيف في مصفوفة الارتباك. الصورة من إعداد المؤلف.

‍

التقاطع على الاتحادIoU

هناك مقياس حيوي آخر في تقييم نماذج اكتشاف الأجسام وهو التقاطع على الاتحادIoU). فبالنسبة لنماذج الذكاء الاصطناعي المرئي هذه، لا يكفي مجرد اكتشاف وجود كائن في الصورة؛ بل يحتاج أيضًا إلى تحديد مكان وجوده في الصورة لرسم المربعات المحدودة.

يقيس مقياس IoU مدى تطابق المربع المتوقع للنموذج مع المربع الفعلي الصحيح (الحقيقة الأرضية). تتراوح الدرجة بين 0 و 1، حيث 1 تعني تطابقًا تامًا و 0 تعني عدم وجود تداخل على الإطلاق.

على سبيل المثال، تعني IoU أعلى (مثل 0.80 أو 0.85) أن المربع المتوقّع مطابق تمامًا للمربع الحقيقي الأرضي، ما يشير إلى دقة تحديد الموقع. بينما يعني انخفاض IoU الأدنى (مثل 0.30 أو 0.25) أن النموذج لم يحدد موقع الجسم بدقة.

لتحديد ما إذا كان الاكتشاف ناجحًا، نستخدم عتبات مختلفة. عتبة IoU الشائعة هي 0.5، وهو ما يعني أن المربع المتوقع يجب أن يتداخل مع المربع الحقيقي الأرضي بنسبة 50% على الأقل ليتم اعتباره إيجابيًا صحيحًا. أي تداخل أقل من هذه العتبة يُعتبر إيجابيًا كاذبًا.

الشكل 3. فهم مفهوم التقاطع على الاتحاد (Intersection over Union). صورة من إعداد المؤلف.

‍

الدقة والاسترجاع

حتى الآن، استكشفنا بعض مقاييس التقييم الأساسية لفهم أداء نماذج الكشف عن الكائنات. بناءً على ذلك، فإن اثنين من أهم المقاييس هما الدقة والاسترجاع (Precision and Recall). إنهما يعطياننا صورة واضحة عن مدى دقة عمليات الكشف التي يقوم بها النموذج. دعونا نلقي نظرة على ماهيتهما.

تخبرنا قيم الدقة بعدد تنبؤات النموذج التي كانت صحيحة بالفعل. إنها تجيب على السؤال: من بين جميع الأجسام التي ادعى النموذج detect كم منها كان موجودًا بالفعل؟

من ناحية أخرى، تقيس قيم الاسترجاع مدى نجاح النموذج في العثور على جميع الأجسام الفعلية الموجودة في الصورة. وهي تجيب على السؤال التالي: من بين جميع الأجسام الحقيقية الموجودة، كم عدد الأجسام الحقيقية التي detect النموذج بشكل صحيح؟

معًا، تعطينا الدقة والاسترجاع صورة أوضح عن مدى جودة أداء النموذج. على سبيل المثال، إذا تنبأ نموذج بوجود 10 سيارات في صورة ما، وكانت 9 منها بالفعل سيارات، فإنه يتمتع بدقة 90٪ (توقع إيجابي).

غالبًا ما تنطوي مقاييس التقييم هاتين على مفاضلة: يمكن للنموذج تحقيق قيمة دقة عالية من خلال إجراء تنبؤات يثق بها تمامًا فقط، ولكن هذا قد يتسبب في فقد العديد من الكائنات، مما يقلل من مستوى الاسترجاع. وفي الوقت نفسه، يمكن أن يصل أيضًا إلى استرجاع عالٍ جدًا من خلال التنبؤ بمربع إحاطة في كل مكان تقريبًا، ولكن هذا سيقلل من الدقة.

الشكل 4. الدقة والاسترجاع. صورة بواسطة المؤلف.

‍

متوسط الدقة

بينما تساعدنا الدقة والاستدعاء على فهم كيفية أداء النموذج في التنبؤات الفردية، يمكن أن يوفر متوسط الدقةAP) رؤية أوسع. فهو يوضح كيف تتغير دقة النموذج عندما يحاول detect المزيد من الكائنات، ويلخص أداءه في رقم واحد.

لحساب متوسط درجة الدقة، يمكننا أولاً إنشاء مقياس مدمج يشبه الرسم البياني يسمى منحنى الدقة والاسترجاع (أو منحنى PR) لكل نوع من أنواع الكائنات. يوضح هذا المنحنى ما يحدث عندما يقدم النموذج المزيد من التنبؤات.

ضع في اعتبارك سيناريو يبدأ فيه النموذج باكتشاف أسهل أو أوضح الأجسام فقط. في هذه المرحلة، تكون الدقة عالية لأن معظم التنبؤات صحيحة، لكن التذكّر يكون منخفضًا لأن العديد من الأجسام لا تزال تُخطئ في اكتشافها. عندما يحاول النموذج detect المزيد من الأجسام، بما في ذلك الأجسام الأصعب أو الأكثر ندرة، فإنه عادةً ما يُدخل المزيد من الأخطاء. يؤدي هذا إلى انخفاض الدقة بينما يزداد الاستدعاء.

متوسط الدقة هو المساحة تحت المنحنى (AUC لمنحنى العلاقات العامة). تعني المساحة الأكبر أن النموذج أفضل في الحفاظ على دقة تنبؤاته، حتى عندما يكتشف المزيد من الكائنات. تُحسب AP تحت AP بشكل منفصل لكل تسمية فئة.

على سبيل المثال، في نموذج يمكنه detect السيارات والدراجات والمشاة يمكننا حساب قيم AP لكل فئة من هذه الفئات الثلاث على حدة. يساعدنا ذلك في معرفة الأجسام التي يجيد النموذج اكتشافها والأماكن التي قد تحتاج إلى تحسين.

الشكل 5. منحنى PR لخمس فئات مختلفة. (المصدر)

‍

متوسط الدقة المتوسطة (Mean Average Precision)

بعد حساب متوسط الدقة لكل فئة من فئات الكائنات، ما زلنا بحاجة إلى درجة واحدة تعكس الأداء الكلي للنموذج في جميع الفئات. يمكن تحقيق ذلك باستخدام معادلة متوسط متوسط الدقة . حيث يتم حساب متوسط درجات AP المتوسطة لكل فئة.

على سبيل المثال، دعنا نفترض أن نموذج رؤية حاسوبية مثل YOLO11 يحقق AP يبلغ 0.827 للسيارات، و0.679 للدراجات النارية، و0.355 للشاحنات، و0.863 للحافلات، و0.982 للدراجات الهوائية. باستخدام معادلة mAP يمكننا جمع هذه الأرقام والقسمة على إجمالي عدد الفئات على النحو التالي:

mAP = (0.827 + 0.679 + 0.679 + 0.355 + 0.863 + 0.982) ÷ 5 = 0.7432 ≈ 0.743

‍

توفر درجة mAP البالغة 0.743 حلاً مباشرًا للحكم على مدى جودة أداء النموذج في جميع فئات الكائنات. تعني القيمة القريبة من 1 أن النموذج دقيق لمعظم الفئات، بينما تشير القيمة الأقل إلى أنه يعاني من بعض الفئات.

أهمية AP و mAP في الرؤية الحاسوبية

والآن بعد أن أصبح لدينا فهم أفضل لكيفية حساب AP و mAP ومكوناتهما، إليك نظرة عامة على أهميتهما في الرؤية الحاسوبية:

AP منخفضة لفئة معينة: غالبًا ما يعني انخفاض معدل AP المنخفض لفئة واحدة أن النموذج يواجه صعوبة في التعامل مع فئة كائن معين. قد يرجع ذلك إلى عدم كفاية بيانات التدريب أو التحديات البصرية في الصور، مثل الانسداد.

أخطاء التعريب: يشير ارتفاع قيمة mAP أعلى عند عتبة IoU الأدنى (مثل mAP مع انخفاض كبير عند عتبة IoU الأعلى (مثل mAP إلى أن النموذج يمكنه detect الأجسام ولكنه يكافح لتحديد موقعها بدقة.

الإفراط في التركيب: تُعد قيمة mAP أعلى في مجموعة بيانات التدريب ولكن قيمة mAP أقل في مجموعة بيانات التحقق من الصحة علامة على الإفراط في التركيب، مما يجعل النموذج غير موثوق به للصور الجديدة.

تطبيقات عملية لمتوسط الدقة الحسابي

بعد ذلك، دعنا نستكشف كيف يمكن أن تساعد المقاييس الرئيسية مثل mAP عند بناء حالات استخدام الرؤية الحاسوبية في العالم الحقيقي.

المركبات ذاتية القيادة: لماذا تعني القيمة الأعلى mAP طرقاً أكثر أماناً

عندما يتعلق الأمر بالسيارات ذاتية القيادة، فإن اكتشاف الأجسام أمر بالغ الأهمية لتحديد المشاة وعلامات الطريق وراكبي الدراجات وعلامات الحارات. على سبيل المثال، إذا ركض طفل فجأة عبر الشارع، فإن السيارة لديها ثوانٍ detect الجسم (الطفل)، وتحديد مكانه، track حركته، واتخاذ الإجراء اللازم (الضغط على المكابح).

تم تصميم نماذج مثل YOLO11 للكشف عن الأجسام في الوقت الفعلي في مثل هذه السيناريوهات عالية المخاطر. في هذه الحالات، تصبح mAP مقياسًا حاسمًا للسلامة.

تضمن درجة mAP العالية أن يكتشف النظام الطفل بسرعة، ويحدد موقعه بدقة، ويطلق الكبح بأقل قدر من التأخير. يمكن أن تعني درجة mAP المنخفضة عدم اكتشافه أو تصنيفات خاطئة خطيرة، مثل الخلط بين الطفل وجسم صغير آخر.

الشكل 6. مثال على استخدام YOLO11 detect المشاة على الطريق.(المصدر)

‍

استخدام mAP للكشف الدقيق عن المنتجات

وبالمثل، في البيع بالتجزئة، يمكن استخدام نماذج الكشف عن الكائنات لأتمتة مهام مثل مراقبة المخزون وعمليات الدفع. عندما يقوم العميل بمسح منتج ضوئيًا عند الدفع الذاتي، يمكن أن يتسبب خطأ في الاكتشاف في الإحباط.

تعمل درجة mAP العالية على التأكد من أن النموذج يميز بدقة بين المنتجات المتشابهة ويرسم مربعات حدية دقيقة، حتى عندما تكون العناصر معبأة بإحكام. يمكن أن تؤدي درجة mAP المنخفضة إلى حدوث خلط. على سبيل المثال، إذا أخطأ النموذج في زجاجة عصير برتقال مع زجاجة عصير تفاح مشابهة لها بصريًا، فقد يؤدي ذلك إلى فواتير غير صحيحة وتقارير مخزون غير دقيقة.

يمكن لأنظمة البيع بالتجزئة المدمجة مع نماذج مثل YOLO11 detect المنتجات في الوقت الفعلي، والتحقق منها مقابل المخزون، وتحديث الأنظمة الخلفية على الفور. في إعدادات البيع بالتجزئة سريعة الوتيرة، تلعب mAP دورًا حاسمًا في الحفاظ على دقة العمليات وموثوقيتها.

تعزيز دقة التشخيص مع ارتفاع mAP خيص في الرعاية الصحية

يبدأ تحسين دقة التشخيص في مجال الرعاية الصحية بالكشف الدقيق في التصوير الطبي. يمكن لنماذج مثل YOLO11 أن تساعد أخصائيي الأشعة في اكتشاف الأورام أو الكسور أو غيرها من الحالات الشاذة من تلك الأشعة الطبية. وهنا، يُعد متوسط الدقة المتوسطة مقياساً أساسياً لتقييم الموثوقية السريرية للنموذج.

يشير ارتفاع mAP إلى أن النموذج يُحقق كلاً من الاستدعاء العالي (تحديد معظم المشكلات الفعلية) والدقة العالية (تجنب الإنذارات الكاذبة)، وهو أمر بالغ الأهمية في اتخاذ القرارات السريرية. بالإضافة إلى ذلك، غالبًا ما يتم تعيين عتبة IoU في مجال الرعاية الصحية عالية جدًا (0.85 أو 0.90) لضمان دقة عالية جدًا في الكشف.

ومع ذلك، يمكن أن تثير درجة mAP المنخفضة المخاوف. لنفترض أن النموذج يغفل ورماً؛ فقد يؤخر التشخيص أو يؤدي إلى علاج غير صحيح.

إيجابيات وسلبيات استخدام mAP

فيما يلي المزايا الرئيسية لاستخدام متوسط الدقة لتقييم نماذج الكشف عن الكائنات:

مقياس موحد: mAP هو معيار الصناعة لتقييم نماذج اكتشاف الأجسام. تتيح قيمة mAP إجراء مقارنات عادلة ومتسقة بين النماذج المختلفة.

يعكس الأداء في العالم الحقيقي: يشير ارتفاع mAP إلى أن النموذج يتفوق في اكتشاف فئات الكائنات المختلفة ويحافظ على أداء قوي في سيناريوهات العالم الحقيقي المعقدة.

التشخيص حسب الفئة: تقوم درجة mAP بتقييم أداء الكشف لكل فئة على حدة. وهذا يجعل من السهل تحديد الفئات ذات الأداء الضعيف (مثل الدراجات الهوائية أو لافتات الشوارع) وضبط النموذج وفقًا لذلك.

على الرغم من وجود العديد من الفوائد لاستخدام مقياس mAP إلا أن هناك بعض القيود التي يجب مراعاتها. فيما يلي بعض العوامل التي يجب أخذها في الاعتبار:

صعب على أصحاب المصلحة غير التقنيين: قد تجد فرق العمل أو الفرق السريرية أن قيم mAP مجردة، على عكس المقاييس الأكثر بديهية وسهلة الفهم.

لا يعكس قيود الوقت الحقيقي: لا يأخذ mAP في الحسبان سرعة الاستدلال أو زمن الوصول، وهما أمران حاسمان للنشر في التطبيقات الحساسة للوقت.

النقاط الرئيسية

لقد رأينا أن متوسط متوسط الدقة ليس مجرد درجة تقنية بل هو انعكاس للأداء المحتمل للنموذج في العالم الحقيقي. سواءً في نظام المركبات ذاتية القيادة أو في عمليات البيع بالتجزئة، تُعد درجة متوسط mAP العالية مؤشراً موثوقاً لأداء النموذج وجاهزيته العملية.

على الرغم من أن mAP مقياس أساسي ومؤثر، إلا أنه يجب النظر إليه كجزء من استراتيجية تقييم شاملة. بالنسبة للتطبيقات الحرجة مثل الرعاية الصحية والقيادة الذاتية، لا يكفي الاعتماد فقط على mAP.

يجب أيضًا مراعاة عوامل إضافية مثل سرعة الاستدلال (مدى سرعة إجراء النموذج للتنبؤات)، وحجم النموذج (الذي يؤثر على النشر على الأجهزة الطرفية)، وتحليل الأخطاء النوعية (فهم أنواع الأخطاء التي يرتكبها النموذج) لضمان أن النظام آمن وفعال ومناسب حقًا للغرض المقصود منه.

انضم إلى مجتمعنا المتنامي ومستودع GitHub لمعرفة المزيد حول رؤية الحاسوب. استكشف صفحات الحلول الخاصة بنا للتعرف على تطبيقات رؤية الحاسوب في الزراعة والذكاء الاصطناعي في مجال الخدمات اللوجستية. تحقق من خيارات الترخيص لدينا لتبدأ في استخدام نموذج رؤية الحاسوب الخاص بك اليوم!

متوسط متوسط الدقةmAP في اكتشاف الأجسام

ما هو متوسط الدقة المتوسطةmAP)؟