فهم متوسط الدقة (mAP) في اكتشاف الكائنات. تعرف على معناه وحسابه ولماذا mAP هو المفتاح لتقييم أداء النموذج.

فهم متوسط الدقة (mAP) في اكتشاف الكائنات. تعرف على معناه وحسابه ولماذا mAP هو المفتاح لتقييم أداء النموذج.
يتزايد تبني الذكاء الاصطناعي بسرعة، ويتم دمجه في العديد من الابتكارات، من السيارات ذاتية القيادة إلى أنظمة البيع بالتجزئة التي يمكنها تحديد المنتجات على الرف. تعتمد هذه التقنيات على رؤية الحاسوب، وهو فرع من فروع الذكاء الاصطناعي (AI) يمكّن الآلات من تحليل البيانات المرئية.
أحد مقاييس التقييم الرئيسية المستخدمة لقياس دقة أنظمة وخوارزميات رؤية الكمبيوتر هو متوسط الدقة (mAP). يشير مقياس mAP إلى مدى تطابق توقعات نموذج Vision AI مع نتائج العالم الحقيقي.
تتمثل إحدى مهام رؤية الحاسوب الشائعة في الكشف عن الكائنات، حيث يحدد النموذج كائنات متعددة في صورة ويرسم مربعات محيطة حولها. mAP هو المقياس القياسي المستخدم لتقييم أداء نماذج الكشف عن الكائنات ويستخدم على نطاق واسع لتقييم نماذج التعلم العميق مثل Ultralytics YOLO11.
في هذه المقالة، سنرى كيف يتم حساب متوسط الدقة المتوسطة وسبب أهميته لأي شخص يقوم بتدريب أو تقييم نماذج الكشف عن الكائنات. هيا بنا نبدأ!
متوسط الدقة المتوسطة هو درجة توضح مدى دقة نموذج التعلم العميق عندما يتعلق الأمر بالمهام المتعلقة باسترجاع المعلومات المرئية، مثل اكتشاف وتحديد الكائنات المختلفة في الصورة. على سبيل المثال، ضع في اعتبارك نموذج اكتشاف الكائنات الذي يحلل صورة تحتوي على كلب وقطة وسيارة. يمكن للنموذج الموثوق به إجراء اكتشاف الكائنات من خلال التعرف على كل كائن ورسم مربعات محيطة وملصقات حوله، مع تسليط الضوء على مكانه وما هو.
يشير mAP إلى مدى جودة أداء النموذج لهذه المهمة عبر العديد من الصور وأنواع مختلفة من الكائنات. وهو يتحقق مما إذا كان النموذج يحدد بدقة كل كائن وموقعه داخل الصورة. تتراوح النتيجة من 0 إلى 1، حيث تعني واحد أن النموذج وجد كل شيء بشكل مثالي، ويعني صفر أنه فشل في اكتشاف أي كائنات.
قبل أن نستكشف المفاهيم الكامنة وراء متوسط الدقة في التعلم الآلي، دعنا نحصل على فهم أفضل لمصطلحين أساسيين: الحقيقة الأساسية والتنبؤات.
تشير الحقيقة الأساسية إلى البيانات المرجعية الدقيقة، حيث يتم تصنيف الكائنات ومواقعها في الصورة بعناية من قبل البشر من خلال عملية تعرف باسم التعليق التوضيحي. وفي الوقت نفسه، فإن التنبؤات هي النتائج التي تقدمها نماذج الذكاء الاصطناعي بعد تحليل الصورة. من خلال مقارنة تنبؤات نموذج الذكاء الاصطناعي بالحقيقة الأساسية، يمكننا قياس مدى قرب النموذج من الحصول على النتائج الصحيحة.
غالبًا ما تستخدم مصفوفة الارتباك (confusion matrix) لفهم مدى دقة نموذج الكشف عن الكائنات. إنه جدول يوضح كيف تتطابق تنبؤات النموذج مع الإجابات الصحيحة الفعلية (الحقيقة الأساسية). من هذا الجدول، يمكننا الحصول على تفصيل للمكونات أو النتائج الرئيسية الأربعة: الإيجابيات الحقيقية، والإيجابيات الخاطئة، والسلبيات الخاطئة، والسلبيات الحقيقية.
فيما يلي ما تمثله هذه المكونات في مصفوفة الالتباس:
لا يتم استخدام السلبيات الحقيقية بشكل شائع في الكشف عن الكائنات، لأننا عادةً ما نتجاهل المناطق الفارغة العديدة في الصورة. ومع ذلك، فهو ضروري في مهام رؤية الكمبيوتر الأخرى، مثل تصنيف الصور، حيث يقوم النموذج بتعيين تسمية للصورة. على سبيل المثال، إذا كانت المهمة هي اكتشاف ما إذا كانت الصورة تحتوي على قطة أم لا، وإذا حدد النموذج بشكل صحيح “لا توجد قطة” عندما لا تحتوي الصورة على واحدة، فهذا سلبي حقيقي.
هناك مقياس حيوي آخر في تقييم نماذج الكشف عن الكائنات وهو تقاطع الاتحاد (IoU). بالنسبة لنماذج رؤية الذكاء الاصطناعي هذه، فإن مجرد اكتشاف وجود كائن في صورة ما ليس كافيًا؛ بل يجب أيضًا تحديد مكانه في الصورة لرسم مربعات محيطة.
يقيس مقياس IoU مدى تطابق المربع المتوقع للنموذج مع المربع الفعلي الصحيح (الحقيقة الأساسية). تتراوح النتيجة بين 0 و 1، حيث 1 تعني تطابقًا مثاليًا و 0 تعني عدم وجود تداخل على الإطلاق.
على سبيل المثال، يعني ارتفاع IoU (مثل 0.80 أو 0.85) أن الصندوق المتوقع يطابق الصندوق ذي الحقيقة الأرضية بشكل وثيق، مما يشير إلى تحديد موقع دقيق. يعني انخفاض IoU (مثل 0.30 أو 0.25) أن النموذج لم يحدد موقع الكائن بدقة.
لتحديد ما إذا كان الاكتشاف ناجحًا، نستخدم عتبات مختلفة. عتبة IoU الشائعة هي 0.5، مما يعني أن الصندوق المتوقع يجب أن يتداخل مع صندوق الحقيقة الأساسية بنسبة 50٪ على الأقل ليتم اعتباره إيجابيًا حقيقيًا. يعتبر أي تداخل أقل من هذه العتبة إيجابيًا خاطئًا.
حتى الآن، استكشفنا بعض مقاييس التقييم الأساسية لفهم أداء نماذج الكشف عن الكائنات. بناءً على ذلك، فإن اثنين من أهم المقاييس هما الدقة والاسترجاع (Precision and Recall). إنهما يعطياننا صورة واضحة عن مدى دقة عمليات الكشف التي يقوم بها النموذج. دعونا نلقي نظرة على ماهيتهما.
تخبرنا قيم الدقة عن عدد التنبؤات التي قدمها النموذج والتي كانت صحيحة بالفعل. يجيب على السؤال: من بين جميع الكائنات التي زعم النموذج أنه اكتشفها، كم عدد الكائنات الموجودة بالفعل؟
من ناحية أخرى، تقيس قيم الاسترجاع مدى جودة عثور النموذج على جميع الكائنات الفعلية الموجودة في الصورة. يجيب على السؤال: من بين جميع الكائنات الحقيقية الموجودة، كم عدد الكائنات التي اكتشفها النموذج بشكل صحيح؟
معًا، تعطينا الدقة والاسترجاع صورة أوضح عن مدى جودة أداء النموذج. على سبيل المثال، إذا تنبأ نموذج بوجود 10 سيارات في صورة ما، وكانت 9 منها بالفعل سيارات، فإنه يتمتع بدقة 90٪ (توقع إيجابي).
غالبًا ما تنطوي مقاييس التقييم هاتين على مفاضلة: يمكن للنموذج تحقيق قيمة دقة عالية من خلال إجراء تنبؤات يثق بها تمامًا فقط، ولكن هذا قد يتسبب في فقد العديد من الكائنات، مما يقلل من مستوى الاسترجاع. وفي الوقت نفسه، يمكن أن يصل أيضًا إلى استرجاع عالٍ جدًا من خلال التنبؤ بمربع إحاطة في كل مكان تقريبًا، ولكن هذا سيقلل من الدقة.
في حين أن الدقة والاسترجاع يساعداننا في فهم كيفية أداء النموذج في التنبؤات الفردية، إلا أن متوسط الدقة (AP) يمكن أن يوفر رؤية أوسع. فهو يوضح كيف تتغير دقة النموذج أثناء محاولته اكتشاف المزيد من الكائنات، ويلخص أدائه في رقم واحد.
لحساب متوسط درجة الدقة، يمكننا أولاً إنشاء مقياس مدمج يشبه الرسم البياني يسمى منحنى الدقة والاسترجاع (أو منحنى PR) لكل نوع من أنواع الكائنات. يوضح هذا المنحنى ما يحدث عندما يقدم النموذج المزيد من التنبؤات.
ضع في اعتبارك سيناريو يبدأ فيه النموذج بالكشف عن أسهل الكائنات أو أكثرها وضوحًا فقط. في هذه المرحلة، تكون الدقة عالية لأن معظم التوقعات صحيحة، ولكن الاسترجاع منخفض لأن العديد من الكائنات لا تزال مفقودة. بينما يحاول النموذج اكتشاف المزيد من الكائنات، بما في ذلك الأصعب أو الأندر منها، فإنه عادة ما يقدم المزيد من الأخطاء. يتسبب هذا في انخفاض الدقة بينما يزداد الاسترجاع.
متوسط الدقة هو المساحة الواقعة أسفل المنحنى (AUC لمنحنى PR). تعني المساحة الأكبر أن النموذج أفضل في الحفاظ على دقة تنبؤاته، حتى مع اكتشافه المزيد من الكائنات. يتم حساب AP بشكل منفصل لكل تسمية فئة.
على سبيل المثال، في نموذج يمكنه اكتشاف السيارات والدراجات والمشاة، يمكننا حساب قيم AP بشكل فردي لكل فئة من هذه الفئات الثلاث. يساعدنا هذا في معرفة الكائنات التي يجيد النموذج اكتشافها وأين قد يحتاج إلى تحسين.
بعد حساب الدقة المتوسطة لكل فئة من فئات الكائنات، ما زلنا بحاجة إلى درجة واحدة تعكس الأداء العام للنموذج عبر جميع الفئات. يمكن تحقيق ذلك باستخدام صيغة متوسط الدقة المتوسطة. وهي تحسب متوسط درجات AP لكل فئة.
على سبيل المثال، لنفترض أن نموذج رؤية حاسوبية مثل YOLO11 يحقق AP بمقدار 0.827 للسيارات، و 0.679 للدراجات النارية، و 0.355 للشاحنات، و 0.863 للحافلات، و 0.982 للدراجات الهوائية. باستخدام صيغة mAP، يمكننا جمع هذه الأرقام وقسمتها على العدد الإجمالي للفئات على النحو التالي:
mAP = (0.827 + 0.679 + 0.355 + 0.863 + 0.982) ÷ 5 = 0.7432 ≈ 0.743
توفر درجة mAP البالغة 0.743 حلاً مباشرًا للحكم على مدى جودة أداء النموذج عبر جميع فئات الكائنات. تعني القيمة القريبة من 1 أن النموذج دقيق لمعظم الفئات، بينما تشير القيمة الأقل إلى أنه يعاني من بعض الفئات.
الآن بعد أن أصبح لدينا فهم أفضل لكيفية حساب AP و mAP وما هي مكوناتهما، إليك نظرة عامة على أهميتهما في الرؤية الحاسوبية:
بعد ذلك، لنتعرف على كيف يمكن أن تساعد المقاييس الرئيسية مثل mAP عند إنشاء حالات استخدام للرؤية الحاسوبية في العالم الحقيقي.
عندما يتعلق الأمر بالسيارات ذاتية القيادة، فإن اكتشاف الكائنات أمر بالغ الأهمية لتحديد المشاة وإشارات المرور وراكبي الدراجات وعلامات المسارات. على سبيل المثال، إذا ركض طفل فجأة عبر الشارع، فإن السيارة لديها ثوانٍ لاكتشاف الكائن (الطفل)، وتحديد مكانه، وتتبع حركته، واتخاذ الإجراء اللازم (تطبيق المكابح).
تم تصميم نماذج مثل YOLO11 للكشف عن الكائنات في الوقت الفعلي في مثل هذه السيناريوهات عالية المخاطر. في هذه الحالات، يصبح mAP مقياسًا حاسمًا للسلامة.
تضمن درجة mAP العالية أن النظام يكتشف الطفل بسرعة، ويحدد مكانه بدقة، ويقوم بتشغيل المكابح بأقل قدر من التأخير. يمكن أن يعني انخفاض mAP عمليات كشف مفقودة أو تصنيفات خاطئة خطيرة، مثل الخلط بين الطفل وجسم صغير آخر.
وبالمثل، في البيع بالتجزئة، يمكن استخدام نماذج الكشف عن الكائنات لأتمتة مهام مثل مراقبة المخزون وعمليات الدفع. عندما يقوم العميل بمسح منتج ضوئيًا عند الدفع الذاتي، يمكن أن يتسبب خطأ في الاكتشاف في الإحباط.
تضمن درجة mAP العالية أن النموذج يميز بدقة بين المنتجات المتشابهة ويرسم مربعات إحاطة دقيقة، حتى عندما تكون العناصر معبأة بإحكام. يمكن أن يؤدي انخفاض درجة mAP إلى حدوث أخطاء. على سبيل المثال، إذا أخطأ النموذج في التعرف على زجاجة عصير برتقال على أنها زجاجة عصير تفاح مشابهة بصريًا، فقد يؤدي ذلك إلى فوترة غير صحيحة وتقارير مخزون غير دقيقة.
يمكن لأنظمة البيع بالتجزئة المدمجة مع نماذج مثل YOLO11 اكتشاف المنتجات في الوقت الفعلي، والتحقق منها مقابل المخزون، وتحديث الأنظمة الخلفية على الفور. في بيئات البيع بالتجزئة سريعة الخطى، يلعب mAP دورًا حاسمًا في الحفاظ على دقة العمليات وموثوقيتها.
يبدأ تحسين دقة التشخيص في الرعاية الصحية بالكشف الدقيق في التصوير الطبي. يمكن لنماذج مثل YOLO11 أن تساعد أخصائيي الأشعة في اكتشاف الأورام أو الكسور أو التشوهات الأخرى من تلك الفحوصات الطبية. هنا، يعد متوسط الدقة المتوسطة مقياسًا أساسيًا لتقييم الموثوقية السريرية للنموذج.
يشير ارتفاع mAP إلى أن النموذج يحقق استرجاعًا عاليًا (تحديد معظم المشكلات الفعلية) ودقة عالية (تجنب الإنذارات الكاذبة)، وهو أمر بالغ الأهمية في اتخاذ القرارات السريرية. أيضًا، غالبًا ما يتم تعيين عتبة IoU في الرعاية الصحية على مستوى عالٍ جدًا (0.85 أو 0.90) لضمان اكتشاف دقيق للغاية.
ومع ذلك، يمكن أن يثير انخفاض درجة mAP مخاوف. لنفترض أن النموذج يفوته ورم؛ فقد يؤخر التشخيص أو يؤدي إلى علاج غير صحيح.
فيما يلي المزايا الرئيسية لاستخدام متوسط الدقة لتقييم نماذج الكشف عن الكائنات:
في حين أن هناك فوائد مختلفة لاستخدام مقياس mAP، إلا أن هناك بعض القيود التي يجب مراعاتها. فيما يلي بعض العوامل التي يجب أخذها في الاعتبار:
لقد رأينا أن متوسط الدقة ليس مجرد درجة تقنية ولكنه انعكاس لإمكانات أداء النموذج في العالم الحقيقي. سواء كان ذلك في نظام مركبة ذاتية القيادة أو في نقطة بيع بالتجزئة، فإن درجة mAP العالية تعمل كمؤشر موثوق لأداء النموذج وجاهزيته العملية.
في حين أن mAP هو مقياس أساسي ومؤثر، إلا أنه يجب اعتباره جزءًا من إستراتيجية تقييم شاملة. بالنسبة للتطبيقات الهامة مثل الرعاية الصحية والقيادة الذاتية، لا يكفي الاعتماد فقط على mAP.
يجب أيضًا مراعاة عوامل إضافية مثل سرعة الاستدلال (مدى سرعة إجراء النموذج للتنبؤات)، وحجم النموذج (الذي يؤثر على النشر على الأجهزة الطرفية)، وتحليل الأخطاء النوعية (فهم أنواع الأخطاء التي يرتكبها النموذج) لضمان أن النظام آمن وفعال ومناسب حقًا للغرض المقصود منه.
انضم إلى مجتمعنا المتنامي ومستودع GitHub لمعرفة المزيد حول رؤية الحاسوب. استكشف صفحات الحلول الخاصة بنا للتعرف على تطبيقات رؤية الحاسوب في الزراعة والذكاء الاصطناعي في مجال الخدمات اللوجستية. تحقق من خيارات الترخيص لدينا لتبدأ في استخدام نموذج رؤية الحاسوب الخاص بك اليوم!