مسرد المصطلحات

الدقة

اكتشف أهمية الدقة في التعلم الآلي، وحسابها، والقيود المفروضة على مجموعات البيانات غير المتوازنة، وطرق تحسين أداء النموذج.

الدقة هي أحد مقاييس التقييم الأساسية والبديهية في التعلم الآلي (ML). فهو يقيس نسبة التنبؤات الصحيحة التي قام بها النموذج من بين جميع التنبؤات التي تم إجراؤها. ونظرًا لبساطتها، غالبًا ما تكون الدقة هي المقياس الأول الذي ينظر إليه المطورون للحصول على فكرة عامة عن أداء نموذج الذكاء الاصطناعي، خاصةً في مهام التصنيف. وهو بمثابة فحص سريع للصحة قبل الغوص في تقييمات أكثر دقة.

التطبيقات الواقعية

تُعد الدقة مؤشر أداء رئيسي في العديد من المجالات التي يكون فيها التصنيف أمرًا بالغ الأهمية. وفيما يلي مثالان:

  • التشخيص الطبي: في مجال الرعاية الصحية المدعومة بالذكاء الاصطناعي، قد يتم تدريب نموذج مصمم لتحليل الصور الطبية على تصنيف صور الأشعة السينية على أنها تظهر علامات الالتهاب الرئوي من عدمه. وتعني الدقة العالية أن النموذج يحدد بشكل صحيح وجود المرض أو عدم وجوده في نسبة عالية من الحالات، مما يوفر دعمًا موثوقًا لأطباء الأشعة.
  • مراقبة جودة التصنيع: في التصنيع الذكي، يمكن استخدام نظام الرؤية الحاسوبية لفحص المنتجات على الحزام الناقل. يصنف النموذج كل عنصر على أنه "معيب" أو "غير معيب". تضمن الدقة العالية تحديد المنتجات المعيبة بشكل صحيح لإزالتها مع تقليل الإبلاغ غير الصحيح عن المنتجات الجيدة، مما يؤثر بشكل مباشر على كفاءة الإنتاج والجودة.

حدود الدقة

على الرغم من فائدتها، إلا أن الدقة قد تكون مضللة للغاية، خاصة عند التعامل مع مجموعات البيانات غير المتوازنة. مجموعة البيانات غير المتوازنة هي تلك التي يختلف فيها عدد الأمثلة في الفئات المختلفة بشكل كبير. على سبيل المثال، في الكشف عن الاحتيال، يفوق عدد المعاملات المشروعة عدد المعاملات الاحتيالية بشكل كبير. يمكن للنموذج الذي يتنبأ دائمًا ب "غير الاحتيالية" أن يحقق دقة تزيد عن 99% ولكنه سيكون عديم الفائدة تمامًا للغرض المقصود منه. هذا لأنه يفشل في تحديد الحالات النادرة ولكن الحرجة. يسلط هذا السيناريو الضوء على مفارقة الدقة، حيث تعطي درجة الدقة العالية إحساسًا زائفًا بفعالية النموذج.

الدقة مقابل المقاييس الأخرى

للحصول على صورة كاملة عن أداء النموذج، من الضروري النظر في مقاييس أخرى إلى جانب الدقة.

  • الدقة: يقيس نسبة التنبؤات الإيجابية التي كانت صحيحة بالفعل. وهي تجيب على السؤال، "من بين جميع التنبؤات التي قمت بها للفئة الإيجابية، كم منها كانت صحيحة؟ تُعد الدقة العالية أمرًا حيويًا عندما تكون تكلفة التنبؤات الإيجابية الخاطئة عالية.
  • الاستدعاء: يُعرف أيضًا باسم الحساسية، ويقيس هذا المقياس نسبة الحالات الإيجابية الفعلية التي تم تحديدها بشكل صحيح. وهو يجيب على السؤال التالي: "من بين جميع الحالات الإيجابية الفعلية، كم عدد الحالات الإيجابية الفعلية التي عثر عليها نموذجي؟ يُعتبر الاستدعاء المرتفع أمرًا بالغ الأهمية عندما تكون تكلفة النتائج السلبية الخاطئة عالية، كما هو الحال في الفحص الطبي.
  • النتيجة F1-نتيجة: هذا هو المتوسط التوافقي للدقة والاستدعاء، مما يوفر درجة واحدة توازن بين الاثنين. وهي مفيدة بشكل خاص لتقييم النماذج على مجموعات البيانات غير المتوازنة حيث تكون كل من النتائج الإيجابية الخاطئة والسلبيات الخاطئة مهمة.
  • مصفوفة الارتباك: جدول يصور أداء نموذج التصنيف من خلال إظهار عدد الإيجابيات الحقيقية والسلبيات الحقيقية والإيجابيات الخاطئة والسلبيات الخاطئة والسلبيات الخاطئة. يوفر البيانات اللازمة لحساب الدقة والدقة والاسترجاع.
  • متوسط الدقة المتوسطة (mAP): بالنسبة للمهام الأكثر تعقيدًا مثل اكتشاف الأجسام، يعتبر متوسط الدقة (mAP) هو المقياس القياسي. فهو لا يقيّم صحة التصنيف فحسب، بل يقيّم أيضًا دقة تحديد موقع المربعات المحدودة المتوقعة عبر مستويات ثقة مختلفة. لفهم أعمق، يمكنك استكشاف مقارنات النماذج المختلفة.

تحسين دقة النموذج

يمكن أن تساعد العديد من التقنيات في تحسين دقة النموذج، على الرغم من أنها غالبًا ما تنطوي على مقايضات مع مقاييس أخرى أو تكلفة حسابية:

يمكن أن توفر الموارد الاستشارية مثل نصائح تدريب النماذج إرشادات عملية. تسمح منصات مثل Ultralytics HUB للمستخدمين بتدريب النماذج وتتبع الدقة بسهولة إلى جانب المقاييس الرئيسية الأخرى، وغالباً ما يتم تصورها باستخدام أدوات مثل TensorBoard. يمكن تتبع التقدم في هذا المجال من خلال موارد مثل تقرير مؤشر ستانفورد للذكاء الاصطناعي أو تصفح مجموعات البيانات على موقع Papers With Code. يشيع استخدام أطر عمل مثل PyTorch و TensorFlow لبناء هذه النماذج وتدريبها.

في الختام، على الرغم من أن الدقة مقياس قيّم وبديهي لتقييم أداء نموذج الذكاء الاصطناعي، إلا أنه نادراً ما ينبغي استخدامه بمعزل عن غيره. يعد النظر في الأهداف المحددة لمهمة التعلم الآلي وطبيعة البيانات، خاصةً الاختلالات المحتملة أو التكاليف المتفاوتة للأخطاء، أمرًا ضروريًا لاختيار مقاييس التقييم الأنسب. يمكن أن يوفر استخدام تقنيات من الذكاء الاصطناعي القابل للتفسير (XAI) أيضًا رؤى أعمق من قيم المقياس الواحد.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون ونمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة