يولو فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

المساحة تحت المنحنى (AUC)

تعرف على أهمية المساحة تحت المنحنى (AUC) في تقييم نموذج تعلم الآلة. اكتشف فوائدها ورؤى منحنى ROC وتطبيقاتها في العالم الحقيقي.

يعد المساحة أسفل المنحنى (AUC) مقياس أداء مستخدم على نطاق واسع في التعلم الآلي (ML) لتقييم فعالية نماذج التصنيف الثنائي. وهو يمثل احتمالية أن يصنف النموذج مثيلاً إيجابيًا تم اختياره عشوائيًا أعلى من مثيل سلبي تم اختياره عشوائيًا. بشكل أساسي، يلخص AUC قدرة النموذج على التمييز بين الفئات عبر جميع عتبات التصنيف الممكنة، مما يوفر مقياسًا واحدًا ومجمعًا للأداء. تشير قيمة AUC الأعلى إلى نموذج ذي أداء أفضل، مما يجعله أداة حاسمة لمقارنة النماذج المختلفة وضبط المعلمات الفائقة.

ما هو منحنى ROC؟

ترتبط AUC ارتباطًا جوهريًا بـ منحنى خاصية تشغيل المستقبل (ROC). منحنى ROC هو رسم بياني يرسم معدل الإيجابية الحقيقية (TPR)، المعروف أيضًا باسم الاسترجاع، مقابل معدل الإيجابية الكاذبة (FPR) عند إعدادات عتبة مختلفة. AUC هي ببساطة المساحة الواقعة أسفل منحنى ROC هذا. في حين أن منحنى ROC يوفر تمثيلًا مرئيًا لمقايضات النموذج بين الحساسية والنوعية، فإن درجة AUC تحدد هذا التبادل في رقم واحد، مما يبسط مقارنة النماذج.

تفسير درجة AUC

تتراوح قيمة AUC من 0 إلى 1، حيث تشير الدرجة الأعلى إلى نموذج أفضل.

  • AUC = 1: يمثل هذا نموذجًا مثاليًا يصنف جميع الحالات الإيجابية والسلبية بشكل صحيح. كل عينة إيجابية لديها احتمال تنبؤي أعلى من كل عينة سلبية.
  • AUC = 0.5: يشير هذا إلى أن النموذج ليس لديه قدرة تمييزية، أي ما يعادل التخمين العشوائي. سيكون منحنى ROC لمثل هذا النموذج خطًا قطريًا مستقيمًا.
  • AUC < 0.5: A score below 0.5 suggests the model is performing worse than random chance. In practice, this often points to an issue with the model or data, such as inverted predictions.
  • 0.5 < AUC < 1: This range signifies that the model has some ability to discriminate. The closer the value is to 1, the better the model's performance.

توفر أدوات مثل Scikit-learn وظائف لحساب درجات AUC بسهولة، والتي يمكن تصورها باستخدام منصات مثل TensorBoard.

تطبيقات واقعية

تعد AUC مقياسًا قيمًا في العديد من المجالات التي يكون فيها التصنيف الثنائي أمرًا بالغ الأهمية.

  1. تحليل الصور الطبية: في مجال الذكاء الاصطناعي في الرعاية الصحية، يتم تطوير النماذج لمهام مثل اكتشاف الأورام من الفحوصات الطبية. يُستخدم مقياس AUC لتقييم مدى قدرة النموذج على التمييز بين الحالات الخبيثة (الإيجابية) والحميدة (السلبية). يعد ارتفاع AUC أمرًا حيويًا لبناء أدوات تشخيصية موثوقة يمكن أن تساعد أخصائيي الأشعة، مما يضمن حساسية عالية دون عدد مفرط من الإنذارات الكاذبة. هذا أمر بالغ الأهمية للنماذج التي تحلل مجموعات البيانات مثل مجموعة بيانات أورام الدماغ.
  2. الكشف عن الاحتيال: في الصناعة المالية، تُستخدم نماذج الذكاء الاصطناعي لتحديد المعاملات الاحتيالية. عادةً ما تكون مجموعات البيانات في هذا المجال غير متوازنة للغاية، مع وجود معاملات مشروعة أكثر بكثير من المعاملات الاحتيالية. يعد AUC مفيدًا بشكل خاص هنا لأنه يوفر مقياس أداء قويًا لا ينحرف بسبب الفئة الأغلبية، على عكس الدقة. فهو يساعد المؤسسات المالية على بناء أنظمة تلتقط الاحتيال بشكل فعال مع تقليل النتائج الإيجابية الكاذبة التي قد تسبب إزعاجًا للعملاء. تعتمد المؤسسات المالية الرائدة على هذه المقاييس لتقييم المخاطر.

AUC مقابل المقاييس الأخرى

في حين أن AUC هو مقياس قيّم، من المهم فهم كيف يختلف عن مقاييس التقييم الأخرى المستخدمة في رؤية الحاسوب (CV) وتعلم الآلة:

  • AUC مقابل الدقة: الدقة تقيس الصحة الإجمالية للتنبؤات ولكنها يمكن أن تكون مضللة على مجموعات البيانات غير المتوازنة. يوفر AUC مقياسًا للفصلية مستقلًا عن العتبة، مما يجعله أكثر موثوقية في مثل هذه الحالات.
  • AUC مقابل الاسترجاع الدقيق: بالنسبة لمجموعات البيانات غير المتوازنة حيث يكون الصنف الموجب نادرًا وذو أهمية أساسية (على سبيل المثال، الكشف عن الأمراض النادرة)، قد يكون منحنى الاسترجاع الدقيق والمساحة المقابلة له (AUC-PR) أكثر إفادة من ROC AUC. تركز مقاييس مثل الدقة و الاسترجاع تحديدًا على الأداء فيما يتعلق بالصنف الموجب. نتيجة F1 توازن أيضًا بين الدقة والاسترجاع.
  • AUC مقابل mAP/IoU: يستخدم AUC بشكل أساسي لمهام التصنيف الثنائي. بالنسبة لمهام اكتشاف الكائنات الشائعة مع نماذج مثل Ultralytics YOLO، فإن المقاييس مثل متوسط الدقة المتوسطة (mAP) و التقاطع على الاتحاد (IoU) هي المعيار. تقوم هذه المقاييس بتقييم كل من دقة التصنيف ودقة تحديد موقع الكائنات المكتشفة باستخدام مربعات الإحاطة. يمكنك معرفة المزيد حول مقاييس أداء YOLO هنا.

يعتمد اختيار المقياس الصحيح على المشكلة المحددة وخصائص مجموعة البيانات (مثل توازن الفئات) وأهداف مشروع الذكاء الاصطناعي (AI project). يظل AUC حجر الزاوية لتقييم أداء التصنيف الثنائي نظرًا لمتانته وقابليته للتفسير. يمكن أن يساعد تتبع التجارب باستخدام أدوات مثل Ultralytics HUB في إدارة هذه المقاييس ومقارنتها بفعالية.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة