تعرّف على أهمية المساحة تحت المنحنى (AUC) في تقييم نموذج تعلّم الآلة. اكتشف فوائده ورؤى منحنى ROC وتطبيقاته في العالم الحقيقي.
المساحة تحت المنحنى (AUC) هو مقياس أداء أساسي يُستخدم بشكل أساسي في التعلم الآلي (ML) لتقييم نماذج التصنيف الثنائية. وهو يقيس قدرة النموذج على التمييز بين الفئات الإيجابية والسلبية عبر جميع عتبات التصنيف الممكنة. تتراوح درجات AUC من 0 إلى 1، حيث تشير القيم الأعلى إلى أداء أفضل للنموذج. فالنموذج الذي يحصل على 0.5 لا يحقق أداءً أفضل من الصدفة العشوائية، بينما النموذج المثالي الذي يفصل بين الفئات بشكل لا تشوبه شائبة يحقق AUC 1.0. يوفر هذا المقياس مقياسًا إجماليًا واحدًا لأداء التصنيف، مستقلًا عن أي اختيار عتبة محددة.
يتم اشتقاق قيمة AUC مباشرةً من منحنى خصائص الاستقبال والتشغيل (ROC). منحنى ROC هو مخطط بياني يوضّح القدرة التشخيصية لمصنف ثنائي مع تغيّر عتبة التمييز الخاصة به. وهو يرسم المعدل الإيجابي الحقيقي (TPR)، والمعروف أيضًا باسم الحساسية أو الاسترجاع، على المحور ص مقابل المعدل الإيجابي الخاطئ (FPR) على المحور س عند إعدادات عتبة مختلفة. يمثل AUC كامل المساحة ثنائية الأبعاد تحت منحنى ROC هذا. يمكن الاطلاع على نظرة عامة شاملة لمنحنيات ROC على ويكيبيديا.
يُفسر AUC على أنه احتمال أن يقوم النموذج بتصنيف نموذج إيجابي تم اختياره عشوائيًا أعلى من نموذج سلبي تم اختياره عشوائيًا. وهذا يجعله مقياسًا للقوة التمييزية الكلية للنموذج. تتمثل إحدى المزايا الرئيسية لمعيار AUC في عدم حساسيته النسبية لاختلال التوازن بين الفئات مقارنةً بمقاييس مثل الدقة. في مجموعات البيانات التي يفوق فيها أحد الفئتين عدد الفئات الأخرى بشكل كبير (وهو سيناريو شائع في المشاكل الواقعية)، قد تكون الدقة مضللة، بينما يوفر AUC مقياسًا أكثر قوة لمدى جودة النموذج في الفصل بين الفئات. تشير درجة AUC الأقرب إلى 1 إلى نموذج يتمتع بإمكانية فصل ممتازة، بينما تشير درجة AUC القريبة من 0.5 إلى قدرة تمييزية ضعيفة، على غرار التخمين العشوائي. إن فهم هذه التفسيرات أمر بالغ الأهمية لتقييم النموذج بفعالية.
يتم استخدام AUC على نطاق واسع في مختلف المجالات التي تكون فيها مهام التصنيف الثنائي حرجة. فيما يلي مثالان:
العديد من أطر ومكتبات التعلم العميق (DL) ، بما في ذلك PyTorch و TensorFlowلبناء هذه المصنفات. وتوفر أدوات مثل Scikit-learn وظائف ملائمة لحساب درجات ROC AUC، مما يبسط عملية التقييم. كما أن منصات مثل Ultralytics HUB تسهّل أيضًا تدريب وتقييم النماذج حيث تكون هذه المقاييس ذات صلة.
على الرغم من أن AUC مقياس قيّم، إلا أنه من المهم فهم كيفية اختلافه عن مقاييس التقييم الأخرى المستخدمة في الرؤية الحاسوبية وتعلم الآلة:
يعتمد اختيار المقياس الصحيح على المشكلة المحددة، وخصائص مجموعة البيانات (مثل توازن الفئات)، وأهداف مشروع الذكاء الاصطناعي. يظل مقياس AUC حجر الزاوية لتقييم أداء التصنيف الثنائي بسبب متانته وقابليته للتفسير.