Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

نتيجة F1

اكتشف أهمية مقياس F1 في تعلم الآلة! تعرف على كيفية موازنة الدقة والاسترجاع لتقييم النموذج الأمثل.

تعد F1-Score مقياس أداء مهم في التعلم الآلي (ML) المستخدم لتقييم دقة نماذج التصنيف. على عكس الدقة البسيطة، والتي تحسب النسبة المئوية للتنبؤات الصحيحة، فإن تجمع F1-Score بين مقياسين حيويين آخرين - الدقة و التذكر-فيقيمة واحدة. يتم تعريفه على أنه المتوسط التوافقي للدقة والاستدعاء. هذا يجعل F1-Score مفيداً بشكل خاص لتقييم النماذج المدرّبة على مجموعات بيانات غير متوازنة، حيث يفوق عدد العينات في إحدى الفئات عدد العينات الأخرى بشكل كبير. في مثل هذه الحالات، قد يحقق النموذج دقة عالية ببساطة عن طريق التنبؤ بفئة الأغلبية، بينما يفشل في تحديد فئة الأقلية التي غالبًا ما تكون ذات أهمية أكبر.

التوازن بين الدقة والاسترجاع

لفهم النتيجة F1-Score، من الضروري فهم التوتر بين مكوناتها. تقيس الدقة جودة التنبؤات الإيجابية (تقليل النتائج الإيجابية الخاطئة)، بينما يقيس Recall كمية النتائج الإيجابية الحقيقية التي تم تحديدها (تقليل السلبيات الخاطئة). في كثير من الأحيان، تؤدي زيادة أحد هذين المقياسين إلى انخفاض في الآخر، وهي ظاهرة ظاهرة تُعرف باسم المفاضلة بين الدقة والاستدعاء. يوفر F1-Score رؤية متوازنة من خلال معاقبة القيم القصوى. حيث تصل إلى أفضل قيمة لها عند 1 (دقة واستدعاء مثاليان) وأسوأ قيمة عند 0 (دقة واستدعاء مثاليان). الدقة والاستدعاء الكاملين) والأسوأ عند 0. هذا التوازن ضروري لتطوير أنظمة تنبؤية قوية أنظمة نمذجة تنبؤية قوية حيث تحمل كل من الكشف عن الأخطاء والإنذارات الخاطئة التي تنطوي على تكاليف كبيرة.

تطبيقات واقعية

لا يمكن الاستغناء عن F1-Score في السيناريوهات التي تكون فيها تكلفة الخطأ مرتفعة أو يكون توزيع البيانات منحرفًا.

  • تحليل الصور الطبية: في مجال الرعاية الصحية، يتطلب تشخيص حالات مثل الأورام حساسية عالية. فالنفي الكاذب (عدم وجود ورم) أمر خطير خطيرة، في حين أن الإيجابية الكاذبة (تحديد الأنسجة السليمة على أنها ورم) تسبب ضغطًا غير ضروري. الحلول تعتمد الاستفادة من الذكاء الاصطناعي في الرعاية الصحية على F1-Score لضمان أن يحافظ النموذج على توازن آمن، حيث يكتشف أكبر عدد ممكن من الحالات الحقيقية دون إغراق الأطباء الأطباء بالإنذارات الكاذبة.
  • الكشف عن الحالات الشاذة في المجال المالي: تستخدم المؤسسات المالية الذكاء الاصطناعي detect المعاملات الاحتيالية. نظرًا لأن الاحتيال الفعلي نادر الحدوث مقارنةً بالمعاملات يمكن للنموذج أن يدّعي دقة بنسبة 99.9% من خلال تصنيف كل شيء على أنه شرعي. ومع ذلك، سيكون هذا عديم الفائدة لاكتشاف الاحتيال. من خلال تحسين النتيجة F1-Score, الذكاء الاصطناعي في مجال التمويل يمكن للأنظمة أن تكشف عن الأنشطة المشبوهة بفعالية مع تقليل الاضطراب الناجم عن حظر البطاقات الصالحة.

النتيجة F1-نتيجة F1 في Ultralytics YOLO11

بالنسبة لمهام الرؤية الحاسوبية مثل اكتشاف الأجسام، يساعد F1-Score في تحديد مدى مدى جودة النموذج في تحديد الحدود وتصنيف الأجسام عند عتبات ثقة محددة. عند تدريب نماذج مثل Ultralytics YOLO11فإن عملية التحقق من الصحة تحسب الدقة والاستدعاء و F1-Scores لمساعدة المهندسين على اختيار أفضل أوزان النماذج.

يوضّح كود Python التالي كيفية التحقق من صحة نموذج YOLO11 المدرّب مسبقًا والوصول إلى مقاييس الأداء.

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Run validation on a dataset like COCO8
# The .val() method computes metrics including Precision, Recall, and mAP
metrics = model.val(data="coco8.yaml")

# Print the mean results
# While F1 is computed internally for curves, mAP is the primary summary metric
print(f"Mean Average Precision (mAP50-95): {metrics.box.map}")
print(f"Precision: {metrics.box.mp}")
print(f"Recall: {metrics.box.mr}")

التمييز بين النتيجة F1- النتيجة من المقاييس ذات الصلة

يعتمد اختيار المقياس الصحيح على الأهداف المحددة لمشروع الذكاء الاصطناعي.

  • الدقة: يقيس ذلك صحة التنبؤات بشكل عام. ويُفضل استخدامه عندما تكون توزيعات الفئات متساوية تقريبًا. في المقابل، فإن F1-Score هو المقياس المفضل لتوزيعات الفئات غير المتساوية.
  • متوسط الدقة المتوسطةmAP: بينما يتم احتساب F1-Score غالبًا عند عتبة ثقة محددة محددة، فإن متوسط الدقة ( mAP ) يقيّم متوسط الدقة الدقة عبر مستويات الاستدعاء المختلفة. mAP هو المعيار لمقارنة نماذج اكتشاف الكائنات، في حين أن F1 مفيد لتحسين نقطة تشغيل محددة.
  • المساحة تحت المنحنى (AUC): يمثل AUC المساحة تحت منحنى منحنى خصائص التشغيل المتلقي (ROC). يقيس AUC قدرة المصنف على التمييز بين الفئات عبر جميع العتبات، بينما يركز F1-Score على وجه التحديد على أداء الفئة الإيجابية عند عتبة واحدة.

تحسين درجة F1-نتيجة النموذج F1

غالبًا ما يتضمن تحسين F1-Score تحسينات متكررة على النموذج والبيانات.

  • ضبط المقياس الفائق: ضبط الإعدادات مثل معدل التعلم أو دالات الخسارة يمكن أن يساعد النموذج على على حل يوازن بين الدقة والاسترجاع بشكل أكثر فعالية.
  • زيادة البيانات: تقنيات مثل التقليب أو القياس أو إضافة الضوضاء إلى بيانات التدريب تُعرّض النموذج لمزيد من الأمثلة المتنوعة مما يحسن قدرته على التعميم وتحديد الحالات الإيجابية الصعبة بشكل صحيح.
  • نقل التعلم: يسمح البدء بنموذج مدرّب مسبقًا على مجموعة بيانات كبيرة ومتنوعة للشبكة بالاستفادة من الميزات المكتسبة المكتسبة، مما يؤدي غالبًا إلى الحصول على درجات F1 أعلى في المهام المتخصصة ذات البيانات المحدودة.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن