Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

مصفوفة الارتباك

فهم أداء النموذج باستخدام مصفوفة الارتباك. استكشف المقاييس والاستخدامات الواقعية والأدوات لتحسين دقة تصنيف الذكاء الاصطناعي.

مصفوفة الارتباك هي أداة قياس الأداء لمشاكل تصنيف التعلم الآلي حيث يمكن أن يكون الناتج فئتين أو أكثر. وهي عبارة عن جدول يحتوي على أربعة مجموعات مختلفة من القيم المتوقعة والفعلية، وتُستخدم كعنصر أساسي لتصور البيانات في تقييم النموذج. على عكس الدقة البسيطة، التي يمكن أن تكون مضللة إذا كانت مجموعة البيانات غير متوازنة، توفر مصفوفة الارتباك تفصيلاً دقيقاً للأماكن التي يرتكب فيها نموذج الرؤية الحاسوبية (CV) أخطاء. من خلال مقارنة التوقعات مع تصنيفات الحقيقة الأساسية، يمكن للمطورين تحديد ما إذا كان النظام يخلط بين فئتين محددتين أو يفشل في detect بالكامل.

المكونات الأساسية للمصفوفة

تنقسم المصفوفة نفسها عادةً إلى أربعة أرباع للتصنيف الثنائي، على الرغم من أنها تتوسع للمشاكل متعددة الفئات مثل تلك التي تتعامل معها Ultralytics . تمثل هذه المكونات الأربعة تقاطع ما تنبأ به النموذج مقابل ما هو موجود بالفعل في الصورة.

  • الإيجابيات الحقيقية (TP): يتنبأ النموذج بشكل صحيح بالفئة الإيجابية. على سبيل المثال، في مهمة الكشف عن الكائنات، ينجح النموذج في رسم مربع حدودي حول شخص موجود بالفعل في الإطار.
  • السلبيات الحقيقية (TN): يتنبأ النموذج بشكل صحيح بالفئة السلبية. وهذا أمر بالغ الأهمية في سيناريوهات مثل الكشف عن الحالات الشاذة، حيث يحدد النظام بشكل صحيح أن قطعة مصنعة لا تحتوي على عيوب.
  • الإيجابيات الخاطئة (FP): يتنبأ النموذج بشكل خاطئ بالفئة الإيجابية. غالبًا ما يطلق عليها "خطأ من النوع الأول"، وتحدث عندما يكتشف النظام كائنًا غير موجود، مثل كاميرا أمنية تحدد ظلًا على أنه متسلل.
  • السلبيات الخاطئة (FN): يتنبأ النموذج بشكل خاطئ بالفئة السلبية. يُعرف هذا بـ "الخطأ من النوع الثاني"، ويحدث عندما يفشل النموذج في detect موجود، أي "يفقد" الهدف بشكل أساسي.

المقاييس المشتقة وأهميتها

تُستخدم الأرقام الأولية في مصفوفة الارتباك لحساب مقاييس أكثر تقدمًا تصف أداء النموذج. فهم هذه المشتقات ضروري لتحسين الشبكات العصبية.

  • الدقة: تُحسب على النحو التالي TP / (TP + FP)، ويكشف هذا المقياس مدى دقة التنبؤات الإيجابية. تعني الدقة العالية عددًا أقل من الإنذارات الكاذبة.
  • الاسترجاع (الحساسية): يُحسب على النحو التالي TP / (TP + FN)، ويقيس قدرة النموذج على العثور على جميع الحالات الإيجابية. يعد الاسترجاع العالي أمرًا حيويًا عندما يكون فقدان كائن ما له عواقب وخيمة.
  • نتيجة F1: المتوسط التوافقي للدقة والاسترجاع. يوفر نتيجة واحدة توازن بين الاثنين، وهي مفيدة لمقارنة نماذج YOLO26 المختلفة.

تطبيقات واقعية

تحدد التكلفة المحددة للأخطاء التي تحددها مصفوفة الارتباك كيفية ضبط النماذج لمختلف الصناعات.

في مجال الذكاء الاصطناعي في الرعاية الصحية، تعد مصفوفة الارتباك مسألة تتعلق بالسلامة. عند تدريب نموذج لتحليل الصور الطبية detect فإن السلبية الكاذبة (عدم اكتشاف ورم) أسوأ بكثير من الإيجابية الكاذبة (الإبلاغ عن بقعة حميدة لكي يراجعها الطبيب). لذلك، يعطي المهندسون الأولوية للاسترجاع على الدقة في هذه المصفوفات لضمان عدم تجاهل أي مخاطر صحية محتملة.

على العكس من ذلك، في مراقبة جودة التصنيع، فإن الكفاءة هي المفتاح. إذا كان النظام الذي يصنف أجزاء خط التجميع يولد الكثير من الإيجابيات الخاطئة (ويعلم الأجزاء الجيدة على أنها معيبة)، فإنه يتسبب في هدر غير ضروري ويبطئ الإنتاج. هنا، تساعد مصفوفة الارتباك المهندسين على ضبط النموذج لتحقيق أقصى قدر من الدقة، مما يضمن أن ما يتم رفضه هو بالفعل معيب، ويبسط سير عمل التعلم الآلي .

إنشاء مصفوفة التباين باستخدام YOLO26

عند استخدام الأطر الحديثة، غالبًا ما يكون إنشاء هذه المصفوفة جزءًا من مسار التحقق القياسي. يوضح المثال أدناه كيفية التحقق من صحة نموذج YOLO26 والوصول إلى بيانات مصفوفة الارتباك باستخدام ultralytics الحزمة.

from ultralytics import YOLO

# Load a pre-trained YOLO26 model
model = YOLO("yolo26n.pt")

# Validate the model on the COCO8 dataset
# This automatically generates and plots the confusion matrix
metrics = model.val(data="coco8.yaml")

# Access the confusion matrix object directly
print(metrics.confusion_matrix.matrix)

التفريق بين المفاهيم ذات الصلة

من المهم التمييز بين مصفوفة الارتباك ومصطلحات التقييم المماثلة.

  • الدقة: الدقة هي ببساطة نسبة التنبؤات الصحيحة إلى إجمالي التنبؤات. على الرغم من فائدتها، يمكن أن تكون الدقة خادعة للغاية في مجموعات البيانات غير المتوازنة. على سبيل المثال، إذا كان 95٪ من رسائل البريد الإلكتروني ليست بريدًا عشوائيًا، فإن النموذج الذي يتنبأ بـ "ليس بريدًا عشوائيًا" لكل رسالة بريد إلكتروني يكون دقيقًا بنسبة 95٪ ولكنه عديم الفائدة. تكشف مصفوفة الارتباك عن هذا الخلل من خلال إظهار صفر من الإيجابيات الحقيقية لفئة البريد العشوائي.
  • مقابل منحنى ROC: توفر مصفوفة الارتباك لمحة سريعة عن الأداء عند عتبة ثقة محددة واحدة. في المقابل، يعرض منحنى خصائص التشغيل للمستقبل (ROC) كيفية تغير معدل الإيجابية الحقيقية ومعدل الإيجابية الكاذبة مع تغير تلك العتبة. تتيح أدوات مثل Ultralytics للمستخدمين استكشاف كلا العرضين لاختيار نقطة التشغيل المثلى لنشرها.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن