مسرد المصطلحات

الثقة

تعريف درجات الثقة في الذكاء الاصطناعي. تعرّف على كيفية قياس النماذج لليقين في التنبؤ، وحدد عتبات الموثوقية، وميّز بين الثقة والدقة.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

تمثل الثقة، في سياق الذكاء الاصطناعي (AI) والتعلم الآلي (ML)، درجة الثقة التي يخصصها النموذج لتوقعاته، مما يشير إلى مدى يقين النموذج بشأن هذا الناتج المحدد. بالنسبة لمهام مثل اكتشاف الكائنات أو تصنيف الصور، فإن كل كائن مكتشف أو تصنيف فئة معينة يأتي مع درجة ثقة، تتراوح عادةً من 0 إلى 1 (أو 0% إلى 100%). تساعد هذه الدرجة المستخدمين على قياس مدى موثوقية التنبؤات الفردية التي تقوم بها نماذج مثل Ultralytics YOLO. تشير الدرجة الأعلى إلى أن النموذج أكثر يقينًا بشأن تنبؤاته استنادًا إلى الأنماط المستفادة أثناء التدريب. يعد فهم الثقة أمرًا بالغ الأهمية لتفسير مخرجات النموذج واتخاذ قرارات مستنيرة بناءً على تنبؤات الذكاء الاصطناعي، خاصةً في التطبيقات الحرجة للسلامة مثل الذكاء الاصطناعي في حلول السيارات.

كيف يتم تحديد الثقة

عادةً ما يتم اشتقاق درجات الثقة من طبقة مخرجات الشبكة العصبية (NN). بالنسبة لمهام التصنيف، غالبًا ما يتضمن ذلك تطبيق دالة تنشيط مثل Softmax أو Sigmoid على المخرجات الأولية (اللوغاريتمات) لإنتاج قيم شبيهة بالاحتمالات لكل فئة. في نماذج الكشف عن الكائنات مثل YOLO قد تجمع درجة الثقة بين احتمال وجود كائن ما في مربع محدد مقترح (غالبًا ما يُطلق عليه "درجة الكائن") واحتمال انتماء هذا الكائن إلى فئة معينة، بشرط وجود كائن ما. وهو ناتج رئيسي يُستخدم أثناء عملية الاستدلال لتقييم صحة الاكتشافات. يتم حساب هذه الدرجة بناءً على أوزان النموذج المستفادة من مجموعات البيانات مثل COCO.

عتبة الثقة

من الناحية العملية، لا تكون جميع التنبؤات من النموذج مفيدة أو موثوقة بنفس القدر. فغالباً ما تمثل التنبؤات ذات درجات الثقة المنخفضة جداً ضجيجاً في الخلفية أو تصنيفات غير مؤكدة. لتصفية هذه التنبؤات، عادةً ما يتم تطبيق "عتبة ثقة". وهي قيمة يحددها المستخدم (على سبيل المثال، 0.5 أو 50%)؛ حيث يتم اعتبار التنبؤات التي تحصل على درجة ثقة أعلى من هذه العتبة فقط مخرجات صالحة. يعد تحديد العتبة المناسبة أمرًا حيويًا وغالبًا ما يعتمد على التطبيق المحدد:

غالبًا ما تعمل عتبة الثقة جنبًا إلى جنب مع تقنيات مثل الكبت غير الأقصى (NMS) لتحسين المجموعة النهائية من الاكتشافات عن طريق إزالة المربعات الحدودية المتداخلة لنفس الكائن. يمكنك تهيئة هذه العتبة بسهولة عند استخدام نماذج Ultralytics عبر واجهة سطر الأوامر (CLI) أو واجهة برمجة تطبيقاتPython . قد ينطوي العثور على العتبة المثلى على ضبط المعلمة الفائقة.

التطبيقات الواقعية

درجات الثقة أساسية في نشر نماذج الذكاء الاصطناعي بشكل مسؤول وفعال:

  1. دعم التشخيص الطبي: في الأنظمة التي تقوم بتحليل الفحوصات الطبية (مثل الأشعة السينية أو التصوير بالرنين المغناطيسي) بحثًا عن الحالات الشاذة المحتملة(مثل اكتشاف الورم)، تساعد درجة الثقة في تحديد أولويات الحالات. قد يشير التنبؤ ذو درجة الثقة المنخفضة إلى اكتشاف غامض يتطلب فحصاً أدق من قبل أخصائي الأشعة، في حين أن التنبؤات ذات درجة الثقة العالية يمكن أن تبسط عملية المراجعة. غالباً ما تناقش الأبحاث في مجال الذكاء الاصطناعي للأشعة مستويات الثقة.
  2. الأنظمة ذاتية القيادة: بالنسبة للسيارات ذاتية القيادة أو الروبوتات ذاتية القيادة، فإن درجات الثقة أمر بالغ الأهمية للسلامة. يجب أن يستوفي اكتشاف وجود أحد المشاة أو سيارة أخرى(تعرف على نهج Waymo) عتبة ثقة عالية قبل أن يبدأ النظام في اتخاذ إجراء مثل الكبح أو الانحراف. أما الاكتشافات منخفضة الثقة فقد يتم تجاهلها أو إطلاق تنبيهات أقل أهمية. وهذا يضمن أن يتصرف النظام بشكل حاسم فقط عند التأكد.

الثقة مقابل المقاييس الأخرى

من المهم عدم الخلط بين درجة الثقة في التنبؤ الفردي ومقاييس تقييم النموذج بشكل عام. فعلى الرغم من ارتباطهما ببعضهما البعض، إلا أنهما يقيسان جوانب مختلفة من الأداء:

  • الدقة: يقيس النسبة المئوية الإجمالية للتنبؤات الصحيحة عبر مجموعة البيانات بأكملها. وهو يوفر إحساسًا عامًا بأداء النموذج، لكنه لا يعكس يقين التنبؤات الفردية. يمكن أن يكون للنموذج دقة عالية ولكن لا يزال بإمكانه إجراء بعض التنبؤات بثقة منخفضة.
  • الدقة: تشير إلى نسبة التنبؤات الإيجابية التي كانت صحيحة بالفعل (الإيجابيات الحقيقية / (الإيجابيات الحقيقية + الإيجابيات الخاطئة)). الدقة العالية تعني عددًا أقل من الإنذارات الكاذبة. تعكس الثقة اعتقاد النموذج في تنبؤاته، والتي قد تتماشى أو لا تتماشى مع صحتها.
  • الاستدعاء (الحساسية): يقيس نسبة الحالات الإيجابية الفعلية التي حددها النموذج بشكل صحيح (الإيجابيات الحقيقية / (الإيجابيات الحقيقية + السلبيات الخاطئة)). الاستدعاء العالي يعني عددًا أقل من الاكتشافات الفائتة. لا ترتبط الثقة مباشرةً بعدد الحالات الإيجابية الفعلية التي تم العثور عليها.
  • النتيجة F1-نتيجة: المتوسط التوافقي لـ Precision و Recall، مما يوفر مقياسًا واحدًا يوازن بين الاثنين. تظل الثقة درجة على مستوى التنبؤ.
  • متوسط الدقة المتوسطة (mAP): مقياس شائع في الكشف عن الكائنات يلخص منحنى الدقة-الاستدعاء عبر عتبات الثقة والفئات المختلفة. في حين أن حساب mAP يتضمن عتبات الثقة، فإن درجة الثقة نفسها تنطبق على كل عملية كشف فردية.
  • المعايرة: يشير إلى مدى توافق درجات الثقة مع الاحتمالية الفعلية للصحة. يجب أن تكون تنبؤات النموذج المُعاير بشكل جيد بثقة 80٪ صحيحة حوالي 80٪ من الوقت. درجات الثقة من النماذج لا تكون دائماً مُعايرة بشكل جيد بطبيعتها(انظر البحث حول المعايرة).

باختصار، الثقة هي ناتج قيّم لتقييم مدى يقين تنبؤات الذكاء الاصطناعي الفردية، مما يتيح تصفية أفضل وتحديد الأولويات واتخاذ القرارات في تطبيقات العالم الحقيقي. وهو يكمل المقاييس التي تقيّم الأداء العام للنموذج مثل تلك التي يتم تتبعها في Ultralytics HUB، ولكنه يختلف عنها.

قراءة الكل