الثقة
حدد درجات الثقة في الذكاء الاصطناعي. تعرف على كيفية قياس النماذج لليقين من التنبؤ، وتعيين عتبات للموثوقية، وتمييز الثقة عن الدقة.
في تعلم الآلة، درجة الثقة هي قيمة رقمية يتم تعيينها لتوقع فردي، مما يشير إلى يقين النموذج من أن التوقع صحيح. يتم التعبير عنها كنسبة مئوية أو قيمة احتمالية بين 0 و 1، وهي تحدد كميًا "اعتقاد" النموذج في ناتجه الخاص لمثيل واحد. على سبيل المثال، في مهمة اكتشاف الكائنات، قد يحدد نموذج مثل Ultralytics YOLO11 سيارة في صورة ويعين درجة ثقة تبلغ 0.95 (أو 95٪)، مما يشير إلى أنه متأكد جدًا من اكتشافه. هذه النتيجة هي ناتج حاسم يساعد المستخدمين على تصفية نتائج النموذج وتحديد أولوياتها وتفسيرها في سيناريوهات العالم الحقيقي.
عادةً ما يتم اشتقاق درجة الثقة من مخرجات الطبقة النهائية من شبكة عصبية (NN)، غالبًا ما تكون دالة softmax أو sigmoid. هذه القيمة مفيدة في التطبيقات العملية، حيث يتم تعيين حد للثقة للتخلص من التنبؤات التي تقل عن مستوى معين من اليقين. من خلال تعديل هذا الحد، يمكن للمطورين موازنة المفاضلة بين التقاط جميع الاكتشافات ذات الصلة وتقليل الإيجابيات الكاذبة، وهو اعتبار رئيسي في نشر النموذج.
تطبيقات واقعية
تعد درجات الثقة ضرورية لجعل أنظمة الذكاء الاصطناعي أكثر موثوقية وقابلية للتنفيذ. فهي تسمح للأنظمة بقياس عدم اليقين وإطلاق استجابات مختلفة وفقًا لذلك.
- المركبات ذاتية القيادة: في السيارات ذاتية القيادة، تُعد علامات الثقة حيوية للسلامة. قد يحدد كاشف الأجسام أحد المشاة بعلامة ثقة تبلغ 98٪، وهي إشارة واضحة للسيارة لكي تبطئ أو تتوقف. وعلى العكس من ذلك، إذا اكتشف جسمًا بعلامة ثقة تبلغ 30٪ فقط، فقد يضع النظام علامة عليه على أنه غير مؤكد ويستخدم مستشعرات أخرى للتحقق من طبيعته قبل اتخاذ إجراء. يساعد ذلك في منع الحوادث من خلال التركيز على التهديدات عالية التأكد. لمزيد من التفاصيل حول هذا الموضوع، يمكنك القراءة عن دور الذكاء الاصطناعي في السيارات ذاتية القيادة.
- تحليل الصور الطبية: عندما يحلل نموذج الذكاء الاصطناعي الفحوصات الطبية بحثًا عن علامات المرض، مثل اكتشاف الأورام في التصوير الطبي، فإن درجة الثقة لا تقدر بثمن. يمكن الإبلاغ فورًا عن الكشف بدرجة ثقة 99٪ لمراجعة أخصائي الأشعة. قد يتم وضع علامة على النتيجة بدرجة ثقة 60٪ على أنها "غامضة" أو "تحتاج إلى مزيد من المراجعة"، مما يضمن حصول الحالات غير المؤكدة على تدقيق بشري دون إرهاق الخبراء بالإنذارات الكاذبة. تقدم إدارة الغذاء والدواء (FDA) إرشادات بشأن الذكاء الاصطناعي/التعلم الآلي في الأجهزة الطبية.
الثقة مقابل المقاييس الأخرى
من المهم عدم الخلط بين درجة الثقة لتوقع فردي ومقاييس تقييم النموذج الإجمالية. على الرغم من ارتباطهما، إلا أنهما يقيسان جوانب مختلفة من الأداء:
- الدقة: يقيس النسبة المئوية الإجمالية للتنبؤات الصحيحة عبر مجموعة البيانات بأكملها. وهو يوفر إحساسًا عامًا بأداء النموذج، لكنه لا يعكس يقين التنبؤات الفردية. يمكن أن يكون للنموذج دقة عالية ولكن لا يزال بإمكانه إجراء بعض التنبؤات بثقة منخفضة.
- الدقة: تشير إلى نسبة التنبؤات الإيجابية التي كانت صحيحة بالفعل. الدقة العالية تعني عددًا أقل من الإنذارات الخاطئة. تعكس الثقة اعتقاد النموذج في تنبؤاته، والتي قد تتماشى أو لا تتماشى مع صحتها.
- الاستدعاء (الحساسية): يقيس نسبة الحالات الإيجابية الفعلية التي حددها النموذج بشكل صحيح. الاستدعاء العالي يعني عددًا أقل من حالات الاكتشاف الفائتة. لا ترتبط الثقة مباشرةً بعدد الحالات الإيجابية الفعلية التي تم العثور عليها.
- النتيجة F1-نتيجة: المتوسط التوافقي لـ Precision و Recall، مما يوفر مقياسًا واحدًا يوازن بين الاثنين. تظل الثقة درجة على مستوى التنبؤ، وليست مقياسًا إجماليًا لأداء النموذج.
- متوسط الدقة المتوسطة (mAP): مقياس شائع في الكشف عن الكائنات يلخص منحنى الدقة-الاستدعاء عبر عتبات الثقة والفئات المختلفة. في حين أن حساب mAP يتضمن عتبات الثقة، فإن درجة الثقة نفسها تنطبق على كل عملية كشف فردية.
- المعايرة: تشير إلى مدى توافق درجات الثقة مع الاحتمالية الفعلية للصحة. يجب أن تكون تنبؤات النموذج المعاير جيدًا بثقة 80٪ صحيحة حوالي 80٪ من الوقت. لا تكون درجات الثقة من الشبكات العصبية الحديثة دائمًا معايرة بشكل جيد بطبيعتها، كما تمت مناقشته في بحث حول معايرة النموذج.
باختصار، تُعد الثقة ناتجًا قيمًا لتقييم يقين تنبؤات الذكاء الاصطناعي الفردية، مما يتيح تحسين الترشيح وتحديد الأولويات واتخاذ القرارات في التطبيقات الواقعية. وهي تكمل المقاييس التي تقيّم الأداء العام للنموذج، مثل تلك التي يمكنك تتبعها وتحليلها باستخدام أدوات مثل Ultralytics HUB، ولكنها تختلف عنها.