Conformal Prediction
اكتشف كيف توفر التوقعات المطابقة (conformal prediction) تقديرًا لعدم اليقين خالٍ من التوزيع للذكاء الاصطناعي. نفذ مجموعات التوقعات مع Ultralytics YOLO26 لضمان نتائج نموذج موثوقة.
التنبؤ المطابق هو إطار إحصائي في تعلم الآلة (ML) يوفر مقاييس عدم اليقين الخالية من التوزيع لتنبؤات النماذج. بدلاً من إخراج تنبؤ بنقطة واحدة—مثل تصنيف فئة محددة—يُخرج المتنبئ المطابق مجموعة أو فترة تنبؤ تحتوي على القيمة الحقيقية باحتمالية يحددها المستخدم (مثل 90% أو 95%). يحيط هذا الإطار بأي نموذج ذكاء اصطناعي (AI) لتقديم ضمانات إحصائية رسمية دون الحاجة إلى إجراء تغييرات على بنية النموذج. للحصول على قائمة شاملة بالأدوات والأبحاث المحدثة، يمكنك استكشاف مستودع Awesome Conformal Prediction.
Link to this sectionكيف يعمل التنبؤ المطابق#
تعتمد الآلية الأساسية على تقييم مدى غرابة التنبؤ الجديد مقارنة بالأمثلة السابقة باستخدام درجة عدم المطابقة (nonconformity score).
- تدريب النموذج: أولاً، قم بتدريب نموذج أساسي باستخدام مجموعة بيانات تدريب قياسية.
- مرحلة المعايرة: قم بتمرير مجموعة بيانات معايرة منفصلة ومحجوزة عبر النموذج المدرب. احسب درجة عدم المطابقة لكل تنبؤ، مثل الاحتمالية العكسية في تصنيف الصور.
- حساب الكميات: حدد مستوى الثقة المستهدف (مثلاً 95%) واعثر على الكمية (quantile) المقابلة لدرجات المعايرة هذه لبناء مجموعات التنبؤ.
- تطبيق الاستدلال: أثناء الاستدلال المباشر، قم بتقييم المدخلات الجديدة وقم بتضمين جميع التصنيفات الممكنة التي تقع درجاتها تحت كمية المعايرة.
يمكنك استكشاف البراهين الرياضية لهذا النهج في البرنامج التعليمي A Gentle Introduction to Conformal Prediction أو التعرف على نهج التنبؤ بالسلاسل الزمنية للتعامل مع حالات عدم اليقين الزمنية.
Link to this sectionالتمييز بين التنبؤ المطابق والمصطلحات ذات الصلة#
من الضروري تمييز هذا الإطار عن المقاييس القياسية المستخدمة أثناء اختبار النموذج:
- التنبؤ المطابق مقابل درجات الثقة: تعكس درجة الثقة القياسية اليقين الداخلي للنموذج ولكنها غالباً ما تكون سيئة المعايرة وتفتقر إلى ضمانات رياضية. يحول التنبؤ المطابق هذه الدرجات الأولية إلى مجموعات مضمونة. للحصول على تعديلات تقليدية، راجع معايرة الاحتمالية في scikit-learn.
- التنبؤ المطابق مقابل الدقة: الدقة هي مقياس تاريخي عالمي يصف عدد المرات التي يكون فيها النموذج صحيحاً عبر مجموعة بيانات كاملة، في حين يوفر الاستدلال المطابق فترة محلية خاصة بالمثيل لكل تنبؤ جديد.
Link to this sectionتطبيقات العالم الحقيقي#
يعد التنبؤ المطابق لا غنى عنه في المجالات عالية المخاطر حيث تكون معرفة النقاط العمياء للنموذج أمراً بالغ الأهمية.
- التشخيص الطبي: عند استخدام الذكاء الاصطناعي في الرعاية الصحية لتحليل الأشعة، قد يُخرج النموذج مجموعة من التشخيصات المعقولة بدلاً من تصنيف واحد قد يكون غير صحيح. يضمن هذا قيام الأطباء بالتحقيق في جميع الاحتمالات الممكنة، مما يدعم الدراسات الحديثة حول الطب الجيني الموثوق والتصوير.
- القيادة الذاتية: في أنظمة الذكاء الاصطناعي للسيارات، يؤدي تطبيق فترات التنبؤ على كشف الأجسام إلى إنشاء منطقة ثقة مكانية حول المشاة، مما يسمح لأنظمة كبح المركبة بمراعاة أسوأ الحالات من التحركات بأمان.
Link to this sectionتنفيذ مجموعات التنبؤ#
توفر مكتبات مثل MAPIE (Model Agnostic Prediction Interval Estimator) أدوات مدمجة لـ Python، وغالباً ما تستخدم مهام الانحدار انحدار الكمية المطابق. يمكنك أيضاً تنفيذ منطق التنبؤ المطابق الأساسي باستخدام احتمالات من نماذج متقدمة مثل Ultralytics YOLO26. يبني المثال التالي مجموعة تنبؤ باستخدام احتمالات تصنيف YOLO26، محاكياً منطق تضمين أفضل التصنيفات حتى يتم استيفاء حد تراكمي.
from ultralytics import YOLO
# Load an Ultralytics YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Perform inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Simple conformal-style prediction set logic based on cumulative probability
target_coverage = 0.95
prediction_set = []
cumulative_prob = 0.0
# Sort probabilities in descending order using the results object
probs = results[0].probs
sorted_indices = probs.top5
for idx in sorted_indices:
class_name = results[0].names[idx]
class_prob = probs.data[idx].item()
prediction_set.append((class_name, round(class_prob, 3)))
cumulative_prob += class_prob
# Stop adding to the set once we reach the 95% coverage threshold
if cumulative_prob >= target_coverage:
break
print(f"95% Prediction Set: {prediction_set}")يتطلب تطوير أنظمة موثوقة ممارسات بيانات قوية لمنع انحراف البيانات من إفساد المعايرة. تعمل أدوات مثل منصة Ultralytics على تبسيط عملية جمع مجموعات بيانات التصنيف الجديدة، وإعادة تدريب النماذج، وإدارة نشر النموذج بشكل آمن. يمكنك قراءة المزيد حول تنظيم البيانات المتوازنة في دليلنا حول فهم انحياز مجموعة البيانات، أو متابعة أحدث التطورات المقدمة في مؤتمر COPA السنوي.






