الاسترجاع
تعرف على ماهية الاسترجاع في التعلم الآلي، ولماذا هو مهم، وكيف يضمن أن نماذج الذكاء الاصطناعي تلتقط الحالات الإيجابية الهامة بشكل فعال.
الاسترجاع، المعروف أيضًا باسم الحساسية أو معدل الإيجابية الحقيقية، هو مقياس تقييم أساسي في التعلم الآلي (ML) والإحصاء. يقيس قدرة النموذج على تحديد جميع الحالات ذات الصلة بشكل صحيح داخل مجموعة البيانات. بعبارات بسيطة، يجيب الاسترجاع على السؤال: "من بين جميع الحالات الإيجابية الفعلية، كم عدد الحالات التي توقعها النموذج بشكل صحيح على أنها إيجابية؟" تشير درجة الاسترجاع العالية إلى أن النموذج فعال في العثور على ما يفترض أن يجده، مما يقلل من عدد الحالات الإيجابية الفائتة (السلبيات الكاذبة). هذا المقياس مهم بشكل خاص في التطبيقات التي يكون فيها عدم اكتشاف حالة إيجابية له عواقب وخيمة.
أهمية الاسترجاع العالي
في العديد من سيناريوهات العالم الحقيقي، تكون تكلفة السلبية الكاذبة (فقدان الاكتشاف) أعلى بكثير من تكلفة الإيجابية الكاذبة (إنذار كاذب). هذا هو المكان الذي تصبح فيه إعطاء الأولوية للاسترجاع العالي أمرًا ضروريًا. على سبيل المثال، في مهام مثل تحليل الصور الطبية أو الكشف عن الاحتيال، يضمن نموذج الاسترجاع العالي التقاط أكبر عدد ممكن من الحالات الحقيقية لمزيد من المراجعة، حتى لو كان ذلك يعني الإبلاغ عن بعض الحالات غير الصحيحة بشكل غير صحيح.
- التشخيص الطبي: في نظام مدعوم بالذكاء الاصطناعي لاكتشاف السرطان من الفحوصات الطبية، يعد نموذج الاسترجاع العالي أمرًا بالغ الأهمية. من الأفضل بكثير أن يقوم النظام بالإبلاغ عن مريض سليم ليقوم أخصائي الأشعة بمراجعته (إيجابي كاذب) بدلاً من تفويت ورم سرطاني (سلبي كاذب)، مما قد يؤخر العلاج المنقذ للحياة. يتم تحسين العديد من حلول الذكاء الاصطناعي في مجال الرعاية الصحية لتحقيق حساسية عالية.
- الأمن والمراقبة: بالنسبة لنظام إنذار أمني مصمم للكشف عن المتسللين، فإن الاسترجاع العالي له أهمية قصوى. يجب على النظام تحديد كل تهديد محتمل، حتى لو أخطأ أحيانًا في اعتبار حيوان ضال متسللًا. إن فقدان خرق أمني حقيقي سيجعل النظام غير فعال.
الاسترجاع (Recall) في نماذج Ultralytics YOLO
في سياق رؤية الكمبيوتر (CV) ونماذج مثل Ultralytics YOLO، يُعد الاسترجاع مقياسًا رئيسيًا يُستخدم جنبًا إلى جنب مع الدقة و متوسط الدقة (mAP) لتقييم الأداء في مهام مثل اكتشاف الكائنات و تقسيم المثيلات. غالبًا ما يكون تحقيق توازن جيد بين الاسترجاع و الدقة ضروريًا لتحقيق أداء قوي في العالم الحقيقي. على سبيل المثال، عند مقارنة نماذج مثل YOLOv8 مقابل YOLO11، يساعد الاسترجاع في فهم مدى جودة تحديد كل نموذج لجميع الكائنات المستهدفة. يمكن للمستخدمين تدريب نماذج مخصصة باستخدام أطر عمل مثل PyTorch أو TensorFlow وتتبع الاسترجاع باستخدام أدوات مثل Weights & Biases أو الميزات المدمجة في Ultralytics HUB. يساعد فهم الاسترجاع في تحسين النماذج لحالات استخدام معينة، والتي قد تتضمن ضبط المعلمات الفائقة أو استكشاف بنيات نماذج مختلفة مثل YOLOv10 أو أحدث YOLO11. تقدم موارد مثل وثائق Ultralytics أدلة شاملة حول التدريب والتقييم.
الاسترجاع مقابل المقاييس الأخرى
من المهم التمييز بين الاسترجاع ومقاييس التقييم الشائعة الأخرى.
- الدقة (Precision): بينما يركز الاسترجاع (Recall) على إيجاد جميع العينات الإيجابية، تقيس الدقة (Precision) دقة التنبؤات الإيجابية التي تم إجراؤها. تجيب على السؤال: "من بين جميع الحالات التي توقعها النموذج على أنها إيجابية، كم عددها كان إيجابيًا بالفعل؟" غالبًا ما يكون هناك مقايضة بين الدقة والاسترجاع؛ زيادة أحدهما قد يقلل الآخر. يُعرف هذا المفهوم باسم المقايضة بين الدقة والاسترجاع (Precision-Recall tradeoff).
- الدقة: تقيس النسبة المئوية الإجمالية للتنبؤات الصحيحة (الإيجابية والسلبية على حد سواء). يمكن أن تكون الدقة مقياسًا مضللًا لمجموعات البيانات غير المتوازنة، حيث يفوق عدد إحدى الفئات عدد الفئة الأخرى بشكل كبير. على سبيل المثال، في مجموعة بيانات تحتوي على 99% من العينات السلبية، يحقق النموذج الذي يتنبأ بكل شيء على أنه سلبي دقة بنسبة 99% ولكنه يحصل على استرجاع صفري للفئة الإيجابية.
- F1-Score: هذا هو المتوسط التوافقي للدقة والاسترجاع. يوفر F1-Score رقمًا واحدًا يوازن بين كلا المقياسين، مما يجعله مقياسًا مفيدًا عندما تحتاج إلى مراعاة كل من الإيجابيات الكاذبة والسلبيات الكاذبة. غالبًا ما يتم استخدامه عندما يكون هناك توزيع غير متساوٍ للفئات.
- المساحة تحت المنحنى (AUC): على وجه التحديد للتصنيف الثنائي، يرسم منحنى خاصية تشغيل المستقبل (ROC) معدل الإيجابية الحقيقية (الاسترجاع) مقابل معدل الإيجابية الكاذبة. يوفر AUC درجة واحدة تلخص أداء النموذج عبر جميع عتبات التصنيف. غالبًا ما تكون المساحة الواقعة أسفل منحنى الدقة والاسترجاع (AUC-PR) أكثر إفادة لمهام التصنيف غير المتوازنة.