اكتشف أهمية الدقة في التعلم الآلي، وحسابها، والقيود المفروضة على مجموعات البيانات غير المتوازنة، وطرق تحسين أداء النموذج.
الدقة هي أحد مقاييس التقييم الأساسية والبديهية في التعلم الآلي (ML). فهو يقيس نسبة التنبؤات الصحيحة التي قام بها النموذج من بين جميع التنبؤات التي تم إجراؤها. ونظرًا لبساطتها، غالبًا ما تكون الدقة هي المقياس الأول الذي ينظر إليه المطورون للحصول على فكرة عامة عن أداء نموذج الذكاء الاصطناعي، خاصةً في مهام التصنيف. وهو بمثابة فحص سريع للصحة قبل الغوص في تقييمات أكثر دقة.
تُعد الدقة مؤشر أداء رئيسي في العديد من المجالات التي يكون فيها التصنيف أمرًا بالغ الأهمية. وفيما يلي مثالان:
على الرغم من فائدتها، إلا أن الدقة قد تكون مضللة للغاية، خاصة عند التعامل مع مجموعات البيانات غير المتوازنة. مجموعة البيانات غير المتوازنة هي تلك التي يختلف فيها عدد الأمثلة في الفئات المختلفة بشكل كبير. على سبيل المثال، في الكشف عن الاحتيال، يفوق عدد المعاملات المشروعة عدد المعاملات الاحتيالية بشكل كبير. يمكن للنموذج الذي يتنبأ دائمًا ب "غير الاحتيالية" أن يحقق دقة تزيد عن 99% ولكنه سيكون عديم الفائدة تمامًا للغرض المقصود منه. هذا لأنه يفشل في تحديد الحالات النادرة ولكن الحرجة. يسلط هذا السيناريو الضوء على مفارقة الدقة، حيث تعطي درجة الدقة العالية إحساسًا زائفًا بفعالية النموذج.
للحصول على صورة كاملة عن أداء النموذج، من الضروري النظر في مقاييس أخرى إلى جانب الدقة.
يمكن أن تساعد العديد من التقنيات في تحسين دقة النموذج، على الرغم من أنها غالبًا ما تنطوي على مقايضات مع مقاييس أخرى أو تكلفة حسابية:
يمكن أن توفر الموارد الاستشارية مثل نصائح تدريب النماذج إرشادات عملية. تسمح منصات مثل Ultralytics HUB للمستخدمين بتدريب النماذج وتتبع الدقة بسهولة إلى جانب المقاييس الرئيسية الأخرى، وغالباً ما يتم تصورها باستخدام أدوات مثل TensorBoard. يمكن تتبع التقدم في هذا المجال من خلال موارد مثل تقرير مؤشر ستانفورد للذكاء الاصطناعي أو تصفح مجموعات البيانات على موقع Papers With Code. يشيع استخدام أطر عمل مثل PyTorch و TensorFlow لبناء هذه النماذج وتدريبها.
في الختام، على الرغم من أن الدقة مقياس قيّم وبديهي لتقييم أداء نموذج الذكاء الاصطناعي، إلا أنه نادراً ما ينبغي استخدامه بمعزل عن غيره. يعد النظر في الأهداف المحددة لمهمة التعلم الآلي وطبيعة البيانات، خاصةً الاختلالات المحتملة أو التكاليف المتفاوتة للأخطاء، أمرًا ضروريًا لاختيار مقاييس التقييم الأنسب. يمكن أن يوفر استخدام تقنيات من الذكاء الاصطناعي القابل للتفسير (XAI) أيضًا رؤى أعمق من قيم المقياس الواحد.