اكتشف أهمية الدقة في التعلم الآلي، وحسابها، وقيودها مع مجموعات البيانات غير المتوازنة، وطرق تحسين أداء النموذج.
تُعد الدقة أحد أهم المقاييس الأساسية لتقييم أداء نموذج التصنيف. وهي تمثل نسبة التنبؤات الصحيحة التي قام بها النظام من إجمالي عدد التنبؤات التي تمت معالجتها. في المشهد الأوسع ل التعلم الآلي (ML)، غالباً ما تكون الدقة هي الرقم الأول الذي يراجعه المطورون لقياس ما إذا كان النموذج يتعلم بفعالية أو مجرد تخمين. في حين أنه يوفر لقطة سريعة للفعالية، إلا أنها كثيراً ما تُستخدم إلى جانب مقاييس تقييم أخرى مقاييس التقييم الأخرى لضمان فهم شامل لسلوك النموذج، خاصة عند التمييز بين الفئات في مجموعات البيانات المعقدة.
يتسم حساب الدقة بالبساطة، مما يجعلها في متناول أصحاب المصلحة بدءًا من علماء البيانات إلى المديرين التنفيذيين في مجال الأعمال. يتم تعريفها رياضيًا على أنها عدد الحالات الإيجابية الحقيقية والسلبية الحقيقية مقسومًا على العدد الإجمالي للحالات. بالنسبة مهام التعلم تحت الإشراف، يشير هذا المقياس يشير إلى عدد المرات التي تتوافق فيها الخوارزمية مع الحقيقة الأساسية المتوفرة في بيانات التدريب. ومع ذلك، لا تعني الدقة العالية دائمًا نموذجًا مثاليًا؛ إذ تعتمد موثوقيتها بشكل كبير على توزيع البيانات الأساسية.
تلعب الدقة دورًا محوريًا في مختلف الصناعات التي تساعد فيها عملية صنع القرار الآلي الخبراء البشريين.
عند تطوير النماذج باستخدام ultralytics حزمة، فإن تقييم الدقة هو جزء قياسي من
سير عمل التحقق من الصحة. يوضح المثال التالي كيفية تحميل
YOLO11 نموذج التصنيف والتحقق من صحته لاسترداد
مقاييس الدقة.
from ultralytics import YOLO
# Load a pretrained YOLO11 classification model
model = YOLO("yolo11n-cls.pt")
# Validate the model on the MNIST160 dataset
# The function returns a metrics object containing top1 and top5 accuracy
metrics = model.val(data="mnist160")
# Display the Top-1 accuracy (percentage of times the top prediction was correct)
print(f"Top-1 Accuracy: {metrics.top1:.2f}")
على الرغم من بديهية الدقة، إلا أنها قد تكون مضللة عند التعامل مع مجموعة بيانات غير متوازنة. تُعرف هذه الظاهرة باسم مفارقة الدقة. على سبيل المثال، في سيناريو الكشف عن الاحتيال حيث يكون 1% فقط من من المعاملات الاحتيالية، فإن النموذج الذي يتنبأ ببساطة ب "شرعية" كل معاملة سيحقق دقة بنسبة 99%. ومع ذلك، فإنه سيفشل تمامًا في مهمته الأساسية المتمثلة في الكشف عن الاحتيال. في مثل هذه الحالات، يُظهر النموذج دقة عالية ولكن قدرته التنبؤية لفئة الأقلية ستكون صفرية.
لمعالجة ذلك، يستخدم الممارسون زيادة البيانات لتحقيق التوازن بين الفئات أو النظر إلى في المقاييس المختلفة التي تشرح أنواع الأخطاء التي يتم ارتكابها.
لفهم أداء النموذج بشكل كامل، يجب التمييز بين الدقة والمصطلحات ذات الصلة:
ينطوي تحسين الدقة على عملية تجريبية تكرارية. غالبًا ما يستخدم المطورون ضبط المعلمة الفائقة لضبط معدلات التعلم وأحجام الدفعات لتحقيق التقارب الأمثل. بالإضافة إلى ذلك، فإن استخدام البنى المتقدمة مثل المحولات أو أحدث التكرارات ل Ultralytics YOLO يمكن أن يحقق مكاسب كبيرة. وأخيرًا، فإن ضمان أن تكون مجموعة بيانات التدريب نظيفة ومتنوعة من خلال التعلم النشط يساعد النموذج على التعميم بشكل أفضل على بيانات العالم الحقيقي غير المرئية بشكل أفضل.