عزز دقة نموذج الذكاء الاصطناعي ومتانته باستخدام تقنية تجانس التسميات - وهي تقنية مثبتة لتحسين التعميم وتقليل الثقة الزائدة.
تجانس التسمية هو أسلوب تنظيمي يُستخدم أثناء تدريب نماذج التعلّم الآلي، خاصةً في مهام التصنيف. وهي تعالج مشكلة الثقة المفرطة في النموذج من خلال منع النموذج من تعيين الاحتمال الكامل 1.0 للفئة الصحيحة. بدلاً من استخدام التسميات "الثابتة" (حيث تكون الفئة الصحيحة 1 وجميع الفئات الأخرى 0)، ينشئ تنعيم التسمية تسميات "ناعمة"، ويوزع جزءًا صغيرًا من كتلة الاحتمالات على الفئات الأخرى. يشجع هذا النموذج على أن يكون أقل يقينًا بشأن تنبؤاته، مما قد يؤدي إلى تعميم أفضل وتحسين الأداء على البيانات غير المرئية. استُخدمت هذه التقنية بشكل ملحوظ في النماذج عالية الأداء وتم تفصيلها في أوراق بحثية مثل متى تساعد تقنية "تنعيم التسمية".
في مشكلة تصنيف التعلم النموذجي الخاضع للإشراف، تتكون بيانات التدريب من المدخلات والتسميات الصحيحة المقابلة لها. على سبيل المثال، في مهمة تصنيف الصور، على سبيل المثال، في مهمة تصنيف الصور، فإن صورة قطة ستكون التسمية "قطة" ممثلة كمتجه مشفر من نقطة واحدة مثل الفئات [قطة، كلب، طائر]. عند حساب دالة الخسارة، يُعاقَب النموذج بناءً على مدى بُعد تنبؤاته عن هذا الهدف الثابت.
يعدّل تجانس التسمية هذا الهدف. إنه يقلل قليلاً من احتمال الهدف للفئة الصحيحة (على سبيل المثال، إلى 0.9) ويوزع الاحتمال الصغير المتبقي (0.1 في هذه الحالة) بالتساوي بين الفئات غير الصحيحة. لذا، قد يبدو الهدف "الناعم" الجديد مثل [0.9، 0.05، 0.05، 0.05]. هذا التغيير البسيط لا يشجع طبقة اللوغاريتم النهائية للشبكة العصبية على إنتاج قيم كبيرة للغاية لفئة واحدة، مما يساعد على منع الإفراط في التخصيص. يمكن إدارة هذه العملية أثناء تدريب النموذج باستخدام منصات مثل Ultralytics HUB.
تتمثل الميزة الأساسية لتنعيم التسمية في تحسين معايرة النموذج. تعكس درجات الثقة المتوقعة للنموذج المُعاير بشكل جيد درجات الثقة المتوقعة بشكل أكثر دقة الاحتمال الحقيقي للصحة. وهذا أمرٌ بالغ الأهمية للتطبيقات التي يكون فيها فهم درجة ثقة النموذج مهمًا، كما هو الحال في تحليل الصور الطبية. من خلال منع الثقة الزائدة، فإنه يحسن أيضًا من قدرة النموذج على التعميم على البيانات الجديدة، وهو هدف رئيسي لأي مشروع تعلّم آلي. وغالبًا ما يؤدي ذلك إلى زيادة طفيفة في الدقة. يؤدي التعميم الأفضل إلى نماذج أكثر قوة للاستدلال في الوقت الحقيقي والنشر النهائي للنموذج.
تجانس التسمية هي تقنية بسيطة وفعالة في الوقت نفسه يتم تطبيقها في مختلف النماذج الحديثة.
من المهم التفريق بين تنعيم التسمية وتقنيات التنظيم الأخرى.