عزز دقة ومتانة نموذج الذكاء الاصطناعي باستخدام تسوية الملصقات - وهي تقنية مُثبتة لتحسين التعميم وتقليل الثقة المفرطة.
تجانس التسمية هي تقنية تنظيم تُستخدم أثناء تدريب نماذج التعلّم الآلي لمنع الشبكة العصبية من أن تصبح الشبكة العصبية من الثقة المفرطة في تنبؤاتها. من خلال تعديل التسميات المستهدفة بشكل طفيف، تشجع هذه الطريقة تشجع النموذج على إنتاج توزيعات احتمالية أقل تطرفًا، مما يؤدي في النهاية إلى تعميم أفضل تعميم أفضل وتحسين الأداء على البيانات غير المرئية. تخفف بشكل فعال من المشكلة الشائعة المتمثلة في الشائعة، حيث يقوم النموذج بحفظ بيانات التدريب بيانات التدريب بدلاً من تعلم الأنماط الأساسية اللازمة للتنبؤات الدقيقة في سيناريوهات العالم الحقيقي.
في مهام التعلم القياسية الخاضعة للإشراف، مثل تصنيف الصور، عادةً ما يتم تدريب النماذج باستخدام أهداف "صلبة". هذه الأهداف هي عبارة عن متجهات حيث يتم تعيين احتمالية 1.0 (100%) للفئة الصحيحة واحتمالية 0.0 لجميع الفئات غير الصحيحة. بينما يبدو هذا بديهيًا، إلا أنه يجبر دالة الخسارة دالة الخسارة - غالباً ما تكونخسارة عبر الانتروبيا - على دفع مخرجات مخرجات طبقة اللوغاريتمات إلى ما لا نهاية لتحقيق لتحقيق 1.0 بالضبط. ينتج عن هذا السلوك نموذجٌ واثقٌ بشكل مفرط، حتى عندما يكون خاطئاً، و يقلل من قدرته على التكيف مع المدخلات الجديدة.
يستبدل تنعيم التسمية هذه الأهداف الصلبة بأهداف "لينة". بدلًا من تعيين 1.0 للأرضية الحقيقة، تقوم هذه التقنية بتعيين قيمة أقل قليلاً، مثل 0.9. كتلة الاحتمالات المتبقية (على سبيل المثال، 0.1) هي موزعة بشكل منتظم عبر الفئات غير الصحيحة. هذا التحوّل الدقيق يمنع دالة التنشيط، عادةً Softmax، من التشبع. للحصول على فهم نظري أعمق فهم أعمق، تقدم الورقة البحثية"إعادة التفكير في بنية الاستهلال للرؤية الحاسوبية" رؤى أساسية حول كيفية استقرار هذه الآلية في التدريب.
تجعل أطر الرؤية الحاسوبية الحديثة من السهل تطبيق هذه التقنية. عند استخدام نموذجUltralytics YOLO11 يمكنك تمكين تجانس التسمية مباشرةً ضمن وسيطات التدريب. هذا مفيد بشكل خاص ل مهام التصنيف حيث قد تحتوي مجموعات البيانات على غموض.
يوضح المثال التالي كيفية تدريب نموذج مع تطبيق تجانس التسمية:
from ultralytics import YOLO
# Load the YOLO11 classification model
model = YOLO("yolo11n-cls.pt")
# Train on a dataset with label smoothing set to 0.1
# This distributes 10% of the probability mass to incorrect classes
model.train(data="mnist", epochs=5, label_smoothing=0.1)
تتمثل إحدى المزايا الأساسية لتنعيم التسمية في تحسين معايرة النموذج. فالنموذج المُعاير جيداً ينتج احتمالات متوقعة تعكس بشكل أساسي الاحتمال الحقيقي للصحة. على سبيل المثال، إذا كان النموذج يتنبأ بفئة بنسبة 70% من الثقة، فيجب أن يكون صحيحًا بنسبة 70% من الوقت. غالبًا ما تؤدي التسميات الصعبة إلى نماذج غير مُعايرة تتنبأ بثقة 99% بغض النظر عن عدم اليقين الفعلي.
علاوةً على ذلك، يزيد تجانس التسمية من المتانة ضد البيانات المشوشة. في مجموعات البيانات الضخمة مثل ImageNetقد تكون بعض التسميات غير صحيحة أو غامضة. من خلال عدم إجبار النموذج على التقارب إلى 1.0 بالضبط، تصبح الشبكة أكثر تسامحًا مع الأمثلة العرضية ذات التسميات الخاطئة العرضية، مما يمنع الشبكة العصبية من تعلم أنماط خاطئة بعمق.
يتم اعتماد استراتيجية التنظيم هذه على نطاق واسع في مختلف مجالات الذكاء الاصطناعي لتعزيز الموثوقية.
من المفيد التمييز بين تجانس التسمية والتقنيات الأخرى المستخدمة لتحسين أداء النموذج.
من خلال دمج تجانس الملصقات في خط التدريب الخاص بك، فإنك تضمن أن تظل نماذجك قابلة للتكيف والمعايرة ومعايرتها، وهو أمر ضروري لنجاح النشر الناجح للنماذج في بيئات الإنتاج في بيئات الإنتاج.