مسرد المصطلحات

تنعيم الملصق

عزز دقة نموذج الذكاء الاصطناعي ومتانته باستخدام تقنية تجانس التسميات - وهي تقنية مثبتة لتحسين التعميم وتقليل الثقة الزائدة.

تجانس التسمية هو أسلوب تنظيمي يُستخدم أثناء تدريب نماذج التعلّم الآلي، خاصةً في مهام التصنيف. وهي تعالج مشكلة الثقة المفرطة في النموذج من خلال منع النموذج من تعيين الاحتمال الكامل 1.0 للفئة الصحيحة. بدلاً من استخدام التسميات "الثابتة" (حيث تكون الفئة الصحيحة 1 وجميع الفئات الأخرى 0)، ينشئ تنعيم التسمية تسميات "ناعمة"، ويوزع جزءًا صغيرًا من كتلة الاحتمالات على الفئات الأخرى. يشجع هذا النموذج على أن يكون أقل يقينًا بشأن تنبؤاته، مما قد يؤدي إلى تعميم أفضل وتحسين الأداء على البيانات غير المرئية. استُخدمت هذه التقنية بشكل ملحوظ في النماذج عالية الأداء وتم تفصيلها في أوراق بحثية مثل متى تساعد تقنية "تنعيم التسمية".

كيفية عمل تنعيم الملصق

في مشكلة تصنيف التعلم النموذجي الخاضع للإشراف، تتكون بيانات التدريب من المدخلات والتسميات الصحيحة المقابلة لها. على سبيل المثال، في مهمة تصنيف الصور، على سبيل المثال، في مهمة تصنيف الصور، فإن صورة قطة ستكون التسمية "قطة" ممثلة كمتجه مشفر من نقطة واحدة مثل الفئات [قطة، كلب، طائر]. عند حساب دالة الخسارة، يُعاقَب النموذج بناءً على مدى بُعد تنبؤاته عن هذا الهدف الثابت.

يعدّل تجانس التسمية هذا الهدف. إنه يقلل قليلاً من احتمال الهدف للفئة الصحيحة (على سبيل المثال، إلى 0.9) ويوزع الاحتمال الصغير المتبقي (0.1 في هذه الحالة) بالتساوي بين الفئات غير الصحيحة. لذا، قد يبدو الهدف "الناعم" الجديد مثل [0.9، 0.05، 0.05، 0.05]. هذا التغيير البسيط لا يشجع طبقة اللوغاريتم النهائية للشبكة العصبية على إنتاج قيم كبيرة للغاية لفئة واحدة، مما يساعد على منع الإفراط في التخصيص. يمكن إدارة هذه العملية أثناء تدريب النموذج باستخدام منصات مثل Ultralytics HUB.

فوائد تنعيم الملصق

تتمثل الميزة الأساسية لتنعيم التسمية في تحسين معايرة النموذج. تعكس درجات الثقة المتوقعة للنموذج المُعاير بشكل جيد درجات الثقة المتوقعة بشكل أكثر دقة الاحتمال الحقيقي للصحة. وهذا أمرٌ بالغ الأهمية للتطبيقات التي يكون فيها فهم درجة ثقة النموذج مهمًا، كما هو الحال في تحليل الصور الطبية. من خلال منع الثقة الزائدة، فإنه يحسن أيضًا من قدرة النموذج على التعميم على البيانات الجديدة، وهو هدف رئيسي لأي مشروع تعلّم آلي. وغالبًا ما يؤدي ذلك إلى زيادة طفيفة في الدقة. يؤدي التعميم الأفضل إلى نماذج أكثر قوة للاستدلال في الوقت الحقيقي والنشر النهائي للنموذج.

التطبيقات الواقعية

تجانس التسمية هي تقنية بسيطة وفعالة في الوقت نفسه يتم تطبيقها في مختلف النماذج الحديثة.

  1. تصنيف الصور على نطاق واسع: غالبًا ما تستخدم النماذج مثل Ultralytics YOLO المدربة على مهام تصنيف الصور على مجموعات بيانات ضخمة مثل ImageNet تجانس التسمية. يمكن أن تحتوي مجموعات البيانات هذه في بعض الأحيان على تسميات مشوشة أو غير صحيحة من عملية تصنيف البيانات. تجعل عملية تجانس التسمية النموذج أكثر قوة في مواجهة ضوضاء التسمية هذه، مما يمنعه من تعلم الثقة المفرطة في التسميات التي يُحتمل أن تكون خاطئة. يمكنك استكشاف مجموعة متنوعة من مجموعات بيانات التصنيف لمشاريعك.
  2. معالجة اللغة الطبيعية (NLP): في مهام مثل الترجمة الآلية، يمكن أن تكون هناك عدة ترجمات صحيحة لعبارة واحدة. لا تشجع عملية تنعيم التسمية، المستخدمة في نماذج مثل المحولات، النموذج على عدم تعيين احتمال 1.0 لكلمة واحدة صحيحة في المفردة، مع الاعتراف بأن هناك كلمات أخرى قد تكون مناسبة أيضًا. هذا المفهوم هو مفهوم أساسي في البرمجة اللغوية العصبية الحديثة، وقد تمت مناقشته في مصادر من مؤسسات مثل مجموعة ستانفورد للبرمجة اللغوية العصبية.

تجانس التسمية مقابل المفاهيم ذات الصلة

من المهم التفريق بين تنعيم التسمية وتقنيات التنظيم الأخرى.

  • التسميات الصعبة: هذا هو النهج القياسي حيث يتم تدريب النموذج بيقين مطلق (100% للفئة الصحيحة). تجانس التسمية هو بديل مباشر لذلك.
  • زيادة البيانات: هذه تقنية تنظيم أخرى تقوم بإنشاء أمثلة تدريب جديدة من خلال تطبيق تحويلات على البيانات الموجودة. وهو يزيد من تنوع مجموعة البيانات، في حين أن تنعيم التسمية يعدل القيم المستهدفة نفسها. يمكنك العثور على أدلة لزيادة بيانات YOLO في وثائق Ultralytics.
  • التسرب: تقوم هذه الطريقة بإلغاء تنشيط جزء من الخلايا العصبية بشكل عشوائي خلال كل خطوة تدريب لمنع عمليات التكيف المشتركة المعقدة. وهي تُعدِّل بنية النموذج أثناء التدريب، بينما تُعدِّل عملية تنعيم التسمية حساب الخسارة. يمكن العثور على نظرة أعمق على التسرب في مقالة GeeksforGeeks حول هذا الموضوع.
  • تقطير المعرفة: في هذه التقنية، يتم تدريب نموذج "طالب" أصغر باستخدام التسميات اللينة التي ينتجها نموذج "معلم" أكبر مدرب مسبقًا. في حين أنه يستخدم أيضًا تسميات ناعمة، إلا أن مصدر هذه التسميات هو تنبؤات نموذج آخر، وليس مجرد إرشادات بسيطة مطبقة على تسميات الحقيقة الأساسية كما هو الحال في تنعيم التسمية. توفر الورقة البحثية الأصلية " تقطير المعرفة في الشبكة العصبية " فهماً أساسياً لهذا المفهوم.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون ونمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة