Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

تنعيم العلامات

عزز دقة ومتانة نموذج الذكاء الاصطناعي باستخدام تسوية الملصقات - وهي تقنية مُثبتة لتحسين التعميم وتقليل الثقة المفرطة.

تجانس التسمية هي تقنية تنظيم تُستخدم أثناء تدريب نماذج التعلّم الآلي لمنع الشبكة العصبية من أن تصبح الشبكة العصبية من الثقة المفرطة في تنبؤاتها. من خلال تعديل التسميات المستهدفة بشكل طفيف، تشجع هذه الطريقة تشجع النموذج على إنتاج توزيعات احتمالية أقل تطرفًا، مما يؤدي في النهاية إلى تعميم أفضل تعميم أفضل وتحسين الأداء على البيانات غير المرئية. تخفف بشكل فعال من المشكلة الشائعة المتمثلة في الشائعة، حيث يقوم النموذج بحفظ بيانات التدريب بيانات التدريب بدلاً من تعلم الأنماط الأساسية اللازمة للتنبؤات الدقيقة في سيناريوهات العالم الحقيقي.

آليات تنعيم الملصقات

في مهام التعلم القياسية الخاضعة للإشراف، مثل تصنيف الصور، عادةً ما يتم تدريب النماذج باستخدام أهداف "صلبة". هذه الأهداف هي عبارة عن متجهات حيث يتم تعيين احتمالية 1.0 (100%) للفئة الصحيحة واحتمالية 0.0 لجميع الفئات غير الصحيحة. بينما يبدو هذا بديهيًا، إلا أنه يجبر دالة الخسارة دالة الخسارة - غالباً ما تكونخسارة عبر الانتروبيا - على دفع مخرجات مخرجات طبقة اللوغاريتمات إلى ما لا نهاية لتحقيق لتحقيق 1.0 بالضبط. ينتج عن هذا السلوك نموذجٌ واثقٌ بشكل مفرط، حتى عندما يكون خاطئاً، و يقلل من قدرته على التكيف مع المدخلات الجديدة.

يستبدل تنعيم التسمية هذه الأهداف الصلبة بأهداف "لينة". بدلًا من تعيين 1.0 للأرضية الحقيقة، تقوم هذه التقنية بتعيين قيمة أقل قليلاً، مثل 0.9. كتلة الاحتمالات المتبقية (على سبيل المثال، 0.1) هي موزعة بشكل منتظم عبر الفئات غير الصحيحة. هذا التحوّل الدقيق يمنع دالة التنشيط، عادةً Softmax، من التشبع. للحصول على فهم نظري أعمق فهم أعمق، تقدم الورقة البحثية"إعادة التفكير في بنية الاستهلال للرؤية الحاسوبية" رؤى أساسية حول كيفية استقرار هذه الآلية في التدريب.

تطبيق تجانس التسمية مع Ultralytics

تجعل أطر الرؤية الحاسوبية الحديثة من السهل تطبيق هذه التقنية. عند استخدام نموذجUltralytics YOLO11 يمكنك تمكين تجانس التسمية مباشرةً ضمن وسيطات التدريب. هذا مفيد بشكل خاص ل مهام التصنيف حيث قد تحتوي مجموعات البيانات على غموض.

يوضح المثال التالي كيفية تدريب نموذج مع تطبيق تجانس التسمية:

from ultralytics import YOLO

# Load the YOLO11 classification model
model = YOLO("yolo11n-cls.pt")

# Train on a dataset with label smoothing set to 0.1
# This distributes 10% of the probability mass to incorrect classes
model.train(data="mnist", epochs=5, label_smoothing=0.1)

الفوائد في معايرة النموذج ومتانته

تتمثل إحدى المزايا الأساسية لتنعيم التسمية في تحسين معايرة النموذج. فالنموذج المُعاير جيداً ينتج احتمالات متوقعة تعكس بشكل أساسي الاحتمال الحقيقي للصحة. على سبيل المثال، إذا كان النموذج يتنبأ بفئة بنسبة 70% من الثقة، فيجب أن يكون صحيحًا بنسبة 70% من الوقت. غالبًا ما تؤدي التسميات الصعبة إلى نماذج غير مُعايرة تتنبأ بثقة 99% بغض النظر عن عدم اليقين الفعلي.

علاوةً على ذلك، يزيد تجانس التسمية من المتانة ضد البيانات المشوشة. في مجموعات البيانات الضخمة مثل ImageNetقد تكون بعض التسميات غير صحيحة أو غامضة. من خلال عدم إجبار النموذج على التقارب إلى 1.0 بالضبط، تصبح الشبكة أكثر تسامحًا مع الأمثلة العرضية ذات التسميات الخاطئة العرضية، مما يمنع الشبكة العصبية من تعلم أنماط خاطئة بعمق.

تطبيقات واقعية

يتم اعتماد استراتيجية التنظيم هذه على نطاق واسع في مختلف مجالات الذكاء الاصطناعي لتعزيز الموثوقية.

  • تحليل الصور الطبية: في حلول الذكاء الاصطناعي للرعاية الصحية، فإن عدم اليقين متأصل. قد يُظهر الفحص ملامح الورم غير نهائية. يساعد تجانس التسمية نماذج تحليل الصور الطبية على تجنب إجراء التنبؤات الإيجابية الخاطئة الواثقة بشكل خطير، ومساعدة أخصائيي الأشعة من خلال توفير درجات احتمالية أكثر دقة أكثر دقة بدلاً من اليقين الثنائي.
  • معالجة اللغات الطبيعية (NLP): في مهام مثل الترجمة الآلية، يمكن لكلمات متعددة في كثير من الأحيان بمثابة ترجمات صحيحة لكلمة مصدر واحدة. يعترف تجانس التسمية بهذا الغموض من خلال منع النموذج النموذج من تعيين احتمالية صفرية للمرادفات الصحيحة، وهو مفهوم بالغ الأهمية في المحولات و نماذج اللغات الكبيرة.

مقارنة مع المفاهيم ذات الصلة

من المفيد التمييز بين تجانس التسمية والتقنيات الأخرى المستخدمة لتحسين أداء النموذج.

  • مقابل تعزيز البيانات: في حين أن تُعدّل زيادة البيانات البيانات المدخلة (على سبيل المثال، تدوير الصور أو قلبها) لزيادة التنوع، فإن تجانس التسميات يعدل التسميات المستهدفة. كلاهما يمكن استخدامهما في آنٍ واحد لتدريب نماذج قوية مثل YOLO26، والذي يهدف إلى تحقيق دقة وكفاءة عالية.
  • مقابل تقطير المعرفة: في تقطير المعرفة، يتعلم نموذج الطالب يتعلم من التنبؤات "اللينة" لنموذج المعلم. على عكس تنعيم التسمية، حيث تكون الأهداف اللينة موحدة واستدلالية، يستخدم التقطير الاحتمالات المستفادة التي تحتوي على معلومات حول العلاقات بين الفئات (على سبيل المثال، "الكلب" يشبه "القطة" أكثر من "السيارة").
  • مقابل الانقطاع عن الدراسة تقوم طبقة التسرب تقوم طبقة التسرب بإلغاء تنشيط الخلايا العصبية بشكل عشوائي أثناء أثناء التدريب لمنع التكيف المشترك. هذا يغير بنية الشبكة ديناميكيًا، في حين أن تجانس التسمية يغير هدف التحسين. يمكن العثور على مزيد من التفاصيل حول التسرب في هذه مجلة أبحاث تعلم الآلة.

من خلال دمج تجانس الملصقات في خط التدريب الخاص بك، فإنك تضمن أن تظل نماذجك قابلة للتكيف والمعايرة ومعايرتها، وهو أمر ضروري لنجاح النشر الناجح للنماذج في بيئات الإنتاج في بيئات الإنتاج.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن