مسرد المصطلحات

التعلم الذاتي الخاضع للإشراف الذاتي

اكتشف كيف يستفيد التعلُّم الخاضع للإشراف الذاتي من البيانات غير المُسمَّاة من أجل التدريب الفعّال، مما يُحدث تحولاً في الذكاء الاصطناعي في مجال الرؤية الحاسوبية والبرمجة اللغوية العصبية وغيرها.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

التعلُّم الخاضع للإشراف الذاتي (SSL) هو نهج للتعلُّم الآلي (ML) يُمكِّن النماذج من التعلُّم من كميات هائلة من البيانات غير المُسمَّاة. وعلى عكس التعلّم الخاضع للإشراف، والذي يعتمد بشكل كبير على البيانات المصنفة بدقة، فإن التعلم الخاضع للإشراف الذاتي يقوم ببراعة بإنشاء إشاراته الإشرافية الخاصة به مباشرةً من بيانات الإدخال نفسها. وهذا يجعلها ذات قيمة استثنائية في مجالات مثل الرؤية الحاسوبية (CV) ومعالجة اللغات الطبيعية (NLP)، حيث تكون البيانات غير الموسومة وفيرة، ولكن تكلفة وجهد وضع العلامات اليدوية(شرح البيانات) قد تكون باهظة.

كيف يعمل التعلّم الخاضع للإشراف الذاتي

تنطوي الآلية الأساسية وراء SSL على تصميم "مهمة ذريعة". وهي مهمة إضافية ذاتية الإنشاء حيث يجب على النموذج أن يتنبأ بخصائص معينة للبيانات التي تم إخفاؤها أو تغييرها عمداً. من خلال حل مهمة الذريعة هذه، يُجبر النموذج على تعلم الهياكل والتمثيلات الأساسية ذات المغزى(التضمينات) للبيانات دون تسميات مقدمة من الإنسان. يشار إلى مرحلة التدريب الأولية هذه عادةً باسم التدريب المسبق.

على سبيل المثال، في رؤية الكمبيوتر، قد تتضمن مهمة الذريعة:

  • التنبؤ بالموضع النسبي لرقع الصور المخلوطة.
  • تلوين صورة بتدرج الرمادي.
  • ملء الأجزاء المفقودة من الصورة (الطلاء الداخلي).
  • تعلُّم التمثيلات من خلال المقارنة بين وجهات النظر المعززة المختلفة لنفس الصورة، وهي تقنية مستخدمة في أساليب التعلم المتباين مثل SimCLR وMoCo.

في البرمجة اللغوية العصبية، من مهام الذريعة المعروفة نمذجة اللغة المقنعة، والتي تشتهر بها نماذج مثل BERT. هنا، يتعلم النموذج التنبؤ بالكلمات التي تم إخفاؤها (إخفاؤها) بشكل عشوائي داخل الجمل.

بعد التدريب المسبق على مجموعات بيانات كبيرة غير موسّمة، يلتقط النموذج تمثيلات غنية بالميزات. يمكن بعد ذلك تكييف هذا النموذج المُدرَّب مسبقًا لمهام محددة في المراحل النهائية - مثل اكتشاف الأجسام أو تصنيف الصور أو تحليل المشاعر - من خلالعملية تسمى الضبط الدقيق. وعادةً ما يتطلب الضبط الدقيق كمية أقل بكثير من البيانات المصنفة مقارنةً بتدريب نموذج من الصفر، مما يجعل من SSL عامل تمكين رئيسي للتعلم الفعال للنقل الفعال.

SSL مقابل نماذج التعلم الأخرى

من الضروري التفريق بين SSL ونماذج التعلم الآلي ذات الصلة:

  • التعلّم تحت الإشراف: يعتمد كليًا على بيانات موسومة، حيث يتم إقران كل مدخلات بمخرجات صحيحة. وعلى العكس من ذلك، يقوم نظام SSL بتوليد تسمياته من البيانات نفسها.
  • التعلّم غير الخاضع للإشراف: يهدف إلى العثور على أنماط (مثل التجميع) أو تقليل الأبعاد في البيانات غير المسماة دون مهام ذريعة محددة مسبقًا. بينما يستخدم التعلّم غير الخاضع للإشراف بيانات غير مسماة مثل التعلّم غير الخاضع للإشراف، إلا أنه يختلف عنه من خلال إنشاء إشارات إشرافية صريحة من خلال مهام الذريعة لتوجيه تعلّم التمثيل.
  • التعلّم شبه الخاضع للإشراف: يستخدم مزيجًا من كمية صغيرة من البيانات المصنفة وكمية كبيرة من البيانات غير المصنفة. وغالبًا ما يكون التدريب المسبق على SSL خطوة أولية قبل الضبط الدقيق شبه الخاضع للإشراف.

التطبيقات الواقعية

تتمتع SSL بقدرات الذكاء الاصطناعي (AI) المتقدمة بشكل كبير:

  1. تطوير نماذج الرؤية الحاسوبية: يسمح التدريب المسبق على SSL لنماذج مثل Ultralytics YOLO11 أن تتعلم ميزات بصرية قوية من مجموعات بيانات الصور الضخمة غير المسماة قبل ضبطها لمهام مثل اكتشاف الأجسام في المركبات ذاتية القيادة أو تحليل الصور الطبية. غالبًا ما يؤدي استخدام الأوزان المدربة مسبقًا المستمدة من SSL إلى أداء أفضل وتقارب أسرع أثناء تدريب النموذج.
  2. تشغيل نماذج اللغات الكبيرة (LLMs): تعتمد النماذج التأسيسية مثل GPT-4 و BERT اعتمادًا كبيرًا على مهام ما قبل السياق اللغوي (مثل نمذجة اللغة المقنعة) خلال مرحلة ما قبل التدريب على مجموعة نصوص ضخمة. وهذا يُمكّنها من فهم بنية اللغة وقواعدها اللغوية وسياقها، مما يُمكّنها من تشغيل تطبيقات تتراوح بين روبوتات الدردشة الآلية المتطورة والترجمة الآلية وتلخيص النصوص.

تقلل SSL بشكل كبير من الاعتماد على مجموعات البيانات الموسومة باهظة الثمن، مما يجعل تطوير نماذج الذكاء الاصطناعي القوية أكثر ديمقراطية. أدوات مثل PyTorch و TensorFlowإلى جانب منصات مثل Ultralytics HUB، توفر بيئات للاستفادة من تقنيات SSL لبناء ونشر حلول الذكاء الاصطناعي المتطورة.

قراءة الكل