اكتشف كيف يستفيد التعلُّم الخاضع للإشراف الذاتي من البيانات غير المُسمَّاة من أجل التدريب الفعّال، مما يُحدث تحولاً في الذكاء الاصطناعي في مجال الرؤية الحاسوبية والبرمجة اللغوية العصبية وغيرها.
التعلُّم الخاضع للإشراف الذاتي (SSL) هو نهج للتعلُّم الآلي (ML) يُمكِّن النماذج من التعلُّم من كميات هائلة من البيانات غير المُسمَّاة. وعلى عكس التعلّم الخاضع للإشراف، والذي يعتمد بشكل كبير على البيانات المصنفة بدقة، فإن التعلم الخاضع للإشراف الذاتي يقوم ببراعة بإنشاء إشاراته الإشرافية الخاصة به مباشرةً من بيانات الإدخال نفسها. وهذا يجعلها ذات قيمة استثنائية في مجالات مثل الرؤية الحاسوبية (CV) ومعالجة اللغات الطبيعية (NLP)، حيث تكون البيانات غير الموسومة وفيرة، ولكن تكلفة وجهد وضع العلامات اليدوية(شرح البيانات) قد تكون باهظة.
تنطوي الآلية الأساسية وراء SSL على تصميم "مهمة ذريعة". وهي مهمة إضافية ذاتية الإنشاء حيث يجب على النموذج أن يتنبأ بخصائص معينة للبيانات التي تم إخفاؤها أو تغييرها عمداً. من خلال حل مهمة الذريعة هذه، يُجبر النموذج على تعلم الهياكل والتمثيلات الأساسية ذات المغزى(التضمينات) للبيانات دون تسميات مقدمة من الإنسان. يشار إلى مرحلة التدريب الأولية هذه عادةً باسم التدريب المسبق.
على سبيل المثال، في رؤية الكمبيوتر، قد تتضمن مهمة الذريعة:
في البرمجة اللغوية العصبية، من مهام الذريعة المعروفة نمذجة اللغة المقنعة، والتي تشتهر بها نماذج مثل BERT. هنا، يتعلم النموذج التنبؤ بالكلمات التي تم إخفاؤها (إخفاؤها) بشكل عشوائي داخل الجمل.
بعد التدريب المسبق على مجموعات بيانات كبيرة غير موسّمة، يلتقط النموذج تمثيلات غنية بالميزات. يمكن بعد ذلك تكييف هذا النموذج المُدرَّب مسبقًا لمهام محددة في المراحل النهائية - مثل اكتشاف الأجسام أو تصنيف الصور أو تحليل المشاعر - من خلالعملية تسمى الضبط الدقيق. وعادةً ما يتطلب الضبط الدقيق كمية أقل بكثير من البيانات المصنفة مقارنةً بتدريب نموذج من الصفر، مما يجعل من SSL عامل تمكين رئيسي للتعلم الفعال للنقل الفعال.
من الضروري التفريق بين SSL ونماذج التعلم الآلي ذات الصلة:
تتمتع SSL بقدرات الذكاء الاصطناعي (AI) المتقدمة بشكل كبير:
تقلل SSL بشكل كبير من الاعتماد على مجموعات البيانات الموسومة باهظة الثمن، مما يجعل تطوير نماذج الذكاء الاصطناعي القوية أكثر ديمقراطية. أدوات مثل PyTorch و TensorFlowإلى جانب منصات مثل Ultralytics HUB، توفر بيئات للاستفادة من تقنيات SSL لبناء ونشر حلول الذكاء الاصطناعي المتطورة.