التعلم الذاتي الخاضع للإشراف الذاتي
اكتشف كيف يستفيد التعلُّم الخاضع للإشراف الذاتي من البيانات غير المُسمَّاة من أجل التدريب الفعّال، مما يُحدث تحولاً في الذكاء الاصطناعي في مجال الرؤية الحاسوبية والبرمجة اللغوية العصبية وغيرها.
التعلم الذاتي الخاضع للإشراف الذاتي (SSL) هو تقنية تعلم آلي تسمح للنماذج بالتعلم من كميات هائلة من البيانات غير المسماة. بدلاً من الاعتماد على التسميات التي يوفرها الإنسان، تقوم SSL تلقائيًا بإنشاء تسميات من البيانات نفسها عن طريق إنشاء وحل "مهمة مسبقة". تجبر هذه العملية النموذج على تعلم أنماط وميزات أساسية ذات مغزى للبيانات، مثل القوام والأشكال في الصور أو الهياكل النحوية في النص. تخلق هذه الميزات المستفادة أساسًا قويًا، مما يمكّن النموذج من الأداء الجيد بشكل استثنائي في المهام النهائية مع بيانات أقل بكثير من البيانات المصنفة خلال مرحلة الضبط الدقيق. تعمل SSL على سد الفجوة بين التعلّم الخاضع للإشراف الكامل، وهو تعلّم متعطش للبيانات، والتعلّم غير الخاضع للإشراف البحت، والذي يمكن أن يكون أقل توجيهاً.
كيف يعمل التعلّم الخاضع للإشراف الذاتي
إن الفكرة الأساسية وراء SSL هي مهمة الذريعة - وهي مشكلة تم إنشاؤها ذاتيًا ويجب على النموذج حلها. يتم اشتقاق تسميات هذه المهمة مباشرةً من بيانات الإدخال. ومن خلال حل مهمة الذريعة، تتعلم الشبكة العصبية تمثيلات قيّمة أو تضمينات تلتقط الخصائص الأساسية للبيانات.
تتضمن مهام الذريعة الشائعة في الرؤية الحاسوبية ما يلي:
- توقع دوران الصورة: يُعرض على النموذج صورة تم تدويرها عشوائيًا (على سبيل المثال، بزاوية 0 أو 90 أو 180 أو 270 درجة) ويجب أن يتنبأ بزاوية الدوران. وللقيام بذلك بشكل صحيح، يجب أن يتعرف النموذج على الاتجاه الأصلي للجسم.
- طمس الصورة: يتم إخفاء جزء من الصورة أو إزالته، ويجب أن يتنبأ النموذج بالرقعة المفقودة. هذا يشجع النموذج على التعرف على سياق الصور ونسيجها.
- التعلم المتباين: يتم تعليم النموذج لتقريب تمثيلات الصور المتشابهة (المعززة) من بعضها البعض وإبعاد تمثيلات الصور المختلفة عن بعضها البعض. تعد أطر العمل مثل SimCLR أمثلة شائعة لهذا النهج.
ينتج عن هذا التدريب المسبق على البيانات غير المُسمّاة أوزان نموذجية قوية يمكن استخدامها كنقطة بداية لمهام أكثر تحديدًا.
SSL مقابل نماذج التعلم الأخرى
من الضروري التفريق بين SSL ونماذج التعلم الآلي ذات الصلة:
- التعلّم تحت الإشراف: يعتمد كليًا على البيانات الموسومة، حيث يتم إقران كل مدخلات بمخرجات صحيحة. وعلى العكس من ذلك، تقوم SSL بإنشاء تسمياتها الخاصة بها من البيانات نفسها، مما يقلل بشكل كبير من الحاجة إلى وضع العلامات اليدوية للبيانات.
- التعلّم غير الخاضع للإشراف: يهدف إلى العثور على أنماط (مثل التجميع) أو تقليل الأبعاد في البيانات غير المسماة دون مهام ذريعة محددة مسبقًا. بينما يستخدم التعلّم غير الخاضع للإشراف بيانات غير مسماة مثل التعلّم غير الخاضع للإشراف، إلا أنه يختلف عنه من خلال إنشاء إشارات إشرافية صريحة من خلال مهام الذريعة لتوجيه تعلّم التمثيل.
- التعلّم شبه الخاضع للإشراف: يستخدم مزيجًا من كمية صغيرة من البيانات المصنفة وكمية كبيرة من البيانات غير المصنفة. وغالبًا ما يكون التدريب المسبق على SSL خطوة أولية قبل الضبط الدقيق شبه الخاضع للإشراف.
- التعلّم النشط: يركز على اختيار نقاط البيانات الأكثر إفادة بذكاء من مجموعة بيانات غير مصنفة ليتم تصنيفها من قبل الإنسان. يتعلم SSL من جميع البيانات غير المصنفة دون تدخل بشري في الحلقة. يمكن أن تكون هاتان الطريقتان متكاملتين في سير عمل الذكاء الاصطناعي المرتكز على البيانات.
التطبيقات الواقعية
تتمتع SSL بقدرات ذكاء اصطناعي (AI) متقدمة بشكل كبير في مختلف المجالات:
- تطوير نماذج الرؤية الحاسوبية: يسمح التدريب المسبق على SSL لنماذج مثل Ultralytics YOLO بتعلم ميزات بصرية قوية من مجموعات بيانات الصور الضخمة غير المسماة قبل ضبطها لمهام مثل اكتشاف الأجسام في المركبات ذاتية القيادة أو تحليل الصور الطبية. غالبًا ما يؤدي استخدام الأوزان المدربة مسبقًا المستمدة من SSL إلى أداء أفضل وتقارب أسرع أثناء تدريب النموذج.
- تشغيل نماذج اللغات الكبيرة (LLMs): تعتمد النماذج التأسيسية مثل GPT-4 و BERT اعتمادًا كبيرًا على مهام ما قبل السياق اللغوي (مثل نمذجة اللغة المقنعة) خلال مرحلة التدريب المسبق على مجموعة نصوص ضخمة. وهذا يُمكّنها من فهم بنية اللغة وقواعدها اللغوية وسياقها، مما يُمكّنها من تشغيل تطبيقات تتراوح بين روبوتات الدردشة الآلية المتطورة والترجمة الآلية وتلخيص النصوص.
تقلل SSL إلى حد كبير من الاعتماد على مجموعات البيانات الموسومة باهظة الثمن، مما يجعل تطوير نماذج الذكاء الاصطناعي القوية أمراً ديمقراطياً. توفر أدوات مثل PyTorch و TensorFlow، إلى جانب منصات مثل Ultralytics HUB، بيئات للاستفادة من تقنيات SSL لبناء ونشر حلول الذكاء الاصطناعي المتطورة. يمكنك العثور على أحدث الأبحاث حول SSL في أفضل مؤتمرات الذكاء الاصطناعي مثل NeurIPS وICML.