يولو فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

التعلم بالإشراف الذاتي (Self-Supervised Learning)

اكتشف كيف يستفيد التعلم الذاتي الإشراف من البيانات غير المسماة للتدريب الفعال، مما يغير الذكاء الاصطناعي في رؤية الكمبيوتر ومعالجة اللغة الطبيعية والمزيد.

التعلم بالإشراف الذاتي (SSL) هو أسلوب من أساليب تعلم الآلة يسمح للنماذج بالتعلم من كميات هائلة من البيانات غير المسماة. بدلاً من الاعتماد على التصنيفات التي يقدمها الإنسان، يقوم SSL تلقائيًا بإنشاء تصنيفات من البيانات نفسها عن طريق إنشاء وحل "مهمة تمهيدية". تجبر هذه العملية النموذج على تعلم الأنماط والميزات الأساسية الهامة للبيانات، مثل القوام والأشكال في الصور أو الهياكل النحوية في النص. تخلق هذه الميزات المتعلمة أساسًا قويًا، مما يمكّن النموذج من الأداء الجيد بشكل استثنائي في المهام اللاحقة مع بيانات مصنفة أقل بكثير أثناء مرحلة الضبط الدقيق (fine-tuning). يسد SSL الفجوة بين التعلم الخاضع للإشراف (supervised learning) الكامل، والذي يستهلك الكثير من البيانات، و التعلم غير الخاضع للإشراف (unsupervised learning) البحت، والذي يمكن أن يكون أقل توجيهًا.

كيف يعمل التعلم بالإشراف الذاتي (Self-Supervised Learning)

الفكرة الأساسية وراء SSL هي مهمة ما قبل التدريب - وهي مشكلة تم إنشاؤها ذاتيًا يجب على النموذج حلها. يتم اشتقاق التسميات لهذه المهمة مباشرةً من بيانات الإدخال. من خلال حل مهمة ما قبل التدريب، تتعلم الشبكة العصبية تمثيلات قيمة، أو تضمينات، تلتقط الخصائص الأساسية للبيانات.

تشمل مهام ما قبل التدريب الشائعة في رؤية الكمبيوتر ما يلي:

  • توقع دوران الصورة: يتم عرض صورة تم تدويرها عشوائيًا (على سبيل المثال، بـ 0 أو 90 أو 180 أو 270 درجة) على النموذج ويجب عليه توقع زاوية الدوران. للقيام بذلك بشكل صحيح، يجب عليه التعرف على الاتجاه الأصلي للكائن.
  • ترميم الصور: يتم إخفاء جزء من الصورة أو إزالته، ويجب على النموذج التنبؤ بالرقعة المفقودة. هذا يشجع النموذج على التعرف على سياق وملمس الصور.
  • التعلم التبايني: يتم تعليم النموذج تقريب تمثيلات الصور المتشابهة (المُعززة) من بعضها البعض ودفع تمثيلات الصور المختلفة بعيدًا عن بعضها البعض. أطر العمل مثل SimCLR هي أمثلة شائعة لهذا النهج.

يؤدي هذا التدريب المسبق على البيانات غير المسماة إلى أوزان نموذج قوية يمكن استخدامها كنقطة انطلاق لمهام أكثر تحديدًا.

التعلّم شبه الموجّه (SSL) مقابل نماذج التعلّم الأخرى

من الضروري التمييز بين SSL ونماذج التعلم الآلي ذات الصلة:

  • التعلم الخاضع للإشراف: يعتمد كليًا على البيانات المصنفة، حيث يتم إقران كل مدخل بمخرج صحيح. وعلى العكس من ذلك، يقوم SSL بإنشاء تسمياته الخاصة من البيانات نفسها، مما يقلل بشكل كبير من الحاجة إلى تصنيف البيانات يدويًا.
  • التعلم غير الخاضع للإشراف: يهدف إلى إيجاد أنماط (مثل التجميع) أو تقليل الأبعاد في البيانات غير المسماة بدون مهام أولية محددة مسبقًا. بينما يستخدم SSL بيانات غير مسماة مثل التعلم غير الخاضع للإشراف، إلا أنه يختلف من خلال إنشاء إشارات إشرافية صريحة من خلال مهام أولية لتوجيه تعلم التمثيل.
  • التعلم شبه الخاضع للإشراف: يستخدم مزيجًا من كمية صغيرة من البيانات المصنفة وكمية كبيرة من البيانات غير المصنفة. غالبًا ما يكون التدريب المسبق لـ SSL خطوة أولية قبل الضبط الدقيق شبه الخاضع للإشراف.
  • التعلم النشط (Active Learning): يركز على الاختيار الذكي لنقاط البيانات الأكثر إفادة من مجموعة بيانات غير مصنفة ليتم تصنيفها بواسطة إنسان. بينما التعلم شبه المشرف (SSL) يتعلم من جميع البيانات غير المصنفة بدون تدخل بشري في الحلقة. يمكن أن تكون هاتان الطريقتان متكاملتين في سير عمل الذكاء الاصطناعي المرتكز على البيانات (data-centric AI workflow).

تطبيقات واقعية

لقد عزز SSL بشكل كبير قدرات الذكاء الاصطناعي (AI) في مختلف المجالات:

  1. تطوير نماذج رؤية الحاسوب: يسمح التدريب المسبق بتقنية SSL لنماذج مثل Ultralytics YOLO بتعلم ميزات بصرية قوية من مجموعات بيانات صور ضخمة غير مصنفة قبل ضبطها بدقة لمهام مثل اكتشاف الكائنات في المركبات ذاتية القيادة أو تحليل الصور الطبية. غالبًا ما يؤدي استخدام الأوزان المدربة مسبقًا المشتقة من SSL إلى أداء أفضل وتقارب أسرع أثناء تدريب النموذج.
  2. تشغيل نماذج اللغة الكبيرة (LLMs): تعتمد النماذج التأسيسية مثل GPT-4 و BERT بشكل كبير على مهام SSL النصية (مثل نمذجة اللغة المقنعة) خلال مرحلة ما قبل التدريب على كميات هائلة من النصوص. يتيح لهم ذلك فهم بنية اللغة وقواعدها وسياقها، مما يدعم التطبيقات التي تتراوح من برامج الدردشة (chatbots) المتطورة و الترجمة الآلية (machine translation) إلى تلخيص النصوص (text summarization).

يقلل SSL بشكل كبير من الاعتماد على مجموعات البيانات المصنفة باهظة الثمن، مما يضفي طابعًا ديمقراطيًا على تطوير نماذج الذكاء الاصطناعي القوية. توفر أدوات مثل PyTorch و TensorFlow، جنبًا إلى جنب مع منصات مثل Ultralytics HUB، بيئات للاستفادة من تقنيات SSL لبناء ونشر حلول الذكاء الاصطناعي المتطورة. يمكنك العثور على أحدث الأبحاث حول SSL في مؤتمرات الذكاء الاصطناعي الكبرى مثل NeurIPS و ICML.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة