استعدوا لـ YOLO Vision 2025!
25 سبتمبر، 2025
10:00 — 18:00 بتوقيت بريطانيا الصيفي
حدث هجين
مؤتمر Yolo Vision 2024
مسرد المصطلحات

التعلم شبه الإشرافي

اكتشف كيف يجمع التعلم شبه الخاضع للإشراف بين البيانات المصنفة وغير المصنفة لتحسين نماذج الذكاء الاصطناعي، وتقليل تكاليف التصنيف، وتعزيز الدقة.

التعلم شبه الخاضع للإشراف (SSL) هو أسلوب تعلم آلي (ML) يسد الفجوة بين التعلم الخاضع للإشراف و التعلم غير الخاضع للإشراف. إنه يستفيد من كمية صغيرة من البيانات المصنفة جنبًا إلى جنب مع كمية كبيرة من البيانات غير المصنفة لتحسين دقة التعلم. في العديد من السيناريوهات الواقعية، يكون الحصول على بيانات غير مصنفة غير مكلف، ولكن عملية تصنيف البيانات مكلفة وتستغرق وقتًا طويلاً. يعالج SSL هذا التحدي من خلال السماح للنماذج بالتعلم من المجموعة الواسعة من الأمثلة غير المصنفة، مسترشدة بالهيكل والمعلومات التي توفرها المجموعة المصنفة الأصغر. هذا النهج قوي بشكل خاص في التعلم العميق (DL)، حيث تتطلب النماذج مجموعات بيانات ضخمة لتحقيق أداء عالٍ.

كيفية عمل التعلّم شبه الموجّه

الفكرة الأساسية وراء SSL هي استخدام البيانات المسماة لبناء نموذج أولي، ثم استخدام هذا النموذج لعمل تنبؤات على البيانات غير المسماة. ثم يتم التعامل مع تنبؤات النموذج الأكثر ثقة على أنها "تسميات زائفة" وإضافتها إلى مجموعة التدريب. ثم يتم إعادة تدريب النموذج على هذا المزيج من التسميات الأصلية والتسميات الزائفة عالية الثقة. تتيح هذه العملية التكرارية للنموذج تعلم البنية الأساسية لمجموعة البيانات بأكملها، وليس فقط الجزء الصغير المسمى.

تشمل تقنيات SSL الشائعة ما يلي:

  • التسوية المنتظمة (Consistency Regularization): تفرض هذه الطريقة فكرة أن تنبؤات النموذج يجب أن تظل متسقة حتى عندما يتم تغيير بيانات الإدخال قليلاً. على سبيل المثال، يجب أن تعطي الصورة مع زيادة البيانات الطفيفة نفس التصنيف.
  • النماذج التوليدية: يمكن لتقنيات مثل شبكات الخصومة التوليدية (GANs) أن تتعلم إنشاء بيانات تشبه توزيع البيانات الحقيقي، مما يساعد على تحديد حدود القرار بين الفئات بشكل أفضل.
  • الطرق القائمة على الرسوم البيانية: تمثل هذه الطرق نقاط البيانات كعقد في رسم بياني وتنشر التصنيفات من العقد المصنفة إلى العقد غير المصنفة بناءً على قربها أو تشابهها. يمكن العثور على نظرة عامة فنية في الدراسات الاستقصائية الأكاديمية.

تطبيقات واقعية

يعتبر SSL فعالاً للغاية في المجالات التي يكون فيها وضع العلامات بمثابة عنق الزجاجة. ومن الأمثلة البارزة على ذلك:

  1. تحليل الصور الطبية: يتطلب تصنيف الفحوصات الطبية مثل التصوير بالرنين المغناطيسي أو التصوير المقطعي المحوسب للكشف عن الأورام وجود خبراء أشعة وهو مكلف للغاية. باستخدام SSL، يمكن تدريب نموذج على بضع مئات من صور الأشعة المصنفة ثم تنقيحها باستخدام آلاف الصور غير المصنفة من أرشيفات المستشفيات. يسمح ذلك بتطوير نماذج قوية لتصنيف الصور وتجزئتها بجهد يدوي أقل بكثير.
  2. تصنيف محتوى الويب والوثائق: يعد التصنيف اليدوي لمليارات صفحات الويب أو المقالات الإخبارية أو مراجعات العملاء أمرًا غير عملي. يمكن لـ SSL استخدام مجموعة صغيرة مصنفة يدويًا من المستندات لتدريب مصنف نصوص أولي. ثم يصنف النموذج المجموعة الضخمة من المستندات غير المسماة، باستخدام تنبؤاته الخاصة للتحسين بمرور الوقت لمهام مثل تحليل المشاعر أو تصنيف الموضوعات.

مقارنة مع نماذج التعلم الأخرى

من المهم التمييز بين SSL ومفاهيم الذكاء الاصطناعي (AI) ذات الصلة:

  • التعلم الخاضع للإشراف الذاتي (SSL): على الرغم من أنه يشترك في الاختصار، إلا أن التعلم الخاضع للإشراف الذاتي مختلف. إنه نوع من التعلّم غير الخاضع للإشراف حيث يتم إنشاء التسميات من البيانات نفسها من خلال مهام مسبقة (على سبيل المثال، التنبؤ بكلمة مقنعة في جملة ما). وهو لا يستخدم أي بيانات مصنفة يدويًا، بينما يتطلب التعلم شبه الخاضع للإشراف مجموعة بيانات صغيرة مصنفة بشكل صريح لتوجيه عملية تدريب النموذج.
  • التعلّم النشط: تهدف هذه التقنية أيضًا إلى تقليل تكاليف التسمية. ومع ذلك، بدلاً من استخدام جميع البيانات غير المُسمّاة، يقوم نموذج التعلّم النشط بالاستعلام بذكاء عن المُعلّق البشري لتسمية نقاط البيانات الأكثر إفادة. على النقيض من ذلك، عادةً ما يستخدم نموذج التعلّم النشط البيانات غير المُسمّاة دون تفاعل بشري مباشر أثناء التدريب.
  • نقل التعلم: يتضمن ذلك استخدام نموذج مُدرَّب مسبقًا على مجموعة بيانات كبيرة (مثل ImageNet) ثم ضبطه على مجموعة بيانات أصغر خاصة بمهمة محددة. بينما يستفيد كلاهما من المعرفة الموجودة، يتعلم تعلم SSL من البيانات غير المسماة للمهمة المستهدفة نفسها، بينما يستفيد التعلم التحويلي من المعرفة من مهمة مختلفة (وإن كانت ذات صلة في كثير من الأحيان).

الأدوات والتدريب

توفر العديد من أطر عمل التعلم العميق (DL) الحديثة، بما في ذلك PyTorch (موقع PyTorch الرسمي) و TensorFlow (موقع TensorFlow الرسمي)، وظائف أو يمكن تكييفها لتنفيذ خوارزميات SSL. توفر مكتبات مثل Scikit-learn بعض طرق SSL. تعمل منصات مثل Ultralytics HUB على تبسيط العملية من خلال تسهيل إدارة مجموعات البيانات التي قد تحتوي على خليط من البيانات المصنفة وغير المصنفة، مما يبسط تدريب و نشر النماذج المصممة للاستفادة من هياكل البيانات هذه. يستمر البحث في SSL في التطور، مع تقديم المساهمات غالبًا في مؤتمرات الذكاء الاصطناعي الكبرى مثل NeurIPS و ICML.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة