Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

التعلم بالإشراف الذاتي (Self-Supervised Learning)

اكتشف كيف يلغي التعلم الذاتي الحاجة إلى التصنيف اليدوي. تعرف على طرق SSL التوليدية والتباينية لتحسين Ultralytics .

التعلم الذاتي (SSL) هو نموذج للتعلم الآلي حيث يتعلم النظام فهم البيانات من خلال توليد إشارات إشرافية خاصة به من البيانات نفسها، بدلاً من الاعتماد على تسميات خارجية مقدمة من البشر. في التعلم التعلم الخاضع للإشراف، تتطلب النماذج كميات هائلة من البيانات المُعلّقة يدويًا — مثل الصور المُصنّفة بـ "قطة" أو "كلب" — والتي قد يكون إنتاجها مكلفًا ويستغرق وقتًا طويلاً. يتجاوز SSL هذا العائق عن طريق إنشاء "مهام ذريعة" حيث يجب على النموذج توقع الأجزاء المخفية أو المفقودة من بيانات الإدخال، مما يعلمه بشكل فعال البنية الأساسية والميزات اللازمة للمهام المعقدة مثل الكشف عن الكائنات و التصنيف.

الآليات الأساسية للتعلم الذاتي

الفكرة الأساسية وراء SSL هي إخفاء أو حجب جزء من البيانات وإجبار الشبكة العصبية (NN) إعادة بنائها أو توقع العلاقة بين وجهات النظر المختلفة لنفس البيانات. تخلق هذه العملية تمثيلات غنية للأغراض العامة يمكن ضبطها لاحقًا لتطبيقات محددة في المراحل اللاحقة.

هناك نهجان أساسيان في SSL:

  • الطرق التوليدية: يتعلم النموذج توليد وحدات بكسل أو كلمات لملء الفراغات. مثال كلاسيكي في معالجة اللغة الطبيعية (NLP) هو توقع الكلمة التالية في الجملة. في الرؤية الحاسوبية، تقنيات مثل التشفير التلقائي المقنع (MAE) تخفي أجزاء عشوائية من الصورة وتكلف النموذج بمهمة إعادة بناء البكسلات المفقودة، مما يجبره على "فهم" السياق البصري .
  • التعلم التبايني: تعلم هذه الطريقة النموذج التمييز بين نقاط البيانات المتشابهة والمختلفة. من خلال تطبيق تقنيات زيادة البيانات —مثل الاقتصاص أو تغيير الألوان أو الدوران—على الصورة، يتعلم النموذج أن هذه الإصدارات المعدلة تمثل نفس الكائن (الأزواج الإيجابية) بينما يعامل الصور الأخرى ككائنات مختلفة (الأزواج السلبية). تستخدم أطر العمل الشائعة مثل SimCLR بشكل كبير على هذا المبدأ.

تطبيقات واقعية

أصبح التعلم الذاتي حجر الزاوية لبناء نماذج أساسية في مختلف المجالات. إن قدرته على الاستفادة من كميات هائلة من البيانات غير المصنفة تجعله قابلاً للتطوير بدرجة كبيرة.

  • التصوير الطبي: الحصول على فحوصات طبية مصنفة من قبل خبراء أمر صعب ومكلف. تسمح SSL للنماذج بالتدريب المسبق على آلاف الصور الشعاعية أو فحوصات التصوير بالرنين المغناطيسي غير المصنفة لتعلم السمات التشريحية العامة. يمكن بعد ذلك ضبط هذا النموذج المدرب مسبقًا بعدد قليل من الأمثلة المصنفة لتحقيق دقة عالية في الكشف عن الأورام أو تشخيص المرض.
  • القيادة الذاتية: تولد السيارات ذاتية القيادة تيرابايتات من بيانات الفيديو يوميًا. تتيح SSL لهذه الأنظمة تعلم الديناميكيات الزمنية والفهم المكاني من لقطات الفيديو الخام دون الحاجة إلى التعليق على كل إطار على حدة . وهذا يساعد على تحسين الكشف عن حارات السير وتجنب العوائق من خلال توقع الإطارات المستقبلية أو حركة الأجسام.

التمييز بين SSL والمصطلحات ذات الصلة

من المهم التمييز بين SSL و التعلم غير الخاضع للإشراف. في حين أن كلا الطريقتين تستخدمان بيانات غير مصنفة، فإن التعلم غير الخاضع للإشراف يركز عادةً على إيجاد أنماط أو تجمعات (تجميع) خفية دون مهمة تنبؤية محددة. على العكس من ذلك، فإن SSL يصوغ عملية التعلم كمهمة خاضعة للإشراف حيث يتم إنشاء التصنيفات تلقائيًا من بنية البيانات نفسها. بالإضافة إلى ذلك، التعلم شبه الخاضع للإشراف كمية صغيرة من البيانات المصنفة مع كمية كبيرة من البيانات غير المصنفة، بينما يقوم التعلم غير الخاضع للإشراف البحت بإنشاء تصنيفاته الخاصة بالكامل من مجموعة البيانات غير المصنفة قبل إجراء أي تعديل دقيق.

استخدام الأوزان المدربة مسبقًا في Ultralytics

في نظام Ultralytics ، نماذج مثل YOLO26 تستفيد بشكل كبير من استراتيجيات التدريب المتقدمة التي غالبًا ما تتضمن مبادئ مشابهة لـ SSL خلال مرحلة ما قبل التدريب على مجموعات البيانات الضخمة مثل ImageNet أو COCO. وهذا يضمن أن تكون أدوات استخراج الميزات قوية بالفعل عندما ينشر المستخدمون نموذجًا لمهمة معينة.

يمكن للمستخدمين الاستفادة من هذه التمثيلات القوية المدربة مسبقًا لضبط النماذج على مجموعات البيانات المخصصة الخاصة بهم باستخدام منصة Ultralytics .

فيما يلي مثال موجز لكيفية تحميل نموذج YOLO26 المدرب مسبقًا والبدء في ضبطه على مجموعة بيانات جديدة، مع الاستفادة من الميزات التي تم تعلمها أثناء التدريب الأولي على نطاق واسع:

from ultralytics import YOLO

# Load a pre-trained YOLO26 model (weights learned from large-scale data)
model = YOLO("yolo26n.pt")

# Fine-tune the model on a specific dataset (e.g., COCO8)
# This leverages the robust feature representations learned during pre-training
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

مستقبل SSL

كما هو الحال بالنسبة للباحثين في المختبرات الكبرى مثل Meta AI و Google يواصلون تحسين هذه التقنيات، تقوم SSL بتوسيع حدود ما هو ممكن في الذكاء الاصطناعي التوليدي ورؤية الكمبيوتر. من خلال تقليل الاعتماد على البيانات المصنفة، تعمل SSL على إتاحة الوصول إلى الذكاء الاصطناعي عالي الأداء، مما يسمح للفرق الصغيرة ببناء نماذج متطورة لتطبيقات متخصصة مثل حماية الحياة البرية أو التفتيش الصناعي.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن