Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

التعلم شبه الإشرافي

اكتشف كيف يجمع التعلم شبه الخاضع للإشراف بين البيانات المصنفة وغير المصنفة لتحسين نماذج الذكاء الاصطناعي، وتقليل تكاليف التصنيف، وتعزيز الدقة.

التعلُّم شبه الخاضع للإشراف (SSL) هو نموذج قوي في مجال في التعلم الآلي (ML) الذي يسد الفجوة بين التعلم تحت الإشراف الكامل و والتعلم غير الخاضع للإشراف. بينما تتطلب الأساليب يتطلب مجموعات بيانات مشروحة بالكامل، بينما تعمل الأساليب غير الخاضعة للإشراف بشكل كامل دون تسميات، تعمل SSL من خلال من خلال الاستفادة من كمية صغيرة من البيانات الموسومة إلى جانب مجموعة أكبر بكثير من البيانات غير الموسومة. في العديد من سيناريوهات العالم الحقيقي يكون الحصول على البيانات الأولية رخيصًا نسبيًا، ولكن عملية تصنيف البيانات مكلفة، وتستغرق وقتًا طويلاً، وتتطلب وتتطلب خبرة بشرية. يعالج SSL عنق الزجاجة هذا العائق من خلال استخدام الأمثلة المحدودة المصنفة لتوجيه عملية التعلم مما يسمح للنموذج باستخراج البنية والأنماط من الأجزاء الشاسعة غير الموسومة، وبالتالي تحسين دقة النموذج الإجمالية والتعميم.

كيفية عمل التعلّم شبه الموجّه

تتضمن الآلية الأساسية وراء SSL نشر المعلومات من البيانات الموسومة إلى البيانات غير الموسومة. تبدأ العملية تبدأ العملية عمومًا بتدريب نموذج أولي على مجموعة البيانات الصغيرة الموسومة. ثم يُستخدم هذا النموذج لاستنتاج التنبؤات على البيانات غير الموسومة. يتم التعامل مع التنبؤات الأكثر ثقة - غالبًا ما تسمى التسميات الزائفة - على أنها الحقيقة الأساسية الحقيقة، ويُعاد تدريب النموذج على مجموعة البيانات الموسّعة هذه. تسمح هذه الدورة التكرارية الشبكات العصبية بتعلم حدود القرار التي أكثر قوة من تلك المستفادة من البيانات المصنفة وحدها.

تتضمن التقنيات الشائعة المستخدمة في SSL ما يلي:

  • التسميات الزائفة: يُنشئ النموذج تسميات للبيانات غير المُسمّاة، وتُضاف تنبؤات عالية الثقة إلى بيانات التدريب. يُستخدم هذا غالبًا في مع عتبات الثقة.
  • انتظام الاتساق: تشجع هذه الطريقة النموذج على إنتاج نفس التنبؤ للصورة الأصلية للصورة الأصلية ونسخة مضطربة منها (على سبيل المثال، بعد تطبيق زيادة البيانات). إذا فهم النموذج الكائن، فإن قلب الصورة أو تدويرها قليلاً لا ينبغي أن يغير التصنيف. يمكنك قراءة المزيد عن مفاهيم تنظيم الاتساق في الأدبيات الأكاديمية.
  • الطرق القائمة على الرسم البياني: يتم تمثيل نقاط البيانات على شكل عقد في رسم بياني، حيث تعكس الحواف التشابه. تُنشر التسميات من العُقد الموسومة إلى جيرانها غير الموسومين، وهي تقنية غالبًا ما تتم مناقشتها في في أبحاث الشبكات العصبية البيانية (GNN).

تطبيقات واقعية

يعد التعلم شبه الخاضع للإشراف تحويليًا بشكل خاص في الصناعات التي تتوافر فيها البيانات بكثرة ولكن التعليقات التوضيحية المتخصصة نادرة. نادرة.

  1. تحليل الصور الطبية: في مجال الرعاية الصحية، توليد مجموعة بيانات موسومة لمهام مثل الكشف عن الأورام يتطلب من أخصائيي الأشعة الذين يتقاضون أجورًا عالية أن يقوموا يدويًا بتعليق صور الرنين المغناطيسي أو الأشعة المقطعية. باستخدام SSL، يمكن للباحثين تدريب نموذج على مجموعة صغيرة من الأشعة التي تم التحقق منها من قبل الأطباء ثم الاستفادة من آلاف من أرشيفات المستشفيات غير المشروحة لتحسين الأداء. وهذا يقلل التكاليف بشكل كبير مع الحفاظ على معايير تشخيصية عالية في الذكاء الاصطناعي في مجال الرعاية الصحية.
  2. التعرف على الكلام: تتطلب المساعدات الصوتية المتخصصة كميات هائلة من البيانات الصوتية. في حين أن فإن نسخ آلاف الساعات من الصوت أمر غير عملي، يمكن لشركات التكنولوجيا استخدام مجموعة صغيرة من الكلام المكتوب لتدريب نموذج أساسي. يتعلم هذا النموذج بعد ذلك من الفروق الدقيقة لملايين الساعات من الصوت غير المكتوب الموجود في بيانات الويب، مما يصقل قدرته على فهم اللهجات واللهجات المختلفة من خلال التعرف التلقائي على الكلام.

التفريق بين المفاهيم ذات الصلة

لفهم SSL بشكل كامل، من المفيد التمييز بينه وبين نماذج التعلم المماثلة:

  • التعلّم الخاضع للإشراف الذاتي التعلم الخاضع للإشراف الذاتي: على الرغم من أنهما يشتركان في الاختصار، إلا أنهما مختلفان. التعلُّم الخاضع للإشراف الذاتي ينشئ تسمياته الخاصة من البيانات (على سبيل المثال، التنبؤ بالكلمة التالية في جملة ما أو رقعة مفقودة في صورة ما) دون أي تسميات بشرية. لا يزال التعلّم شبه الخاضع للإشراف يعتمد على مجموعة أولية من التسميات التي يوفرها الإنسان لتوجيه العملية.
  • SSL مقابل التعلم النشط: في التعلّم النشط، يحدد النموذج نقاط البيانات الأكثر إرباكًا ويطلب صراحةً من الإنسان أن يصنفها هذه النقاط. على النقيض من ذلك، يحاول التعلم النشط حل البيانات غير المسمّاة تلقائيًا دون مقاطعة سير العمل من أجل من أجل المدخلات البشرية.
  • التعلُّم التحوّلي مقابل التعلُّم التحوّلي: يتضمّن تعلّم النقل أخذ أوزان النموذج من مهمة مصدر (مثل ImageNet) وضبطها على المهمة المستهدفة. يركز SSL على استخدام بيانات غير معرّفة من نفس التوزيع المستهدف لتحسين التعلم من البداية.

التنفيذ العملي

غالبًا ما يتضمن تنفيذ سير العمل شبه الخاضع للإشراف حلقة "المعلم-الطالب" أو التدريب التكراري. فيما يلي مثال مفاهيمي باستخدام ultralytics حزمة Python لتوضيح كيف يمكن للمرء أن يستنتج على على بيانات غير معرّفة لتوليد تنبؤات يمكن أن تكون بمثابة تسميات زائفة لمزيد من التدريب.

from ultralytics import YOLO

# Initialize the YOLO11 model (Teacher)
model = YOLO("yolo11n.pt")

# Train initially on a small, available labeled dataset
model.train(data="coco8.yaml", epochs=10)

# Run inference on a directory of unlabeled images to generate predictions
# These results can be filtered by confidence to create 'pseudo-labels'
results = model.predict(source="./unlabeled_data", save_txt=True, conf=0.8)

# The saved text files from prediction can now be combined with the original
# dataset to retrain a robust 'Student' model.

الأدوات والتوقعات المستقبلية

أطر التعلم العميق مثل PyTorch و TensorFlow اللبنات الأساسية اللازمة لتنفيذ حلقات SSL المخصصة ووظائف الخسارة. مع ازدياد حجم النماذج وكبر حجمها، أصبحت تقنيات مثل SSL ممارسة قياسية لزيادة كفاءة البيانات إلى أقصى حد.

تم تصميم منصة Ultralytics Platform القادمة لتبسيط عمليات سير العمل مثل هذه، مما يساعد الفرق على إدارة الانتقال من البيانات الخام إلى نشر النماذج من خلال تسهيل عملية تنظيم البيانات و وعمليات الشرح التلقائي. من خلال استخدام البيانات غير المصنفة بفعالية، يمكن للمؤسسات نشر حلول الذكاء الاصطناعي عالية الأداء مثل YOLO11 بشكل أسرع وبأسعار معقولة أكثر من الاعتماد على الأساليب الخاضعة للإشراف البحت.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن