اكتشف كيف يجمع التعلم شبه الخاضع للإشراف بين البيانات المصنفة وغير المصنفة لتحسين نماذج الذكاء الاصطناعي، وتقليل تكاليف التصنيف، وتعزيز الدقة.
التعلُّم شبه الخاضع للإشراف (SSL) هو نموذج قوي في مجال في التعلم الآلي (ML) الذي يسد الفجوة بين التعلم تحت الإشراف الكامل و والتعلم غير الخاضع للإشراف. بينما تتطلب الأساليب يتطلب مجموعات بيانات مشروحة بالكامل، بينما تعمل الأساليب غير الخاضعة للإشراف بشكل كامل دون تسميات، تعمل SSL من خلال من خلال الاستفادة من كمية صغيرة من البيانات الموسومة إلى جانب مجموعة أكبر بكثير من البيانات غير الموسومة. في العديد من سيناريوهات العالم الحقيقي يكون الحصول على البيانات الأولية رخيصًا نسبيًا، ولكن عملية تصنيف البيانات مكلفة، وتستغرق وقتًا طويلاً، وتتطلب وتتطلب خبرة بشرية. يعالج SSL عنق الزجاجة هذا العائق من خلال استخدام الأمثلة المحدودة المصنفة لتوجيه عملية التعلم مما يسمح للنموذج باستخراج البنية والأنماط من الأجزاء الشاسعة غير الموسومة، وبالتالي تحسين دقة النموذج الإجمالية والتعميم.
تتضمن الآلية الأساسية وراء SSL نشر المعلومات من البيانات الموسومة إلى البيانات غير الموسومة. تبدأ العملية تبدأ العملية عمومًا بتدريب نموذج أولي على مجموعة البيانات الصغيرة الموسومة. ثم يُستخدم هذا النموذج لاستنتاج التنبؤات على البيانات غير الموسومة. يتم التعامل مع التنبؤات الأكثر ثقة - غالبًا ما تسمى التسميات الزائفة - على أنها الحقيقة الأساسية الحقيقة، ويُعاد تدريب النموذج على مجموعة البيانات الموسّعة هذه. تسمح هذه الدورة التكرارية الشبكات العصبية بتعلم حدود القرار التي أكثر قوة من تلك المستفادة من البيانات المصنفة وحدها.
تتضمن التقنيات الشائعة المستخدمة في SSL ما يلي:
يعد التعلم شبه الخاضع للإشراف تحويليًا بشكل خاص في الصناعات التي تتوافر فيها البيانات بكثرة ولكن التعليقات التوضيحية المتخصصة نادرة. نادرة.
لفهم SSL بشكل كامل، من المفيد التمييز بينه وبين نماذج التعلم المماثلة:
غالبًا ما يتضمن تنفيذ سير العمل شبه الخاضع للإشراف حلقة "المعلم-الطالب" أو التدريب التكراري. فيما يلي
مثال مفاهيمي باستخدام ultralytics حزمة Python لتوضيح كيف يمكن للمرء أن يستنتج على
على بيانات غير معرّفة لتوليد تنبؤات يمكن أن تكون بمثابة تسميات زائفة لمزيد من التدريب.
from ultralytics import YOLO
# Initialize the YOLO11 model (Teacher)
model = YOLO("yolo11n.pt")
# Train initially on a small, available labeled dataset
model.train(data="coco8.yaml", epochs=10)
# Run inference on a directory of unlabeled images to generate predictions
# These results can be filtered by confidence to create 'pseudo-labels'
results = model.predict(source="./unlabeled_data", save_txt=True, conf=0.8)
# The saved text files from prediction can now be combined with the original
# dataset to retrain a robust 'Student' model.
أطر التعلم العميق مثل PyTorch و TensorFlow اللبنات الأساسية اللازمة لتنفيذ حلقات SSL المخصصة ووظائف الخسارة. مع ازدياد حجم النماذج وكبر حجمها، أصبحت تقنيات مثل SSL ممارسة قياسية لزيادة كفاءة البيانات إلى أقصى حد.
تم تصميم منصة Ultralytics Platform القادمة لتبسيط عمليات سير العمل مثل هذه، مما يساعد الفرق على إدارة الانتقال من البيانات الخام إلى نشر النماذج من خلال تسهيل عملية تنظيم البيانات و وعمليات الشرح التلقائي. من خلال استخدام البيانات غير المصنفة بفعالية، يمكن للمؤسسات نشر حلول الذكاء الاصطناعي عالية الأداء مثل YOLO11 بشكل أسرع وبأسعار معقولة أكثر من الاعتماد على الأساليب الخاضعة للإشراف البحت.