Zero-Shot Learning
استكشف التعلم بدون تدريب (Zero-Shot Learning) لاكتشاف وتصنيف الكائنات بدون بيانات تدريب. تعرّف على كيفية تمكين Ultralytics YOLO-World للكشف عن المفردات المفتوحة في الوقت الفعلي.
التعلم الصفري (ZSL) هو نموذج في التعلم الآلي يُمكّن نماذج الذكاء الاصطناعي من التعرف على الكائنات أو تصنيفها أو اكتشافها دون أن تكون قد واجهتها مسبقاً خلال مرحلة التدريب. في التعلم الخاضع للإشراف التقليدي، يتطلب النموذج آلاف الأمثلة المصنفة لكل فئة محددة يحتاج إلى تحديدها. يلغي التعلم الصفري هذا الاعتماد الصارم من خلال الاستفادة من المعلومات المساعدة - عادةً ما تكون أوصافاً نصية، أو سمات دلالية، أو تضمينات - لسد الفجوة بين الفئات المرئية وغير المرئية. تسمح هذه القدرة لأنظمة الذكاء الاصطناعي (AI) بأن تكون أكثر مرونة وقابلية للتوسع وقدرة على التعامل مع البيئات الديناميكية حيث يكون جمع بيانات شاملة لكل كائن ممكن أمراً غير عملي.
Link to this sectionكيف يعمل التعلم الصفري#
تتضمن الآلية الأساسية للتعلم الصفري نقل المعرفة من المفاهيم المألوفة إلى غير المألوفة باستخدام مساحة دلالية مشتركة. بدلاً من تعلم التعرف على "الحمار الوحشي" بمجرد حفظ أنماط البكسل للخطوط السوداء والبيضاء، يتعلم النموذج العلاقة بين السمات المرئية والسمات الدلالية (مثل "شكل يشبه الحصان"، "نمط مخطط"، "أربع أرجل") المشتقة من معالجة اللغات الطبيعية (NLP).
يعتمد هذا العملية غالباً على نماذج متعددة الوسائط التي تواءم بين تمثيلات الصور والنصوص. على سبيل المثال، يوضح البحث الأساسي مثل OpenAI's CLIP كيف يمكن للنماذج تعلم المفاهيم المرئية من الإشراف باللغة الطبيعية. عندما يواجه نموذج التعلم الصفري كائناً غير مرئي، فإنه يستخرج السمات المرئية ويقارنها بقاموس من المتجهات الدلالية. إذا توافقت السمات المرئية مع الوصف الدلالي للفئة الجديدة، يمكن للنموذج تصنيفها بشكل صحيح، مما يؤدي فعلياً إلى إجراء تنبؤ "صفري". يعد هذا النهج جوهرياً لـ النماذج التأسيسية الحديثة التي تعمم عبر مجموعة واسعة من المهام.
Link to this sectionتطبيقات العالم الحقيقي#
يدفع التعلم الصفري عجلة الابتكار عبر مختلف الصناعات من خلال تمكين الأنظمة من التعميم إلى ما هو أبعد من بيانات تدريبها الأولية.
-
اكتشاف الكائنات بالمفردات المفتوحة (Open-Vocabulary Object Detection): تستخدم البنى الحديثة مثل YOLO-World التعلم الصفري لاكتشاف الكائنات بناءً على مطالبات نصية يحددها المستخدم. يسمح هذا بـ اكتشاف الكائنات في سيناريوهات يكون فيها تحديد قائمة ثابتة من الفئات مسبقاً أمراً مستحيلاً، مثل البحث عن عناصر محددة في أرشيفات الفيديو الضخمة. يواصل الباحثون في Google Research دفع حدود قدرات المفردات المفتوحة هذه.
-
التشخيص الطبي: في الذكاء الاصطناعي في الرعاية الصحية، غالباً ما يكون الحصول على بيانات مصنفة للأمراض النادرة أمراً صعباً ومكلفاً. يمكن تدريب نماذج التعلم الصفري على الحالات الشائعة وأوصاف الأعراض النادرة من الأدبيات الطبية الموجودة في قواعد البيانات مثل PubMed، مما يُمكّن النظام من الإشارة إلى الشذوذات النادرة المحتملة في التصوير الطبي دون الحاجة إلى مجموعة بيانات ضخمة من الحالات الإيجابية.
-
الحفاظ على الحياة البرية: بالنسبة لـ الذكاء الاصطناعي في الزراعة والبيئة، يعد تحديد الأنواع المهددة بالانقراض التي نادراً ما يتم تصويرها أمراً بالغ الأهمية. يسمح التعلم الصفري للمحافظين على البيئة باكتشاف هذه الحيوانات باستخدام أوصاف قائمة على السمات محددة في قواعد البيانات البيولوجية مثل Encyclopedia of Life.
Link to this sectionالاكتشاف الصفري مع Ultralytics#
يعد نموذج Ultralytics YOLO-World مثالاً على التعلم الصفري قيد التنفيذ. فهو يسمح للمستخدمين بتعريف فئات مخصصة ديناميكياً في وقت التشغيل دون الحاجة لإعادة تدريب النموذج. يتم تحقيق ذلك من خلال ربط هيكل اكتشاف قوي بـ مشفر نصوص يفهم اللغة الطبيعية.
يوضح مثال Python التالي كيفية استخدام YOLO-World لاكتشاف الكائنات التي لم تكن جزءاً صريحاً من مجموعة تدريب قياسية باستخدام حزمة ultralytics.
from ultralytics import YOLOWorld
# Load a pre-trained YOLO-World model capable of Zero-Shot Learning
model = YOLOWorld("yolov8s-world.pt")
# Define custom classes via text prompts (e.g., specific accessories)
# The model adjusts to detect these new classes without retraining
model.set_classes(["blue backpack", "red apple", "sunglasses"])
# Run inference on an image to detect the new zero-shot classes
results = model.predict("https://ultralytics.com/images/bus.jpg")
# Display the results
results[0].show()Link to this sectionالتمييز عن المفاهيم ذات الصلة#
لفهم التعلم الصفري بشكل كامل، من المفيد تمييزه عن استراتيجيات التعلم المماثلة المستخدمة في رؤية الحاسوب (CV):
- التعلم القليل من الأمثلة (Few-Shot Learning - FSL): بينما لا يتطلب التعلم الصفري أي أمثلة للفئة المستهدفة، يوفر التعلم القليل من الأمثلة (FSL) للنموذج مجموعة دعم صغيرة جداً (عادةً من 1 إلى 5 أمثلة) للتكيف. يُعتبر التعلم الصفري عموماً أكثر صعوبة لأنه يعتمد كلياً على الاستدلال الدلالي بدلاً من الأمثلة المرئية.
- التعلم من مثال واحد (One-Shot Learning): مجموعة فرعية من FSL حيث يتعلم النموذج من مثال واحد مصنف بالضبط. يختلف التعلم الصفري بشكل جوهري لأنه يعمل بدون حتى صورة واحدة للفئة الجديدة.
- التعلم بنقل المعرفة (Transfer Learning): يشير هذا المصطلح الواسع إلى نقل المعرفة من مهمة إلى أخرى. التعلم الصفري هو نوع محدد من التعلم بنقل المعرفة يستخدم السمات الدلالية لنقل المعرفة إلى فئات غير مرئية دون الحاجة إلى الضبط الدقيق التقليدي على بيانات جديدة.
Link to this sectionالتحديات والتوقعات المستقبلية#
بينما يوفر التعلم الصفري إمكانات هائلة، فإنه يواجه تحديات مثل مشكلة تحول النطاق (domain shift problem)، حيث لا تتوافق السمات الدلالية التي تم تعلمها أثناء التدريب تماماً مع المظهر المرئي للفئات غير المرئية. بالإضافة إلى ذلك، يمكن أن تعاني نماذج التعلم الصفري من التحيز، حيث تكون دقة التنبؤ أعلى بكثير للفئات المرئية مقارنة بغير المرئية.
تواصل الأبحاث من منظمات مثل مختبر الذكاء الاصطناعي بجامعة ستانفورد و IEEE Computer Society معالجة هذه القيود. ومع تزايد قوة أدوات رؤية الحاسوب، من المتوقع أن يصبح التعلم الصفري ميزة قياسية، مما يقلل الاعتماد على جهود تصنيف البيانات الضخمة. بالنسبة للفرق التي تتطلع إلى إدارة مجموعات البيانات بكفاءة قبل نشر نماذج متقدمة، تقدم منصة Ultralytics أدوات شاملة للتعليق التوضيحي وإدارة مجموعات البيانات.






