اكتشف التعلم الصفري: نهج متطور للذكاء الاصطناعي يمكّن النماذج من تصنيف البيانات غير المرئية، مما يحدث ثورة في الكشف عن الأجسام ومعالجة اللغة الطبيعية والمزيد.
التعلم الصفري (Zero-Shot Learning (ZSL)) هو قدرة رائعة في التعلم الآلي (ML) حيث يمكن للنموذج التعرف على الكائنات وتصنيفها من الفئات التي لم يرها مطلقًا خلال مرحلة بيانات التدريب الخاصة به. على عكس التعلم الخاضع للإشراف التقليدي، الذي يتطلب أمثلة صريحة لكل فئة ممكنة، يمكّن ZSL النموذج من تعميم معرفته على فئات جديدة غير مرئية. يتم تحقيق ذلك من خلال ربط الفئات المرصودة وغير المرصودة من خلال أوصاف دلالية عالية المستوى، مثل السمات أو تضمينات النص. يتيح ذلك لنموذج الذكاء الاصطناعي أن يكون أكثر مرونة وقابلية للتطوير، خاصة في سيناريوهات العالم الحقيقي حيث يكون جمع البيانات المصنفة الشاملة غير عملي.
الفكرة الأساسية وراء ZSL هي إنشاء مساحة تضمين مشتركة حيث يمكن تمثيل كل من الميزات المرئية من الصور والمعلومات الدلالية من النص. أثناء التدريب، يتعلم النموذج تعيين صور الفئات المرئية إلى المتجهات الدلالية المقابلة لها (السمات أو تضمينات الكلمات). على سبيل المثال، يتعلم النموذج الميزات المرئية لـ "حصان" ويربطها بوصف دلالي مثل "له أربع أرجل" و "هو من الثدييات" و "يمكن ركوبه".
عندما يتم تقديم صورة لفئة غير مرئية، مثل "حمار وحشي"، يستخرج النموذج ميزاته المرئية. في الوقت نفسه، يستخدم الوصف الدلالي لـ "حمار وحشي" - على سبيل المثال، "يشبه الحصان"، "له خطوط" - لتحديد موقعه في مساحة التضمين. من خلال إيجاد أقرب وصف دلالي للميزات المرئية المستخرجة، يمكن للنموذج تصنيف الصورة بشكل صحيح على أنها "حمار وحشي"، حتى بدون صورة تدريب واحدة لها. تعتمد هذه العملية غالبًا على نماذج متعددة الوسائط قوية مدربة مسبقًا مثل CLIP من OpenAI، والتي تتفوق في ربط الرؤية واللغة.
من المهم التمييز بين ZSL وتقنيات التعلم ذات الصلة:
لدى ZSL العديد من التطبيقات العملية، مما يجعل أنظمة رؤية الكمبيوتر أكثر ديناميكية وقدرة على التكيف.
على الرغم من إمكاناته، يواجه التعلم الصفري تحديات مثل مشكلة التمركز (حيث تصبح بعض النقاط في الفضاء الدلالي أقرب الجيران لعدد كبير جدًا من النقاط) و انزياح المجال (حيث تختلف العلاقات بين الميزات والسمات بين الفئات المرئية وغير المرئية). ولمعالجة هذه المشكلات، يقوم الباحثون بتطوير تقنيات أكثر قوة مثل التعلم الصفري المعمم (GZSL)، حيث يجب على النموذج التعرف على الفئات المرئية و غير المرئية أثناء الاستدلال. إن تطور النماذج الأساسية ومنصات مثل Ultralytics HUB سيزيد من تبسيط دمج ونشر التعلم الصفري، مما يجعل أنظمة الذكاء الاصطناعي أقل اعتمادًا على تصنيف البيانات المكثف وأكثر توافقًا مع التفكير الشبيه بالبشر.