اكتشف التعلُّم من الصفر: نهج متطور للذكاء الاصطناعي يُمكِّن النماذج من تصنيف البيانات غير المرئية، مما يُحدث ثورة في اكتشاف الأشياء، ومعالجة اللغات الطبيعية وغيرها.
التعلّم الصفري (ZSL) هو قدرة رائعة في التعلّم الآلي (ML) حيث يمكن للنموذج التعرّف على الأشياء وتصنيفها من الفئات التي لم يسبق له رؤيتها خلال مرحلة بيانات التدريب. وعلى عكس التعلّم التقليدي الخاضع للإشراف، والذي يتطلب أمثلة صريحة لكل فئة محتملة، يُمكّن التعلم الصفري من تعميم معرفته على فئات جديدة غير مرئية. ويتحقق ذلك من خلال الربط بين الفئات المرصودة وغير المرصودة من خلال أوصاف دلالية عالية المستوى، مثل السمات أو تضمينات النص. يتيح ذلك لنموذج الذكاء الاصطناعي أن يكون أكثر مرونة وقابلية للتطوير، خاصةً في سيناريوهات العالم الحقيقي حيث يكون جمع البيانات الشاملة الموسومة غير عملي.
الفكرة الأساسية وراء ZSL هي إنشاء مساحة تضمين مشتركة حيث يمكن تمثيل كل من السمات المرئية من الصور والمعلومات الدلالية من النص. أثناء التدريب، يتعلّم النموذج تعيين صور الفئات المرئية إلى المتجهات الدلالية المقابلة لها (السمات أو تضمينات الكلمات). على سبيل المثال، يتعلم النموذج السمات المرئية لـ "الحصان" ويربطها بوصف دلالي مثل "له أربع أرجل" و"هو حيوان ثديي" و"يمكن ركوبه".
عند تقديم صورة لفئة غير مرئية، مثل "الحمار الوحشي"، يستخرج النموذج سماته البصرية. في نفس الوقت، يستخدم النموذج الوصف الدلالي ل "الحمار الوحشي" - على سبيل المثال، "يشبه الحصان"، "له خطوط" - لتحديد موقعه في فضاء التضمين. من خلال العثور على أقرب وصف دلالي للسمات البصرية المستخرجة، يمكن للنموذج تصنيف الصورة على أنها "حمار وحشي" بشكل صحيح، حتى بدون صورة واحدة للتدريب على صورة حمار وحشي. تعتمد هذه العملية غالبًا على نماذج قوية متعددة الوسائط مدربة مسبقًا مثل نموذج CLIP من OpenAI، والتي تتفوق في الربط بين الرؤية واللغة.
من المهم التمييز بين ZSL وتقنيات التعلم ذات الصلة:
تتمتع ZSL بالعديد من التطبيقات العملية، مما يجعل أنظمة الرؤية الحاسوبية أكثر ديناميكية وقابلية للتكيف.
على الرغم من إمكانياتها، تواجه ZSL تحديات مثل مشكلة المحورية (حيث تصبح بعض النقاط في الفضاء الدلالي أقرب جيران للعديد من النقاط) وتحول المجال (حيث تختلف العلاقات بين السمات والسمات بين الفئات المرئية وغير المرئية). ولمعالجة هذه المشاكل، يقوم الباحثون بتطوير تقنيات أكثر قوة مثل التعلّم الصفري المعمم (GZSL)، حيث يجب أن يتعرف النموذج على كل من الفئات المرئية وغير المرئية أثناء الاستدلال. سيؤدي تطور النماذج الأساسية والمنصات مثل Ultralytics HUB إلى زيادة تبسيط دمج ونشر التعلم الصفري المعمم (ZSL)، مما يجعل أنظمة الذكاء الاصطناعي أقل اعتمادًا على وضع علامات واسعة النطاق على البيانات وأكثر توافقًا مع التفكير الشبيه بالإنسان.