يولو فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

التعلم الصفري

اكتشف التعلم الصفري: نهج متطور للذكاء الاصطناعي يمكّن النماذج من تصنيف البيانات غير المرئية، مما يحدث ثورة في الكشف عن الأجسام ومعالجة اللغة الطبيعية والمزيد.

التعلم الصفري (Zero-Shot Learning (ZSL)) هو قدرة رائعة في التعلم الآلي (ML) حيث يمكن للنموذج التعرف على الكائنات وتصنيفها من الفئات التي لم يرها مطلقًا خلال مرحلة بيانات التدريب الخاصة به. على عكس التعلم الخاضع للإشراف التقليدي، الذي يتطلب أمثلة صريحة لكل فئة ممكنة، يمكّن ZSL النموذج من تعميم معرفته على فئات جديدة غير مرئية. يتم تحقيق ذلك من خلال ربط الفئات المرصودة وغير المرصودة من خلال أوصاف دلالية عالية المستوى، مثل السمات أو تضمينات النص. يتيح ذلك لنموذج الذكاء الاصطناعي أن يكون أكثر مرونة وقابلية للتطوير، خاصة في سيناريوهات العالم الحقيقي حيث يكون جمع البيانات المصنفة الشاملة غير عملي.

كيف يعمل؟

الفكرة الأساسية وراء ZSL هي إنشاء مساحة تضمين مشتركة حيث يمكن تمثيل كل من الميزات المرئية من الصور والمعلومات الدلالية من النص. أثناء التدريب، يتعلم النموذج تعيين صور الفئات المرئية إلى المتجهات الدلالية المقابلة لها (السمات أو تضمينات الكلمات). على سبيل المثال، يتعلم النموذج الميزات المرئية لـ "حصان" ويربطها بوصف دلالي مثل "له أربع أرجل" و "هو من الثدييات" و "يمكن ركوبه".

عندما يتم تقديم صورة لفئة غير مرئية، مثل "حمار وحشي"، يستخرج النموذج ميزاته المرئية. في الوقت نفسه، يستخدم الوصف الدلالي لـ "حمار وحشي" - على سبيل المثال، "يشبه الحصان"، "له خطوط" - لتحديد موقعه في مساحة التضمين. من خلال إيجاد أقرب وصف دلالي للميزات المرئية المستخرجة، يمكن للنموذج تصنيف الصورة بشكل صحيح على أنها "حمار وحشي"، حتى بدون صورة تدريب واحدة لها. تعتمد هذه العملية غالبًا على نماذج متعددة الوسائط قوية مدربة مسبقًا مثل CLIP من OpenAI، والتي تتفوق في ربط الرؤية واللغة.

التعلم الصفري مقابل النماذج الأخرى

من المهم التمييز بين ZSL وتقنيات التعلم ذات الصلة:

  • التعلم بعدد قليل من اللقطات (Few-Shot Learning (FSL)): في FSL، يتم تدريب النموذج بعدد صغير جدًا من الأمثلة المصنفة (على سبيل المثال، 1 إلى 5) لكل فئة جديدة. هذا يختلف عن ZSL، الذي يعمل مع صفر أمثلة للفئة المستهدفة.
  • التعلم بلقطة واحدة (OSL): نوع فرعي من FSL حيث يتلقى النموذج مثالاً واحداً بالضبط لفئة جديدة. إنه أكثر تقييدًا للبيانات من FSL العام ولكنه لا يزال يتطلب عينة واحدة على الأقل، على عكس ZSL.
  • التعلم بالنقل (Transfer Learning): ZSL هو شكل من أشكال التعلم بالنقل، ولكنه فريد من نوعه. في حين أن التعلم بالنقل القياسي يتضمن عادةً ضبط دقيق لنموذج مدرب مسبقًا على مجموعة بيانات مسماة جديدة (أصغر)، فإن ZSL ينقل المعرفة إلى فئات جديدة باستخدام معلومات دلالية مساعدة فقط، متجاوزًا الحاجة إلى أي أمثلة مسماة لتلك الفئات.

تطبيقات واقعية

لدى ZSL العديد من التطبيقات العملية، مما يجعل أنظمة رؤية الكمبيوتر أكثر ديناميكية وقدرة على التكيف.

  1. اكتشاف الأجسام بمفردات مفتوحة: تستفيد نماذج مثل YOLO-World من ZSL لاكتشاف أي كائن موصوف بالنص. يمكن للمستخدم تقديم مطالبات نصية مثل "شخص يرتدي قميصًا أزرق" أو "أنبوب تسرب"، ويمكن للنموذج تحديد موقع هذه الكائنات في صورة أو بث فيديو دون تدريب صريح على تلك الفئات المحددة. هذه خطوة مهمة نحو إنشاء أنظمة رؤية للأغراض العامة حقًا.
  2. تحديد الأنواع المستقل: في الذكاء الاصطناعي للحفاظ على الحياة البرية، يمكن لـ ZSL تحديد الأنواع النادرة أو المكتشفة حديثًا. يمكن لنموذج مدرب على الحيوانات الشائعة استخدام سمات وصفية (مثل "له رقبة طويلة"، "مرقط"، "عاشب") من قاعدة معرفية مثل Wikipedia لتحديد الزرافة، حتى لو لم تكن هناك صور زرافة في مجموعة التدريب الأصلية الخاصة به.

التحديات والاتجاهات المستقبلية

على الرغم من إمكاناته، يواجه التعلم الصفري تحديات مثل مشكلة التمركز (حيث تصبح بعض النقاط في الفضاء الدلالي أقرب الجيران لعدد كبير جدًا من النقاط) و انزياح المجال (حيث تختلف العلاقات بين الميزات والسمات بين الفئات المرئية وغير المرئية). ولمعالجة هذه المشكلات، يقوم الباحثون بتطوير تقنيات أكثر قوة مثل التعلم الصفري المعمم (GZSL)، حيث يجب على النموذج التعرف على الفئات المرئية و غير المرئية أثناء الاستدلال. إن تطور النماذج الأساسية ومنصات مثل Ultralytics HUB سيزيد من تبسيط دمج ونشر التعلم الصفري، مما يجعل أنظمة الذكاء الاصطناعي أقل اعتمادًا على تصنيف البيانات المكثف وأكثر توافقًا مع التفكير الشبيه بالبشر.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة