مسرد المصطلحات

التعلّم المتباين

اكتشف قوة التعلّم المتباين، وهي تقنية ذاتية الإشراف لتمثيل البيانات القوية مع الحد الأدنى من البيانات المصنفة.

التعلّم التبايني هو أسلوب تعلّم آلي يقوم بتدريب نموذج للتمييز بين الأشياء المتشابهة وغير المتشابهة. بدلاً من تعلم التنبؤ بتسمية من نقطة بيانات واحدة، يتعلم النموذج من خلال مقارنة أزواج من الأمثلة. تتمثل الفكرة الأساسية في تعليم النموذج على تقريب تمثيلات الأزواج المتشابهة (الإيجابية) من بعضها البعض في فضاء الميزات، بينما يتم إبعاد تمثيلات الأزواج غير المتشابهة (السلبية) عن بعضها البعض. هذا النهج فعال للغاية في تعلم تمثيلات ذات مغزى من مجموعات البيانات الكبيرة غير الموسومة، مما يجعلها طريقة قوية ضمن الفئة الأوسع من التعلم الذاتي الخاضع للإشراف.

كيف تعمل؟

تدور عملية التعلم التبايني حول إنشاء عينات إيجابية وسلبية. بالنسبة لنقطة بيانات معينة، تسمى "مرساة"، يتم تدريب النموذج على النحو التالي:

  1. الأزواج الموجبة: يتكون الزوج الإيجابي من نقطة الارتكاز ونقطة بيانات مشابهة لها من الناحية الدلالية. في الرؤية الحاسوبية، غالبًا ما يتم إنشاء عينة إيجابية من خلال تطبيق زيادة قوية للبيانات (مثل الاقتصاص العشوائي أو التدوير أو الارتعاش اللوني) على صورة الارتكاز. يُعتبر كل من المرساة والنسخة المعززة زوجًا إيجابيًا لأنهما ينشآن من نفس الصورة المصدر.
  2. الأزواج السالبة: يتكون الزوج السلبي من نقطة الارتكاز ونقطة بيانات غير متشابهة. في الإعداد النموذجي، يتم التعامل مع جميع الصور الأخرى ضمن دفعة التدريب على أنها عينات سلبية.
  3. هدف التدريب: يقوم النموذج، الذي غالبًا ما يكون شبكة عصبية تلافيفية (CNN)، بمعالجة هذه الأزواج ويتم تحسينه باستخدام دالة خسارة متباينة، مثل InfoNCE أو خسارة ثلاثية. تعاقب دالة الخسارة هذه النموذج عندما تكون الأزواج السلبية قريبة جدًا أو الأزواج الإيجابية متباعدة جدًا في مساحة التضمين. وقد طورت أوراق بحثية بارزة مثل SimCLR و MoCo هذه التقنيات بشكل كبير.

التطبيقات الواقعية

يتفوق التعلم التبايني في نماذج التدريب المسبق لتعلم تمثيلات الميزات القوية التي يمكن ضبطها بعد ذلك لمهام محددة.

  • البحث المرئي واسترجاع الصور: في مجال التجارة الإلكترونية، قد يرغب المستخدم في العثور على منتجات مشابهة بصريًا لصورة يقوم بتحميلها. يمكن لنموذج مُدرَّب مسبقاً باستخدام التعلّم المتباين تعيين الصور إلى فضاء متجه حيث يتم تجميع العناصر المتشابهة معاً. وهذا يسمح بالبحث الدلالي الفعال وأنظمة التوصية الفعالة، والتي تعتبر ضرورية لتحسين تجربة العملاء في الذكاء الاصطناعي في مجال البيع بالتجزئة.
  • التدريب المسبق للمهام النهائية: يمكن أن تستفيد نماذج مثل Ultralytics YOLO11 من التدريب المسبق على مجموعات بيانات كبيرة غير موسومة باستخدام أساليب متباينة. يساعد هذا النموذج على تعلّم ميزات بصرية قوية قبل أن يتم ضبطه على مجموعة بيانات أصغر موسومة لمهام مثل اكتشاف الكائنات أو تجزئة النماذج. غالبًا ما يؤدي هذا النهج إلى أداء أفضل وتقارب أسرع، خاصةً عندما تكون البيانات الموسومة نادرة، وهو مفهوم يُعرف باسم التعلم في لقطات قليلة.

التعلّم التبايني مقابل النماذج الأخرى

من المفيد التمييز بين التعلم المتباين والنماذج ذات الصلة:

  • التعلّم تحت الإشراف: يعتمد كليًا على البيانات المصنفة بدقة، مثل الصور ذات المربعات المحدودة لمهام اكتشاف الأجسام. على النقيض من ذلك، يولد التعلم الإشرافي إشارات الإشراف الخاصة به من البيانات نفسها، مما يقلل بشكل كبير من الحاجة إلى وضع العلامات اليدوية للبيانات.
  • التعلّم غير الخاضع للإشراف: هذه فئة واسعة تهدف إلى العثور على أنماط خفية في البيانات غير المُسمّاة. بينما يستخدم التعلّم التبايني بيانات غير موسومة مثل الأساليب التقليدية غير الخاضعة للإشراف (على سبيل المثال، التجميع k-means)، إلا أنه يتميز لأنه ينشئ هدفًا شبيهًا بالإشراف (مهمة مقارنة الأزواج) لتوجيه عملية التعلّم.
  • التعلم الخاضع للإشراف الذاتي (SSL): التعلّم المتباين هو نوع بارز من التعلّم الخاضع للإشراف الذاتي. SSL هو نموذج يتم فيه إنشاء الإشراف من البيانات نفسها. يُعد التعلّم المتباين إحدى الطرق لتحقيق ذلك، ولكن توجد طرق أخرى غير متباينة للتعلّم الذاتي للإشراف الذاتي، مثل تلك التي تعتمد على التنبؤ بالأجزاء المقنّعة من الصورة.

الفوائد والتحديات

الفوائد:

  • تقليل الاعتماد على التسمية: الاستفادة من كميات هائلة من البيانات غير المُسمّاة، مما يقلل من الحاجة إلى شرح البيانات المكلفة والمستهلكة للوقت.
  • تمثيلات قوية: غالبًا ما يتعلم ميزات أكثر ثباتًا في مواجهة التغيرات المزعجة مقارنةً بالطرق الخاضعة للإشراف البحت.
  • تدريب مسبق فعال: يوفر نقاط بداية ممتازة للضبط الدقيق لمهام نهائية محددة، مما يؤدي غالبًا إلى أداء أفضل، خاصةً مع البيانات المحدودة المصنفة. يمكنك استكشاف كيفية استخدام النماذج المدربة مسبقًا في تدريب النماذج المخصصة.

التحديات:

  • اختيار العينة السلبية: يمكن أن يكون الأداء حساسًا لعدد العينات السلبية وجودتها. يعد اختيار عينات سلبية غنية بالمعلومات أمرًا بالغ الأهمية ولكنه صعب.
  • استراتيجية التعزيز: يؤثر اختيار تقنيات زيادة البيانات بشكل كبير على الثوابت التي يتعلمها النموذج.
  • التكلفة الحسابية: غالبًا ما تتطلب أحجام دفعات كبيرة وموارد حاسوبية كبيرة(وحدات معالجة الرسوميات) للتدريب الفعال، على الرغم من أن الأبحاث جارية للتخفيف من ذلك. يمكن لمنصات مثل Ultralytics HUB تسهيل إدارة هذه النماذج وتدريبها. وتوفر أطر عمل مثل PyTorch(الموقع الرسمي) و TensorFlow(الموقع الرسمي) أدوات لتنفيذ أساليب التعلم المتباين.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون ونمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة