Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

التعلم التبايني

اكتشف قوة التعلم التبايني، وهي تقنية تعلم ذاتي الإشراف لتمثيلات بيانات قوية بأقل قدر من البيانات المصنفة.

التعلم التبايني هو تقنية قوية تعلّم آلي قوي يمكّن النماذج من تعلم تمثيلات قوية للبيانات دون الحاجة إلى تسميات يدوية. من خلال تعليم شبكة عصبية للتمييز بين نقاط البيانات المتشابهة نقاط البيانات المتشابهة والمختلفة، يسمح هذا النهج للخوارزميات بفهم البنية الأساسية لمجموعة البيانات. بدلاً من من التنبؤ بفئة معينة مباشرة، يتعلم النموذج من خلال مقارنة أزواج من الأمثلة، وسحب تمثيلات للعناصر ذات الصلة - المعروفة بالأزواج الإيجابية - إلى بعضها البعض في في فضاء التضمينات، بينما يدفع العناصر غير ذات الصلة -الأزواج السلبية غير ذات الصلة، بينما تدفع العناصر غير ذات الصلة -الأزواج السلبية- بعيدًا عن بعضها البعض. هذه الإمكانية تجعلها حجر الزاوية في الحديثة ذاتية الإشراف، مما يسمح للمطوّرين بالاستفادة من كميات هائلة من البيانات غير المسماة.

كيف يعمل التعلّم المتباين

تدور الآلية الأساسية للتعلم التبايني حول مفهوم التمييز بين الأمثلة. تتضمن عملية التدريب تتضمن عملية التدريب عمومًا ثلاثة مكونات رئيسية: زيادة البيانات، وشبكة تشفير، ودالة الخسارة المتباينة دالة خسارة التباين.

  • زيادة البيانات: لإنشاء زوج إيجابي، يأخذ النظام صورة أصلية ("المرساة") ويطبق تحويلات عشوائية تحويرات عشوائية، مثل الاقتصاص أو التقليب أو الارتعاش اللوني. هذه المشاهدات المعززة تمثل نفس المحتوى الدلالي ولكن تبدو مختلفة من ناحية البكسل.
  • شبكة التشفير: A الشبكة العصبية التلافيفية (CNN) أو محول الرؤية (ViT) تعالج كلاً من المرساة وإصداراتها المعززة لإنتاج متجهات السمات. أطر مثل PyTorch تُستخدم عادةً لتنفيذ هذه البنى.
  • الخسارة التباينية: دالة الخسارة، مثل دالة الخسارة خسارة InfoNCE، تعمل على تحسين النموذج عن طريق تقليل المسافة بين بين الأزواج الموجبة وتعظيم المسافة بين العيّنات الأساسية والسالبة (عادةً الصور الأخرى في نفس حجم الدفعة). أظهرت أبحاث بارزة مثل SimCLR من أبحاث Google مدى فعالية هذه الطريقة في تعلم التمثيل المرئي.

تطبيقات واقعية

إن التمثيلات التي يتم تعلمها من خلال طرق التباين قابلة للنقل إلى المهام النهائية.

  1. البحث المرئي والتوصية: في الذكاء الاصطناعي في البيع بالتجزئة، يعمل التعلم التبايني على تشغيل محركات البحث الدلالي. من خلال رسم خرائط المنتجات الصور في مساحة متجهة حيث يتم تجميع العناصر المتشابهة بصريًا معًا، يمكن لمنصات التجارة الإلكترونية أن توصي بالمنتجات التي تتطابق مع نمط أو ميزات صورة استعلام المستخدم، مما يحسن تجربة العميل.
  2. التدريب المسبق للكشف عن الكائنات: يمكن تدريب النماذج مسبقًا على مجموعات بيانات ضخمة غير موسومة باستخدام الأهداف المتباينة قبل أن يتم ضبطها لمهام محددة مثل اكتشاف الأجسام. هذه الاستراتيجية، التي غالباً ما تُستخدم قبل تدريب البنى المتقدمة مثل YOLO11, بشكل كبير من الأداء وسرعة التقارب، خاصةً عندما تكون البيانات الموسومة نادرة (سيناريو يُعرف باسم التعلُّم قليل اللقطات).

التعلّم المتباين مقابل المفاهيم ذات الصلة

إن فهم التمييز بين التعلّم التبايني والنماذج الأخرى مفيد في اختيار النهج الصحيح.

  • مقابل. التعلّم تحت الإشراف: يعتمد التعلّم التقليدي الخاضع للإشراف على مجموعات بيانات واسعة النطاق حيث تتطلب كل صورة وضع علامات يدوية يدويًا. يولد التعلم المتباين إشارات إشرافية خاصة به من البيانات نفسها، مما يقلل من تكاليف التعليقات التوضيحية.
  • ضد. أجهزة الترميز التلقائي: على الرغم من أن كلاهما غير خاضع للإشراف، إلا أن أجهزة الترميز التلقائي تهدف عادةً إلى إعادة بناء بيانات الإدخال بكسل تلو الآخر. يركز التباين يركز التعلم التبايني على تعلم السمات التمييزية التي تفصل بين الحالات المختلفة، والتي غالبًا ما ينتج عنها تمثيلات ذات مغزى أكبر لمهام التصنيف.
  • ضد. CLIP: إن CLIP (التدريب المسبق للغة والصورة المتباينة) من OpenAI هو تطبيق محدد للتعلم المتباين. بينما يقارن يقارن التعلم التبايني القياسي بين صورة وصورة، يقارن CLIP الصور بالأوصاف النصية، مما يتيح قدرات الذكاء الاصطناعي متعدد الوسائط.

مثال على ذلك: استخدام الميزات المكتسبة

بينما يتطلب تدريب حلقة التباين الكاملة عملية حسابية كبيرة، يمكنك الاستفادة من النماذج التي تعلمت قوية من خلال تقنيات تدريب مسبق مماثلة. يوضّح المثال التالي تحميل نموذج تصنيف الصور المدرّب مسبقًا لتصنيف الصور لمعالجة صورة صورة، والذي يستخدم قدرات استخراج الميزات الأساسية التي تم تحسينها أثناء التدريب.

from ultralytics import YOLO

# Load a pre-trained YOLO11 classification model
# The backbone of this model has learned to extract powerful features
model = YOLO("yolo11n-cls.pt")

# Run inference on a sample image
# This process utilizes the learned feature embeddings to predict the class
results = model("https://ultralytics.com/images/bus.jpg")

# Display the top predicted class names
print(results[0].names[results[0].probs.top1])

التحديات والاتجاهات المستقبلية

على الرغم من نجاحه، يواجه التعلم التبايني تحديات. فهو يتطلب اختيارًا دقيقًا للأزواج السلبية؛ فإذا كانت العينات السلبية سهلة التمييز، يتوقف النموذج عن التعلم بفعالية. طرق مثل MoCo (التباين الزخم) التي أدخلت بنوك الذاكرة للتعامل مع كبيرة من العينات السلبية بكفاءة. بالإضافة إلى ذلك، غالبًا ما يتطلب التدريب موارد حاسوبية كبيرة, مثل وحدات معالجة الرسومات عالية الأداء. ومع تقدم البحث، تواصل Ultralytics استكشاف هذه التقنيات في البحث والتطوير للنماذج القادمة مثل YOLO26، بهدف تقديم أنظمة كشف أسرع وأصغر حجمًا وأكثر دقة من خلال تحسين كيفية تعلم النماذج من البيانات المتنوعة وغير المنسقة.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن