Contrastive Learning
استكشف التعلم التبايني (contrastive learning) في تعلم الآلة. تعلم كيف يستخدم بيانات الإشراف الذاتي لبناء ميزات ذكاء اصطناعي قوية لـ Ultralytics YOLO26 ورؤية الكمبيوتر.
التعلم التبايني هو نموذج من نماذج تعلم الآلة يُعلِّم النماذج فهم البيانات من خلال مقارنة العينات المتشابهة وغير المتشابهة. وعلى عكس التعلم الخاضع للإشراف التقليدي، الذي يعتمد بشكل كبير على مجموعات بيانات مصنفة يدوياً، غالباً ما يُستخدم التعلم التبايني في سياقات التعلم الذاتي الإشراف. الفكرة الجوهرية بسيطة ولكنها قوية: يتعلم النموذج تقريب تمثيلات العناصر ذات الصلة (الأزواج الإيجابية) من بعضها البعض في مساحة متجهة، بينما يعمل على إبعاد العناصر غير ذات الصلة (الأزواج السلبية). تتيح هذه العملية للخوارزميات بناء ميزات قوية وقابلة للتعميم من كميات هائلة من البيانات غير المصنفة، وهو أمر بالغ الأهمية لتوسيع نطاق أنظمة الذكاء الاصطناعي (AI).
Link to this sectionآلية التعلم التبايني#
في جوهر التعلم التبايني يكمن مفهوم التعلم عن طريق المقارنة. بدلاً من حفظ أن صورة معينة هي "قطة"، يتعلم النموذج أن صورتين مختلفتين لقطة تتشابهان مع بعضهما البعض أكثر مما تشابهان صورة لكلب. يتم تحقيق ذلك عادةً من خلال تعزيز البيانات. حيث يتم تحويل صورة الإدخال، التي تسمى غالباً "المرساة" (anchor)، إلى نسختين مختلفتين باستخدام تقنيات مثل الاقتصاص أو القلب أو تغيير تباين الألوان. تشكل هاتان النسختان زوجاً إيجابياً. بعد ذلك، يتم تدريب النموذج على تقليل المسافة بين التضمينات الخاصة بهما مع زيادة المسافة إلى صور عشوائية أخرى (عينات سلبية) في الدفعة.
يساعد هذا النهج الشبكة العصبية على التركيز على الميزات الدلالية عالية المستوى بدلاً من تفاصيل البكسل منخفضة المستوى. على سبيل المثال، سواء كانت السيارة حمراء أو زرقاء، أو تواجه اليسار أو اليمين، يظل المفهوم الأساسي لـ "السيارة" ثابتاً. من خلال تجاهل هذه الاختلافات السطحية، يطور النموذج فهماً أعمق للعالم المرئي، مما يفيد بشكل كبير المهام اللاحقة مثل اكتشاف الأشياء والتصنيف.
Link to this sectionتطبيقات العالم الحقيقي#
أصبح التعلم التبايني حجر الزاوية للعديد من تطبيقات الذكاء الاصطناعي المتطورة، خاصة حيث تكون البيانات المصنفة نادرة أو مكلفة للحصول عليها.
-
تصنيف الصور بدون أمثلة (Zero-Shot): تستخدم نماذج مثل CLIP (التدريب المسبق التبايني للغة والصورة) التعلم التبايني لمطابقة الصور والنصوص في مساحة ميزات مشتركة. من خلال التدريب على ملايين أزواج الصور والنصوص، يتعلم النموذج ربط المفاهيم المرئية بأوصاف اللغة الطبيعية. وهذا يتيح التعلم بدون أمثلة، حيث يمكن للنموذج تصنيف الصور إلى فئات لم يرها من قبل أثناء التدريب ببساطة عن طريق مطابقة الصورة مع نص توجيهي.
-
التدريب المسبق القوي للتصوير الطبي: في الرعاية الصحية، يعد الحصول على فحوصات طبية مصنفة من قبل خبراء أمراً مكلفاً ويستغرق وقتاً طويلاً. يستخدم الباحثون التعلم التبايني لتدريب النماذج مسبقاً على قواعد بيانات كبيرة من صور الأشعة السينية أو فحوصات الرنين المغناطيسي غير المصنفة. يخلق هذا التدريب المسبق غير الخاضع للإشراف هيكلاً أساسياً قوياً يمكن ضبطه بدقة باستخدام عدد صغير من الأمثلة المصنفة لاكتشاف أمراض مثل الالتهاب الرئوي أو الأورام بدقة عالية. تستفيد هذه التقنية من التعلم بنقل المعرفة لتحسين أدوات التشخيص في مجال الذكاء الاصطناعي في الرعاية الصحية.
Link to this sectionالتمييز بين المفاهيم ذات الصلة#
من المفيد تمييز التعلم التبايني عن التقنيات المماثلة لفهم دوره الفريد في مشهد تعلم الآلة (ML).
- مقابل المشفرات التلقائية (Autoencoders): بينما كلاهما طريقتان غير خاضعتين للإشراف، تهدف المشفرات التلقائية إلى إعادة بناء بيانات الإدخال بكسل ببكسل، وضغطها في طبقة عنق زجاجة. من ناحية أخرى، لا يحاول التعلم التبايني إعادة إنشاء الصورة ولكنه يركز فقط على تعلم تمثيلات تمييزية تفصل بين المفاهيم المختلفة.
- مقابل الشبكات التنافسية التوليدية (GANs): تتضمن GANs مولداً ينشئ بيانات مزيفة ومميزاً يحاول اكتشافها. يركز التعلم التبايني على تعلم التمثيل بدلاً من توليد البيانات، مما يجعله أكثر ملاءمة لمهام مثل البحث والاسترجاع والتصنيف.
- مقابل خسارة الثلاثية (Triplet Loss): تتطلب خسارة الثلاثية التقليدية صراحةً مرساة، وعينة إيجابية، وعينة سلبية. تقوم الطرق التباينية الحديثة، مثل SimCLR أو MoCo، بتعميم هذا من خلال مقارنة مرساة مقابل العديد من العينات السلبية في وقت واحد داخل دفعة واحدة، وغالباً ما تستخدم دالة خسارة محددة مثل InfoNCE.
Link to this sectionمثال عملي مع التضمينات#
بينما يعد تدريب نموذج تبايني من الصفر أمراً مكثفاً من حيث الموارد، يمكنك بسهولة استخدام نماذج مدربة مسبقاً لاستخراج الميزات. يوضح المثال التالي كيفية تحميل نموذج واستخراج متجه الميزات (التضمين) لصورة باستخدام حزمة ultralytics. يمثل هذا التضمين المحتوى الدلالي الذي تم تعلمه عبر تقنيات مشابهة للتدريب المسبق التبايني.
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Run inference on an image to get the results
# The 'embed' argument can be used in advanced workflows to extract feature layers
results = model("https://ultralytics.com/images/bus.jpg")
# Access the top predicted class probability
# This prediction is based on the learned feature representations
print(f"Top class: {results[0].names[results[0].probs.top1]}")
print(f"Confidence: {results[0].probs.top1conf:.4f}")تجعل هذه القدرة على استخراج ميزات غنية وذات مغزى التعلم التبايني أمراً أساسياً لبناء أنظمة رؤية حاسوبية (CV) حديثة، مما يتيح البحث في الصور الفعال والتحليلات المتقدمة. لإدارة مجموعات البيانات وتدريب نماذج مخصصة تستفيد من هذه البنى المتقدمة، توفر منصة Ultralytics بيئة مبسطة للنشر والمراقبة.






