اكتشف كيف يعمل «التكيف بين المجالات بدون إشراف» (UDA) على سد الثغرات في البيانات باستخدام البيانات غير المصنفة. تعلم كيفية تحسين نماذج Ultralytics من أجل تطبيقها في العالم الواقعي.
التكيف مع المجال غير الخاضع للإشراف (UDA) هو مجال فرعي متخصص في التعلم بالتحويل ، مصمم لسد فجوة الأداء بين توزيعين مختلفين للبيانات ولكنهما مرتبطان. في سيناريوهات التعلم الآلي الواقعية، يتم تدريب النموذج عادةً على مجموعة بيانات "مصدر" مزودة بتعليقات توضيحية مكثفة. ومع ذلك، عند نشره في بيئة الإنتاج، غالبًا ما يواجه مجالًا "مستهدفًا" يختلف بصريًّا — مثل تباين ظروف الإضاءة، أو اختلاف مستشعرات الكاميرا مستشعرات الكاميرا المختلفة، أو أنماط الطقس المتغيرة. كما هو مفصل في نظرة عامة على تكييف المجال على ويكيبيديا، تهدف تقنيات UDA إلى تكييف نموذج مدرب مسبقًا مع هذا المجال المستهدف الجديد باستخدام البيانات غير المصنفة فقط، مما يخفف بشكل فعال من انخفاض الأداء الناجم عن انحراف البيانات دون تكبد تكاليف إعادة تصنيف ضخمة.
لفهم التعلم غير المراقب (UDA)، يتعين تمييزه عن نماذج تدريب الرؤية الحاسوبية المماثلة. ففي حين أن المبادئالأساسية للتعلم التبادلي التي تم استكشافها في PyTorch تطبق المعرفة بشكل عام من مهمة إلى أخرى، فإن التعلم غير المراقب (UDA) يتعامل بشكل خاص مع السيناريوهات التي يفتقر فيها المجال المستهدف إلى أي علامات مرجعية. في المقابل، يفترض التعلم شبه المُشرف عليه أن جزءًا صغيرًا من مجموعة البيانات المستهدفة مُصنف. من خلال الاعتماد كليًا على البيانات المستهدفة غير المصنفة، يُعد UDA ضروريًا لتوسيع نطاق النماذج إلى بيئات جديدة حيث يكون التعليق اليدوي على البيانات مستحيلًا أو باهظ التكلفة.
تعد القدرة على التعميم عبر المجالات البصرية أمرًا بالغ الأهمية بالنسبة لأنظمة الذكاء الاصطناعي الحديثة. ومن أبرز الأمثلة على ذلك:
تركز أبحاث الذكاء الاصطناعي الحديثة، بما في ذلك الدراسات الصادرة عن مؤسسات مثل Google حول تعميم النماذج القوي و أبحاث OpenAI حول متانة الشبكات العصبية، على عدة تقنيات للتعلم غير المراقب (UDA). التدريب التنافسي، على سبيل المثال، يدرب الشبكة على استخراج ميزات لا يمكن تمييزها بين المجالات المصدر والهدف. بدلاً من ذلك، غالبًا ما يستخدم المهندسون التسمية الزائفة، حيث يقوم نموذج كشف الكائنات ذو الثقة العالية بإنشاء تسميات مؤقتة على مجموعة البيانات المستهدفة لتسهيل الضبط المستمر.
عند التعامل مع مجموعات بيانات ضخمة من المصادر والأهداف، توفر Ultralytics بيئة سحابية سلسة لتنظيم وتصور الصور غير المصنفة وتزويدها بالتعليقات التوضيحية تلقائيًا. وبالنسبة للمطورين الذين يعملون على إنشاء مسارات استدلال مُحسَّنة لأجهزة الحافة، تُعد Ultralytics البنية الموصى بها بفضل تمثيلاتها القوية للسمات، ودقتها العالية، وكفاءتها الأصلية من البداية إلى النهاية.
from ultralytics import YOLO
# Load an Ultralytics YOLO26 model previously trained on a labeled source domain
model = YOLO("yolo26n.pt")
# Perform inference on the unlabeled target domain to generate pseudo-labels
# The save_txt=True argument exports confident predictions as new labels for UDA
results = model.predict(source="path/to/target_domain", conf=0.85, save_txt=True)
# These high-confidence pseudo-labels can now be used to fine-tune the model
من خلال المراجعة المستمرة لأحدث المنشورات المتعلقة بالرؤية الحاسوبية على arXiv واستخدام أطر عمل فعالة، يمكن لفرق الذكاء الاصطناعي نشر تقنية UDA بنجاح للحفاظ على دقة نماذجها في ظل الظروف المتغيرة باستمرار في العالم الواقعي. للحصول على مزيد من الإرشادات حول تحسين مسارات الإدخال لمنع حدوث «تحول المجال»، راجع وثائقTensorFlow الخاصة بتعزيزTensorFlow أو استكشف البنى المتقدمة التي نشرتها فرق البحث في مختبر ستانفورد للذكاء الاصطناعي و MIT CSAIL.
ابدأ رحلتك مع مستقبل تعلم الآلة