يولو فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

التعلم النشط

اكتشف التعلم النشط، وهو طريقة فعالة من حيث التكلفة لتعلم الآلة تعزز الدقة بعدد أقل من التصنيفات. تعرف على كيف يغير تدريب الذكاء الاصطناعي!

التعلم النشط هو منهجية تدريب متخصصة في التعلم الآلي (ML) حيث يمكن لخوارزمية التعلم أن تستعلم بشكل تفاعلي من مستخدم أو مصدر معلومات آخر ("وسيط") لتسمية نقاط بيانات جديدة. الفكرة الأساسية هي أنه إذا كان النموذج قادرًا على اختيار البيانات التي يتعلم منها، فيمكنه تحقيق دقة أعلى مع بيانات تدريب أقل بكثير. وهذا ذو قيمة خاصة في المجالات التي تكون فيها تسمية البيانات مكلفة أو تستغرق وقتًا طويلاً أو تتطلب معرفة الخبراء. بدلاً من تسمية مجموعة بيانات كاملة مرة واحدة، يعطي التعلم النشط الأولوية للعينات الأكثر "إفادة" للتسمية، مما يجعل عملية تدريب النموذج أكثر كفاءة.

كيف يعمل التعلم النشط

تتسم عملية التعلم النشط بأنها دورية وغالبًا ما توصف بأنها سير عمل يتدخل فيه العنصر البشري. وعادةً ما تتبع الخطوات التالية:

  1. التدريب الأولي للنموذج: يتم أولاً تدريب نموذج، مثل كاشف Ultralytics YOLO11، على مجموعة بيانات صغيرة ومصنفة مبدئيًا.
  2. الاستعلام عن البيانات غير المسماة: يتم بعد ذلك استخدام النموذج المدرب جزئيًا لتقديم تنبؤات على مجموعة كبيرة من البيانات غير المسماة. بناءً على هذه التنبؤات، يختار النموذج مجموعة فرعية من العينات التي هو "غير متأكد" منها.
  3. الترميز البشري: يتم تقديم هذه العينات غير المؤكدة إلى خبير بشري (المرجع)، والذي يقدم التصنيفات الصحيحة.
  4. زيادة حجم مجموعة البيانات: تتم إضافة العينات التي تم تصنيفها حديثًا إلى مجموعة التدريب.
  5. إعادة التدريب: تتم إعادة تدريب النموذج على مجموعة البيانات الأكبر والمحدثة. تتكرر هذه الدورة حتى يصل أداء النموذج إلى الحد المطلوب أو يتم استنفاد ميزانية التصنيف.

يكمن مفتاح هذه العملية في استراتيجية الاستعلام. تتضمن الاستراتيجيات الشائعة أخذ عينات عدم اليقين (تحديد الحالات التي يكون النموذج أقل ثقة بشأنها)، أو الاستعلام عن طريق اللجنة (باستخدام نماذج متعددة وتحديد الحالات التي تختلف عليها)، أو تقدير التغيير المتوقع في النموذج. يمكن العثور على نظرة عامة جيدة على هذه في استطلاع التعلم النشط هذا.

تطبيقات واقعية

التعلم النشط فعال للغاية في المجالات المتخصصة حيث يكون تعليق الخبراء بمثابة عنق الزجاجة.

  • تحليل الصور الطبية: عند تدريب الذكاء الاصطناعي للكشف عن أمراض مثل السرطان من الفحوصات الطبية، قد يكون هناك الملايين من الصور المتاحة ولكن كمية محدودة فقط من وقت أخصائي الأشعة. بدلاً من مطالبته بتصنيف الصور العشوائية، يمكن لنظام التعلم النشط تحديد الحالات الأكثر غموضًا أو نادرة للمراجعة. هذا يركز جهد الخبير حيث تشتد الحاجة إليه، مما يسرع تطوير نموذج عالي الدقة لمهام مثل الكشف عن أورام الدماغ. تظهر الأبحاث في هذا المجال انخفاضًا كبيرًا في جهد التصنيف، كما هو مفصل في دراسات مثل هذه الدراسة حول تجزئة الصور الطبية الحيوية.
  • القيادة الذاتية: يجب تدريب أنظمة الإدراك في المركبات ذاتية القيادة على مجموعات بيانات واسعة ومتنوعة تغطي عددًا لا يحصى من سيناريوهات القيادة. يمكن للتعلم النشط تحديد "الحالات الشاذة" من بيانات القيادة التي تم جمعها - مثل أحد المشاة المختبئ جزئيًا خلف أحد العوائق أو الظروف الجوية غير العادية - التي يعاني منها نموذج اكتشاف الكائنات الحالي. من خلال تحديد أولويات هذه المشاهد الصعبة للتعليق التوضيحي، يمكن للمطورين تحسين قوة النموذج وسلامته بشكل أكثر فعالية.

التعلم النشط مقابل المفاهيم ذات الصلة

من المهم التمييز بين التعلم النشط ونماذج التعلم الأخرى التي تستخدم أيضًا بيانات غير مصنفة:

  • التعلم شبه الخاضع للإشراف: يستخدم كلاً من البيانات المصنفة وغير المصنفة في وقت واحد أثناء التدريب. على عكس التعلم النشط، فإنه يستخدم عادةً جميع البيانات غير المصنفة المتاحة بشكل سلبي، بدلاً من الاستعلام بشكل انتقائي عن مثيلات محددة للحصول على تصنيفات.
  • التعلم بالإشراف الذاتي: يتعلم التمثيلات من البيانات غير المصنفة عن طريق إنشاء مهام ذرائعية (مثل التنبؤ بجزء محجوب من الصورة). لا يتطلب تعليقًا بشريًا خلال مرحلة التدريب المسبق، في حين أن التعلم النشط يعتمد على وسيط للحصول على التصنيفات. استكشفت DeepMind هذا المجال على نطاق واسع.
  • التعلم بالتعزيز: يتعلم عن طريق التجربة والخطأ من خلال التفاعل مع بيئة ما، وتلقي المكافآت أو العقوبات على الإجراءات. لا يتضمن الاستعلام عن التصنيفات الصريحة مثل التعلم النشط.
  • Federated Learning: يركز على تدريب النماذج عبر الأجهزة اللامركزية مع الحفاظ على البيانات محلية، ومعالجة مخاوف خصوصية البيانات بشكل أساسي. يركز التعلم النشط على اكتساب التسميات بكفاءة. يمكن دمج هذه التقنيات في بعض الأحيان.

الأدوات والتنفيذ

غالبًا ما يتضمن تطبيق التعلم النشط دمج نماذج ML مع أدوات الشرح وإدارة سير عمل البيانات. تقدم أطر العمل مثل scikit-learn بعض الوظائف، بينما توجد مكتبات متخصصة لمهام محددة. يمكن دمج برامج الشرح مثل Label Studio في مسارات التعلم النشط، مما يسمح للشراح بتقديم تسميات للعينات المستعلم عنها. تعد الإدارة الفعالة لـ مجموعات البيانات المتطورة و النماذج المدربة أمرًا بالغ الأهمية، وتوفر منصات مثل Ultralytics HUB بنية أساسية لتنظيم هذه الأصول طوال دورة حياة التطوير. استكشف مستودع Ultralytics GitHub لمزيد من المعلومات حول تنفيذ تقنيات ML المتقدمة.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة