Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

التعلّم بعدد قليل من الأمثلة

اكتشف كيف يمكّن التعلّم بعدد قليل من الأمثلة الذكاء الاصطناعي من التكيف بأقل قدر من البيانات، مما يغير مجالات مثل التشخيص الطبي والحفاظ على الحياة البرية.

تعلُّم اللقطات القليلة (FSL) هو مجال فرعي متخصص في التعلم الآلي (ML) الذي يركز على تدريب نماذج الذكاء الاصطناعي لتصنيف المفاهيم الجديدة أو detect أو فهمها باستخدام عدد قليل جدًا من الأمثلة المصنفة. في التعلّم التعلم العميق التقليدي (DL)، غالبًا ما تتطلب النماذج آلاف من الصور لكل فئة لتحقيق دقة عالية. ومع ذلك، يحاكي التعلُّم العميق الفائق القدرة البشرية على التعميم بسرعة من خلال محدودة - مثلما يستطيع الطفل التعرف على الزرافة بعد رؤية صورة أو صورتين فقط. هذه القدرة حاسمة للتطبيقات التي يكون فيها الحصول على كميات كبيرة من بيانات التدريب مكلفة، أو تستغرق وقتًا طويلاً، أو أو مستحيل عملياً.

الآليات الأساسية لتعلم اللقطات القليلة

الهدف الأساسي من FSL هو تقليل الاعتماد على مجموعات البيانات الضخمة من خلال الاستفادة من المعرفة المسبقة. بدلاً من تعلّم أنماط جديدة من الصفر، يستخدم النموذج المعلومات المستفادة من مجموعة بيانات أساسية لتفسير الأمثلة القليلة القليلة المتاحة لمهمة جديدة. وغالبًا ما يتم تحقيق ذلك من خلال أساليب متميزة:

  • التعلّم الفوقي: غالبًا ما يوصف بأنه "التعلم للتعلم" يُدرّب التعلّم الفوقي النماذج على التكيف بسرعة مع المهام الجديدة. تعمل خوارزميات مثل التعلم التعريفي الحيادي للنموذج (MAML) على تحسين المعلمات الداخلية للنموذج بحيث تؤدي بعض خطوات التدرج في مهمة جديدة إلى أداء جيد.
  • التعلّم القائم على القياس: يقوم هذا النهج بتعيين البيانات المدخلة في فضاء مميز حيث تكون العناصر المتشابهة قريبة من بعضها البعض والعناصر غير المتشابهة متباعدة. تقنيات مثل الشبكات النموذجية: تحسب الشبكات النموذجية تمثيلًا متوسطًا (نموذجًا أوليًا) لكل فئة لكل فئة classify عينات الاستعلام الجديدة بناءً على المسافة بينها وبين هذه النماذج الأولية، وتعمل بشكل مشابه لنهج المتطورة k-أقرب الجيران (k-NN) المعقدة.
  • زيادة البيانات: عندما تكون العينات نادرة، غالبًا ما يقوم الباحثون بتوسيع مجموعة البيانات بشكل مصطنع. يمكن لتقنيات زيادة البيانات المتقدمة توليد اختلافات اصطناعية للصور القليلة المتاحة، مما يساعد على منع النموذج من من الإفراط في ملاءمة الأمثلة المحدودة.

تطبيق التعلُّم من اللقطات القليلة باستخدام YOLO11

في سيناريوهات الرؤية الحاسوبية العملية (CV) ، كثيراً ما يتم تطبيق FSL في كثير من الأحيان عن طريق التعلُّم التحويلي. من خلال أخذ نموذج قوي مثل YOLO11الذي تعلّم بالفعل ميزات غنية من مجموعات بيانات ضخمة مثل COCO, يمكن للمطورين ضبط النموذج على مجموعة بيانات صغيرة مخصصة. تعمل الأوزان المدربة مسبقًا كميزة قوية قوية، مما يسمح للنموذج بالتقارب على فئات جديدة مع عدد قليل جدًا من العينات.

توضّح شيفرة Python التالية كيفية تطبيق هذا المفهوم باستخدام الرمز ultralytics الحزمة. من خلال تحميل نموذج مُدرَّب مسبقًا والتدريب لفترة قصيرة على مجموعة بيانات صغيرة، فإنك تقوم بشكل أساسي بإجراء قليلة.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model to leverage learned feature representations
model = YOLO("yolo11n.pt")

# Fine-tune the model on a small dataset (e.g., 'coco8.yaml' has only 4 images per batch)
# The model adapts its existing knowledge to the new few-shot task
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# The model can now detect objects from the small dataset with high efficiency

تمييز اللقطات القليلة من المفاهيم ذات الصلة

ولفهم مدى ملاءمة تقنية FSL لمشهد الذكاء الاصطناعي، من المفيد التفريق بينها وبين نماذج التعلم المماثلة:

  • التعلم بدون أمثلة (ZSL): بينما يتطلّب التعلّم على الأقل مجموعة صغيرة من الأمثلة ("مجموعة الدعم")، لا يتطلّب التعلّم من دون أمثلة مرئية على الإطلاق أثناء التدريب على الاستدلال للفئة المستهدفة المحددة. بدلاً من ذلك، تعتمد ZSL على الأوصاف الدلالية أو أو السمات (مثل تضمينات النص) للتعرف على الفئات غير المرئية.
  • التعلّم دفعة واحدة: هذه حالة حالة متطرفة من FSL حيث يجب على النموذج أن يتعلم فئة جديدة من مثال واحد فقط من الأمثلة المصنفة. إنه معيار قياسي في أنظمة التعرف على الوجوه، حيث يفتح الهاتف بعد رؤية وجه المستخدم مرة واحدة فقط.
  • نقل التعلّم: التعلُّم التحويلي هو تطبيق محدد لتعلم النقل. قد يستمر التعلم النقلي القياسي في استخدام مئات الصور من أجل للضبط الدقيق، في حين يستهدف تعلم التحويل التلقائي صراحةً سيناريوهات مع أنظمة بيانات منخفضة جدًا (على سبيل المثال، من 5 إلى 10 صور لكل فئة).

تطبيقات واقعية

يُطلق التعلُّم من خلال اللقطات القليلة الإمكانات في الصناعات التي تندر فيها البيانات بطبيعة الحال أو تندر فيها الحالات الشاذة المميزة.

التشخيص الطبي

في تحليل الصور الطبية، فإن الحصول على الآلاف من عمليات المسح الضوئي الموسومة للأمراض النادرة أمر مستحيل في كثير من الأحيان. تتيح تقنية FSL نماذج الذكاء الاصطناعي من تحديد أنواع الأورام النادرة أو الحالات الوراثية النادرة باستخدام عدد قليل من دراسات الحالات المشروحة. تعمل مؤسسات مثل ستانفورد للطب تعمل بنشاط على استكشاف هذه التقنيات لإضفاء الطابع الديمقراطي على أدوات تشخيصية للأمراض الناقصة التمثيل.

مراقبة جودة التصنيع

يعتمد الذكاء الاصطناعي الحديث في التصنيع على اكتشاف العيوب لضمان الجودة. ومع ذلك، قد تحدث عيوب معينة مرة واحدة فقط في مليون وحدة. بدلاً من الانتظار أشهر لجمع مجموعة بيانات كبيرة من "العيوب"، يستخدم المهندسون نظام FSL لتدريب أنظمة الكشف عن العيوب على أمثلة قليلة من عيب جديد، مما يسمح بالنشر الفوري لبروتوكولات ضمان الجودة المحدثة.

الروبوتات والتكيف

غالباً ما تواجه الروبوتات التي تعمل في بيئات ديناميكية أجساماً لم ترها من قبل. باستخدام FSL, يمكن لأنظمة الروبوتات أن تتعلم الإمساك أو التعامل مع أداة جديدة جديدة بعد عرضها عدة مرات فقط. هذه القدرة ضرورية للأتمتة المرنة في في مجال التخزين والخدمات اللوجستية، وهي محور تركيز شركات مثل بوسطن ديناميكس.

التحديات والتوقعات المستقبلية

على الرغم من أنها واعدة، إلا أنها تواجه تحديات فيما يتعلق بالموثوقية. يمكن أن تكون النماذج حساسة للأمثلة القليلة المحددة المقدمة؛ فإذا كانت مجموعة الدعم غير تمثيلية، ينخفض الأداء بشكل كبير. تركز الأبحاث الحالية على على تحسين متانة التضمينات وتطوير طرق أفضل لتقدير عدم اليقين. أطر عمل مثل PyTorch و TensorFlow تستمر في التطور، مما يوفر للباحثين الأدوات اللازمة لدفع حدود التعلم الفعال للبيانات. كما أن نماذج مثل YOLO26 فإننا نتوقع قدرات أكبر في التعلم من الحد الأدنى من مدخلات البيانات.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن