استكشف التعلم من عدد قليل من اللقطات (FSL) لتدريب الذكاء الاصطناعي باستخدام الحد الأدنى من البيانات. تعرف على كيفية استفادة Ultralytics من التعلم التلوي للتكيف السريع والدقة العالية.
التعلم من عدد قليل من اللقطات (FSL) هو مجال فرعي متخصص من التعلم الآلي (ML) مصمم لتدريب النماذج على التعرف على المفاهيم classify باستخدام عدد قليل جدًا من الأمثلة المصنفة. في التعلم العميق التقليدي (DL)، يتطلب تحقيق دقة عالية عادةً مجموعات بيانات ضخمة تحتوي على آلاف الصور لكل فئة. ومع ذلك، يحاكي FSL القدرة الإدراكية البشرية على التعميم السريع من تجربة محدودة، تمامًا مثلما يستطيع الطفل التعرف على الزرافة بعد رؤية صورة أو صورتين فقط في كتاب. هذه القدرة ضرورية لنشر الذكاء الاصطناعي (AI) في السيناريوهات التي يكون فيها جمع كميات كبيرة من بيانات التدريب مكلفًا للغاية ويستغرق وقتًا طويلاً أو مستحيلًا من الناحية العملية.
الهدف الأساسي لـ FSL هو تقليل الاعتماد على جمع البيانات على نطاق واسع من خلال الاستفادة من المعرفة المسبقة. بدلاً من تعلم الأنماط من الصفر، يستخدم النموذج "مجموعة دعم" تحتوي على بعض الأمثلة الموسومة لفهم الفئات الجديدة. وغالبًا ما يتم تحقيق ذلك من خلال تقنيات متقدمة مثل التعلم التلوي، المعروف أيضًا باسم "التعلم من أجل التعلم". في هذا النموذج، يتم تدريب النموذج على مجموعة متنوعة من المهام بحيث يتعلم قاعدة التهيئة أو التحديث المثلى، مما يسمح له بالتكيف مع المهام الجديدة بأقل قدر من التعديلات.
هناك نهج شائع آخر يتضمن التعلم القائم على المقاييس، حيث يتعلم النموذج تخطيط بيانات الإدخال في فضاء متجه باستخدام التضمينات. في هذا الفضاء، يتم تجميع العناصر المتشابهة معًا بينما يتم فصل العناصر غير المتشابهة. تقوم خوارزميات مثل الشبكات النموذجية بحساب تمثيل متوسط، أو نموذج أولي، لكل فئة classify عينات الاستعلام classify بناءً على بعدها عن هذه النماذج الأولية. يعتمد هذا غالبًا على قدرات استخراج الميزات التي تم تطويرها أثناء التدريب المسبق على مجموعات بيانات عامة أكبر.
التعلم من خلال عدد قليل من المحاولات (Few-Shot Learning) يحدث تحولاً في الصناعات التي كانت ندرة البيانات فيها تعيق في السابق اعتماد تقنيات الذكاء الاصطناعي.
في مجال تحليل الصور الطبية، غالبًا ما يكون الحصول على آلاف المسح الضوئي الموسوم لأمراض نادرة أمرًا غير ممكن. تتيح FSL للباحثين تدريب أنظمة الرؤية الحاسوبية (CV) على detect أنواع الأورام النادرة أو التشوهات الجينية المحددة باستخدام عدد قليل من دراسات الحالات الموسومة. تعمل هذه القدرة على إتاحة الوصول إلى أدوات التشخيص المتقدمة، وهو هدف تسعى إليه مؤسسات مثل Stanford Medicine، مما يساعد على تحديد الحالات التي تتطلب خبرات بشرية متخصصة.
تعتمد الذكاء الاصطناعي الحديث في التصنيع بشكل كبير على الفحص الآلي. ومع ذلك، قد تحدث عيوب محددة في حالات نادرة جدًا، مما يجعل من الصعب إنشاء مجموعة بيانات كبيرة من الأجزاء "السيئة". تتيح FSL لأنظمة الكشف عن الحالات الشاذة تعلم خصائص نوع جديد من العيوب من خلال عدد قليل من الصور. وهذا يسمح لمشغلي المصانع بتحديث بروتوكولات ضمان الجودة بسرعة دون إيقاف الإنتاج لجمع البيانات، مما يحسن بشكل كبير من الكفاءة في بيئات الإنتاج الديناميكية .
من المفيد التمييز بين FSL ونماذج التعلم المماثلة التي تعتمد على بيانات قليلة لفهم مجالها المحدد:
في الممارسة العملية، تتمثل إحدى أكثر الطرق فعالية لتنفيذ التعلم بعدد قليل من المحاولات في الاستفادة من نموذج مسبق التدريب عالي القوة . وقد تعلمت النماذج الحديثة مثل YOLO26 الأحدث تمثيلات غنية للميزات من مجموعات بيانات ضخمة مثل COCO أو ImageNet. من خلال ضبط هذه النماذج على مجموعة بيانات مخصصة صغيرة ، يمكنها التكيف مع المهام الجديدة بسرعة ودقة ملحوظتين.
يوضح Python التالي Python كيفية تدريب نموذج على مجموعة بيانات صغيرة باستخدام
ultralytics حزمة، تؤدي بشكل فعال التكيف بعدة محاولات:
from ultralytics import YOLO
# Load a pre-trained YOLO26 model (incorporates learned features)
model = YOLO("yolo26n.pt")
# Fine-tune on a tiny dataset (e.g., coco8 has only 4 images per batch)
# This leverages the model's prior knowledge for the new task
results = model.train(data="coco8.yaml", epochs=20, imgsz=640)
# The model adapts to detect objects in the small dataset
print("Few-shot adaptation complete.")
على الرغم من قوتها، تواجه FSL تحديات تتعلق بالموثوقية. إذا كانت الأمثلة القليلة المقدمة شاذة أو مشوشة، فإن أداء النموذج يمكن أن يتدهور، وهي مشكلة تعرف باسم التكيف المفرط. البحث في زيادة البيانات و توليد البيانات الاصطناعية أمر بالغ الأهمية للتخفيف من هذه المخاطر. مع تزايد حجم النماذج الأساسية وزيادة قدراتها، وتبسيط أدوات مثل Ultralytics لتدريب النماذج وإدارتها، ستصبح القدرة على إنشاء حلول ذكاء اصطناعي مخصصة باستخدام الحد الأدنى من البيانات متاحة بشكل متزايد للمطورين في جميع أنحاء العالم.