اكتشف كيف يمكّن التعلّم بعدد قليل من الأمثلة الذكاء الاصطناعي من التكيف بأقل قدر من البيانات، مما يغير مجالات مثل التشخيص الطبي والحفاظ على الحياة البرية.
تعلُّم اللقطات القليلة (FSL) هو مجال فرعي متخصص في التعلم الآلي (ML) الذي يركز على تدريب نماذج الذكاء الاصطناعي لتصنيف المفاهيم الجديدة أو detect أو فهمها باستخدام عدد قليل جدًا من الأمثلة المصنفة. في التعلّم التعلم العميق التقليدي (DL)، غالبًا ما تتطلب النماذج آلاف من الصور لكل فئة لتحقيق دقة عالية. ومع ذلك، يحاكي التعلُّم العميق الفائق القدرة البشرية على التعميم بسرعة من خلال محدودة - مثلما يستطيع الطفل التعرف على الزرافة بعد رؤية صورة أو صورتين فقط. هذه القدرة حاسمة للتطبيقات التي يكون فيها الحصول على كميات كبيرة من بيانات التدريب مكلفة، أو تستغرق وقتًا طويلاً، أو أو مستحيل عملياً.
الهدف الأساسي من FSL هو تقليل الاعتماد على مجموعات البيانات الضخمة من خلال الاستفادة من المعرفة المسبقة. بدلاً من تعلّم أنماط جديدة من الصفر، يستخدم النموذج المعلومات المستفادة من مجموعة بيانات أساسية لتفسير الأمثلة القليلة القليلة المتاحة لمهمة جديدة. وغالبًا ما يتم تحقيق ذلك من خلال أساليب متميزة:
في سيناريوهات الرؤية الحاسوبية العملية (CV) ، كثيراً ما يتم تطبيق FSL في كثير من الأحيان عن طريق التعلُّم التحويلي. من خلال أخذ نموذج قوي مثل YOLO11الذي تعلّم بالفعل ميزات غنية من مجموعات بيانات ضخمة مثل COCO, يمكن للمطورين ضبط النموذج على مجموعة بيانات صغيرة مخصصة. تعمل الأوزان المدربة مسبقًا كميزة قوية قوية، مما يسمح للنموذج بالتقارب على فئات جديدة مع عدد قليل جدًا من العينات.
توضّح شيفرة Python التالية كيفية تطبيق هذا المفهوم باستخدام الرمز ultralytics الحزمة. من خلال
تحميل نموذج مُدرَّب مسبقًا والتدريب لفترة قصيرة على مجموعة بيانات صغيرة، فإنك تقوم بشكل أساسي بإجراء
قليلة.
from ultralytics import YOLO
# Load a pre-trained YOLO11 model to leverage learned feature representations
model = YOLO("yolo11n.pt")
# Fine-tune the model on a small dataset (e.g., 'coco8.yaml' has only 4 images per batch)
# The model adapts its existing knowledge to the new few-shot task
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# The model can now detect objects from the small dataset with high efficiency
ولفهم مدى ملاءمة تقنية FSL لمشهد الذكاء الاصطناعي، من المفيد التفريق بينها وبين نماذج التعلم المماثلة:
يُطلق التعلُّم من خلال اللقطات القليلة الإمكانات في الصناعات التي تندر فيها البيانات بطبيعة الحال أو تندر فيها الحالات الشاذة المميزة.
في تحليل الصور الطبية، فإن الحصول على الآلاف من عمليات المسح الضوئي الموسومة للأمراض النادرة أمر مستحيل في كثير من الأحيان. تتيح تقنية FSL نماذج الذكاء الاصطناعي من تحديد أنواع الأورام النادرة أو الحالات الوراثية النادرة باستخدام عدد قليل من دراسات الحالات المشروحة. تعمل مؤسسات مثل ستانفورد للطب تعمل بنشاط على استكشاف هذه التقنيات لإضفاء الطابع الديمقراطي على أدوات تشخيصية للأمراض الناقصة التمثيل.
يعتمد الذكاء الاصطناعي الحديث في التصنيع على اكتشاف العيوب لضمان الجودة. ومع ذلك، قد تحدث عيوب معينة مرة واحدة فقط في مليون وحدة. بدلاً من الانتظار أشهر لجمع مجموعة بيانات كبيرة من "العيوب"، يستخدم المهندسون نظام FSL لتدريب أنظمة الكشف عن العيوب على أمثلة قليلة من عيب جديد، مما يسمح بالنشر الفوري لبروتوكولات ضمان الجودة المحدثة.
غالباً ما تواجه الروبوتات التي تعمل في بيئات ديناميكية أجساماً لم ترها من قبل. باستخدام FSL, يمكن لأنظمة الروبوتات أن تتعلم الإمساك أو التعامل مع أداة جديدة جديدة بعد عرضها عدة مرات فقط. هذه القدرة ضرورية للأتمتة المرنة في في مجال التخزين والخدمات اللوجستية، وهي محور تركيز شركات مثل بوسطن ديناميكس.
على الرغم من أنها واعدة، إلا أنها تواجه تحديات فيما يتعلق بالموثوقية. يمكن أن تكون النماذج حساسة للأمثلة القليلة المحددة المقدمة؛ فإذا كانت مجموعة الدعم غير تمثيلية، ينخفض الأداء بشكل كبير. تركز الأبحاث الحالية على على تحسين متانة التضمينات وتطوير طرق أفضل لتقدير عدم اليقين. أطر عمل مثل PyTorch و TensorFlow تستمر في التطور، مما يوفر للباحثين الأدوات اللازمة لدفع حدود التعلم الفعال للبيانات. كما أن نماذج مثل YOLO26 فإننا نتوقع قدرات أكبر في التعلم من الحد الأدنى من مدخلات البيانات.