Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

التعلّم بعدد قليل من الأمثلة

استكشف التعلم من عدد قليل من اللقطات (FSL) لتدريب الذكاء الاصطناعي باستخدام الحد الأدنى من البيانات. تعرف على كيفية استفادة Ultralytics من التعلم التلوي للتكيف السريع والدقة العالية.

التعلم من عدد قليل من اللقطات (FSL) هو مجال فرعي متخصص من التعلم الآلي (ML) مصمم لتدريب النماذج على التعرف على المفاهيم classify باستخدام عدد قليل جدًا من الأمثلة المصنفة. في التعلم العميق التقليدي (DL)، يتطلب تحقيق دقة عالية عادةً مجموعات بيانات ضخمة تحتوي على آلاف الصور لكل فئة. ومع ذلك، يحاكي FSL القدرة الإدراكية البشرية على التعميم السريع من تجربة محدودة، تمامًا مثلما يستطيع الطفل التعرف على الزرافة بعد رؤية صورة أو صورتين فقط في كتاب. هذه القدرة ضرورية لنشر الذكاء الاصطناعي (AI) في السيناريوهات التي يكون فيها جمع كميات كبيرة من بيانات التدريب مكلفًا للغاية ويستغرق وقتًا طويلاً أو مستحيلًا من الناحية العملية.

الآليات الأساسية لتعلم اللقطات القليلة

الهدف الأساسي لـ FSL هو تقليل الاعتماد على جمع البيانات على نطاق واسع من خلال الاستفادة من المعرفة المسبقة. بدلاً من تعلم الأنماط من الصفر، يستخدم النموذج "مجموعة دعم" تحتوي على بعض الأمثلة الموسومة لفهم الفئات الجديدة. وغالبًا ما يتم تحقيق ذلك من خلال تقنيات متقدمة مثل التعلم التلوي، المعروف أيضًا باسم "التعلم من أجل التعلم". في هذا النموذج، يتم تدريب النموذج على مجموعة متنوعة من المهام بحيث يتعلم قاعدة التهيئة أو التحديث المثلى، مما يسمح له بالتكيف مع المهام الجديدة بأقل قدر من التعديلات.

هناك نهج شائع آخر يتضمن التعلم القائم على المقاييس، حيث يتعلم النموذج تخطيط بيانات الإدخال في فضاء متجه باستخدام التضمينات. في هذا الفضاء، يتم تجميع العناصر المتشابهة معًا بينما يتم فصل العناصر غير المتشابهة. تقوم خوارزميات مثل الشبكات النموذجية بحساب تمثيل متوسط، أو نموذج أولي، لكل فئة classify عينات الاستعلام classify بناءً على بعدها عن هذه النماذج الأولية. يعتمد هذا غالبًا على قدرات استخراج الميزات التي تم تطويرها أثناء التدريب المسبق على مجموعات بيانات عامة أكبر.

تطبيقات واقعية

التعلم من خلال عدد قليل من المحاولات (Few-Shot Learning) يحدث تحولاً في الصناعات التي كانت ندرة البيانات فيها تعيق في السابق اعتماد تقنيات الذكاء الاصطناعي.

التصوير الطبي والتشخيص

في مجال تحليل الصور الطبية، غالبًا ما يكون الحصول على آلاف المسح الضوئي الموسوم لأمراض نادرة أمرًا غير ممكن. تتيح FSL للباحثين تدريب أنظمة الرؤية الحاسوبية (CV) على detect أنواع الأورام النادرة أو التشوهات الجينية المحددة باستخدام عدد قليل من دراسات الحالات الموسومة. تعمل هذه القدرة على إتاحة الوصول إلى أدوات التشخيص المتقدمة، وهو هدف تسعى إليه مؤسسات مثل Stanford Medicine، مما يساعد على تحديد الحالات التي تتطلب خبرات بشرية متخصصة.

مراقبة الجودة الصناعية

تعتمد الذكاء الاصطناعي الحديث في التصنيع بشكل كبير على الفحص الآلي. ومع ذلك، قد تحدث عيوب محددة في حالات نادرة جدًا، مما يجعل من الصعب إنشاء مجموعة بيانات كبيرة من الأجزاء "السيئة". تتيح FSL لأنظمة الكشف عن الحالات الشاذة تعلم خصائص نوع جديد من العيوب من خلال عدد قليل من الصور. وهذا يسمح لمشغلي المصانع بتحديث بروتوكولات ضمان الجودة بسرعة دون إيقاف الإنتاج لجمع البيانات، مما يحسن بشكل كبير من الكفاءة في بيئات الإنتاج الديناميكية .

التمييز بين المفاهيم ذات الصلة

من المفيد التمييز بين FSL ونماذج التعلم المماثلة التي تعتمد على بيانات قليلة لفهم مجالها المحدد:

  • التعلم النقلي: غالبًا ما يتم تنفيذ FSL كشكل محدد ومتطرف من أشكال التعلم النقلي. في حين أن التعلم النقلي القياسي قد يضبط نموذجًا مثل YOLO26 على مئات الصور، فإن FSL يستهدف سيناريوهات ربما تحتوي على 5 إلى 10 صور فقط لكل فئة (المعروفة باسم تصنيف "N-way K-shot").
  • التعلم من مرة واحدة: هذا هو مجموعة فرعية صارمة من FSL حيث يجب أن يتعلم النموذج من مثال واحد مصنف بالضبط. ويستخدم عادة في التعرف على الوجه للتحقق من الهوية مقابل صورة واحدة مخزنة.
  • التعلم بدون تدريب (Zero-Shot Learning): على عكس التعلم من خلال التعرض (FSL)، الذي يتطلب على الأقل مجموعة صغيرة من الدعم البصري، لا يتطلب التعلم بدون تدريب أي أمثلة بصرية للفئة المستهدفة أثناء التدريب. بدلاً من ذلك، يعتمد على الأوصاف أو السمات الدلالية (مثل المطالبات النصية) للتعرف على الكائنات غير المرئية.

التنفيذ العملي باستخدام Ultralytics

في الممارسة العملية، تتمثل إحدى أكثر الطرق فعالية لتنفيذ التعلم بعدد قليل من المحاولات في الاستفادة من نموذج مسبق التدريب عالي القوة . وقد تعلمت النماذج الحديثة مثل YOLO26 الأحدث تمثيلات غنية للميزات من مجموعات بيانات ضخمة مثل COCO أو ImageNet. من خلال ضبط هذه النماذج على مجموعة بيانات مخصصة صغيرة ، يمكنها التكيف مع المهام الجديدة بسرعة ودقة ملحوظتين.

يوضح Python التالي Python كيفية تدريب نموذج على مجموعة بيانات صغيرة باستخدام ultralytics حزمة، تؤدي بشكل فعال التكيف بعدة محاولات:

from ultralytics import YOLO

# Load a pre-trained YOLO26 model (incorporates learned features)
model = YOLO("yolo26n.pt")

# Fine-tune on a tiny dataset (e.g., coco8 has only 4 images per batch)
# This leverages the model's prior knowledge for the new task
results = model.train(data="coco8.yaml", epochs=20, imgsz=640)

# The model adapts to detect objects in the small dataset
print("Few-shot adaptation complete.")

التحديات والتوقعات المستقبلية

على الرغم من قوتها، تواجه FSL تحديات تتعلق بالموثوقية. إذا كانت الأمثلة القليلة المقدمة شاذة أو مشوشة، فإن أداء النموذج يمكن أن يتدهور، وهي مشكلة تعرف باسم التكيف المفرط. البحث في زيادة البيانات و توليد البيانات الاصطناعية أمر بالغ الأهمية للتخفيف من هذه المخاطر. مع تزايد حجم النماذج الأساسية وزيادة قدراتها، وتبسيط أدوات مثل Ultralytics لتدريب النماذج وإدارتها، ستصبح القدرة على إنشاء حلول ذكاء اصطناعي مخصصة باستخدام الحد الأدنى من البيانات متاحة بشكل متزايد للمطورين في جميع أنحاء العالم.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن