مسرد المصطلحات

التعلم الصفري

اكتشف التعلُّم من الصفر: نهج متطور للذكاء الاصطناعي يُمكِّن النماذج من classify البيانات غير المرئية، مما يُحدث ثورة في اكتشاف الأشياء، ومعالجة اللغات الطبيعية وغيرها.

التعلُّم الصفري (ZSL) هو نموذج قوي في التعلم الآلي (ML) الذي يمكّن نماذج نماذج الذكاء الاصطناعي من التعرف على الأشياء التي لم تصادفها أثناء مرحلة تدريب البيانات. في التعلّم التقليدي التعلم التقليدي الخاضع للإشراف، يجب تدريب النموذج على آلاف الصور المصنفة لكل فئة محددة يحتاج إلى تحديدها. يتخلص ZSL من هذا القيد من خلال الاستفادة من المعلومات الإضافية - عادةً الأوصاف النصية أو السمات أو التضمينات الدلالية لسدالفجوة بين الفئات المرئية وغير المرئية غير المرئية. تتيح هذه الإمكانية لأنظمة الذكاء الاصطناعي أن تكون أكثر مرونة وقابلية للتطوير وقادرة على التعامل مع البيئات الديناميكية حيث يكون جمع البيانات الشاملة بيانات شاملة لكل كائن ممكن أمر غير عملي.

كيف يعمل التعلّم من الصفر

تتضمن الآلية الأساسية ل ZSL نقل المعرفة من المفاهيم المألوفة إلى المفاهيم غير المألوفة باستخدام فضاء دلالي مشترك. فبدلاً من تعلم التعرف على "قطة" فقط من خلال حفظ أنماط البكسل فقط، يتعلم النموذج يتعلّم العلاقة بين السمات البصرية والسمات الدلالية (على سبيل المثال، "فروي" "شعيرات"، "أربعة أرجل") المستمدة من معالجة اللغة الطبيعية (NLP).

تعتمد هذه العملية غالبًا على نماذج متعددة الوسائط تعمل على مواءمة الصور والنصوص التمثيلات النصية. على سبيل المثال، توضح الأبحاث التأسيسية مثل OpenAI's CLIP يوضح كيف يمكن للنماذج أن تتعلم المفاهيم البصرية من الإشراف على اللغة الطبيعية. عندما يصادف نموذج ZSL كائنًا غير مرئي، مثل أنواع الطيور النادرة، فإنه يستخرج السمات البصرية ويقارنها بقاموس من المتجهات الدلالية. إذا كانت السمات البصرية تتماشى مع مع الوصف الدلالي للفئة الجديدة، يمكن للنموذج أن classify بشكل صحيح، مما يؤدي بشكل فعال إلى تنبؤاً "صفرياً".

التمييز عن المفاهيم ذات الصلة

لفهم ZSL فهماً كاملاً، من المفيد تمييزه عن استراتيجيات التعلم المماثلة المستخدمة في الرؤية الحاسوبية (CV):

التعلُّم بالقليل من اللقطات (FSL): في حين أن ZSL لا يتطلب أي أمثلة للفئة المستهدفة، فإن التعلم عن طريق اللقطات القليلة يوفر للنموذج مجموعة دعم صغيرة جداً (عادةً من 1 إلى 5 أمثلة) للتكيف. تُعد ZSL أكثر صعوبة لأنها تعتمد بالكامل على الاستدلال الدلالي بدلاً من بدلاً من الأمثلة المرئية.
التعلّم دفعة واحدة: مجموعة فرعية من FSL حيث يتعلم النموذج من مثال واحد مُسمّى فقط. يختلف ZSL اختلافًا جوهريًا لأنه يعمل بدون حتى صورة واحدة للفئة الجديدة.
نقل التعلّم: يشير هذا المصطلح الواسع يشير المصطلح إلى نقل المعرفة من مهمة إلى أخرى. ZSL هو نوع محدد من التعلم النقلي الذي يستخدم يستخدم السمات الدلالية لنقل المعرفة إلى فئات غير مرئية دون الحاجة إلى الضبط التقليدي الضبط التقليدي على البيانات الجديدة.

تطبيقات واقعية

يقود التعلّم الصفري إلى الابتكار في مختلف الصناعات من خلال تمكين الأنظمة من التعميم إلى ما بعد التدريب الأولي.

الكشف عن الكائنات مفتوحة المفردات: تستخدم البنى الحديثة مثل YOLO تستخدم ZSL detect الكائنات استنادًا إلى مطالبات نصية محددة من قبل المستخدم. يسمح ذلك ب باكتشاف الكائنات في السيناريوهات التي يكون فيها تحديد قائمة ثابتة من الفئات مسبقًا أمرًا مستحيلًا، مثل البحث عن عناصر محددة في أرشيفات الفيديو الضخمة. يعمل الباحثون في أبحاثGoogle ومؤسسات أخرى بنشاط على تحسين قدرات هذه المفردات المفتوحة.
التشخيص الطبي: في الذكاء الاصطناعي في مجال الرعاية الصحية، فإن الحصول على بيانات موسومة عن للأمراض النادرة أمر صعب ومكلف. يمكن تدريب نماذج ZSL على الحالات الشائعة وأوصاف الأعراض النادرة من الكتب الطبية النادرة من الكتب الطبية (على سبيل المثال، مقالات مجلات PubMed )، مما يمكّن النظام من النظام من الإبلاغ عن الحالات الشاذة النادرة المحتملة في الأشعة السينية أو التصوير بالرنين المغناطيسي دون الحاجة إلى مجموعة بيانات ضخمة من الحالات الإيجابية.
الحفاظ على الحياة البرية: بالنسبة لـ الذكاء الاصطناعي في الزراعة والبيئة، فإن تحديد الأنواع المهددة بالانقراض التي نادراً ما يتم تصويرها أمر بالغ الأهمية. تسمح ZSL للمحافظين على البيئة detect هذه الحيوانات باستخدام الأوصاف القائمة على السمات (مثل أنماط الفراء المحددة أو أشكال القرون) المحددة في قواعد البيانات البيولوجية مثل موسوعة الحياة.

اكتشاف اللقطة الصفرية باستخدام Ultralytics

يجسّد نموذج Ultralytics YOLO نموذج "اللقطة الصفرية التعلم في العمل. فهو يتيح للمستخدمين تحديد الفئات المخصصة ديناميكيًا في وقت التشغيل دون إعادة تدريب النموذج. يتم تحقيق ذلك يتم تحقيق ذلك من خلال ربط YOLO11 العمود الفقري للكشف مع مشفر نصي قائم على CLIP.

يوضّح مثال Python التالي كيفية استخدام YOLO detect الأشياء التي لم تكن جزءًا من مجموعة بيانات COCO القياسية، مثل ألوان معينة من الملابس، باستخدام ultralytics الحزمة.

from ultralytics import YOLOWorld

# Load a pre-trained YOLO-World model
model = YOLOWorld("yolov8s-world.pt")

# Define custom classes for Zero-Shot detection using text prompts
# The model will now look for these specific descriptions
model.set_classes(["blue backpack", "red apple", "person wearing sunglasses"])

# Run inference on an image to detect the new zero-shot classes
results = model.predict("path/to/image.jpg")

# Show the results
results[0].show()

التحديات والتوقعات المستقبلية

بينما توفر ZSL إمكانات هائلة، إلا أنها تواجه تحديات مثل مشكلة تحول المجال، حيث لا تتوافق السمات الدلالية المكتسبة أثناء التدريب السمات الدلالية المكتسبة أثناء التدريب لا تتوافق تمامًا مع المظهر المرئي للفئات غير المرئية. بالإضافة إلى ذلك، يمكن أن تعاني نماذج ZSL من التحيز، حيث تكون دقة التنبؤ أعلى بكثير بالنسبة للفئات المرئية للفئات المرئية مقارنةً بالفئات غير المرئية (التعلم الصفري المعمم).

تواصل الأبحاث التي تجريها منظمات مثل مختبر الذكاء الاصطناعي بجامعة ستانفورد و تواصل جمعية IEEE للحاسوب معالجة هذه القيود. بينما تصبح نماذج الأساس أكثر قوة، من المتوقع أن تصبح ZSL من المتوقع أن تصبح ميزة قياسية في في أدوات الرؤية الحاسوبية، مما يقلل من الاعتماد على جهود وضع علامات البيانات الضخمة وإضفاء الطابع الديمقراطي على قدرات الذكاء الاصطناعي المتقدمة.

التعلم الصفري

تدريب نماذج Ultralytics YOLO لتبسيط سير العمل في مختلف الصناعات

حل ترخيص مرن للمؤسسات لدعم ابتكاراتك

تدريب نماذج الذكاء الاصطناعي في ثوانٍ مع Ultralytics YOLO

كيف يعمل التعلّم من الصفر

التمييز عن المفاهيم ذات الصلة

تطبيقات واقعية

اكتشاف اللقطة الصفرية باستخدام Ultralytics

التحديات والتوقعات المستقبلية

اقرأ المزيد في هذه الفئة

تقنية الرؤية الاصطناعية تتيح تقنية التعرف على الإيماءات بدون لمس

استخدامYOLO Ultralytics YOLO للكشف عن تسربات الألواح

الدليل الشامل لأدوات تقدير الوضعيات

انضم إلى مجتمع Ultralytics