Prompt Enrichment

تعرف على كيفية أتمتة إثراء المطالبات لزيادة المدخلات لتحسين دقة الذكاء الاصطناعي. اكتشف كيفية استخدام هذه التقنية مع Ultralytics YOLO26 لمهام رؤية أكثر ذكاءً.

إثراء المطالبات هو عملية آلية تهدف إلى تعزيز المدخلات الأولية للمستخدم بسياق ذي صلة، أو تعليمات محددة، أو بيانات تكميلية قبل إرسالها إلى نموذج الذكاء الاصطناعي (AI). تعمل هذه التقنية كطبقة وسيطة ذكية تعمل على تحسين التفاعل بين البشر والآلات، مما يضمن تلقي نماذج اللغات الكبيرة (LLMs) وأنظمة الرؤية الحاسوبية لاستفسارات شاملة. من خلال حقن تفاصيل قد يغفل عنها المستخدم—مثل التفضيلات التاريخية، أو بيانات الموقع الجغرافي، أو القيود التقنية—يعمل إثراء المطالبات على تحسين الدقة وتخصيص مخرجات النموذج بشكل كبير دون الحاجة إلى أن يكون المستخدم خبيراً في صياغة تعليمات مفصلة.

Link to this sectionآلية الإثراء#

الوظيفة الأساسية لإثراء المطالبات هي سد الفجوة بين النوايا البشرية الغامضة والمدخلات الدقيقة والغنية بالبيانات التي تتطلبها النماذج لتحقيق الأداء الأمثل. عند تلقي استعلام، يقوم النظام بتحليله واسترجاع معلومات الخلفية الضرورية من رسم بياني للمعرفة أو قاعدة بيانات مهيكلة. يتم تنسيق هذه البيانات المسترجعة برمجياً وإلحاقها بالمطالبة الأصلية.

على سبيل المثال، في سير عمل معالجة اللغات الطبيعية (NLP)، يعتبر سؤال بسيط مثل "ما هي الحالة؟" غير كافٍ من الناحية السياقية. يحدد نظام الإثراء الجلسة النشطة، ويسترجع رقم الطلب الأحدث من قاعدة بيانات المعاملات، ويعيد صياغة المطالبة إلى: "المستخدم يسأل عن الطلب رقم 998، والذي هو حالياً في مرحلة النقل. قدم تحديثاً للشحن بناءً على هذه الحالة." غالباً ما تستخدم هذه العملية قواعد بيانات المتجهات للعثور بسرعة على سياق ذي صلة دلالياً ليتم حقنه.

Link to this sectionتطبيقات العالم الحقيقي#

يعد إثراء المطالبات أمراً ضرورياً لنشر تطبيقات الذكاء الاصطناعي التوليدي القوية عبر مختلف الصناعات، مما يعزز الأنظمة النصية والقائمة على الرؤية:

دعم العملاء الواعي بالسياق: في مكاتب المساعدة المؤتمتة، يستخدم روبوت المحادثة الإثراء للوصول إلى تاريخ شراء العميل وبيئته التقنية. بدلاً من سؤال المستخدم عن إصدار جهازه، يسترجع النظام هذه المعلومات من بيانات الحساب الوصفية ويحقنها في المطالبة. هذا يسمح لـ وكيل الذكاء الاصطناعي بتقديم خطوات استكشاف أخطاء الجهاز وإصلاحها بشكل فوري ومحدد، مما يحسن تجربة العميل بشكل كبير.
تهيئة الرؤية الحاسوبية الديناميكية: في عمليات الأمان، قد يقوم المستخدم ببساطة بتبديل إعداد "الوضع الليلي". خلف الكواليس، يترجم إثراء المطالبات هذه النية عالية المستوى إلى فئات كائنات محددة لنموذج كشف مفتوح المفردات مثل YOLO-World. يقوم النظام بإثراء المطالبة للمسح الضوئي تحديداً عن "مصباح يدوي"، أو "حركة مريبة"، أو "شخص غير مصرح له"، مما يُمكّن النموذج من تكييف تركيز اكتشاف الكائنات الخاص به ديناميكياً.

Link to this sectionمثال: إثراء الفئات الديناميكي#

يوضح مثال Python التالي مفهوم إثراء المطالبات باستخدام حزمة ultralytics. هنا، يتم إثراء نية المستخدم عالية المستوى برمجياً لتصبح قائمة من الفئات الوصفية المحددة التي يقوم النموذج بالمسح الضوئي عنها.

from ultralytics import YOLO


def run_enriched_inference(user_mode):
    """Enriches a simple user mode into specific detection prompts."""
    # Load a YOLO-World model capable of open-vocabulary detection
    model = YOLO("yolov8s-world.pt")

    # Enrichment Logic: Map simple user intent to detailed class prompts
    context_map = {
        "site_safety": ["hard hat", "safety vest", "gloves"],
        "traffic": ["car", "bus", "traffic light", "pedestrian"],
    }

    # Inject the enriched context into the model
    enriched_classes = context_map.get(user_mode, ["object"])
    model.set_classes(enriched_classes)

    # The model now looks for the specific enriched terms
    print(f"Mode: {user_mode} -> Enriched Prompt: {enriched_classes}")


run_enriched_inference("site_safety")

Link to this sectionإثراء المطالبات مقابل المفاهيم ذات الصلة#

لتنفيذ عمليات تعلم الآلة (MLOps) بشكل فعال، من المفيد التمييز بين إثراء المطالبات والمصطلحات المشابهة:

التوليد المعزز بالاسترجاع (RAG): يعتبر RAG طريقة محددة للإثراء. فهو يشير بدقة إلى آلية جلب المستندات ذات الصلة من مجموعة نصوص خارجية لتدعيم استجابة النموذج. الإثراء هو المفهوم الأوسع الذي يتضمن RAG ولكنه يغطي أيضاً حقن بيانات الجلسة الثابتة، أو بيانات المستخدم الوصفية، أو وقت النظام دون الحاجة بالضرورة إلى إجراء بحث دلالي معقد.
هندسة المطالبات: هي الحرفة اليدوية لتصميم مطالبات فعالة. الإثراء هو عملية آلية تطبق مبادئ هندسة المطالبات ديناميكياً أثناء وقت التشغيل.
ضبط المطالبات: هي تقنية ضبط دقيق فعال للمعاملات (PEFT) حيث يتم تحسين "المطالبات اللينة" (الموترات القابلة للتعلم) أثناء التدريب. يحدث إثراء المطالبات بالكامل أثناء الاستنتاج في الوقت الفعلي ولا يغير أوزان النموذج.
التعلم ببضع لقطات (Few-Shot Learning): يتضمن ذلك تقديم أمثلة داخل المطالبة لتعليم النموذج مهمة معينة. غالباً ما تقوم أنظمة الإثراء بحقن هذه الأمثلة ببضع لقطات ديناميكياً بناءً على نوع المهمة، مما يجمع بفعالية بين كلا المفهومين.

Link to this sectionالأهمية في أنظمة الذكاء الاصطناعي الحديثة#

مع زيادة قدرة نماذج مثل Ultralytics YOLO26 و GPT-4، غالباً ما يتحول عنق الزجاجة إلى جودة المدخلات. يعمل إثراء المطالبات على تخفيف الهلوسة في نماذج LLMs من خلال تدعيم النموذج ببيانات واقعية مقدمة. في الرؤية الحاسوبية (CV)، يسمح ذلك بوجود أنظمة تعلم صفري اللقطات (Zero-Shot Learning) مرنة يمكنها التكيف مع بيئات جديدة فوراً دون إعادة تدريب، ببساطة عن طريق تعديل المطالبات النصية التي يتم إدخالها في النظام. هذه المرونة حاسمة لبناء حلول ذكاء اصطناعي متعدد الوسائط قابلة للتوسع يمكنها الاستنتاج عبر كل من النصوص والصور. غالباً ما يعتمد المستخدمون الذين يتطلعون إلى إدارة مجموعات البيانات المستخدمة لتدعيم هذه الأنظمة على أدوات مثل منصة Ultralytics لتنظيم بياناتهم وتعليقها بفعالية.