أتقن فن هندسة الموجهات لتوجيه نماذج الذكاء الاصطناعي مثل نماذج اللغات الكبيرة (LLMs) للحصول على مخرجات دقيقة وعالية الجودة في المحتوى وخدمة العملاء والمزيد.
هندسة المطالبات هي فن وعلم تصميم مدخلات فعالة (مطالبات) لتوجيه نماذج الذكاء الاصطناعي (AI)، وخاصة النماذج اللغوية الكبيرة (LLMs)، نحو توليد المخرجات المرغوبة. إنه مماثل لكونك متواصلاً ماهراً مع الذكاء الاصطناعي، مع معرفة دقيقة بما يجب قوله وكيفية قوله للحصول على أفضل استجابة ممكنة. هذه الممارسة ضرورية لأن الأداء والأهمية والجودة لمخرجات نموذج الذكاء الاصطناعي حساسة للغاية للطريقة التي يتم بها تأطير الاستعلام. تتيح هندسة المطالبات الفعالة للمستخدمين تسخير الإمكانات الكاملة لنماذج الأساس القوية لمجموعة واسعة من المهام.
يكمن جوهر هندسة المطالبات في هيكلة مدخل يوفر سياقًا واضحًا وكافيًا للنموذج. في حين أن السؤال البسيط يمكن أن يسفر عن إجابة أساسية، إلا أن المطالبة المصممة جيدًا يمكن أن تتحكم في النبرة والتنسيق والتعقيد. يمكن أن تتضمن المكونات الرئيسية للمطالبة المتقدمة ما يلي:
أتمتة دعم العملاء: لضمان اتساق العلامة التجارية ودقتها، يمكن للشركة استخدام هندسة المطالبات لتوجيه برنامج الدردشة الخاص بالدعم. قد توجه المطالبة الذكاء الاصطناعي إلى تبني لهجة ودية ومفيدة، واستخدام قاعدة معارف داخلية للإجابة على أسئلة المنتج، وتحديد بروتوكول واضح لتصعيد المحادثة إلى وكيل بشري. يتحكم هذا في سلوك الذكاء الاصطناعي، ويمنعه من تقديم معلومات غير صحيحة أو التفاعل مع العملاء بطريقة غير متوافقة مع العلامة التجارية.
إنشاء المحتوى الإبداعي: في نماذج تحويل النص إلى صورة مثل Midjourney أو DALL-E 3 من OpenAI، يكون الموجه هو الأداة الأساسية للإبداع. سينتج عن موجه بسيط مثل "صورة لسيارة" نتيجة عامة. ومع ذلك، فإن الموجه التفصيلي مثل "سيارة رياضية حمراء كلاسيكية من الستينيات تنطلق بسرعة على طريق ساحلي عند غروب الشمس، بأسلوب واقعي للغاية، وإضاءة سينمائية، ودقة 8K" يوفر تعليمات محددة حول الموضوع والإعداد والأسلوب والجودة، مما ينتج صورة مخصصة للغاية ومذهلة بصريًا.
في حين أنه نشأ في معالجة اللغة الطبيعية (NLP)، إلا أن هندسة المطالبات (prompt engineering) أصبحت ذات صلة متزايدة في الرؤية الحاسوبية (CV). وهذا مدفوع بتطوير النماذج متعددة الوسائط التي يمكنها معالجة كل من النصوص والصور في وقت واحد. يمكن لنماذج مثل CLIP وأدوات الكشف عن المفردات المفتوحة مثل YOLO-World أداء مهام مثل اكتشاف الكائنات بناءً على أوصاف نصية عشوائية. بالنسبة لهذه النماذج، فإن صياغة مطالبة نصية فعالة (مثل "اكتشاف جميع 'الدراجات الهوائية' ولكن تجاهل 'الدراجات النارية'") هي شكل من أشكال هندسة المطالبات الحاسمة لتوجيه نماذج لغة الرؤية هذه. تسهل منصات مثل Ultralytics HUB التفاعل مع النماذج المختلفة، حيث يمكن أن تستفيد المهام المحددة من خلال الواجهات من مبادئ هندسة المطالبات.
من المهم التمييز بين هندسة الموجهات ومفاهيم التعلم الآلي الأخرى: