استعدوا لـ YOLO Vision 2025!
25 سبتمبر، 2025
10:00 — 18:00 بتوقيت بريطانيا الصيفي
حدث هجين
مؤتمر Yolo Vision 2024
مسرد المصطلحات

هندسة الموجه

أتقن فن هندسة الموجهات لتوجيه نماذج الذكاء الاصطناعي مثل نماذج اللغات الكبيرة (LLMs) للحصول على مخرجات دقيقة وعالية الجودة في المحتوى وخدمة العملاء والمزيد.

هندسة المطالبات هي فن وعلم تصميم مدخلات فعالة (مطالبات) لتوجيه نماذج الذكاء الاصطناعي (AI)، وخاصة النماذج اللغوية الكبيرة (LLMs)، نحو توليد المخرجات المرغوبة. إنه مماثل لكونك متواصلاً ماهراً مع الذكاء الاصطناعي، مع معرفة دقيقة بما يجب قوله وكيفية قوله للحصول على أفضل استجابة ممكنة. هذه الممارسة ضرورية لأن الأداء والأهمية والجودة لمخرجات نموذج الذكاء الاصطناعي حساسة للغاية للطريقة التي يتم بها تأطير الاستعلام. تتيح هندسة المطالبات الفعالة للمستخدمين تسخير الإمكانات الكاملة لنماذج الأساس القوية لمجموعة واسعة من المهام.

كيف تعمل هندسة المطالبات (Prompt Engineering)

يكمن جوهر هندسة المطالبات في هيكلة مدخل يوفر سياقًا واضحًا وكافيًا للنموذج. في حين أن السؤال البسيط يمكن أن يسفر عن إجابة أساسية، إلا أن المطالبة المصممة جيدًا يمكن أن تتحكم في النبرة والتنسيق والتعقيد. يمكن أن تتضمن المكونات الرئيسية للمطالبة المتقدمة ما يلي:

  • تعليمات: توجيه واضح ومحدد يخبر النموذج بالمهام التي يجب تنفيذها (على سبيل المثال، "لخص المقالة التالية في ثلاث نقاط").
  • السياق: توفير معلومات أساسية أو بيانات ذات صلة يجب أن يستخدمها النموذج لإثراء استجابته.
  • الشخصية: تعيين دور للذكاء الاصطناعي لتبنيه، مما يؤثر على نبرة وأسلوب الإخراج (على سبيل المثال، "تصرف كمحلل مالي خبير").
  • التنسيق: تحديد الهيكل المطلوب للإخراج، مثل قائمة أو كائن JSON أو نمط كتابة معين.
  • أمثلة: إن تضمين أمثلة لتنسيق الإدخال والإخراج المطلوب، وهي تقنية تُعرف باسم التعلم قليل الطلقات (few-shot learning)، يساعد في توجيه استجابة النموذج. يمكن العثور على مورد شامل لهذه التقنيات في دليل المطالبات (Prompting Guide).

تطبيقات واقعية

  1. أتمتة دعم العملاء: لضمان اتساق العلامة التجارية ودقتها، يمكن للشركة استخدام هندسة المطالبات لتوجيه برنامج الدردشة الخاص بالدعم. قد توجه المطالبة الذكاء الاصطناعي إلى تبني لهجة ودية ومفيدة، واستخدام قاعدة معارف داخلية للإجابة على أسئلة المنتج، وتحديد بروتوكول واضح لتصعيد المحادثة إلى وكيل بشري. يتحكم هذا في سلوك الذكاء الاصطناعي، ويمنعه من تقديم معلومات غير صحيحة أو التفاعل مع العملاء بطريقة غير متوافقة مع العلامة التجارية.

  2. إنشاء المحتوى الإبداعي: في نماذج تحويل النص إلى صورة مثل Midjourney أو DALL-E 3 من OpenAI، يكون الموجه هو الأداة الأساسية للإبداع. سينتج عن موجه بسيط مثل "صورة لسيارة" نتيجة عامة. ومع ذلك، فإن الموجه التفصيلي مثل "سيارة رياضية حمراء كلاسيكية من الستينيات تنطلق بسرعة على طريق ساحلي عند غروب الشمس، بأسلوب واقعي للغاية، وإضاءة سينمائية، ودقة 8K" يوفر تعليمات محددة حول الموضوع والإعداد والأسلوب والجودة، مما ينتج صورة مخصصة للغاية ومذهلة بصريًا.

الأهمية في رؤية الكمبيوتر

في حين أنه نشأ في معالجة اللغة الطبيعية (NLP)، إلا أن هندسة المطالبات (prompt engineering) أصبحت ذات صلة متزايدة في الرؤية الحاسوبية (CV). وهذا مدفوع بتطوير النماذج متعددة الوسائط التي يمكنها معالجة كل من النصوص والصور في وقت واحد. يمكن لنماذج مثل CLIP وأدوات الكشف عن المفردات المفتوحة مثل YOLO-World أداء مهام مثل اكتشاف الكائنات بناءً على أوصاف نصية عشوائية. بالنسبة لهذه النماذج، فإن صياغة مطالبة نصية فعالة (مثل "اكتشاف جميع 'الدراجات الهوائية' ولكن تجاهل 'الدراجات النارية'") هي شكل من أشكال هندسة المطالبات الحاسمة لتوجيه نماذج لغة الرؤية هذه. تسهل منصات مثل Ultralytics HUB التفاعل مع النماذج المختلفة، حيث يمكن أن تستفيد المهام المحددة من خلال الواجهات من مبادئ هندسة المطالبات.

هندسة المطالبات مقابل المفاهيم ذات الصلة

من المهم التمييز بين هندسة الموجهات ومفاهيم التعلم الآلي الأخرى:

  • Fine-Tuning: يتضمن ذلك تحديث أوزان النموذج من خلال مواصلة عملية التدريب على مجموعة بيانات جديدة. من ناحية أخرى، لا يغير هندسة المطالبات النموذج نفسه، بل يوجه سلوك النموذج الحالي في وقت الاستدلال.
  • ضبط الموجهات (Prompt Tuning): طريقة ضبط دقيق فعال للمعلمات (PEFT)، يتضمن ضبط الموجهات تعلم مجموعة صغيرة من تضمينات (embeddings) "الموجهات اللينة" التي تضاف إلى بداية الإدخال. إنه يقوم بأتمتة إنشاء الموجهات من خلال التدريب، في حين أن هندسة الموجهات هي العملية اليدوية لصياغة "الموجهات الصلبة" النصية.
  • مطالبة سلسلة التفكير (CoT): CoT هي تقنية محددة لهندسة المطالبات حيث تتم إضافة تعليمات مثل "فكر خطوة بخطوة" إلى المطالبة. يشجع هذا النموذج على تقسيم المشكلات المعقدة إلى خطوات تفكير وسيطة، مما يؤدي غالبًا إلى نتائج أكثر دقة، كما هو مفصل في ورقة بحث Google AI الأصلية.
  • تسلسل المطالبات (Prompt Chaining): تتضمن هذه التقنية تقسيم مهمة معقدة إلى مطالبات متعددة ومتسلسلة، حيث يكون ناتج إحدى الخطوات هو المدخل للخطوة التالية. هندسة المطالبات هي الممارسة الأوسع لتصميم كل من هذه المطالبات الفردية بشكل فعال. تم تصميم أطر عمل مثل LangChain لتنسيق هذه السلاسل.
  • الجيل المعزز بالاسترجاع (RAG): RAG هو نظام يعزز المطالبة عن طريق استرجاع البيانات ذات الصلة أولاً من قاعدة معرفة خارجية. تعتبر هندسة المطالبات أمرًا بالغ الأهمية داخل نظام RAG لصياغة كل من استعلام البحث الأولي والمطالبة النهائية التي تجمع بين سؤال المستخدم والمعلومات المسترجعة بشكل صحيح.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة