أتقن فن هندسة الموجهات لتوجيه نماذج الذكاء الاصطناعي مثل نماذج اللغات الكبيرة (LLMs) للحصول على مخرجات دقيقة وعالية الجودة في المحتوى وخدمة العملاء والمزيد.
هندسة الموجهات هي العملية الاستراتيجية لهيكلة نص الإدخال وتحسينه، والمعروفة باسم المطالبات، من أجل توجيه نماذج الذكاء الاصطناعي (AI) بفعالية نحو توليد مخرجات محددة وعالية الجودة. بينما شاعت في البداية مع ظهور النماذج اللغوية الكبيرة (LLMs) مثل GPT-4، فقد تطوّر هذا النظام ليصبح مهارةً حاسمة في التفاعل مع الأنظمة التوليدية المختلفة. وهو ينطوي على فهم الفروق الدقيقة في كيفية تفسير النموذج للغة, والسياق والتعليمات لسد الفجوة بين النية البشرية وتنفيذ الآلة. من خلال اختيار الكلمات بعناية وقيود التنسيق، وتوفير السياق، يمكن للمستخدمين تحسين دقة وملاءمة استجابات استجابات الذكاء الاصطناعي التوليدي دون الحاجة إلى تغيير المعلمات الأساسية للنموذج.
تعتمد الهندسة الفورية في جوهرها على مبدأ أن نماذج الذكاء الاصطناعي حساسة لصياغة وبنية المدخلات. عادةً ما تحتوي المطالبة المصممة جيدًا على مكونات محددة مصممة لتقليل الغموض. وتشمل هذه المكونات تعليمات صريحة، ومعلومات أساسية ذات صلة (السياق)، ومواصفات الإخراج مثل التنسيق - على سبيل المثال على سبيل المثال، طلب استجابة في JSON أو قائمة نقطية. تتضمن التقنيات المتقدمة التعلُّم في لقطات قليلة, حيث يقدم المستخدم أمثلة على أزواج المدخلات والمخرجات المطلوبة ضمن المطالبة لتوجيه تفكير النموذج. طريقة قوية أخرى هي المطالبة بتسلسل الأفكار، والتي التي تشجع النموذج على تقسيم المشاكل المعقدة إلى خطوات منطقية وسيطة، مما يحسن الأداء في المهام ذات المنطق الثقيل كما هو مفصّل في أبحاثGoogle منشورات جوجل.
على الرغم من ارتباطها في كثير من الأحيان بتوليد النصوص، إلا أن هندسة السرعة أصبحت حيوية بشكل متزايد في الرؤية الحاسوبية. النماذج الحديثة النماذج متعددة الوسائط وكاشفات المفردات المفتوحة, مثل YOLO تسمح للمستخدمين بتعريف أهداف الكشف الأهداف باستخدام لغة طبيعية بدلًا من معرّفات الفئات المحددة مسبقًا. في هذا السياق، "الموجه" في هذا السياق هو النص للكائن (على سبيل المثال، "خوذة حمراء" مقابل "خوذة"). هذه الإمكانية، التي يشار إليها غالبًا باسم التعلّم بدون لقطة، تمكّن النماذج من detect الأجسام التي لم يتم تدريبها عليها بشكل صريح، وذلك ببساطة عن طريق معالجة العلاقة الدلالية بين المطالبة النصية والميزات المرئية.
يوضح المثال التالي كيف يتم تطبيق الهندسة السريعة برمجيًا باستخدام
ultralytics لتعريف الفئات ديناميكيًا ل
اكتشاف الأجسام:
from ultralytics import YOLO
# Load a YOLO-World model capable of interpreting text prompts
model = YOLO("yolo-world.pt")
# Use prompt engineering to define custom classes without retraining
# The model aligns these text descriptions with visual features
model.set_classes(["person in safety vest", "forklift", "cardboard box"])
# Run inference on an image to detect the prompted objects
results = model.predict("warehouse.jpg")
تمتد فائدة الهندسة السريعة عبر مختلف الصناعات، مما يعزز الأتمتة والإبداع:
من المهم التفريق بين الهندسة السريعة والمصطلحات المماثلة في مجال التعلم الآلي: