Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

هندسة الموجه

أتقن فن هندسة الموجهات لتوجيه نماذج الذكاء الاصطناعي مثل نماذج اللغات الكبيرة (LLMs) للحصول على مخرجات دقيقة وعالية الجودة في المحتوى وخدمة العملاء والمزيد.

هندسة الموجهات هي العملية الاستراتيجية لهيكلة نص الإدخال وتحسينه، والمعروفة باسم المطالبات، من أجل توجيه نماذج الذكاء الاصطناعي (AI) بفعالية نحو توليد مخرجات محددة وعالية الجودة. بينما شاعت في البداية مع ظهور النماذج اللغوية الكبيرة (LLMs) مثل GPT-4، فقد تطوّر هذا النظام ليصبح مهارةً حاسمة في التفاعل مع الأنظمة التوليدية المختلفة. وهو ينطوي على فهم الفروق الدقيقة في كيفية تفسير النموذج للغة, والسياق والتعليمات لسد الفجوة بين النية البشرية وتنفيذ الآلة. من خلال اختيار الكلمات بعناية وقيود التنسيق، وتوفير السياق، يمكن للمستخدمين تحسين دقة وملاءمة استجابات استجابات الذكاء الاصطناعي التوليدي دون الحاجة إلى تغيير المعلمات الأساسية للنموذج.

آليات الموجهات الفعالة

تعتمد الهندسة الفورية في جوهرها على مبدأ أن نماذج الذكاء الاصطناعي حساسة لصياغة وبنية المدخلات. عادةً ما تحتوي المطالبة المصممة جيدًا على مكونات محددة مصممة لتقليل الغموض. وتشمل هذه المكونات تعليمات صريحة، ومعلومات أساسية ذات صلة (السياق)، ومواصفات الإخراج مثل التنسيق - على سبيل المثال على سبيل المثال، طلب استجابة في JSON أو قائمة نقطية. تتضمن التقنيات المتقدمة التعلُّم في لقطات قليلة, حيث يقدم المستخدم أمثلة على أزواج المدخلات والمخرجات المطلوبة ضمن المطالبة لتوجيه تفكير النموذج. طريقة قوية أخرى هي المطالبة بتسلسل الأفكار، والتي التي تشجع النموذج على تقسيم المشاكل المعقدة إلى خطوات منطقية وسيطة، مما يحسن الأداء في المهام ذات المنطق الثقيل كما هو مفصّل في أبحاثGoogle منشورات جوجل.

الأهمية في رؤية الكمبيوتر

على الرغم من ارتباطها في كثير من الأحيان بتوليد النصوص، إلا أن هندسة السرعة أصبحت حيوية بشكل متزايد في الرؤية الحاسوبية. النماذج الحديثة النماذج متعددة الوسائط وكاشفات المفردات المفتوحة, مثل YOLO تسمح للمستخدمين بتعريف أهداف الكشف الأهداف باستخدام لغة طبيعية بدلًا من معرّفات الفئات المحددة مسبقًا. في هذا السياق، "الموجه" في هذا السياق هو النص للكائن (على سبيل المثال، "خوذة حمراء" مقابل "خوذة"). هذه الإمكانية، التي يشار إليها غالبًا باسم التعلّم بدون لقطة، تمكّن النماذج من detect الأجسام التي لم يتم تدريبها عليها بشكل صريح، وذلك ببساطة عن طريق معالجة العلاقة الدلالية بين المطالبة النصية والميزات المرئية.

يوضح المثال التالي كيف يتم تطبيق الهندسة السريعة برمجيًا باستخدام ultralytics لتعريف الفئات ديناميكيًا ل اكتشاف الأجسام:

from ultralytics import YOLO

# Load a YOLO-World model capable of interpreting text prompts
model = YOLO("yolo-world.pt")

# Use prompt engineering to define custom classes without retraining
# The model aligns these text descriptions with visual features
model.set_classes(["person in safety vest", "forklift", "cardboard box"])

# Run inference on an image to detect the prompted objects
results = model.predict("warehouse.jpg")

تطبيقات واقعية

تمتد فائدة الهندسة السريعة عبر مختلف الصناعات، مما يعزز الأتمتة والإبداع:

  • توليد المحتوى الآلي: في مجال التسويق والإعلام، يستخدم المحترفون مطالبات مفصلة لتوجيه مولدات تحويل النص إلى صورة مثل Midjourney أو النشر المستقر. موجه محدد يصف الإضاءة والأسلوب الفني والتركيب يسمح للمصممين بوضع نماذج أولية سريعة للأصول المرئية، مما يوفر الوقت مقارنةً بطرق العرض التقليدية.
  • دعم العملاء الذكي: تنشر الشركات روبوتات الدردشة الآ لية التي تعمل بواسطة الروبوتات الآلية ذاتية القيادة للتعامل مع استفسارات العملاء. يقوم المهندسون بصياغة "مطالبات النظام" التي تحدد شخصية الروبوت (على سبيل المثال، "أنت مساعد مساعد دعم تقني مفيد")، ووضع حدود لمنع الهلوسة، وتوجيه الذكاء الاصطناعي لاسترداد الإجابات من قاعدة معرفية محددة.

التمييز بين المفاهيم ذات الصلة

من المهم التفريق بين الهندسة السريعة والمصطلحات المماثلة في مجال التعلم الآلي:

  • هندسة الموجه مقابل ضبط الموجه: تتضمن هندسة الموجهات صياغة استعلامات اللغة الطبيعية يدويًا. وعلى النقيض من ذلك، فإن ضبط الموجه هو آلية فعالة من حيث المعلمات تتعلم التضمينات التضمينات اللينة (المتجهات العددية) أثناء مرحلة التدريب لتحسين مدخلات النموذج، وغالبًا ما تكون غير مرئية للمستخدم البشري.
  • الهندسة الفورية مقابل الضبط الدقيق: يُحدِّث الضبط الدقيق بشكل دائم أوزان النموذج بشكل دائم من خلال التدريب على مجموعة بيانات متخصصة. لا تُغيّر هندسة الموجهات النموذج نفسه؛ فهي تعمل فقط على تحسين المدخلات أثناء الاستدلال في الوقت الحقيقي.
  • برومب إنجنيرنغ مقابل RAG الاسترجاع-التوليد المعزز (RAG) هو هندسة نظام يجلب بيانات خارجية لتأسيس نموذج استجابة النموذج. هندسة الموجهات هي التقنية المستخدمة في RAG لتنسيق البيانات المسترجعة بشكل صحيح و وتقديمها إلى نظام التوليد المعزَّز للاسترجاع من أجل المعالجة.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن