الإثراء الفوري
إتقان الذكاء الاصطناعي مع الإثراء الفوري! حسِّن مخرجات نماذج اللغات الكبيرة باستخدام السياق والتعليمات الواضحة والأمثلة للحصول على نتائج دقيقة.
إثراء الموجه هو العملية الآلية لإضافة السياق أو المعلومات ذات الصلة برمجيًا إلى المطالبة الأولية للمستخدم قبل إرسالها إلى نموذج الذكاء الاصطناعي، وخاصةً نموذج اللغة الكبيرة (LLM). والهدف من ذلك هو تحويل استعلام المستخدم البسيط أو الغامض إلى تعليمات مفصلة ومحددة ومراعية للسياق. تساعد خطوة المعالجة المسبقة هذه نموذج الذكاء الاصطناعي على فهم أفضل لنوايا المستخدم، مما يؤدي إلى استجابات أكثر دقة وتخصيصًا وفائدة بشكل كبير دون تغيير النموذج نفسه.
كيف يعمل التخصيب الفوري
يعمل الإثراء الفوري كطبقة وسيطة ذكية. عندما يقوم المستخدم بإرسال استعلام، يقوم نظام آلي باعتراضه. يقوم هذا النظام بعد ذلك بجمع البيانات السياقية من مصادر مختلفة، مثل ملفات تعريف المستخدمين أو سجل المحادثة أو بيانات الجلسة (مثل نوع الجهاز أو الموقع) أو قواعد البيانات الخارجية. ثم يقوم بإدخال هذه المعلومات بشكل ديناميكي في المطالبة الأصلية. يتم في النهاية تمرير المطالبة "الغنية" الناتجة، التي تحتوي الآن على كل من استعلام المستخدم والسياق المضاف، إلى LLM للمعالجة. يعمل هذا على تحسين قدرة النموذج على أداء مهام فهم اللغة الطبيعية المعقدة (NLU ).
التطبيقات الواقعية
- دعم العملاء المخصص: يتفاعل المستخدم مع روبوت دردشة للتجارة الإلكترونية ويكتب "أين الطرد الخاص بي؟ يمكن لنظام التخصيب الفوري أن يجلب تلقائيًا تفاصيل حساب المستخدم ورقم طلبه الأخير من قاعدة بيانات CRM. تصبح المطالبة المرسلة إلى النموذج "يسأل العميل رقم 98765 عن حالة أحدث طلبية له، #ABC-12345. استعلام المستخدم الأصلي: "أين الطرد الخاص بي؟ يتيح ذلك لوكيل خدمة العملاء المعتمد على الذكاء الاصطناعي تقديم تحديث فوري ومحدد بدلاً من طلب معلومات توضيحية.
- توصية محتوى أكثر ذكاءً: يقول مستخدم لخدمة البث: "أوصي بفيلم". هذا أمر غامض للغاية بالنسبة لتوصية جيدة. يمكن لعملية الإثراء أن تزيد من هذه المطالبة ببيانات مثل تاريخ مشاهدة المستخدم، وتفضيلاته المعلنة للنوع والوقت من اليوم. قد تبدو المطالبة النهائية كما يلي: "استمتع المستخدم مؤخرًا بمشاهدة أفلام الخيال العلمي والدراما التاريخية. إنها ليلة السبت. أوصي بفيلم يناسب هذه المعايير." يؤدي هذا إلى اقتراح أكثر ملاءمة من نظام التوصيات ويحسن تجربة المستخدم من خلال التخصيص.
الإثراء الفوري مقابل المفاهيم ذات الصلة
من المهم التمييز بين الإثراء الفوري والمصطلحات المشابهة:
- هندسة موجه: هذا هو المجال الواسع لتصميم مطالبات فعالة. يعد إثراء الموجهات تقنية آلية محددة ضمن هندسة الموجهات تركز على إضافة سياق ديناميكي إلى مدخلات المستخدم.
- الاسترجاع-التوليد المعزز (RAG): RAG هو نوع قوي ومحدد من الإثراء الفوري. وهو متخصص في استرجاع المعلومات الواقعية من قاعدة معرفية خارجية لتأسيس مخرجات النموذج ومنع الهلوسة. في حين أن RAG هو شكل من أشكال الإثراء، فإن الإثراء يمكن أن يستخدم أيضًا مصادر سياق أخرى، مثل بيانات جلسة المستخدم، التي ليست جزءًا من قاعدة معرفية ثابتة.
- التسلسل الفوري: تقوم هذه التقنية بتقسيم المهمة إلى سلسلة من المطالبات المتعددة والمترابطة، حيث يغذي ناتج أحد الموجهات الموجهات الموجهات التالية. على النقيض من ذلك، يقوم التخصيب بتعديل مطالبة واحدة قبل معالجتها. يمكن أن تكون خطوة الإثراء الفوري جزءًا من سلسلة أكبر، وغالبًا ما تكون الخطوة الأولى. تركز تقنيات أخرى مثل موجهات سلسلة التفكير (CoT) على تحسين التفكير ضمن تفاعل واحد.
- الضبط الفوري: هذه طريقة لتدريب النموذج. وباعتبارها تقنية ضبط دقيق فعال للمعلمات (PEFT) ، فهي تعمل على تكييف سلوك النموذج من خلال تدريب مجموعة صغيرة من المعلمات الجديدة. التخصيب الموجه هو تقنية وقت الاستدلال التي تعالج استعلام الإدخال ولا تغير أوزان النموذج.
على الرغم من أن الفكرة الأساسية أكثر شيوعًا في معالجة اللغات الطبيعية (NLP)، إلا أنها قابلة للتطبيق في جميع مجالات التعلم الآلي. في الرؤية الحاسوبية، يمكن أن يتضمن مفهوم مماثل إضافة بيانات وصفية (على سبيل المثال، الموقع والوقت) إلى صورة لتحسين أداء نموذج مثل Ultralytics YOLO11 في مهمة اكتشاف كائن ما. توفر منصات MLOps مثل Ultralytics HUB البنية التحتية اللازمة لنشر نموذج قوي، حيث يمكن تنفيذ خطوط أنابيب مدخلات متطورة باستخدام الإثراء وأطر عمل مثل LangChain أو LlamaIndex.