مسرد المصطلحات

التوليد المعزز للاسترجاع (RAG)

اكتشف كيف يعمل التوليد المعزَّز للاسترجاع (RAG) على تحسين نماذج الذكاء الاصطناعي من خلال دمج البيانات الخارجية الموثوقة في الوقت الفعلي للحصول على استجابات دقيقة ومُحدَّثة.

التوليد المعزز للاسترجاع (RAG) هو إطار عمل متقدم للذكاء الاصطناعي مصمم لتحسين جودة ودقة وملاءمة الاستجابات التي تولدها نماذج اللغات الكبيرة (LLMs). وهو يعمل من خلال ربط النموذج التوليدي بقاعدة معرفية خارجية محدّثة. يتيح ذلك للنموذج "استرجاع" المعلومات ذات الصلة قبل توليد الإجابة، مما يجعل مخرجاته تستند بشكل فعال إلى حقائق يمكن التحقق منها ويقلل من احتمالية الهلوسة أو الاستجابات القديمة. يجعل RAG من النماذج التوليدية أكثر موثوقية للمهام كثيفة المعرفة من خلال منحها إمكانية الوصول إلى المعلومات المتخصصة أو الخاصة التي لم يتم تدريبها عليها.

كيف يعمل التوليد المعزز بالاسترجاع

يمكن تقسيم عملية RAG إلى مرحلتين رئيسيتين: الاسترجاع والتوليد. ويجمع هذا النهج ثنائي المراحل بين نقاط قوة أنظمة استرجاع المعلومات والنماذج التوليدية.

  1. الاسترجاع: عندما يقدم المستخدم مطالبة أو يطرح سؤالاً، يستخدم نظام RAG أولاً المطالبة للبحث في مصدر معرفي عن المعلومات ذات الصلة. عادةً ما يكون هذا المصدر عبارة عن قاعدة بيانات متجهة تحتوي على مقتطفات من المستندات أو المقالات أو البيانات الأخرى. يقوم مكوّن المسترجع بتحديد وسحب مقتطفات النص أو البيانات الأكثر صلة بناءً على استعلام المستخدم. هناك خطوة اختيارية ولكنها قوية تتمثل في استخدام أداة إعادة الترتيب لتنقيح هذه النتائج المسترجعة، مما يضمن تمرير المعلومات الأكثر أهمية من حيث السياق فقط.
  2. توليد معزز: يتم بعد ذلك دمج المعلومات المسترجعة مع مطالبة المستخدم الأصلية. يتم إدخال هذه المطالبة الجديدة المعززة في نموذج الذكاء الاصطناعي التوليدي (LLM). يستخدم النموذج هذا السياق المضاف لصياغة استجابة شاملة ودقيقة وذات صلة. تُستخدم أطر عمل مثل LangChain و LlamaIndex بشكل شائع لبناء وإدارة خطوط أنابيب RAG المعقدة هذه.

التطبيقات والأمثلة

تُعد RAG مفيدة بشكل خاص في السيناريوهات التي تتطلب دقة واقعية والوصول إلى بيانات ديناميكية أو متخصصة.

  • أنظمة الإجابة على الأسئلة المتقدمة: يمكن أن يستخدم روبوت الدردشة الآلي الخاص بدعم العملاء نظام RAG للوصول إلى قاعدة معارف الشركة بأكملها من كتيبات المنتجات، وأدلة استكشاف الأخطاء وإصلاحها، ووثائق السياسة. عندما يسأل العميل "ما هي سياسة الضمان لمنتجي؟"، يسترجع النظام أحدث مستند ضمان ويستخدمه لتقديم إجابة دقيقة ومحدثة، وهو ما يمثل تحسناً كبيراً مقارنةً بالإجابات العامة.
  • إنشاء المحتوى والبحث: يمكن للمحلل المالي استخدام أداة تعمل بنظام RAG لكتابة ملخص للسوق. يمكن للأداة استرداد أحدث التقارير المالية وأخبار السوق وبيانات أداء الأسهم من مصادر موثوقة مثل بلومبرج أو رويترز. ثم تقوم الأداة بعد ذلك بتجميع هذه المعلومات في تقرير متماسك ومكتمل بالاقتباسات، مما يسرّع عملية البحث إلى حد كبير.

RAG مقابل المفاهيم ذات الصلة

من المفيد التمييز بين RAG والطرق الأخرى المستخدمة لتحسين أداء LLM:

  • الضبط الدقيق: يعمل الضبط الدقيق على تكييف نموذج مُدرّب مسبقًا من خلال مواصلة التدريب على مجموعة بيانات أصغر ومتخصصة، مما يعدّل الأوزان الداخلية للنموذج. على عكس RAG، فهو لا يستعين بالبيانات الخارجية أثناء الاستدلال. يُعد الضبط الدقيق مثاليًا لتعليم النموذج أسلوبًا أو مهارة جديدة، في حين أن RAG أفضل لدمج المعرفة الواقعية. يمكن أن تكون هذه الأساليب مكملة لبعضها البعض.
  • هندسة الموجهات: هذه هي العملية اليدوية لتصميم المطالبات بعناية للحصول على المخرجات المطلوبة من LLM. تعمل RAG على أتمتة جزء من هذا الأمر من خلال إضافة ("تعزيز") المطالبة بالبيانات المسترجعة برمجيًا، بدلًا من الاعتماد على الإنسان لتوفير كل السياق يدويًا.
  • الإثراء الفوري: على الرغم من أنه مشابه لمصطلح RAG، إلا أن الإثراء الفوري هو مصطلح أوسع نطاقًا. قد يتضمن إضافة سياق من تاريخ المستخدم أو تدفق المحادثة. RAG هو نوع محدد من الإثراء الذي يركز على استرجاع معلومات واقعية من قاعدة معرفية خارجية لتأسيس استجابة النموذج.

RAG في الرؤية الحاسوبية

في حين أن RAG يُستخدم في الغالب في معالجة اللغات الطبيعية (NLP)، إلا أنه يجري استكشاف مفهومه الأساسي لمهام الرؤية الحاسوبية. على سبيل المثال، يمكن للنظام استرداد المعلومات المرئية ذات الصلة لتوجيه توليد الصور أو تحليلها. يمكن أن يتضمن ذلك العثور على صور متشابهة من مجموعة بيانات كبيرة لتحسين أداء نموذج اكتشاف الكائنات مثل Ultralytics YOLO. يتم تبسيط إدارة هذه النماذج ومجموعات البيانات المعقدة باستخدام منصات مثل Ultralytics HUB، والتي يمكن أن تكون بمثابة أساس لتطبيقات النماذج متعددة الوسائط المستقبلية التي تستخدم RAG. يمكنك استكشاف تطبيق ذي صلة في مدونتنا حول تعزيز الذكاء الاصطناعي باستخدام RAG والرؤية الحاسوبية.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون ونمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة