الجيل المعزز بالاسترجاع (RAG)
اكتشف كيف يعزز الجيل المعزز بالاسترجاع (RAG) نماذج الذكاء الاصطناعي من خلال دمج بيانات خارجية موثوقة وفي الوقت الفعلي للحصول على استجابات دقيقة وحديثة.
جيل الاسترجاع المعزز (RAG) هو إطار عمل متقدم للذكاء الاصطناعي مصمم لتحسين جودة ودقة وملاءمة الاستجابات التي تولدها نماذج اللغة الكبيرة (LLMs). وهو يعمل عن طريق توصيل نموذج توليدي بقاعدة معرفة خارجية وحديثة. يتيح ذلك للنموذج "استرجاع" المعلومات ذات الصلة قبل إنشاء إجابة، مما يؤسس بشكل فعال مخرجاته في الحقائق التي يمكن التحقق منها ويقلل من احتمالية الهلوسة أو الاستجابات القديمة. تجعل RAG LLMs أكثر موثوقية للمهام كثيفة المعرفة من خلال منحها الوصول إلى معلومات متخصصة أو مملوكة لم يتم تدريبها عليها.
كيف يعمل الاسترجاع المعزز بالتوليد (Retrieval-Augmented Generation)؟
يمكن تقسيم عملية الاسترجاع المعزز بالتوليد (RAG) إلى مرحلتين رئيسيتين: الاسترجاع والتوليد. يجمع هذا النهج المزدوج بين نقاط القوة لأنظمة استرجاع المعلومات والنماذج التوليدية.
- الاسترجاع: عندما يقدم المستخدم مطالبة أو يطرح سؤالاً، يستخدم نظام RAG أولاً هذه المطالبة للبحث في مصدر معرفة عن المعلومات ذات الصلة. هذا المصدر هو عادةً قاعدة بيانات متجهات تحتوي على تضمينات للمستندات أو المقالات أو البيانات الأخرى. يحدد مكون الاسترجاع أهم أجزاء النص أو البيانات ويستخرجها بناءً على استعلام المستخدم. هناك خطوة اختيارية ولكنها قوية وهي استخدام معيد ترتيب لتحسين النتائج المسترجعة، وضمان تمرير المعلومات الأكثر أهمية من حيث السياق فقط.
- الجيل المعزز: يتم بعد ذلك دمج المعلومات المسترجعة مع موجه المستخدم الأصلي. يتم تغذية هذا الموجه الجديد والمثرى في نموذج الذكاء الاصطناعي التوليدي (LLM). يستخدم النموذج هذا السياق المضاف لصياغة استجابة شاملة ودقيقة وذات صلة. تُستخدم أطر عمل مثل LangChain و LlamaIndex بشكل شائع لبناء وإدارة خطوط RAG المعقدة هذه.
التطبيقات والأمثلة
تعد تقنية استرجاع المعلومات المعزز (RAG) مفيدة بشكل خاص في السيناريوهات التي تتطلب دقة وقائعية والوصول إلى بيانات ديناميكية أو متخصصة.
- أنظمة متقدمة للإجابة على الأسئلة (Advanced Question-Answering Systems): يمكن لروبوت محادثة (chatbot) لدعم العملاء استخدام RAG للوصول إلى قاعدة المعرفة الكاملة للشركة من كتيبات المنتجات وأدلة استكشاف الأخطاء وإصلاحها ووثائق السياسة. عندما يسأل العميل، "ما هي سياسة الضمان لمنتجي؟"، يسترجع النظام أحدث وثيقة ضمان ويستخدمها لتقديم إجابة دقيقة وحديثة، وهو تحسن كبير عن الاستجابات العامة.
- إنشاء المحتوى والبحث: يمكن لمحلل مالي استخدام أداة مدعومة بـ RAG لكتابة ملخص للسوق. يمكن للأداة استرداد أحدث التقارير المالية وأخبار السوق وبيانات أداء الأسهم من مصادر موثوقة مثل Bloomberg أو Reuters. ثم يقوم LLM بتجميع هذه المعلومات في تقرير متماسك، كامل مع الاستشهادات، مما يسرع عملية البحث بشكل كبير.
RAG مقابل المفاهيم ذات الصلة
من المفيد التمييز بين RAG والطرق الأخرى المستخدمة لتحسين أداء LLM:
- Fine-tuning: يقوم الضبط الدقيق بتكييف نموذج مُدرَّب مسبقًا عن طريق مواصلة التدريب على مجموعة بيانات أصغر ومتخصصة، مما يعدل أوزان النموذج الداخلية. على عكس RAG، فإنه لا يستشير بيانات خارجية أثناء الاستدلال. يعتبر الضبط الدقيق مثاليًا لتعليم النموذج أسلوبًا أو مهارة جديدة، بينما يعتبر RAG أفضل لدمج المعرفة الواقعية. يمكن أن تكون هذه الأساليب أيضًا متكاملة.
- هندسة المطالبات (Prompt Engineering): هذه هي العملية اليدوية لتصميم المطالبات بعناية للحصول على الناتج المطلوب من نموذج لغوي كبير (LLM). تعمل RAG على أتمتة جزء من هذا عن طريق إضافة ("زيادة") المطالبة برمجيًا بالبيانات المسترجعة، بدلاً من الاعتماد على إنسان لتوفير كل السياق يدويًا.
- إثراء المطالبات (Prompt Enrichment): على الرغم من أنه مشابه لـ RAG، إلا أن إثراء المطالبات هو مصطلح أوسع. قد يتضمن إضافة سياق من سجل المستخدم أو تدفق المحادثة. RAG هو نوع معين من الإثراء يركز على استرجاع المعلومات الواقعية من قاعدة معرفة خارجية لترسيخ استجابة النموذج.
استرجاع المعلومات المعزز (RAG) في مجال رؤية الحاسوب
في حين أن RAG يستخدم في الغالب في معالجة اللغة الطبيعية (NLP)، إلا أنه يتم استكشاف مفهومه الأساسي لمهام رؤية الكمبيوتر (CV). على سبيل المثال، يمكن للنظام استرداد معلومات مرئية ذات صلة لتوجيه إنشاء الصور أو تحليلها. قد يتضمن ذلك العثور على صور مماثلة من مجموعة بيانات (dataset) كبيرة لتحسين أداء نموذج اكتشاف الكائنات (object detection) مثل Ultralytics YOLO. يتم تبسيط إدارة هذه النماذج ومجموعات البيانات المعقدة باستخدام منصات مثل Ultralytics HUB، والتي يمكن أن تكون بمثابة أساس لتطبيقات النماذج متعددة الوسائط (multi-modal model) المستقبلية التي تستخدم RAG. يمكنك استكشاف تطبيق ذي صلة في مدونتنا حول تحسين الذكاء الاصطناعي باستخدام RAG ورؤية الكمبيوتر (blog on enhancing AI with RAG and computer vision).