Agentic RAG
استكشف Agentic RAG لتعزيز الذكاء الاصطناعي بالاستدلال المستقل. تعلم كيف تدعم Ultralytics YOLO26 ومنصة Ultralytics عمليات الاسترجاع الذكي والرؤية.
يُعد التوليد المعزز بالاسترجاع الوكيل (Agentic RAG) بنية متقدمة لـ الذكاء الاصطناعي (AI) تعمل على تحسين أنظمة الاسترجاع التقليدية من خلال دمج وكلاء الذكاء الاصطناعي المستقلين. وفي حين تعمل مسارات RAG القياسية في تسلسل خطي من "الاسترجاع ثم التوليد"، فإن Agentic RAG تُمكّن نموذجاً لغوياً كبيراً (LLM) من العمل كمنسق ذكي. يمكن لهذا الوكيل تحليل مطالبة المستخدم بشكل مستقل، وتحديد ما إذا كانت هناك حاجة إلى معلومات خارجية، وصياغة استعلامات بحث متعددة، وتقييم البيانات المسترجعة، وتحسين بحثه بشكل تكراري حتى يجمع إجابة شاملة ودقيقة. ومن خلال الاستفادة من إمكانات استدعاء الوظائف واستخدام الأدوات، تقوم هذه الأنظمة بتوجيه الاستعلامات ديناميكياً عبر قواعد بيانات وواجهات برمجة تطبيقات (APIs) وأدوات تحليلية متنوعة، مما يقلل بشكل كبير من الهلوسة في نماذج LLMs عند التعامل مع المشكلات المعقدة ومتعددة الخطوات.
Link to this sectionكيف تعمل أنظمة Agentic RAG#
يكمن الابتكار الجوهري في Agentic RAG في قدرتها على التكرار والاستنتاج. وتقوم أطر العمل الرائدة في مجال الذكاء الاصطناعي الوكيلي بهيكلة هذه العملية في سير عمل ديناميكي ومستقل:
- تخطيط الاستعلام وتوجيهه: يقوم الوكيل بتفكيك الأسئلة المعقدة إلى مهام فرعية صغيرة وقابلة للإدارة، ويوجه كلاً منها إلى الأداة الأكثر ملاءمة أو قاعدة بيانات متجهة.
- الاسترجاع التكراري: على عكس الاسترجاع الثابت، يقوم الوكيل بمراجعة المستندات التي تم جلبها. إذا كان السياق غير كافٍ، فإنه يعيد صياغة استراتيجية البحث الخاصة به ويقوم بالاستعلام مرة أخرى.
- تكامل الأدوات: يمكن للوكيل كتابة وتنفيذ الأكواد، أو إجراء العمليات الحسابية، أو تشغيل نماذج التعلم الآلي (ML) لتوليف بيانات جديدة أثناء التنقل.
Link to this sectionمقارنة بين Agentic RAG و RAG القياسي#
لتنفيذ مسارات توليدية قوية، من الضروري التمييز بين Agentic RAG ومفاهيمها التأسيسية:
- التوليد المعزز بالاسترجاع القياسي (RAG): يعمل في تمريرة واحدة. فهو يجلب المستندات بناءً على التشابه الدلالي ويولد استجابة. وهو يعاني عند التعامل مع المنطق المعقد الذي يتطلب توليف مصادر بيانات متباينة عبر خطوات متعددة.
- Agentic RAG: يقدم اتخاذ القرارات والحلقات التكرارية. يقوم الوكيل بتقييم جودة الاسترجاع ويمكنه تشغيل عمليات بحث لاحقة أو استخدام أدوات مختلفة قبل الانتهاء من توليده.
- RAG متعدد الوسائط (Multimodal RAG): يركز على استرجاع أنواع متنوعة من البيانات (صور، نصوص، فيديو). يمكن لـ Agentic RAG التحكم في مسار عمل Multimodal RAG، واتخاذ قرار بشأن متى يجب البحث في قاعدة بيانات مرئية مقابل مستند نصي.
Link to this sectionتطبيقات العالم الحقيقي#
تُحدث Agentic RAG تحولاً في الصناعات من خلال أتمتة البحوث العميقة ومهام استكشاف الأخطاء وإصلاحها المعقدة التي تحاكي التفكير التحليلي البشري.
- توليف المعرفة المؤسسية: في بيئات الشركات، قد يتلقى الوكيل طلباً لـ "تلخيص أدائنا في الربع الثالث ومقارنته بأحدث أرباح أكبر منافسينا". يقوم الوكيل بشكل مستقل بالاستعلام عن قواعد البيانات المالية الداخلية، وإجراء عمليات بحث فورية على الويب عن إيداعات المنافسين، وتحليل الأرقام باستخدام أداة حاسبة، وصياغة موجز شامل.
- الفحص الذاتي للجودة: في التصنيع، يمكن تكليف وكيل بتحديد السبب الجذري لفشل التجميع. يمكنه تشغيل نموذج رؤية حاسوبية (CV) لفحص بث كاميرا مباشر، والاستعلام عن سجلات الصيانة التاريخية، وتوليف تقرير تشخيصي بناءً على الأدلة المرئية والنصية.
Link to this sectionدمج رؤية الذكاء الاصطناعي في مسارات عمل الوكيل#
تعمل نماذج الرؤية كأدوات استشعار قوية لأنظمة Agentic RAG التي تتفاعل مع العالم المادي. على سبيل المثال، يمكن للوكيل استخدام Ultralytics YOLO26 لاسترجاع سياق مرئي ديناميكياً من صورة أو بث فيديو للإجابة على استفسارات المستخدمين. يمكن للمطورين إدارة تعليق البيانات وتدريب أدوات الرؤية المخصصة هذه باستخدام Ultralytics Platform.
يوضح مثال Python التالي كيف يمكن لوكيل ذكاء اصطناعي استدعاء YOLO26 برمجياً لاستخراج ملاحظات منظمة من صورة، مما يجمع سياقاً واقعياً لخطوة التفكير التالية له.
from ultralytics import YOLO
# Initialize YOLO26 for the agent's visual retrieval tool
model = YOLO("yolo26n.pt")
# The agent invokes the model on an image to gather visual facts
results = model("https://ultralytics.com/images/bus.jpg")
# The agent parses the detected objects to formulate its next query or action
visual_context = [model.names[int(c)] for c in results[0].boxes.cls]
print(f"Agent Observation: I currently see {', '.join(visual_context)}.")من خلال ربط نماذج الرؤية عالية القدرة بمحركات الاستنتاج، تسد Agentic RAG الفجوة بين استرجاع المعرفة الثابتة والذكاء المكاني الديناميكي في العالم الحقيقي. للحصول على نظرة أعمق على المشهد المتطور للأنظمة المستقلة، يوفر تقرير مؤشر الذكاء الاصطناعي لجامعة ستانفورد تتبعاً شاملاً للقدرات الوكيلية.






