ReAct Prompting
استكشف أسلوب التلقين ReAct لبناء وكلاء ذكاء اصطناعي مستقلين. تعلم كيف تتآزر عمليات التفكير والتنفيذ مع النماذج اللغوية الكبيرة (LLMs) وأدوات الرؤية الحاسوبية مثل Ultralytics YOLO26.
يعد توجيه ReAct (الاستدلال والعمل) نموذجًا متقدمًا لـ هندسة الأوامر يُمكّن نماذج اللغات الكبيرة (LLMs) من دمج مسارات الاستدلال خطوة بخطوة مع إجراءات محددة للمهام بشكل ديناميكي. تم تقديم هذه التقنية في الورقة الأكاديمية المؤثرة لعام 2022 بعنوان "ReAct: Synergizing Reasoning and Acting in Language Models"، وهي تحول نموذج اللغة الثابت إلى وكيل ذكاء اصطناعي تفاعلي. من خلال توليد أفكار حول مشكلة ما صراحةً وتنفيذ إجراءات لاسترجاع معلومات خارجية، يعمل إطار عمل ReAct على تحسين الدقة الواقعية وقدرات اتخاذ القرار بشكل كبير في مهام سير عمل الذكاء الاصطناعي المعقدة.
Link to this sectionآليات الاستدلال والعمل#
في التفاعلات التقليدية، يولد النموذج استجابة تعتمد كليًا على معرفته الداخلية، وهو ما يؤدي غالبًا إلى هلوسة نماذج اللغات الكبيرة. تعمل بنية ReAct على حل هذه المشكلة من خلال تثبيت الذكاء الاصطناعي في بيئات خارجية باستخدام حلقة مستمرة من الأفكار والإجراءات والملاحظات.
عند مواجهة استعلام، يقوم النموذج أولاً بتوليد "فكرة" لتحديد استراتيجيته. ثم يطلق "إجراءً"، مثل الاستعلام من محرك بحث، أو التفاعل مع قاعدة بيانات، أو استدعاء واجهة برمجة تطبيقات رؤية من خلال مفهوم يُعرف باسم استدعاء الوظائف. تعيد البيئة "ملاحظة"، توفر بيانات واقعية. يقوم النموذج بتقييم هذه المعلومات الجديدة، وتحديث استدلاله، وتكرار الدورة حتى يصل إلى الإجابة النهائية. تعكس هذه المنهجية، الموضحة بمزيد من التفصيل في دليل هندسة الأوامر حول ReAct، حل المشكلات البشري وتؤسس سلوكيات وكيل شفافة للغاية وقابلة للتحكم.
Link to this sectionتطبيقات العالم الحقيقي#
يتفوق توجيه ReAct في السيناريوهات التي تتطلب حل المشكلات التكراري واستخدام الأدوات متعددة الخطوات، مما يجعله أساسيًا في أنظمة الذكاء الاصطناعي الوكيلة الحديثة.
- وكلاء دعم العملاء الآليون: في بيئات المؤسسات، يستخدم وكلاء مكتب المساعدة في تكنولوجيا المعلومات ReAct لحل مشكلات المستخدمين. إذا أبلغ مستخدم عن انقطاع في الشبكة، يستنتج الوكيل أنه بحاجة إلى التحقق من حالة الخادم. يتصرف من خلال إجراء ping لواجهة برمجة تطبيقات تشخيصية، ويلاحظ النتيجة، ثم يقوم إما بتصعيد التذكرة أو تقديم دليل استكشاف الأخطاء وإصلاحها بناءً على الحقائق المسترجعة، مما يبسط خطوط أنابيب توليد الاسترجاع المعزز (RAG) التقليدية.
- التحليل البصري الديناميكي: تستفيد أنظمة الرؤية الحاسوبية من ReAct للإجابة على الأسئلة البصرية المعقدة. قد يراقب وكيل آلي مكلف بإدارة المخزون رفًا، ويستنتج أنه بحاجة إلى عد عناصر محددة، ويتصرف باستدعاء نموذج اكتشاف الكائنات، ويستخدم بيانات صندوق الإحاطة العائدة لإنهاء العد. يسد هذا التآزر الفجوة بين الاستدلال القائم على النص والفهم المكاني.
Link to this sectionتنفيذ ReAct مع الرؤية الحاسوبية#
بالنسبة للمطورين الذين يستخدمون Python، غالبًا ما تقوم وكلاء ReAct بتنسيق نماذج الإدراك للتفاعل مع العالم المادي. يوضح الكود المفاهيمي التالي كيف يمكن لحلقة استدلال ReAct نشر نموذج Ultralytics YOLO26 بسلاسة كأداة خارجية للمراقبة والإبلاغ عن بيئة ما.
from ultralytics import YOLO
def vision_tool(image_path: str) -> str:
"""Action tool for a ReAct agent to detect objects in an image."""
model = YOLO("yolo26n.pt") # Load highly efficient YOLO26 nano model
results = model(image_path)
# Format the observation for the LLM's reasoning loop
detected_classes = [model.names[int(c)] for c in results[0].boxes.cls]
return f"Observation: Found {len(detected_classes)} objects: {', '.join(detected_classes)}"
# Simulated ReAct agent executing an action
agent_observation = vision_tool("https://ultralytics.com/images/bus.jpg")
print(agent_observation)يمكن تبسيط إدارة مجموعات البيانات وتتبع التجارب لأدوات الرؤية هذه بالكامل باستخدام منصة Ultralytics، التي تقدم حلولًا شاملة لنشر الذكاء الاصطناعي الحديث. يمكن لأولئك المهتمين ببناء هؤلاء الوكلاء من الصفر أيضًا دراسة المنطق التأسيسي في مستودع ReAct الرسمي.
Link to this sectionالتمييز بين المفاهيم ذات الصلة#
لتصميم بنيات قوية متعددة الوسائط كما تم استكشافه في أبحاث المواءمة الأكاديمية الأخيرة، من الضروري تمييز ReAct عن أنماط الهندسة ذات الصلة:
- مقابل توجيه سلسلة الأفكار: يشجع توجيه سلسلة الأفكار (CoT) النموذج على التفكير خطوة بخطوة ولكنه يعتمد كليًا على معرفة ثابتة وداخلية. يوسع ReAct نموذج CoT عن طريق حقن "إجراءات" ديناميكية تجمع ملاحظات خارجية جديدة أثناء عملية الاستدلال.
- مقابل تسلسل الأوامر: يتضمن تسلسل الأوامر برمجة سلسلة من استدعاءات نماذج اللغات الكبيرة المنفصلة حيث يتم تغذية مخرجات خطوة واحدة تلقائيًا في الخطوة التالية. ReAct هو نموذج أكثر استقلالية حيث يقرر وكيل واحد ديناميكيًا أي الأدوات أو الإجراءات المتسلسلة يجب اتخاذها بناءً على الملاحظات المستمرة، بدلاً من اتباع نص برمجي متسلسل بشكل جامد.
من خلال توحيد الاستنتاج المنطقي مع تنفيذ أدوات خارجية متخصصة مثل النماذج متعددة الوسائط، يُمكّن توجيه ReAct من تطوير أنظمة ذكاء اصطناعي عامة ذات قدرات عالية.






