Mixture of Agents (MoA)
اكتشف كيف يستفيد مزيج الوكلاء (MoA) من نماذج LLM متعددة لحل المهام المعقدة. تعلم دمج Ultralytics YOLO26 كوكيل مرئي في سير عمل MoA.
يعد خليط الوكلاء (MoA) بنية ذكاء اصطناعي متقدمة تستفيد من نماذج لغوية كبيرة (LLMs) متعددة أو وكلاء مستقلين لحل المهام المعقدة بشكل تعاوني. بدلاً من الاعتماد على نموذج واحد لإنشاء استجابة، يقوم نظام MoA بالاستعلام من عدة نماذج متميزة في وقت واحد. ينتج هؤلاء الوكلاء الأوليون إجابات مستقلة، والتي يتم تمريرها بعد ذلك إلى وكيل تجميع أو دمج. يقوم المجمع بتقييم وجهات النظر المتنوعة وتنقيحها ودمجها في مخرجات نهائية واحدة عالية الجودة. يعزز هذا النهج التعاوني قدرات التفكير بشكل كبير ويخفف من التحيزات أو نقاط الضعف الفردية للنماذج المستقلة، مما يمثل قفزة كبيرة إلى الأمام في معالجة اللغات الطبيعية (NLP) وحل المشكلات.
Link to this sectionخليط الوكلاء مقابل خليط الخبراء#
على الرغم من تشابه الأسماء، من الضروري التمييز بين MoA والمفهوم ذي الصلة خليط الخبراء (MoE).
- خليط الخبراء (MoE): يعمل ضمن بنية شبكة عصبية واحدة. يستخدم آلية توجيه لتنشيط طبقات فرعية متخصصة محددة فقط (خبراء) لكل رمز أثناء الاستدلال. يعمل هذا على تحسين الكفاءة الحسابية مع الحفاظ على عدد كبير من المعلمات.
- خليط الوكلاء (MoA): يعمل على مستوى النموذج أو النظام. وهو يتضمن وكلاء ذكاء اصطناعي منفصلين تمامًا—غالبًا ما يتم بناؤهم على نماذج أساسية مختلفة—يتفاعلون في خط أنابيب. يعمل MoA بشكل أشبه بـ تجميع النماذج مدمجًا مع عملية مراجعة ذكية، كما هو مفصل في أبحاث أنظمة الوكلاء المتعددة الأخيرة.
Link to this sectionتطبيقات العالم الحقيقي#
تتفوق بنى MoA في البيئات التي تتطلب تفكيرًا عميقًا، والتحقق من الحقائق، وتوليف البيانات المتنوعة.
- هندسة البرمجيات المعقدة: في تطوير البرمجيات، قد يستخدم نظام MoA نموذج Anthropic Claude لكتابة المنطق الأساسي، ونموذج OpenAI GPT-4o لإنشاء اختبارات الوحدة، ونموذجًا محليًا للتدقيق الأمني. يقوم وكيل تجميع نهائي بمراجعة الكود المدمج واختباره وإخراج نص برمجي منقح وخالٍ من الأخطاء.
- التشخيص الطبي الآلي: في الذكاء الاصطناعي في الرعاية الصحية، يمكن لخط أنابيب MoA التشخيصي نشر وكلاء متخصصين لمراجعة سجل المريض، وتحليل نتائج المختبر، ومعالجة الصور الطبية. يقوم وكيل التوليف بتجميع هذه النتائج لمساعدة الأطباء في تكوين تشخيص شامل، مما يقلل بشكل كبير من احتمالية الخطأ البشري.
Link to this sectionدمج الرؤية في سير عمل MoA#
تزداد أنظمة MoA الحديثة كونها متعددة الوسائط، مما يعني أنها تعتمد على نماذج الرؤية الحاسوبية (CV) لإدراك العالم المادي قبل التفكير فيه. على سبيل المثال، في الذكاء الاصطناعي في التصنيع، يمكن لوكيل بصري فحص بث كاميرا مباشر وإرسال ملاحظاته الواقعية إلى وكيل تفكير.
يوضح مثال Python التالي كيف يمكن لـ Ultralytics YOLO26 أن يعمل كـ "وكيل بصري" ضمن خط أنابيب MoA، حيث يستخرج بيانات سياقية ليتم تغذيتها لنماذج LLM المصب. يمكن للمطورين إدارة هذه الأدوات البصرية المتخصصة وضبطها بدقة بسلاسة باستخدام منصة Ultralytics.
from ultralytics import YOLO
# Initialize YOLO26 as a dedicated visual agent
visual_agent = YOLO("yolo26n.pt")
# The agent observes the environment by running inference on an image
results = visual_agent("https://ultralytics.com/images/bus.jpg")
# Extract structured data to pass to the MoA aggregator
detected_classes = [visual_agent.names[int(cls)] for cls in results[0].boxes.cls]
unique_objects = set(detected_classes)
# This text context is then sent to the reasoning agent
print(f"Visual Agent Report: I have identified {', '.join(unique_objects)} in the scene.")من خلال سد الفجوة بين نماذج الرؤية عالية القدرة المبنية بأطر عمل مثل PyTorch ومحركات التفكير المتقدمة مثل Google Gemini، تعكس أنظمة MoA البيئية التعاون البشري. إنها تصبح بسرعة العمود الفقري لخطوط أنابيب Agentic RAG، مما يمهد الطريق لأنظمة مستقلة أكثر قوة وموثوقية.






