اكتشف كيف يستفيد نظام "مزيج الوكلاء" (MoA) من نماذج اللغة الكبيرة المتعددة لحل المهام المعقدة. تعلم كيفية دمج Ultralytics كوكيل بصري في سير عمل نظام MoA.
"مزيج الوكلاء" (MoA) هو بنية متطورة للذكاء الاصطناعي تستفيد من عدة نماذج لغوية ضخمة (LLMs) أو وكلاء مستقلين لحل المهام المعقدة بشكل تعاوني. وبدلاً من الاعتماد على نموذج واحد لتوليد استجابة، يقوم نظام MoA بالاستعلام عن عدة نماذج متميزة في وقت واحد. ويقدم هؤلاء الوكلاء الأوليون إجابات مستقلة، والتي تُمرر بعد ذلك إلى وكيل تجميع أو وكيل توليف. يقوم عامل التجميع بتقييم وتنقيح ودمج وجهات النظر المتنوعة في ناتج نهائي واحد عالي الجودة. يعزز هذا النهج التعاوني بشكل كبير قدرات الاستدلال ويخفف من التحيزات الفردية أو نقاط الضعف في النماذج المستقلة، مما يمثل قفزة كبيرة إلى الأمام في معالجة اللغة الطبيعية (NLP) وحل المشكلات.
على الرغم من تشابه المصطلحين، من الضروري التمييز بين «طريقة العمل» (MoA) والمفهوم المرتبط بها «مزيج الخبراء» (MoE).
تتميز بنى MoA بأدائها المتميز في البيئات التي تتطلب التفكير العميق والتحقق من صحة المعلومات وتوليف البيانات المتنوعة.
أصبحت أنظمة MoA الحديثة متعددة الوسائط بشكل متزايد، بمعنى أنها تعتمد على نماذج الرؤية الحاسوبية (CV) لاستشعار العالم المادي قبل إجراء الاستدلال بشأنه. على سبيل المثال، في مجال الذكاء الاصطناعي في التصنيع، يمكن لوكيل بصري فحص بث مباشر من الكاميرا وإرسال ملاحظاته الواقعية إلى وكيل الاستدلال.
يوضح Python التالي Python كيف يمكن Ultralytics أن يعمل كـ "وكيل بصري" ضمن مسار عمل MoA، حيث يستخرج البيانات السياقية لتغذية نماذج اللغة الكبيرة (LLMs) في المراحل اللاحقة. ويمكن للمطورين إدارة هذه الأدوات البصرية المتخصصة وضبطها بسلاسة باستخدام Ultralytics .
from ultralytics import YOLO
# Initialize YOLO26 as a dedicated visual agent
visual_agent = YOLO("yolo26n.pt")
# The agent observes the environment by running inference on an image
results = visual_agent("https://ultralytics.com/images/bus.jpg")
# Extract structured data to pass to the MoA aggregator
detected_classes = [visual_agent.names[int(cls)] for cls in results[0].boxes.cls]
unique_objects = set(detected_classes)
# This text context is then sent to the reasoning agent
print(f"Visual Agent Report: I have identified {', '.join(unique_objects)} in the scene.")
من خلال سد الفجوة بين نماذج الرؤية عالية الأداء التي تم إنشاؤها باستخدام أطر عمل مثل PyTorch والمحركات المعرفية المتقدمة مثل Google تعكس أنظمة MoA التعاون البشري. وهي تصبح بسرعة العمود الفقري لخطوط إنتاج Agentic RAG، مما يمهد الطريق لأنظمة مستقلة أكثر قوة وموثوقية.
ابدأ رحلتك مع مستقبل تعلم الآلة