Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

مزيج من العوامل (MoA)

اكتشف كيف يستفيد نظام "مزيج الوكلاء" (MoA) من نماذج اللغة الكبيرة المتعددة لحل المهام المعقدة. تعلم كيفية دمج Ultralytics كوكيل بصري في سير عمل نظام MoA.

"مزيج الوكلاء" (MoA) هو بنية متطورة للذكاء الاصطناعي تستفيد من عدة نماذج لغوية ضخمة (LLMs) أو وكلاء مستقلين لحل المهام المعقدة بشكل تعاوني. وبدلاً من الاعتماد على نموذج واحد لتوليد استجابة، يقوم نظام MoA بالاستعلام عن عدة نماذج متميزة في وقت واحد. ويقدم هؤلاء الوكلاء الأوليون إجابات مستقلة، والتي تُمرر بعد ذلك إلى وكيل تجميع أو وكيل توليف. يقوم عامل التجميع بتقييم وتنقيح ودمج وجهات النظر المتنوعة في ناتج نهائي واحد عالي الجودة. يعزز هذا النهج التعاوني بشكل كبير قدرات الاستدلال ويخفف من التحيزات الفردية أو نقاط الضعف في النماذج المستقلة، مما يمثل قفزة كبيرة إلى الأمام في معالجة اللغة الطبيعية (NLP) وحل المشكلات.

طريقة "مزيج الوكلاء" مقابل طريقة "مزيج الخبراء"

على الرغم من تشابه المصطلحين، من الضروري التمييز بين «طريقة العمل» (MoA) والمفهوم المرتبط بها «مزيج الخبراء» (MoE).

  • مزيج الخبراء (MoE): يعمل ضمن بنية شبكة عصبية واحدة. ويستخدم آلية توجيه لتنشيط طبقات فرعية محددة ومتخصصة (خبراء) فقط لكل رمز أثناء عملية الاستدلال. وهذا يحقق الكفاءة الحسابية مع الحفاظ على عدد كبير من المعلمات.
  • مزيج العوامل (MoA): يعمل على مستوى النموذج أو النظام. ويتضمن عوامل ذكاء اصطناعيمنفصلة تمامًا —غالبًا ما تكون مبنية على نماذج أساسية مختلفة —تتفاعل ضمن مسار متسلسل. ويعمل مزيج العوامل بشكل أشبه بمجموعة من النماذج مقترنة بعملية مراجعة ذكية ، كما هو موضح بالتفصيل في الأبحاث الحديثة حول أنظمة العوامل المتعددة.

تطبيقات واقعية

تتميز بنى MoA بأدائها المتميز في البيئات التي تتطلب التفكير العميق والتحقق من صحة المعلومات وتوليف البيانات المتنوعة.

  • هندسة البرمجيات المعقدة: في مجال تطوير البرمجيات، قد يستخدم نظام MoA Anthropic لكتابة المنطق الأساسي، و«OpenAI GPT-4o» لإنشاء اختبارات الوحدات، ونموذجًا مخصصًا للتدقيق الأمني. ثم يقوم وكيل تجميع نهائي بمراجعة الكود المدمج واختباره، ويُخرج نصًا برمجيًا مُحسَّنًا وخاليًا من الأخطاء.
  • التشخيص الطبي الآلي: في مجال الذكاء الاصطناعي في الرعاية الصحية، يمكن لمسار عمل التشخيص نشر عوامل متخصصة لمراجعة تاريخ المريض، وتحليل نتائج الفحوصات المخبرية، ومعالجة الصور الطبية. ويقوم عامل التوليف بتجميع هذه النتائج لمساعدة الأطباء في وضع تشخيص شامل، مما يقلل بشكل كبير من احتمالية وقوع أخطاء بشرية.

دمج الرؤية في سير عمل وزارة الزراعة

أصبحت أنظمة MoA الحديثة متعددة الوسائط بشكل متزايد، بمعنى أنها تعتمد على نماذج الرؤية الحاسوبية (CV) لاستشعار العالم المادي قبل إجراء الاستدلال بشأنه. على سبيل المثال، في مجال الذكاء الاصطناعي في التصنيع، يمكن لوكيل بصري فحص بث مباشر من الكاميرا وإرسال ملاحظاته الواقعية إلى وكيل الاستدلال.

يوضح Python التالي Python كيف يمكن Ultralytics أن يعمل كـ "وكيل بصري" ضمن مسار عمل MoA، حيث يستخرج البيانات السياقية لتغذية نماذج اللغة الكبيرة (LLMs) في المراحل اللاحقة. ويمكن للمطورين إدارة هذه الأدوات البصرية المتخصصة وضبطها بسلاسة باستخدام Ultralytics .

from ultralytics import YOLO

# Initialize YOLO26 as a dedicated visual agent
visual_agent = YOLO("yolo26n.pt")

# The agent observes the environment by running inference on an image
results = visual_agent("https://ultralytics.com/images/bus.jpg")

# Extract structured data to pass to the MoA aggregator
detected_classes = [visual_agent.names[int(cls)] for cls in results[0].boxes.cls]
unique_objects = set(detected_classes)

# This text context is then sent to the reasoning agent
print(f"Visual Agent Report: I have identified {', '.join(unique_objects)} in the scene.")

من خلال سد الفجوة بين نماذج الرؤية عالية الأداء التي تم إنشاؤها باستخدام أطر عمل مثل PyTorch والمحركات المعرفية المتقدمة مثل Google تعكس أنظمة MoA التعاون البشري. وهي تصبح بسرعة العمود الفقري لخطوط إنتاج Agentic RAG، مما يمهد الطريق لأنظمة مستقلة أكثر قوة وموثوقية.

لنبني مستقبل الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة