Mixture of Agents (MoA)
探索代理混合 (MoA) 如何利用多个 LLM 解决复杂任务。学习如何将 Ultralytics YOLO26 集成为 MoA 工作流中的视觉代理。
Mixture of Agents (MoA) 是一种先进的人工智能架构,它利用多个 大语言模型 (LLMs) 或自主智能体来协作解决复杂任务。MoA 系统不是依赖单一模型来生成响应,而是同时查询多个不同的模型。这些初始智能体生成独立的答案,然后传递给聚合器或合成器智能体。聚合器会对这些不同的视角进行评估、优化并整合为一个高质量的最终输出。这种协作方法显著增强了推理能力,并减轻了单一模型固有的偏见或弱点,代表了在 自然语言处理 (NLP) 和问题解决领域的一大进步。
Link to this sectionMixture of Agents 与 Mixture of Experts#
虽然听起来很相似,但区分 MoA 与相关的 Mixture of Experts (MoE) 概念至关重要。
- Mixture of Experts (MoE): 在单个 神经网络架构 内运行。它使用路由机制在推理过程中仅为每个 token 激活特定的、专门的子层(专家)。这在保持高参数量的同时优化了计算效率。
- Mixture of Agents (MoA): Operates at the model or system level. It involves entirely separate AI agents—often built on different foundation models—interacting in a pipeline. MoA acts more like a model ensemble combined with an intelligent review process, as detailed in recent multi-agent system research.
Link to this section实际应用#
MoA 架构在需要深度推理、事实核查和多样化数据合成的环境中表现优异。
- 复杂软件工程: 在软件开发中,MoA 系统可能会利用 Anthropic Claude 来编写核心逻辑,使用 OpenAI GPT-4o 来生成单元测试,并使用本地模型进行安全审计。最终的聚合器智能体会审查组合后的代码、测试代码并输出经过优化、无 bug 的脚本。
- 自动化医疗诊断: 在 AI 医疗保健 领域,诊断型 MoA 流水线可以部署专门的智能体来查看患者病史、分析实验室结果并处理医学影像。合成器智能体将这些发现汇总,以协助医生形成综合诊断,从而大幅降低人为错误的几率。
Link to this section将视觉集成到 MoA 工作流中#
现代 MoA 系统正变得越来越具有多模态特性,这意味着它们在进行推理之前,会依赖 计算机视觉 (CV) 模型来感知物理世界。例如,在 AI 制造业 中,视觉智能体可以检查实时摄像头画面,并将事实观察结果发送给推理智能体。
以下 Python 示例展示了 Ultralytics YOLO26 如何作为 MoA 流水线中的“视觉智能体”发挥作用,提取上下文数据并将其馈送给下游的 LLM。开发者可以使用 Ultralytics Platform 无缝管理和微调这些专业的视觉工具。
from ultralytics import YOLO
# Initialize YOLO26 as a dedicated visual agent
visual_agent = YOLO("yolo26n.pt")
# The agent observes the environment by running inference on an image
results = visual_agent("https://ultralytics.com/images/bus.jpg")
# Extract structured data to pass to the MoA aggregator
detected_classes = [visual_agent.names[int(cls)] for cls in results[0].boxes.cls]
unique_objects = set(detected_classes)
# This text context is then sent to the reasoning agent
print(f"Visual Agent Report: I have identified {', '.join(unique_objects)} in the scene.")通过架起像 PyTorch 这样构建的高性能视觉模型与像 Google Gemini 这样先进的认知引擎之间的桥梁,MoA 生态系统映射了人类的协作模式。它们正迅速成为 Agentic RAG 流水线的基石,为更强大、更可靠的自主系统铺平道路。






