Mixture of Agents (MoA)
Descobre como o Mixture of Agents (MoA) aproveita múltiplos LLMs para resolver tarefas complexas. Aprende a integrar o Ultralytics YOLO26 como um agente visual em fluxos de trabalho MoA.
Uma Mixture of Agents (MoA) é uma arquitetura avançada de inteligência artificial que utiliza múltiplos large language models (LLMs) ou agentes autônomos para resolver tarefas complexas de forma colaborativa. Em vez de depender de um único modelo para gerar uma resposta, um sistema MoA consulta vários modelos distintos simultaneamente. Esses agentes iniciais produzem respostas independentes, que são então enviadas a um agente agregador ou sintetizador. O agregador avalia, refina e combina as diversas perspectivas em um único resultado final de alta qualidade. Essa abordagem colaborativa aumenta significativamente as capacidades de raciocínio e mitiga os vieses ou fraquezas individuais de modelos isolados, representando um grande salto em natural language processing (NLP) e na resolução de problemas.
Link to this sectionMixture of Agents vs. Mixture of Experts#
Embora soem parecidos, é crucial diferenciar MoA do conceito relacionado de Mixture of Experts (MoE).
- Mixture of Experts (MoE): Opera dentro de uma única neural network architecture. Utiliza um mecanismo de roteamento para ativar apenas subcamadas (especialistas) específicas durante a inferência para cada token. Isso otimiza a eficiência computacional enquanto mantém uma alta contagem de parâmetros.
- Mixture of Agents (MoA): Opera no nível do modelo ou do sistema. Envolve AI agents totalmente separados — muitas vezes construídos sobre diferentes modelos base — interagindo em um pipeline. O MoA funciona mais como um model ensemble combinado com um processo de revisão inteligente, conforme detalhado em pesquisas recentes sobre multi-agent system research.
Link to this sectionAplicações no Mundo Real#
Arquiteturas MoA se destacam em ambientes que exigem raciocínio profundo, verificação de fatos e síntese de dados diversos.
- Engenharia de Software Complexa: No desenvolvimento de software, um sistema MoA pode utilizar Anthropic Claude para escrever a lógica principal, OpenAI GPT-4o para gerar testes unitários e um modelo local para auditoria de segurança. Um agente agregador final revisa o código combinado, testa-o e gera um script refinado e livre de erros.
- Diagnósticos Médicos Automatizados: Em AI in healthcare, um pipeline MoA de diagnóstico pode implantar agentes especializados para revisar o histórico do paciente, analisar resultados laboratoriais e processar exames de imagem. O agente sintetizador agrega essas descobertas para ajudar os médicos a formar um diagnóstico abrangente, reduzindo drasticamente a chance de erro humano.
Link to this sectionIntegrando Visão em Workflows MoA#
Sistemas MoA modernos são cada vez mais multimodais, o que significa que dependem de modelos de computer vision (CV) para perceber o mundo físico antes de raciocinar sobre ele. Por exemplo, em AI in manufacturing, um agente visual pode inspecionar um feed de câmera ao vivo e enviar suas observações factuais para um agente de raciocínio.
O exemplo em Python a seguir demonstra como o Ultralytics YOLO26 pode funcionar como um "agente visual" dentro de um pipeline MoA, extraindo dados contextuais para serem fornecidos a LLMs subsequentes. Desenvolvedores podem gerenciar e ajustar facilmente essas ferramentas de visão especializadas usando a Ultralytics Platform.
from ultralytics import YOLO
# Initialize YOLO26 as a dedicated visual agent
visual_agent = YOLO("yolo26n.pt")
# The agent observes the environment by running inference on an image
results = visual_agent("https://ultralytics.com/images/bus.jpg")
# Extract structured data to pass to the MoA aggregator
detected_classes = [visual_agent.names[int(cls)] for cls in results[0].boxes.cls]
unique_objects = set(detected_classes)
# This text context is then sent to the reasoning agent
print(f"Visual Agent Report: I have identified {', '.join(unique_objects)} in the scene.")Ao preencher a lacuna entre modelos de visão altamente capazes, construídos com frameworks como PyTorch, e motores cognitivos avançados como o Google Gemini, os ecossistemas MoA espelham a colaboração humana. Eles estão se tornando rapidamente a espinha dorsal de pipelines de Agentic RAG, abrindo caminho para sistemas autônomos mais robustos e confiáveis.






