Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

RAG Agente

Explore o Agentic RAG para aprimorar a IA com raciocínio autônomo. Saiba como Ultralytics e a Ultralytics impulsionam a recuperação e a visão inteligentes.

A Geração Aumentada por Recuperação Agente (Agentic RAG) é uma arquitetura avançada de inteligência artificial (IA) que aprimora os sistemas de recuperação tradicionais através da integração de agentes de IA autônomos . Enquanto os pipelines RAG padrão operam em uma sequência linear de "recuperação e geração", a Agentic RAG capacita um Modelo de Linguagem Grande (LLM) a atuar como um orquestrador inteligente. Este agente pode analisar de forma independente o prompt de um utilizador, determinar se são necessárias informações externas, formular várias consultas de pesquisa, avaliar os dados recuperados e refinar iterativamente a sua pesquisa até compilar uma resposta abrangente e precisa. Ao aproveitar os recursos de chamada de funções e uso de ferramentas, esses sistemas encaminham dinamicamente as consultas por várias bases de dados, APIs e ferramentas analíticas, reduzindo significativamente as alucinações nos LLMs ao lidar com problemas complexos e de várias etapas.

Como funcionam os sistemas RAG agênicos

A principal inovação do Agentic RAG reside na sua capacidade de repetir e raciocinar. As principais estruturas de IA agênica estruturam esse processo em fluxos de trabalho dinâmicos e autônomos:

RAG agênico vs. RAG padrão

Para implementar pipelines generativos robustos, é crucial diferenciar o Agentic RAG dos seus conceitos fundamentais:

  • Geração Aumentada por Recuperação Padrão (RAG): Opera em uma única passagem. Ela busca documentos com base na similaridade semântica e gera uma resposta. Ela tem dificuldade com lógicas complexas que exigem a síntese de fontes de dados díspares em várias etapas.
  • RAG Agente: Introduz a tomada de decisões e loops. O agente avalia a qualidade da recuperação e pode acionar pesquisas subsequentes ou diferentes ferramentas antes de finalizar a sua geração.
  • RAG multimodal: concentra-se na recuperação de diversos tipos de dados (imagens, texto, vídeo). O RAG agênico pode controlar um pipeline RAG multimodal , decidindo quando pesquisar um banco de dados visual em vez de um documento de texto.

Aplicações no Mundo Real

A Agentic RAG está a transformar indústrias ao automatizar pesquisas aprofundadas e tarefas complexas de resolução de problemas que imitam o raciocínio analítico humano .

  • Síntese do conhecimento empresarial: Em ambientes corporativos, um agente pode receber uma solicitação para «resumir o nosso desempenho no terceiro trimestre e compará-lo com os últimos resultados financeiros do nosso principal concorrente». O agente consulta autonomamente bases de dados financeiras internas, realiza pesquisas em tempo real na Internet sobre os registos dos concorrentes, analisa os números utilizando uma ferramenta de cálculo e elabora um resumo abrangente.
  • Inspeção de qualidade autónoma: Na fabricação, um agente pode ser encarregado de identificar a causa raiz de uma falha de montagem. Ele pode acionar um modelo de visão computacional (CV) para inspecionar uma transmissão ao vivo da câmara, consultar registros históricos de manutenção e sintetizar um relatório de diagnóstico com base em evidências visuais e textuais .

Integrando a IA de visão em fluxos de trabalho agenticos

Os modelos de visão servem como poderosas ferramentas sensoriais para sistemas RAG agênicos que interagem com o mundo físico. Por exemplo, um agente pode usar Ultralytics para recuperar dinamicamente o contexto visual de uma imagem ou fluxo de vídeo para responder às consultas dos utilizadores. Os programadores podem gerir a anotação de dados e o treinamento dessas ferramentas de visão personalizadas usando Ultralytics .

Python a seguir demonstra como um agente de IA pode invocar programaticamente o YOLO26 para extrair observações estruturadas de uma imagem, reunindo contexto factual para a sua próxima etapa de raciocínio.

from ultralytics import YOLO

# Initialize YOLO26 for the agent's visual retrieval tool
model = YOLO("yolo26n.pt")

# The agent invokes the model on an image to gather visual facts
results = model("https://ultralytics.com/images/bus.jpg")

# The agent parses the detected objects to formulate its next query or action
visual_context = [model.names[int(c)] for c in results[0].boxes.cls]
print(f"Agent Observation: I currently see {', '.join(visual_context)}.")

Ao conectar modelos de visão altamente capazes a motores de raciocínio, o Agentic RAG preenche a lacuna entre a recuperação de conhecimento estático e a inteligência espacial dinâmica do mundo real . Para uma análise mais aprofundada do cenário em evolução dos sistemas autónomos, o Relatório do Índice de IA de Stanford fornece um acompanhamento abrangente das capacidades agênicas .

Energize-se com o Ultralytics YOLO

Obtenha visão de IA avançada para seus projetos. Encontre a licença certa para seus objetivos hoje.

Explore as opções de licenciamento