Explore o Agentic RAG para aprimorar a IA com raciocínio autônomo. Saiba como Ultralytics e a Ultralytics impulsionam a recuperação e a visão inteligentes.
A Geração Aumentada por Recuperação Agente (Agentic RAG) é uma arquitetura avançada de inteligência artificial (IA) que aprimora os sistemas de recuperação tradicionais através da integração de agentes de IA autônomos . Enquanto os pipelines RAG padrão operam em uma sequência linear de "recuperação e geração", a Agentic RAG capacita um Modelo de Linguagem Grande (LLM) a atuar como um orquestrador inteligente. Este agente pode analisar de forma independente o prompt de um utilizador, determinar se são necessárias informações externas, formular várias consultas de pesquisa, avaliar os dados recuperados e refinar iterativamente a sua pesquisa até compilar uma resposta abrangente e precisa. Ao aproveitar os recursos de chamada de funções e uso de ferramentas, esses sistemas encaminham dinamicamente as consultas por várias bases de dados, APIs e ferramentas analíticas, reduzindo significativamente as alucinações nos LLMs ao lidar com problemas complexos e de várias etapas.
A principal inovação do Agentic RAG reside na sua capacidade de repetir e raciocinar. As principais estruturas de IA agênica estruturam esse processo em fluxos de trabalho dinâmicos e autônomos:
Para implementar pipelines generativos robustos, é crucial diferenciar o Agentic RAG dos seus conceitos fundamentais:
A Agentic RAG está a transformar indústrias ao automatizar pesquisas aprofundadas e tarefas complexas de resolução de problemas que imitam o raciocínio analítico humano .
Os modelos de visão servem como poderosas ferramentas sensoriais para sistemas RAG agênicos que interagem com o mundo físico. Por exemplo, um agente pode usar Ultralytics para recuperar dinamicamente o contexto visual de uma imagem ou fluxo de vídeo para responder às consultas dos utilizadores. Os programadores podem gerir a anotação de dados e o treinamento dessas ferramentas de visão personalizadas usando Ultralytics .
Python a seguir demonstra como um agente de IA pode invocar programaticamente o YOLO26 para extrair observações estruturadas de uma imagem, reunindo contexto factual para a sua próxima etapa de raciocínio.
from ultralytics import YOLO
# Initialize YOLO26 for the agent's visual retrieval tool
model = YOLO("yolo26n.pt")
# The agent invokes the model on an image to gather visual facts
results = model("https://ultralytics.com/images/bus.jpg")
# The agent parses the detected objects to formulate its next query or action
visual_context = [model.names[int(c)] for c in results[0].boxes.cls]
print(f"Agent Observation: I currently see {', '.join(visual_context)}.")
Ao conectar modelos de visão altamente capazes a motores de raciocínio, o Agentic RAG preenche a lacuna entre a recuperação de conhecimento estático e a inteligência espacial dinâmica do mundo real . Para uma análise mais aprofundada do cenário em evolução dos sistemas autónomos, o Relatório do Índice de IA de Stanford fornece um acompanhamento abrangente das capacidades agênicas .