Explore Agentic RAG para mejorar la IA con razonamiento autónomo. Descubra cómo Ultralytics y la Ultralytics potencian la recuperación y la visión inteligentes.
La generación aumentada por recuperación agencial (Agentic RAG) es una arquitectura avanzada de inteligencia artificial (IA) que mejora los sistemas de recuperación tradicionales mediante la integración de agentes autónomos de IA. Mientras que los procesos RAG estándar funcionan en una secuencia lineal de «recuperar y generar», Agentic RAG permite que un modelo de lenguaje grande (LLM) actúe como un orquestador inteligente. Este agente puede analizar de forma independiente la solicitud de un usuario, determinar si se necesita información externa , formular múltiples consultas de búsqueda, evaluar los datos recuperados y refinar iterativamente su investigación hasta compilar una respuesta completa y precisa. Al aprovechar las capacidades de llamada a funciones y uso de herramientas, estos sistemas dirigen dinámicamente las consultas a través de diversas bases de datos, API y herramientas analíticas, lo que reduce significativamente las alucinaciones en los LLM cuando se trata de problemas complejos y de múltiples pasos.
La innovación fundamental de Agentic RAG reside en su capacidad para realizar bucles y razonar. Los principales marcos de IA agencial estructuran este proceso en flujos de trabajo dinámicos y autónomos:
Para implementar canalizaciones generativas robustas, es fundamental diferenciar el RAG agencial de sus conceptos fundamentales:
Agentic RAG está transformando las industrias al automatizar la investigación profunda y las tareas complejas de resolución de problemas que imitan el razonamiento analítico humano.
Los modelos de visión sirven como potentes herramientas sensoriales para los sistemas RAG agenciales que interactúan con el mundo físico. Por ejemplo, un agente puede utilizar Ultralytics para recuperar dinámicamente el contexto visual de una imagen o un flujo de vídeo para responder a las consultas de los usuarios. Los desarrolladores pueden gestionar la anotación de datos y el entrenamiento de estas herramientas de visión personalizadas utilizando Ultralytics .
El siguiente Python muestra cómo un agente de IA podría invocar mediante programación YOLO26 para extraer observaciones estructuradas de una imagen, recopilando contexto factual para su siguiente paso de razonamiento.
from ultralytics import YOLO
# Initialize YOLO26 for the agent's visual retrieval tool
model = YOLO("yolo26n.pt")
# The agent invokes the model on an image to gather visual facts
results = model("https://ultralytics.com/images/bus.jpg")
# The agent parses the detected objects to formulate its next query or action
visual_context = [model.names[int(c)] for c in results[0].boxes.cls]
print(f"Agent Observation: I currently see {', '.join(visual_context)}.")
Al conectar modelos de visión altamente capaces con motores de razonamiento, Agentic RAG salva la brecha entre la recuperación de conocimientos estáticos y la inteligencia espacial dinámica y del mundo real . Para profundizar en el panorama en evolución de los sistemas autónomos, el Informe del Índice de IA de Stanford ofrece un seguimiento exhaustivo de las capacidades de los agentes .