Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

RAG agencial

Explore Agentic RAG para mejorar la IA con razonamiento autónomo. Descubra cómo Ultralytics y la Ultralytics potencian la recuperación y la visión inteligentes.

La generación aumentada por recuperación agencial (Agentic RAG) es una arquitectura avanzada de inteligencia artificial (IA) que mejora los sistemas de recuperación tradicionales mediante la integración de agentes autónomos de IA. Mientras que los procesos RAG estándar funcionan en una secuencia lineal de «recuperar y generar», Agentic RAG permite que un modelo de lenguaje grande (LLM) actúe como un orquestador inteligente. Este agente puede analizar de forma independiente la solicitud de un usuario, determinar si se necesita información externa , formular múltiples consultas de búsqueda, evaluar los datos recuperados y refinar iterativamente su investigación hasta compilar una respuesta completa y precisa. Al aprovechar las capacidades de llamada a funciones y uso de herramientas, estos sistemas dirigen dinámicamente las consultas a través de diversas bases de datos, API y herramientas analíticas, lo que reduce significativamente las alucinaciones en los LLM cuando se trata de problemas complejos y de múltiples pasos.

Cómo funcionan los sistemas RAG agenticos

La innovación fundamental de Agentic RAG reside en su capacidad para realizar bucles y razonar. Los principales marcos de IA agencial estructuran este proceso en flujos de trabajo dinámicos y autónomos:

RAG agencial frente a RAG estándar

Para implementar canalizaciones generativas robustas, es fundamental diferenciar el RAG agencial de sus conceptos fundamentales:

  • Generación aumentada por recuperación estándar (RAG): Opera en una sola pasada. Recupera documentos basándose en la similitud semántica y genera una respuesta. Tiene dificultades con la lógica compleja que requiere sintetizar fuentes de datos dispares en múltiples pasos.
  • RAG agencial: Introduce la toma de decisiones y los bucles. El agente evalúa la calidad de la recuperación y puede activar búsquedas posteriores o diferentes herramientas antes de finalizar su generación.
  • RAG multimodal: Se centra en recuperar diversos tipos de datos (imágenes, texto, vídeo). El RAG agénico puede controlar un proceso RAG multimodal , decidiendo cuándo buscar en una base de datos visual frente a un documento de texto.

Aplicaciones en el mundo real

Agentic RAG está transformando las industrias al automatizar la investigación profunda y las tareas complejas de resolución de problemas que imitan el razonamiento analítico humano.

  • Síntesis del conocimiento empresarial: En entornos corporativos, un agente podría recibir una indicación para «resumir nuestro rendimiento del tercer trimestre y compararlo con las últimas ganancias de nuestro principal competidor». El agente consulta de forma autónoma las bases de datos financieras internas, realiza búsquedas en tiempo real en la web para encontrar los informes de la competencia, analiza las cifras utilizando una herramienta de cálculo y redacta un informe completo.
  • Inspección de calidad autónoma: En la fabricación, se puede encargar a un agente que identifique la causa raíz de un fallo de montaje. Puede activar un modelo de visión artificial (CV) para inspeccionar la imagen en directo de una cámara, consultar registros históricos de mantenimiento y sintetizar un informe de diagnóstico basado en pruebas visuales y textuales .

Integración de la IA visual en los flujos de trabajo de Agentic

Los modelos de visión sirven como potentes herramientas sensoriales para los sistemas RAG agenciales que interactúan con el mundo físico. Por ejemplo, un agente puede utilizar Ultralytics para recuperar dinámicamente el contexto visual de una imagen o un flujo de vídeo para responder a las consultas de los usuarios. Los desarrolladores pueden gestionar la anotación de datos y el entrenamiento de estas herramientas de visión personalizadas utilizando Ultralytics .

El siguiente Python muestra cómo un agente de IA podría invocar mediante programación YOLO26 para extraer observaciones estructuradas de una imagen, recopilando contexto factual para su siguiente paso de razonamiento.

from ultralytics import YOLO

# Initialize YOLO26 for the agent's visual retrieval tool
model = YOLO("yolo26n.pt")

# The agent invokes the model on an image to gather visual facts
results = model("https://ultralytics.com/images/bus.jpg")

# The agent parses the detected objects to formulate its next query or action
visual_context = [model.names[int(c)] for c in results[0].boxes.cls]
print(f"Agent Observation: I currently see {', '.join(visual_context)}.")

Al conectar modelos de visión altamente capaces con motores de razonamiento, Agentic RAG salva la brecha entre la recuperación de conocimientos estáticos y la inteligencia espacial dinámica y del mundo real . Para profundizar en el panorama en evolución de los sistemas autónomos, el Informe del Índice de IA de Stanford ofrece un seguimiento exhaustivo de las capacidades de los agentes .

Potencia con Ultralytics YOLO

Obtenga visión artificial avanzada para sus proyectos. Encuentre la licencia adecuada para sus objetivos hoy mismo.

Explore las opciones de licencia