Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Generación Aumentada de Recuperación (RAG)

Descubra cómo la Generación Aumentada por Recuperación (RAG) mejora los modelos de IA integrando datos externos fiables y en tiempo real para obtener respuestas precisas y actualizadas.

Retrieval Augmented Generation (RAG) es un marco avanzado diseñado para optimizar la salida de grandes modelos lingüísticos (LLM) haciendo referencia a una base de conocimientos autorizada fuera de sus datos de entrenamiento originales. En los sistemas generativos estándar, el modelo se basa únicamente en la información estática que aprendió durante el entrenamiento, lo que puede dar lugar a respuestas obsoletas o errores factuales conocidos como alucinaciones. RAG cubre este vacío información relevante y actualizada de fuentes externas fiables y la introduce en el modelo como contexto antes de generar una respuesta. antes de generar una respuesta. Este proceso sirve de base a la IA, garantizando precisión y pertinencia sin necesidad de reentrenamiento del modelo.

Cómo funciona la Generación Aumentada de Recuperación

El flujo de trabajo del GAR integra dos componentes principales: un sistema de recuperación y un modelo de generación. Esta sinergia transforma cómo procesamiento del lenguaje natural (PLN) (PLN).

  1. Recuperación: Cuando un usuario envía una consulta, el sistema busca primero en una base de base de conocimientos especializada base de datos vectorial. Esta base contiene representaciones numéricasde texto o datos que permiten una búsqueda semántica eficaz. El recuperador identifica los documentos o fragmentos de datos más similares semánticamente a la petición del usuario.
  2. Aumento: La información recuperada se combina con la consulta original del usuario utilizando técnicas de ingeniería de consulta. Esta "aumentada" proporciona al modelo el contexto fáctico necesario del que carecía inicialmente.
  3. Generación: Por último, el mensaje enriquecido se transmite al LLM. El modelo utiliza el contexto para generar una respuesta coherente y basada en hechos. Los principales marcos de trabajo, como LangChain se utilizan a menudo para orquestar estos pasos a la perfección.

Aplicaciones en el mundo real

El GAR es esencial en sectores en los que los datos cambian con frecuencia o en los que la precisión es fundamental.

  • Gestión del conocimiento empresarial: Las organizaciones utilizan RAG para chatbots internos que ayudan a los empleados. Por ejemplo, un asistente puede recuperar los últimos documentos normativos de un servidor de la empresa para responder a preguntas sobre prestaciones. Este Esto garantiza que la IA se adhiere a protocolos específicos de la empresa en lugar de conocimientos genéricos de Internet.
  • Apoyo a la toma de decisiones clínicas: En el ámbito médico, la IA en la atención sanitaria se beneficia significativamente de RAG. Un sistema puede recuperar los trabajos de investigación médica más recientes o los historiales de pacientes específicos para ayudar a los médicos en el diagnóstico, garantizando que los resultados sean fiables. a los médicos en el diagnóstico, garantizando que el modelo predictivo se basa en la ciencia ciencia más que en la fecha de corte del modelo.

RAG en Visión Artificial

Aunque tradicionalmente se basan en el texto, los conceptos de GAR se están ampliando a la la visión por ordenador (CV). En un modelo modelo multimodal, un sistema podría recuperar imágenes similares o metadatos visuales que ayuden a la detección o clasificación de objetos. Por ejemplo, la identificación de un espécimen biológico poco común podría mejorarse recuperando imágenes de referencia de una base de datos científica para base de datos científica para aumentar el análisis visual realizado por modelos como Ultralytics YOLO11.

RAG vs. Ajuste fino

Es importante distinguir entre la GAR y el ajuste fino, ya que resuelven problemas diferentes:

  • RAG conecta un modelo con hechos dinámicos externos. Es ideal para aplicaciones que requieren información actualizada y verificabilidad. No modifica los parámetros internos del modelo.
  • El ajuste consiste en seguir entrenando el modelo en un conjunto de datos específico para ajustar sus pesos del modelo. Esto es ideal para enseñar a un modelo un estilo, tono o comportamiento especializado, pero es menos eficaz para mantener una base de conocimientos de hechos que cambian rápidamente. hechos que cambian rápidamente. A menudo, los desarrolladores utilizan aprendizaje por transferencia para combinar ambos enfoques para obtener un rendimiento óptimo.

Ejemplo: Aumentar una pregunta con datos de detección

En este ejemplo Python , simulamos un flujo de trabajo RAG básico utilizando un modelo de detección de objetos para "recuperar" datos sobre una imagen. A continuación, estos hechos aumentan una indicación de texto, basando la descripción en datos visuales verificados.

from ultralytics import YOLO

# Load the YOLO11 model acting as our 'retrieval' mechanism for visual facts
model = YOLO("yolo11n.pt")

# Run inference to retrieve content information from the image
results = model("https://ultralytics.com/images/bus.jpg")

# Extract detected classes to augment the prompt
detected_objects = [model.names[int(cls)] for cls in results[0].boxes.cls]
context_string = ", ".join(set(detected_objects))

# Construct the augmented prompt (RAG concept)
prompt = f"Based on the verified presence of {context_string} in the scene, describe the traffic situation."
print(f"Augmented Prompt: {prompt}")

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora