Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Enriquecimiento de Prompts

¡Domina la IA con el enriquecimiento de prompts! Mejora las salidas de los Modelos de Lenguaje Grandes utilizando contexto, instrucciones claras y ejemplos para obtener resultados precisos.

El enriquecimiento de la solicitud es el proceso de aumentar automáticamente la entrada inicial de un usuario con contexto, datos o instrucciones relevantes antes de enviarla a un sistema informático. instrucciones antes de enviarlas a un modelo de modelo de Inteligencia Artificial (IA). En que el usuario puede haber omitido, esta técnica garantiza que la información se transmita de forma correcta. grandes modelos lingüísticos (LLM) y sistemas de visión reciban una consulta completa, lo que da lugar a resultados más precisos, personalizados y procesables. Actúa como una capa intermedia inteligente que optimiza las interacciones entre humanos y máquinas sin necesidad de que el usuario sea un experto en la elaboración de indicaciones detalladas. un experto en la elaboración de instrucciones detalladas.

El mecanismo del enriquecimiento

La función principal del enriquecimiento de instrucciones es salvar la distancia entre la intención, posiblemente vaga, del usuario y la información precisa que necesita una IA. precisa que necesita una IA. Cuando se recibe una consulta, el sistema recupera información complementaria (preferencias del usuario, datos históricos o lecturas de sensores en tiempo real) de una base de datos, datos históricos o lecturas de sensores en tiempo real. base de datos. Estos datos recuperados se y se añaden a la consulta original.

Por ejemplo, en Procesamiento del Lenguaje Natural (PLN) una simple pregunta como "¿Cuál es el estado?" es insuficiente para un modelo. Mediante el enriquecimiento, el sistema identifica el identificador de la sesión activa del usuario, busca la última transacción en una base de datos vectorial y reescribe la pregunta para que diga: "¿Cuál es el estado? en una base de datos vectorial y reescribe la pregunta: "El usuario (ID: 5521) pregunta por el pedido nº 988, que se encuentra en tránsito. Proporcione una actualización de estado basada en estos datos de seguimiento".

Aplicaciones en el mundo real

El enriquecimiento rápido es esencial para el despliegue de aplicaciones de IA generativa en diversos sectores:

  1. Atención al cliente consciente del contexto: En los servicios de asistencia automatizados, un chatbot utiliza el enriquecimiento para acceder al historial de y el entorno técnico del cliente. En lugar de preguntar al usuario por la versión de su dispositivo, el sistema la recupera de los metadatos de la cuenta y la inyecta en la pregunta. de los metadatos de la cuenta y los inyecta en la pregunta. Esto permite al agente de Esto permite que el agente de IA proporcione dispositivo, lo que mejora significativamente la experiencia del cliente.
  2. Configuración dinámica de la visión por ordenador: En operaciones de seguridad, un usuario puede simplemente activar un "Modo nocturno". Entre bastidores, el enriquecimiento de avisos traduce esta intención de alto nivel en clases de objetos específicas para una aplicación. específicas para un modelo de lenguaje de visión (VLM) o un detector de vocabulario abierto. El sistema enriquece el aviso para buscar específicamente "linterna", "movimiento sospechoso" o "movimiento sospechoso". "movimiento sospechoso" o "persona no autorizada", lo que permite al modelo adaptar su detección de objetos de forma dinámica.

Ejemplo: Enriquecimiento dinámico de clases con YOLO

El siguiente ejemplo Python demuestra el concepto de enriquecimiento rápido utilizando Ultralytics YOLO. Aquí, la simple selección de selección de "modo" de un usuario se enriquece programáticamente en una lista de clases descriptivas específicas que el modelo busca.

from ultralytics import YOLO


def run_enriched_inference(user_mode):
    """Enriches a simple user mode into specific detection prompts."""
    # Load an open-vocabulary YOLO model
    model = YOLO("yolov8s-world.pt")

    # Enrichment Logic: Map simple user intent to detailed class prompts
    context_map = {
        "site_safety": ["hard hat", "safety vest", "gloves"],
        "traffic": ["car", "bus", "traffic light", "pedestrian"],
    }

    # Inject the enriched context into the model
    enriched_classes = context_map.get(user_mode, ["object"])
    model.set_classes(enriched_classes)

    # The model now looks for the specific enriched terms
    # model.predict("site_image.jpg") # Run inference
    print(f"Mode: {user_mode} -> Enriched Prompt: {enriched_classes}")


# Example usage
run_enriched_inference("site_safety")

Enriquecimiento de Prompts vs. Conceptos Relacionados

Para aplicar eficazmente Machine Learning Operations (MLOps), es útil distinguir el enriquecimiento rápido de términos similares:

  • Generación mejorada por recuperación (RAG): La RAG es un método específico de enriquecimiento. Se refiere estrictamente al mecanismo de obtención de documentos pertinentes de un corpus externo para fundamentar la respuesta del modelo. El enriquecimiento es el concepto más amplio que incluye la RAG, pero también la inyección de datos estáticos de sesión, metadatos de usuario o tiempo de sistema sin realizar necesariamente una compleja búsqueda semántica.
  • Prompt Engineering: Se trata el diseño manual de instrucciones eficaces. El enriquecimiento es un proceso automatizado que aplica principios de ingeniería de avisos de forma dinámica en tiempo de ejecución.
  • Prompt Tuning: Se trata de un ajuste fino eficiente de parámetros (PEFT) (PEFT) en la que se optimizan las "indicaciones suaves" (tensores aprendibles) durante el entrenamiento. El enriquecimiento se produce completamente inferencia en tiempo real y no altera pesos del modelo.
  • Aprendizaje de Pocos Tiros: Este consiste en proporcionar ejemplos dentro de la instrucción para enseñar al modelo una tarea. Los sistemas de enriquecimiento suelen inyectar dinámicamente en función del tipo de tarea, combinando ambos conceptos.

Relevancia en los sistemas modernos de IA

Como modelos como Ultralytics YOLO11 y GPT-4 se vuelven más capaces, el cuello de botella se desplaza a menudo a la calidad de la entrada. El enriquecimiento rápido mitiga las alucinaciones en los LLM al basar el modelo modelo en datos reales. En visión por ordenador (VC), permite sistemas de que pueden adaptarse a nuevos entornos instantáneamente sin necesidad de reentrenamiento, simplemente modificando las simplemente modificando el texto que se introduce en el sistema. Esta flexibilidad es crucial para crear soluciones escalables y multimodales que puedan razonar sobre texto y las imágenes.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora