Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Enriquecimiento de Prompts

Descubra cómo el enriquecimiento rápido automatiza el aumento de datos de entrada para mejorar la precisión de la IA. Aprenda a optimizar los modelos LLM y de visión como [YOLO26](ultralytics) para obtener mejores resultados.

El enriquecimiento rápido es el proceso automatizado de aumentar la entrada inicial de un usuario con contexto relevante, instrucciones específicas o datos complementarios antes de enviarla a un modelo de inteligencia artificial (IA). Esta técnica actúa como una capa de middleware inteligente que optimiza la interacción entre humanos y máquinas, garantizando que los modelos de lenguaje grandes (LLM) y los sistemas de visión artificial reciban consultas completas. Al introducir detalles que el usuario podría omitir, como preferencias históricas, datos de ubicación o limitaciones técnicas, el enriquecimiento de prompts mejora significativamente la precisión y la personalización de los resultados del modelo sin que el usuario tenga que ser un experto en la elaboración de instrucciones detalladas.

El mecanismo del enriquecimiento

La función principal del enriquecimiento de prompts es salvar la brecha entre una intención humana vaga y la entrada precisa y rica en datos que requieren los modelos para un rendimiento óptimo. Cuando se recibe una consulta, el sistema la analiza y recupera la información de fondo necesaria de un grafo de conocimiento o una base de datos estructurada. Estos datos recuperados se formatean mediante programación y se añaden al prompt original.

Por ejemplo, en los flujos de trabajo de procesamiento del lenguaje natural (NLP) , una pregunta sencilla como «¿Cuál es el estado?» es insuficiente desde el punto de vista contextual. Un sistema de enriquecimiento identifica la sesión activa, recupera el último número de pedido de una base de datos transaccional y reescribe el mensaje de solicitud de la siguiente manera: «El usuario pregunta por el pedido n.º 998, que actualmente está en tránsito. Proporcione una actualización del envío basada en este estado». Este proceso suele utilizar bases de datos vectoriales para encontrar rápidamente un contexto semánticamente relevante que insertar.

Aplicaciones en el mundo real

El enriquecimiento rápido es esencial para implementar aplicaciones sólidas de IA generativa en diversas industrias, mejorando tanto los sistemas basados en texto como en visión:

  1. Atención al cliente consciente del contexto: en los servicios de asistencia automatizados, un chatbot utiliza el enriquecimiento para acceder al historial de compras y al entorno técnico del cliente. En lugar de preguntar al usuario por la versión de su dispositivo, el sistema recupera esta información de los metadatos de la cuenta y la introduce en el mensaje. Esto permite al agente de IA proporcionar pasos de resolución de problemas inmediatos y específicos para cada dispositivo , lo que mejora significativamente la experiencia del cliente.
  2. Configuración dinámica de la visión por ordenador: en operaciones de seguridad, un usuario podría simplemente activar o desactivar la configuración del «modo nocturno». Entre bastidores, el enriquecimiento de indicaciones traduce esta intención de alto nivel en clases de objetos específicas para un detector de vocabulario abierto como YOLO. El sistema enriquece la indicación para buscar específicamente «linterna», «movimiento sospechoso» o «persona no autorizada», lo que permite al modelo adaptar dinámicamente su enfoque de detección de objetos.

Ejemplo: Enriquecimiento dinámico de clases

Los siguientes Python El ejemplo muestra el concepto de enriquecimiento rápido utilizando el ultralytics paquete. Aquí, la intención de alto nivel de un usuario se enriquece mediante programación en una lista de clases descriptivas específicas que el modelo escanea.

from ultralytics import YOLO


def run_enriched_inference(user_mode):
    """Enriches a simple user mode into specific detection prompts."""
    # Load a YOLO-World model capable of open-vocabulary detection
    model = YOLO("yolov8s-world.pt")

    # Enrichment Logic: Map simple user intent to detailed class prompts
    context_map = {
        "site_safety": ["hard hat", "safety vest", "gloves"],
        "traffic": ["car", "bus", "traffic light", "pedestrian"],
    }

    # Inject the enriched context into the model
    enriched_classes = context_map.get(user_mode, ["object"])
    model.set_classes(enriched_classes)

    # The model now looks for the specific enriched terms
    print(f"Mode: {user_mode} -> Enriched Prompt: {enriched_classes}")


run_enriched_inference("site_safety")

Enriquecimiento de Prompts vs. Conceptos Relacionados

Para aplicar eficazmente Machine Learning Operations (MLOps), es útil distinguir el enriquecimiento rápido de términos similares:

  • Generación aumentada por recuperación (RAG): La RAG es un método específico de enriquecimiento. Se refiere estrictamente al mecanismo de obtención de documentos relevantes de un corpus externo para fundamentar la respuesta del modelo. El enriquecimiento es el concepto más amplio que incluye la RAG, pero también abarca la inyección de datos de sesión estáticos, metadatos de usuario o tiempo del sistema sin necesidad de realizar una búsqueda semántica compleja .
  • Prompt Engineering: Se trata el diseño manual de instrucciones eficaces. El enriquecimiento es un proceso automatizado que aplica principios de ingeniería de avisos de forma dinámica en tiempo de ejecución.
  • Prompt Tuning: Se trata de un ajuste fino eficiente de parámetros (PEFT) (PEFT) en la que se optimizan las "indicaciones suaves" (tensores aprendibles) durante el entrenamiento. El enriquecimiento se produce completamente inferencia en tiempo real y no altera pesos del modelo.
  • Aprendizaje de Pocos Tiros: Este consiste en proporcionar ejemplos dentro de la instrucción para enseñar al modelo una tarea. Los sistemas de enriquecimiento suelen inyectar dinámicamente en función del tipo de tarea, combinando ambos conceptos.

Relevancia en los sistemas modernos de IA

A medida que modelos como Ultralytics y GPT-4 se vuelven más capaces, el cuello de botella a menudo se desplaza a la calidad de la entrada. El enriquecimiento de las indicaciones mitiga las alucinaciones en los LLM al basar el modelo en datos fácticos proporcionados. En la visión por ordenador (CV), permite sistemas de detección de aprendizaje flexibles y sin disparos que pueden adaptarse a nuevos entornos al instante sin necesidad de volver a entrenarlos, simplemente modificando las indicaciones de texto introducidas en el sistema. Esta flexibilidad es crucial para crear soluciones de IA escalables y multimodales que puedan razonar tanto sobre texto como sobre imágenes. Los usuarios que desean gestionar los conjuntos de datos utilizados para fundamentar estos sistemas suelen recurrir a herramientas como la Ultralytics para organizar y anotar su información de forma eficaz.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora