Prompt Enrichment
Aprende cómo el enriquecimiento de prompts automatiza la aumentación de entradas para mejorar la precisión de la IA. Descubre cómo usar esta técnica con Ultralytics YOLO26 para tareas de visión más inteligentes.
El enriquecimiento de prompts es el proceso automatizado de aumentar la entrada inicial de un usuario con contexto relevante, instrucciones específicas o datos suplementarios antes de enviarla a un modelo de Inteligencia Artificial (IA). Esta técnica actúa como una capa intermedia inteligente que optimiza la interacción entre humanos y máquinas, asegurando que los Modelos de Lenguaje Extensos (LLMs) y los sistemas de visión artificial reciban consultas completas. Al inyectar detalles que un usuario podría omitir, como preferencias históricas, datos de ubicación o restricciones técnicas, el enriquecimiento de prompts mejora significativamente la precisión y la personalización de la salida del modelo sin requerir que el usuario sea un experto en la redacción de instrucciones detalladas.
Link to this sectionEl mecanismo de enriquecimiento#
La función principal del enriquecimiento de prompts es cerrar la brecha entre una intención humana vaga y la entrada precisa y rica en datos que los modelos requieren para un rendimiento óptimo. Cuando se recibe una consulta, el sistema la analiza y recupera la información de fondo necesaria de un grafo de conocimiento o una base de datos estructurada. Estos datos recuperados se formatean programáticamente y se añaden al prompt original.
Por ejemplo, en flujos de trabajo de Procesamiento del Lenguaje Natural (NLP), una pregunta simple como "¿Cuál es el estado?" es contextualmente insuficiente. Un sistema de enriquecimiento identifica la sesión activa, recupera el número de pedido más reciente de una base de datos transaccional y reescribe el prompt a: "El usuario está preguntando por el Pedido #998, que se encuentra actualmente en tránsito. Proporciona una actualización de envío basada en este estado". Este proceso a menudo utiliza bases de datos vectoriales para encontrar rápidamente contexto semánticamente relevante que inyectar.
Link to this sectionAplicaciones en el mundo real#
El enriquecimiento de prompts es esencial para implementar aplicaciones robustas de IA generativa en diversas industrias, mejorando tanto los sistemas basados en texto como en visión:
-
Atención al cliente consciente del contexto: En servicios de soporte automatizados, un chatbot utiliza el enriquecimiento para acceder al historial de compras y al entorno técnico de un cliente. En lugar de preguntar al usuario por la versión de su dispositivo, el sistema la recupera de los metadatos de la cuenta y la inyecta en el prompt. Esto permite al agente de IA proporcionar pasos de solución de problemas inmediatos y específicos para el dispositivo, mejorando significativamente la experiencia del cliente.
-
Configuración dinámica de visión artificial: En operaciones de seguridad, un usuario podría simplemente activar una configuración de "Modo Noche". Detrás de escena, el enriquecimiento de prompts traduce esta intención de alto nivel en clases de objetos específicas para un detector de vocabulario abierto como YOLO-World. El sistema enriquece el prompt para buscar específicamente "linterna", "movimiento sospechoso" o "persona no autorizada", permitiendo que el modelo adapte dinámicamente su enfoque de detección de objetos.
Link to this sectionEjemplo: Enriquecimiento dinámico de clases#
El siguiente ejemplo de Python demuestra el concepto de enriquecimiento de prompts utilizando el paquete ultralytics. Aquí, la intención de alto nivel de un usuario se enriquece programáticamente en una lista de clases descriptivas específicas que el modelo busca.
from ultralytics import YOLO
def run_enriched_inference(user_mode):
"""Enriches a simple user mode into specific detection prompts."""
# Load a YOLO-World model capable of open-vocabulary detection
model = YOLO("yolov8s-world.pt")
# Enrichment Logic: Map simple user intent to detailed class prompts
context_map = {
"site_safety": ["hard hat", "safety vest", "gloves"],
"traffic": ["car", "bus", "traffic light", "pedestrian"],
}
# Inject the enriched context into the model
enriched_classes = context_map.get(user_mode, ["object"])
model.set_classes(enriched_classes)
# The model now looks for the specific enriched terms
print(f"Mode: {user_mode} -> Enriched Prompt: {enriched_classes}")
run_enriched_inference("site_safety")Link to this sectionEnriquecimiento de prompts vs. conceptos relacionados#
Para implementar de forma eficaz las Operaciones de Aprendizaje Automático (MLOps), es útil distinguir el enriquecimiento de prompts de términos similares:
- Generación aumentada por recuperación (RAG): RAG es un método específico de enriquecimiento. Se refiere estrictamente al mecanismo de búsqueda de documentos relevantes en un corpus externo para fundamentar la respuesta del modelo. El enriquecimiento es el concepto más amplio que incluye RAG, pero también abarca la inyección de datos de sesión estáticos, metadatos de usuario o la hora del sistema sin realizar necesariamente una búsqueda semántica compleja.
- Ingeniería de prompts: Es el trabajo manual de diseñar prompts efectivos. El enriquecimiento es un proceso automatizado que aplica principios de ingeniería de prompts dinámicamente en tiempo de ejecución.
- Ajuste de prompts: Es una técnica de ajuste fino eficiente en parámetros (PEFT) donde los "prompts suaves" (tensores aprendibles) se optimizan durante el entrenamiento. El enriquecimiento de prompts ocurre completamente durante la inferencia en tiempo real y no altera los pesos del modelo.
- Aprendizaje con pocos ejemplos (Few-Shot Learning): Esto implica proporcionar ejemplos dentro del prompt para enseñar una tarea al modelo. Los sistemas de enriquecimiento a menudo inyectan estos ejemplos de pocos casos dinámicamente según el tipo de tarea, combinando eficazmente ambos conceptos.
Link to this sectionRelevancia en los sistemas de IA modernos#
A medida que modelos como Ultralytics YOLO26 y GPT-4 se vuelven más capaces, el cuello de botella a menudo se desplaza hacia la calidad de la entrada. El enriquecimiento de prompts mitiga las alucinaciones en LLMs al fundamentar el modelo en datos fácticos proporcionados. En visión artificial (CV), permite sistemas de detección flexibles de aprendizaje cero (zero-shot) que pueden adaptarse a nuevos entornos al instante sin necesidad de reentrenamiento, simplemente modificando los prompts de texto introducidos en el sistema. Esta flexibilidad es crucial para construir soluciones de IA multimodal escalables que pueden razonar tanto sobre texto como sobre imágenes. Los usuarios que buscan gestionar conjuntos de datos utilizados para fundamentar estos sistemas a menudo confían en herramientas como la Plataforma Ultralytics para organizar y anotar su información eficazmente.






