Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Ingeniería de Prompts

Domina el arte de la ingeniería de prompts para guiar modelos de IA como los LLM y obtener resultados precisos y de alta calidad en contenido, atención al cliente y más.

La ingeniería de prompts es el arte y la ciencia de diseñar entradas (prompts) eficaces para guiar a los modelos de Inteligencia Artificial (IA), en particular a los Modelos de Lenguaje Grandes (LLM), hacia la generación de las salidas deseadas. Es análogo a ser un comunicador experto con una IA, sabiendo precisamente qué decir y cómo decirlo para obtener la mejor respuesta posible. Esta práctica es crucial porque el rendimiento, la relevancia y la calidad de la salida de un modelo de IA son muy sensibles a la forma en que se formula una consulta. Una ingeniería de prompts eficaz permite a los usuarios aprovechar todo el potencial de los potentes modelos de base para una amplia gama de tareas.

Cómo funciona la ingeniería de prompts

La base de la ingeniería de prompts es estructurar una entrada que proporcione un contexto claro y suficiente para el modelo. Si bien una simple pregunta puede generar una respuesta básica, un prompt bien diseñado puede controlar el tono, el formato y la complejidad. Los componentes clave de un prompt avanzado pueden incluir:

  • Instrucción: Una directiva clara y específica que le dice al modelo qué tarea debe realizar (por ejemplo, "Resume el siguiente artículo en tres puntos").
  • Contexto: Proporcionar información o datos de fondo relevantes que el modelo debe utilizar para fundamentar su respuesta.
  • Persona: Asignar un rol para que la IA lo adopte, lo que influye en el tono y el estilo de la salida (por ejemplo, "Actuar como un analista financiero experto").
  • Formato: Especifica la estructura deseada de la salida, como una lista, un objeto JSON o un estilo de escritura específico.
  • Ejemplos: Incluir ejemplos del formato de entrada y salida deseado, una técnica conocida como aprendizaje con pocos ejemplos (few-shot learning), ayuda a guiar la respuesta del modelo. Se puede encontrar un recurso completo para estas técnicas en la Guía de Prompting.

Aplicaciones en el mundo real

  1. Automatización de la atención al cliente: Para garantizar la coherencia y la precisión de la marca, una empresa puede utilizar la ingeniería de prompts para guiar su chatbot de soporte. Un prompt podría indicar a la IA que adopte un tono amigable y útil, que utilice una base de conocimientos interna para responder a las preguntas sobre los productos y que defina un protocolo claro sobre cuándo escalar una conversación a un agente humano. Esto controla el comportamiento de la IA, evitando que proporcione información incorrecta o que interactúe con los clientes de una manera que no se ajuste a la marca.

  2. Generación de contenido creativo: En modelos de texto a imagen como Midjourney o DALL-E 3 de OpenAI, el prompt es la herramienta principal para la creación. Un prompt simple como "una foto de un coche" producirá un resultado genérico. Sin embargo, un prompt detallado como "Un coche deportivo rojo vintage de la década de 1960 circulando a toda velocidad por una carretera costera al atardecer, estilo fotorrealista, iluminación cinematográfica, resolución 8K" proporciona instrucciones específicas sobre el tema, el entorno, el estilo y la calidad, lo que da como resultado una imagen muy personalizada y visualmente impresionante.

Relevancia en la visión artificial

Aunque se originó en el Procesamiento del Lenguaje Natural (PNL), la ingeniería de prompts es cada vez más relevante en la Visión Artificial (CV). Esto se debe al desarrollo de modelos multimodales que pueden procesar tanto texto como imágenes simultáneamente. Modelos como CLIP y detectores de vocabulario abierto como YOLO-World pueden realizar tareas como la detección de objetos basándose en descripciones de texto arbitrarias. Para estos modelos, la elaboración de un prompt de texto eficaz (por ejemplo, "detectar todas las 'bicicletas' pero ignorar las 'motocicletas'") es una forma de ingeniería de prompts crucial para guiar estos Modelos de Lenguaje de Visión. Plataformas como Ultralytics HUB facilitan la interacción con varios modelos, donde la definición de tareas a través de interfaces puede beneficiarse de los principios de la ingeniería de prompts.

Ingeniería de Prompts vs. Conceptos Relacionados

Es importante distinguir la ingeniería de prompts de otros conceptos de aprendizaje automático:

  • Ajuste fino: Esto implica actualizar los pesos de un modelo continuando el proceso de entrenamiento en un nuevo conjunto de datos. La ingeniería de prompts, por el contrario, no cambia el modelo en sí, sino que guía el comportamiento del modelo existente en el momento de la inferencia.
  • Ajuste de Prompts (Prompt Tuning): Un método de ajuste fino eficiente en parámetros (PEFT), el ajuste de prompts implica aprender un pequeño conjunto de embeddings de "soft prompt" que se anteponen a la entrada. Automatiza la creación de prompts a través del entrenamiento, mientras que la ingeniería de prompts es el proceso manual de crear "hard prompts" basados en texto.
  • Prompting Chain-of-Thought (CoT): CoT es una técnica específica de ingeniería de prompts donde se añade una instrucción como "piensa paso a paso" al prompt. Esto anima al modelo a descomponer problemas complejos en pasos de razonamiento intermedios, lo que a menudo conduce a resultados más precisos, como se detalla en el artículo de investigación original de Google AI.
  • Encadenamiento de Prompts (Prompt Chaining): Esta técnica implica dividir una tarea compleja en múltiples prompts secuenciales, donde la salida de un paso es la entrada para el siguiente. La ingeniería de prompts es la práctica más amplia de diseñar cada uno de esos prompts individuales de manera efectiva. Frameworks como LangChain están diseñados para orquestar tales cadenas.
  • Generación Aumentada por Recuperación (Retrieval-Augmented Generation, RAG): RAG es un sistema que mejora un prompt recuperando primero datos relevantes de una base de conocimiento externa. La ingeniería de prompts es fundamental dentro de un sistema RAG para formular correctamente tanto la consulta de búsqueda inicial como el prompt final que combina la pregunta del usuario con la información recuperada.

Únete a la comunidad de Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora
Enlace copiado al portapapeles