Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Prompting de Cadena de Pensamiento

¡Impulse el razonamiento de la IA con el prompting de cadena de pensamiento! Mejore la precisión, la transparencia y la retención del contexto para tareas complejas de varios pasos.

La incitación a la cadena de pensamiento (CoT) es una técnica sofisticada de para mejorar la capacidad de razonamiento capacidades de razonamiento de modelos lingüísticos amplios (LLM). En lugar de que un modelo de IA proporcione una respuesta inmediata a una consulta compleja, las instrucciones CoT indican al modelo que descomponga el problema en una serie de pasos intermedios y lógicos. Este método imita los procesos humanos de resolución de problemas, permite al modelo "pensar en voz alta" antes de llegar a una conclusión final. Al generar una secuencia de pasos de razonamiento, el modelo puede mejorar significativamente su rendimiento en tareas que requieran aritmética, razonamiento de sentido común y lógica simbólica. y lógica simbólica. Este método fue popularizado por los investigadores de Google Brain, demostrando que los procesos de pensamiento estructurados conducen a resultados de Inteligencia Artificial (IA) más fiables y precisos. más fiables y precisos.

Mecanismos de la cadena de pensamiento

La eficacia de CoT reside en su capacidad para descomponer tareas complejas en componentes manejables. Esto no sólo Esto no sólo ayuda al modelo a mantener la coherencia, sino que también proporciona transparencia sobre cómo se ha obtenido una respuesta, un factor clave en la IA explicable (XAI). IA explicable (XAI). Hay dos formas principales de aplicar esta estrategia:

  • TdC de disparo cero: Consiste en añadir una frase desencadenante como "Pensemos paso a paso" al final de un mensaje. Como se describe en la investigación sobre Zero-Shot Reasoners, esta sencilla instrucción activa la capacidad de razonamiento razonamiento del modelo sin necesidad de ejemplos concretos. el aprendizaje cero para manejar tareas novedosas.
  • CoT de pocas preguntas: En este escenario, la solicitud incluye algunos ejemplos de preguntas acompañadas de sus soluciones paso a paso. soluciones paso a paso. Se utiliza el modelo aprende el patrón de razonamiento modelo aprende el patrón de razonamiento a partir del contexto proporcionado y lo aplica a la nueva entrada.

Aplicaciones en el mundo real

Las instrucciones de la cadena de pensamiento están transformando el modo en que los desarrolladores crean aplicaciones en diversos ámbitos, sobre todo cuando la precisión y la lógica son primordiales. donde la precisión y la lógica son primordiales.

  1. Análisis de datos complejos: En campos como las finanzas o análisis de datos, CoT se utiliza para guiar modelos a través de cálculos de varias etapas. Por ejemplo, un analista puede pedir a una IA que "Primero extraiga las cifras de ingresos del primer trimestre ingresos del primer trimestre, luego ajuste la inflación con el índice del IPC y, por último, compare la tasa de crecimiento con la del ejercicio anterior". anterior". Este enfoque estructurado reduce los errores de cálculo habituales en las instrucciones de respuesta directa.
  2. Generación y depuración de código: Los desarrolladores utilizan CoT para generar código robusto para visión por ordenador (CV) tareas. En lugar de un guión, un usuario puede pedir al modelo que describa la lógica para cargar un conjunto de datos, configurar la arquitectura del modelo y ejecutar el bucle de entrenamiento. y ejecutar el bucle de entrenamiento. Esto garantiza que los scripts generados para bibliotecas como ultralytics son lógicas y sintácticamente correctas.

Ejemplo de código

Aunque CoT es una técnica basada en texto, se utiliza con frecuencia para generar código Python correcto para flujos de trabajo de aprendizaje automático. aprendizaje automático. En el siguiente ejemplo se muestra cómo estructurar una cadena de instrucciones en Python para obtener una solución paso a paso para el uso de la tecnología CoT. paso a paso para utilizar YOLO11 para detect objetos.

# Example of a Chain-of-Thought prompt structure for generating YOLO11 code
prompt = """
Task: Write a Python script to detect objects in a video stream using YOLO11.

Chain of Thought:
1. Import the YOLO class from the ultralytics package.
2. Load the pre-trained 'yolo11n.pt' model weights.
3. Define the source as '0' for the webcam or a video file path.
4. Run the predict() method with show=True to visualize results in real-time.

Now, generate the Python code based on these steps.
"""

print(f"Sending the following prompt to LLM:\n{prompt}")

Comparación con conceptos relacionados

Es importante distinguir la incitación a la cadena de pensamiento de otras técnicas de aprendizaje automático. técnicas de aprendizaje automático:

  • Encadenamiento: Mientras que el CoT se produce dentro de un único ciclo de solicitud-respuesta, el encadenamiento de solicitudes implica dividir una tarea en una secuencia de llamadas a la API separadas, donde la salida de una solicitud se convierte en la entrada de la siguiente. de llamadas separadas a la API, donde la salida de una solicitud se convierte en la entrada de la siguiente. CoT se centra en el razonamiento interno, mientras que el encadenamiento se centra en la orquestación del flujo de trabajo.
  • Generación mejorada por recuperación (RAG): La RAG consiste en obtener datos externos para fundamentar el conocimiento del modelo antes de generar una respuesta. CoT puede combinarse combinarse con RAG (por ejemplo, "Primero, recupera el documento, luego razona sobre su contenido"), pero CoT se refiere específicamente a la estructura de razonamiento, no al mecanismo de recuperación de datos.
  • Prompt Tuning: Se trata de un ajuste fino eficiente de parámetros (PEFT) que optimiza las indicaciones suaves continuas (vectores) durante el entrenamiento. En cambio, CoT es una estrategia discreta de lenguaje natural aplicada en tiempo de inferencia sin alterar las del modelo.

Al integrar las instrucciones de la cadena de pensamiento, los desarrolladores pueden aprovechar todo el potencial de la IA generativa. la IA generativa, garantizando que los modelos no sólo proporcionen respuestas, sino que también demuestren la validez lógica de sus soluciones. Esto es esencial para desplegar agentes de fiables en entornos críticos.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora