Glossaire

L'incitation à la chaîne de pensée

Améliorez le raisonnement de l'IA grâce à l'invite de la chaîne de pensée ! Améliorez la précision, la transparence et la mémorisation du contexte pour les tâches complexes à plusieurs étapes.

L'incitation à la chaîne de pensée (CoT) est une technique avancée utilisée principalement avec les grands modèles de langage (LLM) pour améliorer leur capacité à effectuer des tâches de raisonnement complexes. Au lieu de demander uniquement la réponse finale, la CoT encourage le modèle à générer des étapes intermédiaires ou une "chaîne de pensée" qui mène logiquement à la solution. Cette approche imite les processus humains de résolution de problèmes et aide les modèles à s'attaquer plus efficacement aux problèmes nécessitant un raisonnement arithmétique, logique ou symbolique, ce qui se traduit souvent par une précision nettement supérieure. Cette technique a notamment été mise en évidence dans une étude de Google AI.

Comment fonctionne l'incitation à la chaîne de pensée

L'incitation CoT guide un modèle d'IA en lui montrant explicitement comment décomposer un problème. Il existe deux variantes principales :

  1. CoT à quelques plans : L'invite comprend quelques exemples (plans) où chaque exemple consiste en une question, un processus de raisonnement détaillé étape par étape (la chaîne de pensée) et la réponse finale. Le modèle apprend à partir de ces exemples à appliquer un processus de raisonnement similaire à la question posée. Il s'agit d'une forme d'apprentissage à partir d'un petit nombre d'exemples appliquée aux voies de raisonnement.
  2. CoT à tir nul : Cette approche plus simple ne nécessite pas de fournir des exemples. Au lieu de cela, une instruction simple telle que "Réfléchissons étape par étape" est jointe à la question. Cet indice encourage le modèle à articuler son processus de raisonnement avant de fournir la réponse finale. Il exploite les capacités inhérentes du modèle acquises au cours de son entraînement préalable approfondi.

En externalisant les étapes du raisonnement, la CoT rend le processus du modèle plus transparent et permet de déboguer plus facilement les erreurs de raisonnement. Elle contraste avec l'incitation standard, qui demande souvent une réponse directe et peut échouer dans des tâches nécessitant plusieurs étapes logiques.

Avantages et applications

Le principal avantage de l'incitation CoT est sa capacité à améliorer les capacités de raisonnement des MFR pour des tâches complexes que l'incitation standard ne permet pas d'accomplir. Les principaux avantages sont les suivants :

  • Amélioration des performances : Augmente considérablement la précision des tâches telles que les problèmes mathématiques, les énigmes logiques et les réponses à des questions à plusieurs étapes.
  • Transparence accrue : La chaîne de pensée générée donne un aperçu du processus de raisonnement du modèle, contribuant ainsi à l'IA explicable (XAI).
  • Meilleure gestion de la complexité : Permet aux modèles de s'attaquer à des problèmes qui nécessitent une décomposition en étapes plus petites et plus faciles à gérer.

Exemples concrets :

  1. Assistance à la clientèle complexe : Un chatbot d' IA utilisant la CoT peut gérer des problèmes complexes, tels que le dépannage d'un problème technique en plusieurs parties ou l'explication d'une demande de facturation complexe. L'invite CoT guide l'IA pour qu'elle identifie d'abord le problème principal, puis rappelle les politiques ou les étapes techniques pertinentes, vérifie l'historique de l'utilisateur si nécessaire, et enfin formule un plan de résolution étape par étape pour le client. C'est plus efficace que de deviner directement une solution. Des plateformes comme Salesforce Einstein exploitent un raisonnement similaire pour le service client.
  2. Analyse et interprétation des données : Lorsqu'on lui présente un ensemble de données et une requête complexe (par exemple, "Identifiez les facteurs clés contribuant à la baisse des ventes au dernier trimestre sur la base de ce rapport"), un LLM utilisant CoT peut présenter son plan d'analyse : premièrement, identifier les points de données pertinents ; deuxièmement, effectuer les calculs ou les comparaisons nécessaires ; troisièmement, synthétiser les résultats ; et enfin, présenter la conclusion. Cette approche structurée améliore la fiabilité des analyses de données générées par l'IA.

La technologie CoT est particulièrement précieuse dans les domaines nécessitant une prise de décision fiable et complexe, tels que l'analyse d'images médicales ou la modélisation financière. Elle complète les progrès réalisés dans des domaines tels que la vision artificielle (CV), grâce à des modèles comme Ultralytics YOLO.

Comparaison avec des concepts apparentés

L'invite CoT est liée à d'autres techniques de traitement du langage naturel (NLP) et d'apprentissage automatique (ML), mais elle en est distincte :

  • Ingénierie des messages-guides: Il s'agit de la pratique générale consistant à concevoir des entrées efficaces (messages-guides) pour les modèles d'IA. CoT est une technique spécifique et avancée d'ingénierie des invites, axée sur l'obtention d'un raisonnement. D'autres techniques peuvent être axées sur la clarté, la fourniture d'un contexte(enrichissement de l'invite) ou la spécification d'un format.
  • Enchaînement d'invites: Le chaînage d'invites consiste à décomposer une tâche complexe en une séquence d'invites plus simples et interconnectées, où la sortie d'une invite devient l'entrée de la suivante. Cela nécessite souvent une orchestration externe (par exemple, en utilisant des cadres comme LangChain). En revanche, CoT vise à obtenir l'ensemble du processus de raisonnement dans le cadre d'une interaction unique entre l'invite et la réponse.
  • Apprentissage à partir de zéro: Il s'agit de la capacité d'un modèle à effectuer des tâches pour lesquelles il n'a pas été explicitement formé, sans aucun exemple. L'apprentissage à partir de zéro est une application spécifique de ce principe, qui utilise une instruction générique ("Réfléchissons étape par étape") pour déclencher le raisonnement. Cependant, la TdC est souvent plus performante dans un contexte d'apprentissage à quelques coups, qui fournit des exemples de raisonnement spécifiques à une tâche, contrairement à l'apprentissage à zéro coup.

L'incitation CoT représente une étape importante vers la construction de systèmes d'intelligence artificielle (IA) plus performants et plus faciles à interpréter. La compréhension et l'utilisation de ces techniques peuvent être bénéfiques lors du développement de modèles d'IA sophistiqués, en tirant éventuellement parti de plateformes comme Ultralytics HUB pour la gestion de la formation et du déploiement. Des techniques telles que l'autoconsistance peuvent encore améliorer la confiance en soi en échantillonnant plusieurs voies de raisonnement et en sélectionnant la réponse la plus cohérente.

Rejoindre la communauté Ultralytics

Rejoignez l'avenir de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

S'inscrire
Lien copié dans le presse-papiers