Glossaire

Chaînage rapide

Découvrez l'enchaînement d'invites : une technique d'IA étape par étape qui améliore l'exactitude, le contrôle et la précision des tâches complexes à l'aide de grands modèles de langage.

Le chaînage d'invites est une technique puissante utilisée pour gérer des tâches complexes en les décomposant en une série d'invites plus petites et interconnectées pour un modèle d'intelligence artificielle (IA). Au lieu de s'appuyer sur une invite unique et massive pour résoudre un problème à plusieurs étapes, on crée une chaîne dans laquelle la sortie d'une invite devient l'entrée de la suivante. Cette approche modulaire améliore la fiabilité, la transparence et les performances globales des systèmes d'intelligence artificielle, en particulier des grands modèles de langage (LLM). Elle permet de construire des flux de travail sophistiqués qui peuvent impliquer la logique, des outils externes et même plusieurs modèles d'IA différents.

Comment fonctionne le chaînage d'invites

Le chaînage d'invites orchestre une séquence d'appels à un ou plusieurs modèles d'intelligence artificielle. Le processus suit un flux logique : une invite initiale est envoyée au modèle, sa réponse est traitée et les informations clés de cette réponse sont extraites et utilisées pour construire l'invite suivante dans la séquence. Ce cycle se poursuit jusqu'à ce que l'objectif final soit atteint. Cette méthodologie est essentielle pour construire des agents d'intelligence artificielle capables de raisonner et d'agir.

Cette approche permet de décomposer les tâches, chaque étape de la chaîne étant optimisée pour une sous-tâche spécifique. Par exemple, une invite peut être conçue pour l'extraction d'informations, la suivante pour le résumé de données et la dernière pour la génération de textes créatifs. Des cadres tels que LangChain sont spécifiquement conçus pour simplifier le développement de ces chaînes en gérant l'état, les invites et l'intégration d'outils externes.

Applications dans le monde réel

L'enchaînement de commandes est polyvalent et a de nombreuses applications pratiques dans l'apprentissage automatique (ML) et l'automatisation des flux de travail.

  1. Agent d'assistance à la clientèle automatisé: Un utilisateur soumet un ticket d'assistance complexe.

    • Invitation 1 (Classification): Un LLM analyse le message de l'utilisateur pour classer le problème (par exemple, "facturation", "technique", "accès au compte").
    • Invite 2 (Recherche de données): Sur la base de la classification "technique", le système exécute une étape de génération assistée par récupération (RAG). Une nouvelle invite demande à l'IA de rechercher des documents pertinents dans une base de connaissances techniques.
    • Invite 3 (génération de réponses): Les documents récupérés sont introduits dans une dernière invite qui demande au LLM de synthétiser les informations et de générer une solution claire, étape par étape, pour l'utilisateur. En savoir plus sur les mécanismes des systèmes RAG.
  2. Création de contenu multimodal: Un spécialiste du marketing souhaite créer une campagne de médias sociaux pour un nouveau produit.

    • Invitation 1 (Génération de texte): Le spécialiste du marketing fournit des détails sur le produit et demande à un LLM de générer cinq slogans marketing accrocheurs.
    • Invitation 2 (génération d'images): Le slogan choisi est ensuite utilisé comme point de départ pour une nouvelle invitation à créer un visuel à partir d' un modèle texte-image tel que la diffusion stable.
    • Invitation 3 (Analyse de la vision): Un modèle de vision par ordinateur, tel qu'un modèle YOLO d'Ultralytics formé sur mesure, pourrait alors être utilisé dans une étape ultérieure pour s'assurer que l'image générée respecte les directives de la marque (par exemple, en confirmant que le bon logo est présent). De tels modèles peuvent être gérés et déployés via des plateformes comme Ultralytics HUB.

Enchaînement d'invites et concepts connexes

Il est utile de distinguer l'enchaînement d'invites des techniques similaires :

  • Prompt Engineering: Il s'agit de la pratique générale consistant à concevoir des messages-guides efficaces. Le chaînage d'invites est une technique spécifique de l'ingénierie des invites qui se concentre sur la structuration séquentielle de plusieurs invites.

  • Chaîne de pensée (CoT): Le CoT vise à améliorer le raisonnement d'un LLM dans le cadre d'une seule invite en lui demandant de "penser étape par étape". En revanche, l'enchaînement d'invites décompose la tâche en plusieurs étapes distinctes, qui peuvent impliquer des modèles ou des outils différents à chaque étape.

  • Génération améliorée par récupération (RAG): La RAG est une technique par laquelle une IA récupère des informations d'une source externe avant de générer une réponse. La RAG est souvent utilisée comme une étape spécifique au sein d' une chaîne d'invite plus large, et non comme le mécanisme d'enchaînement lui-même.

  • Enrichissement des messages: Il s'agit d'ajouter automatiquement un contexte à l'invite initiale d'un utilisateur avant qu' elle ne soit envoyée à l'IA. Il s'agit d'enrichir un seul message plutôt que d'orchestrer le traitement séquentiel de plusieurs messages interconnectés.

  • Prompt Tuning: Une méthode de réglage fin efficace en fonction des paramètres (PEFT ) qui apprend des "invites douces"(embeddings) pendant la formation du modèle. Il s'agit d'une technique de personnalisation du modèle, distincte de la structure d'exécution du chaînage d'invites.

L'enchaînement d'invites est une méthode puissante pour structurer les interactions avec des modèles d'IA avancés tels que les LLM et même pour les intégrer à d'autres systèmes d'IA, y compris ceux utilisés pour la classification d'images ou la segmentation d'instances. Cela rend les tâches complexes plus faciles à gérer et améliore la fiabilité des résultats dans diverses applications d'apprentissage automatique, de l'analyse de données de base aux systèmes d'IA multimodaux sophistiqués. Le déploiement de modèles spécialisés pouvant constituer des composants de ces chaînes est facilité par des plateformes de bout en bout. Vous pouvez explorer une variété de tâches de vision par ordinateur qui peuvent être intégrées dans ces flux de travail avancés.

Rejoindre la communauté Ultralytics

Rejoignez l'avenir de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

S'inscrire
Lien copié dans le presse-papiers