Glossaire

Enrichissement des messages-guides

Maîtrise l'IA grâce à l'enrichissement rapide ! Améliore les sorties des grands modèles linguistiques en utilisant le contexte, des instructions claires et des exemples pour obtenir des résultats précis.

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

L'enrichissement des invites est le processus d'amélioration automatique ou semi-automatique de l'invite d'entrée initiale d'un utilisateur avant qu'elle ne soit traitée par un modèle d'intelligence artificielle (IA), en particulier les grands modèles de langage (LLM). L'objectif principal est d'améliorer la qualité, la pertinence et la spécificité des résultats de l'IA en ajoutant des informations contextuelles pertinentes, en clarifiant les ambiguïtés potentielles, en fixant des contraintes ou en incluant des détails spécifiques. Cette technique affine l'interaction entre les utilisateurs et les systèmes d'IA, en rendant les messages-guides plus efficaces sans que l'utilisateur ait besoin d'une expertise approfondie en matière d'ingénierie des messages-guides, ce qui améliore l'expérience globale de l'utilisateur (UX).

Comment fonctionne l'enrichissement par l'exemple ?

Le processus d'enrichissement commence généralement par l'analyse de l'invite originale de l'utilisateur. Sur la base de cette analyse, le système exploite des sources d'informations supplémentaires ou des règles prédéfinies pour enrichir l'invite. Il peut s'agir d'accéder à l'historique des interactions de l'utilisateur, de récupérer des documents pertinents dans une base de connaissances, d'intégrer le contexte de la conversation en cours ou d'appliquer des instructions de formatage spécifiques requises par le modèle. Par exemple, une simple invite comme "Résume les derniers développements d'Ultralytics " pourrait être enrichie pour spécifier "Résume les principales caractéristiques et les améliorations de performance d'Ultralytics YOLOv11 par rapport à YOLOv8en se concentrant sur les tâches de détection d'objets." Des techniques telles que la génération améliorée par récupération (RAG) sont couramment utilisées : le système récupère des bribes de données pertinentes (par exemple, dans Ultralytics Docs) et les incorpore dans la fenêtre contextuelle de l'invite avant de l'envoyer au LLM. Cela permet de s'assurer que le modèle dispose du contexte nécessaire pour générer une réponse complète et précise.

Applications et exemples

L'enrichissement des messages rapides est précieux dans de nombreuses applications pilotées par l'IA, car il améliore la qualité des interactions et l'exécution des tâches :

  • Chatbots d'assistance à la clientèle : Un client qui demande "Quel est le statut de ma commande ?" peut voir son message enrichi de son identifiant ou de son numéro de commande récent récupéré dans un système de gestion de la relation client (CRM) via une intégration API. L'invite enrichie permet au chatbot de fournir immédiatement une mise à jour spécifique, plutôt que de poser des questions de clarification de suivi.
  • Des assistants virtuels pour la personnalisation: Lorsqu'un utilisateur demande à un assistant virtuel comme Google Assistant ou Alexa de "Jouer de la musique", l'invite peut être enrichie en fonction de l'historique d'écoute de l'utilisateur, de ses genres préférés, de l'heure de la journée, ou même de l'activité actuelle détectée via les appareils connectés, ce qui conduit à une sélection musicale plus personnalisée.
  • Outils de création de contenu : Un assistant d'écriture créative utilisant la génération de texte pourrait recevoir une invite vague comme "Écrivez une histoire." L'enrichissement de l'invite pourrait ajouter des détails basés sur les interactions précédentes, comme "Écris une courte histoire de science-fiction située dans un futur dystopique, mettant en scène un protagoniste rebelle", ce qui rendrait le résultat plus aligné sur les intérêts probables de l'utilisateur.
  • Systèmes derecherche sémantique: Lors de la recherche de documents internes à l'entreprise, une requête telle que "Trouver des rapports sur les performances du T4" peut être enrichie avec le département, le rôle et les autorisations d'accès de l'utilisateur afin de récupérer les documents les plus pertinents et les plus autorisés à partir d'un vaste lac de données.

Enrichissement des messages-guides et concepts connexes

Il est crucial de comprendre les nuances entre l'enrichissement rapide et les termes similaires :

  • Ingénierie des messages-guides: Il s'agit généralement d'un processus manuel au cours duquel les humains élaborent soigneusement des messages-guides pour obtenir les réponses souhaitées de la part d'une IA. L'enrichissement des messages-guides, à l'inverse, vise à automatiser ou à semi-automatiser ce processus d'amélioration, souvent à partir d'un message-guide initial moins raffiné.
  • Ajustement de l'invite: Cette technique implique l'apprentissage d'incrustations d' invites douces par descente de gradient afin de conditionner un modèle pré-entraîné figé pour des tâches spécifiques. Elle modifie des parties de la représentation d'entrée du modèle plutôt que l'invite textuelle elle-même. Il s'agit d'une forme de paramétrage fin efficace (PEFT).
  • Mise au point: Il s'agit de mettre à jour les poids d' un modèle pré-entraîné sur un ensemble de données plus petit et spécifique à une tâche. L'enrichissement des messages-guides ne modifie pas les paramètres du modèle ; il modifie seulement le message-guide envoyé au modèle existant.
  • Génération améliorée par récupération (RAG): La RAG est une méthode spécifique souvent employée dans les systèmes d'enrichissement des messages-guides. Elle consiste à récupérer des données externes pertinentes et à les ajouter au contexte de l'invite afin d'améliorer la base factuelle et de réduire les hallucinations.

Pertinence dans le domaine de la vision par ordinateur

Bien que l'enrichissement de l'invite soit le plus souvent associé aux LLM et à la compréhension du langage naturel (NLU), ses principes deviennent pertinents dans le domaine de la vision par ordinateur (CV). Les tâches traditionnelles de CV comme la détection d'objets standard à l'aide de modèles tels que Ultralytics YOLO s'appuient généralement sur des images plutôt que sur des textes complexes. Cependant, les nouveaux modèles multimodaux et les systèmes de vision guidée, tels que CLIP, YOLO et YOLOE, acceptent des textes ou des images pour guider des tâches telles que la détection d'un zéro pointé. Pour ces modèles, l'enrichissement d'une simple invite textuelle (par exemple, "détecter les véhicules") avec plus de contexte (par exemple, "détecter uniquement les véhicules d'urgence comme les ambulances et les camions de pompiers dans ce flux de caméras de circulation") pourrait améliorer de manière significative les performances et la spécificité. Des plateformes comme Ultralytics HUB pourraient potentiellement intégrer de telles techniques pour simplifier l'interaction avec l'utilisateur lors de la définition de tâches de vision complexes ou de l'analyse des résultats, ce qui représente un domaine de recherche et de développement de l 'IA en cours visant à améliorer la sécurité et la convivialité de l 'IA dans tous les domaines.

Tout lire