Enrichissement des messages
Maîtrisez l'IA grâce à l'enrichissement rapide ! Améliorez les résultats des modèles linguistiques à grande échelle en utilisant le contexte, des instructions claires et des exemples pour des résultats précis.
L'enrichissement des invites est le processus d'amélioration automatique ou semi-automatique de l'invite d'entrée initiale d'un utilisateur avant qu'elle ne soit traitée par un modèle d'intelligence artificielle (IA), en particulier les grands modèles de langage (LLM). L'objectif principal est d'améliorer la qualité, la pertinence et la spécificité des résultats de l'IA en ajoutant des informations contextuelles pertinentes, en clarifiant les ambiguïtés potentielles, en fixant des contraintes ou en incluant des détails spécifiques. Cette technique affine l'interaction entre les utilisateurs et les systèmes d'IA, en rendant les messages-guides plus efficaces sans que l'utilisateur ait besoin d'une expertise approfondie en matière d'ingénierie des messages-guides, ce qui améliore l'expérience globale de l'utilisateur (UX).
Applications et exemples
L'enrichissement des messages est précieux pour de nombreuses applications basées sur l'IA, car il améliore la qualité des interactions et l'exécution des tâches :
- Chatbots d'assistance à la clientèle : Un client qui demande "Quel est le statut de ma commande ?" peut voir son message enrichi de son identifiant ou de son numéro de commande récent extrait d'un système de gestion de la relation client (CRM) via une intégration API. L'invite enrichie permet au chatbot de fournir immédiatement une mise à jour spécifique, plutôt que de poser des questions complémentaires de clarification.
- Assistants virtuels pour la personnalisation: Lorsqu'un utilisateur demande à un assistant virtuel comme Google Assistant ou Alexa de "jouer de la musique", l'invite peut être enrichie en fonction de l'historique d'écoute de l'utilisateur, de ses genres préférés, de l'heure de la journée ou même de l'activité actuelle détectée par les appareils connectés, ce qui conduit à une sélection musicale plus personnalisée.
- Outils de création de contenu : Un assistant de création littéraire utilisant la génération de texte peut recevoir un message vague du type "Écrivez une histoire". L'enrichissement de l'invite pourrait ajouter des détails basés sur les interactions précédentes, tels que "Écrivez une courte histoire de science-fiction se déroulant dans un futur dystopique et mettant en scène un protagoniste rebelle", ce qui rendrait le résultat plus conforme aux intérêts probables de l'utilisateur.
- Systèmes derecherche sémantique: Lors de la recherche de documents internes à l'entreprise, une requête telle que "Trouver des rapports sur les performances du T4" peut être enrichie par le département, le rôle et les autorisations d'accès de l'utilisateur afin de récupérer les documents les plus pertinents et les plus autorisés à partir d'un vaste lac de données.
Enrichissement du message et concepts connexes
Il est essentiel de comprendre les nuances entre l'enrichissement rapide et les termes similaires :
- Ingénierie des messages-guides: Il s'agit généralement d'un processus manuel au cours duquel les humains élaborent soigneusement des messages-guides afin d'obtenir les réponses souhaitées de la part d'une IA. L'enrichissement des invites, à l'inverse, vise à automatiser ou à semi-automatiser ce processus d'amélioration, souvent à partir d'une invite initiale moins raffinée.
- Réglage de l'invite: Cette technique implique l'apprentissage d'incrustations d' invites douces par descente de gradient afin de conditionner un modèle pré-entraîné figé pour des tâches spécifiques. Elle modifie certaines parties de la représentation d'entrée du modèle plutôt que l'invite textuelle elle-même. Il s'agit d'une forme de paramétrage fin efficace (PEFT).
- Leréglage fin: Il s'agit de mettre à jour les poids d' un modèle pré-entraîné sur un ensemble de données plus petit et spécifique à une tâche. L'enrichissement des invites ne modifie pas les paramètres du modèle ; il ne fait que modifier l'invite d'entrée fournie au modèle existant.
- Génération améliorée par récupération (RAG): La RAG est une méthode spécifique souvent utilisée dans les systèmes d'enrichissement des messages. Elle consiste à récupérer des données externes pertinentes et à les ajouter au contexte de l'invite afin d'améliorer la base factuelle et de réduire les hallucinations.
Pertinence dans le domaine de la vision par ordinateur
Bien que l'enrichissement des invites soit le plus souvent associé aux LLM et à la compréhension du langage naturel (NLU), ses principes sont de plus en plus pertinents dans le domaine de la vision artificielle (CV). Les tâches traditionnelles de vision artificielle, telles que la détection d'objets standard à l'aide de modèles comme Ultralytics YOLO, s'appuient généralement sur des images plutôt que sur des messages textes complexes. Cependant, les nouveaux modèles multimodaux et les systèmes de vision guidée, tels que CLIP, YOLO-World et YOLOE, acceptent des textes ou des images pour guider des tâches telles que la détection de l'absence d'objet. Pour ces modèles, l'enrichissement d'une simple invite textuelle (par exemple, "détecter les véhicules") avec davantage de contexte (par exemple, "détecter uniquement les véhicules d'urgence tels que les ambulances et les camions de pompiers dans ce flux de caméras de circulation") pourrait améliorer de manière significative les performances et la spécificité. Des plateformes comme Ultralytics HUB pourraient potentiellement intégrer de telles techniques pour simplifier l'interaction avec l'utilisateur lors de la définition de tâches de vision complexes ou de l'analyse des résultats, ce qui représente un domaine de recherche et de développement en cours dans le domaine de l'IA visant à améliorer la sécurité et la facilité d'utilisation de l'IA dans tous les domaines.
Comment fonctionne l'enrichissement par l'exemple ?
Le processus d'enrichissement commence généralement par l'analyse de l'invite originale de l'utilisateur. Sur la base de cette analyse, le système exploite des sources d'information supplémentaires ou des règles prédéfinies pour compléter l'invite. Il peut s'agir d'accéder à l'historique des interactions de l'utilisateur, de récupérer des documents pertinents dans une base de connaissances, d'intégrer le contexte de la conversation en cours ou d'appliquer des instructions de formatage spécifiques requises par le modèle. Par exemple, une simple invite comme "Résumez les derniers développements d'Ultralytics" pourrait être enrichie pour spécifier "Résumez les caractéristiques clés et les améliorations de performance d'Ultralytics YOLOv11 par rapport à YOLOv8, en vous concentrant sur les tâches de détection d'objets ". Des techniques telles que la génération améliorée par récupération (RAG) sont couramment utilisées, où le système récupère des extraits de données pertinentes (par exemple, à partir d'Ultralytics Docs) et les incorpore dans la fenêtre contextuelle de l'invite avant de l'envoyer au LLM. Cela permet de s'assurer que le modèle dispose du contexte nécessaire pour générer une réponse complète et précise.