Maîtrise l'IA grâce à l'enrichissement rapide ! Améliore les sorties des grands modèles linguistiques en utilisant le contexte, des instructions claires et des exemples pour obtenir des résultats précis.
L'enrichissement des invites est le processus d'amélioration automatique ou semi-automatique de l'invite d'entrée initiale d'un utilisateur avant qu'elle ne soit traitée par un modèle d'intelligence artificielle (IA), en particulier les grands modèles de langage (LLM). L'objectif principal est d'améliorer la qualité, la pertinence et la spécificité des résultats de l'IA en ajoutant des informations contextuelles pertinentes, en clarifiant les ambiguïtés potentielles, en fixant des contraintes ou en incluant des détails spécifiques. Cette technique affine l'interaction entre les utilisateurs et les systèmes d'IA, en rendant les messages-guides plus efficaces sans que l'utilisateur ait besoin d'une expertise approfondie en matière d'ingénierie des messages-guides, ce qui améliore l'expérience globale de l'utilisateur (UX).
Le processus d'enrichissement commence généralement par l'analyse de l'invite originale de l'utilisateur. Sur la base de cette analyse, le système exploite des sources d'informations supplémentaires ou des règles prédéfinies pour enrichir l'invite. Il peut s'agir d'accéder à l'historique des interactions de l'utilisateur, de récupérer des documents pertinents dans une base de connaissances, d'intégrer le contexte de la conversation en cours ou d'appliquer des instructions de formatage spécifiques requises par le modèle. Par exemple, une simple invite comme "Résume les derniers développements d'Ultralytics " pourrait être enrichie pour spécifier "Résume les principales caractéristiques et les améliorations de performance d'Ultralytics YOLOv11 par rapport à YOLOv8en se concentrant sur les tâches de détection d'objets." Des techniques telles que la génération améliorée par récupération (RAG) sont couramment utilisées : le système récupère des bribes de données pertinentes (par exemple, dans Ultralytics Docs) et les incorpore dans la fenêtre contextuelle de l'invite avant de l'envoyer au LLM. Cela permet de s'assurer que le modèle dispose du contexte nécessaire pour générer une réponse complète et précise.
L'enrichissement des messages rapides est précieux dans de nombreuses applications pilotées par l'IA, car il améliore la qualité des interactions et l'exécution des tâches :
Il est crucial de comprendre les nuances entre l'enrichissement rapide et les termes similaires :
Bien que l'enrichissement de l'invite soit le plus souvent associé aux LLM et à la compréhension du langage naturel (NLU), ses principes deviennent pertinents dans le domaine de la vision par ordinateur (CV). Les tâches traditionnelles de CV comme la détection d'objets standard à l'aide de modèles tels que Ultralytics YOLO s'appuient généralement sur des images plutôt que sur des textes complexes. Cependant, les nouveaux modèles multimodaux et les systèmes de vision guidée, tels que CLIP, YOLO et YOLOE, acceptent des textes ou des images pour guider des tâches telles que la détection d'un zéro pointé. Pour ces modèles, l'enrichissement d'une simple invite textuelle (par exemple, "détecter les véhicules") avec plus de contexte (par exemple, "détecter uniquement les véhicules d'urgence comme les ambulances et les camions de pompiers dans ce flux de caméras de circulation") pourrait améliorer de manière significative les performances et la spécificité. Des plateformes comme Ultralytics HUB pourraient potentiellement intégrer de telles techniques pour simplifier l'interaction avec l'utilisateur lors de la définition de tâches de vision complexes ou de l'analyse des résultats, ce qui représente un domaine de recherche et de développement de l 'IA en cours visant à améliorer la sécurité et la convivialité de l 'IA dans tous les domaines.