Glossaire

Enchaînement de prompts

Découvrez l'enchaînement de prompts : une technique d'IA étape par étape qui améliore la précision, le contrôle et la justesse pour les tâches complexes avec les grands modèles linguistiques.

Le chaînage d'invites est une technique sophistiquée utilisée pour exécuter des flux de travail complexes en les décomposant en une séquence d'entrées interconnectées destinées à être utilisées par les utilisateurs. d'entrées interconnectées pour les modèles d'intelligence artificielle (IA). modèles d'intelligence artificielle (IA). Au lieu de s'appuyer sur une instruction unique et monolithique pour exécuter une tâche à multiples facettes, cette méthode structure le processus de telle sorte que la sortie d'une étape serve d'entrée pour les modèles d'intelligence artificielle. de sorte que les résultats d'une étape servent d'entrée à l'étape suivante. Cette approche modulaire améliore considérablement la fiabilité et l'interprétabilité des des grands modèles de langage (LLM), ce qui permet aux de construire des applications robustes capables de raisonner, de planifier et d'exécuter des opérations en plusieurs étapes. des opérations en plusieurs étapes.

Comment fonctionne l’enchaînement d’invites

Le principe de base de l'enchaînement des tâches est le suivant décomposition des tâches, où un objectif objectif compliqué est divisé en sous-tâches gérables. Chaque maillon de la chaîne se concentre sur une fonction spécifique, telle que le nettoyage des données, l'extraction d'informations ou la prise de décision. comme le nettoyage des données, l'extraction d'informations ou la prise de décision, avant de transmettre les résultats à d'autres. avant de transmettre les résultats. Ce processus itératif permet une validation intermédiaire, garantissant que les erreurs sont détectées rapidement plutôt que de se propager. que les erreurs soient détectées rapidement plutôt que de se propager à travers une réponse complexe.

Cette méthodologie est fondamentale pour créer agents d'IA qui peuvent interagir avec des outils ou des API externes. Des cadres spécialisés tels que LangChain sont apparus pour faciliter cette orchestration, en gérant le flux de données entre le modèle d'IA, le ont émergé pour faciliter cette orchestration, en gérant le flux de données entre le modèle d'IA, les bases de données vectorielles et d'autres composants logiciels, les bases de données vectorielles et d'autres composants logiciels. En En maintenant l'état à travers ces interactions, le chaînage rapide permet la création de systèmes dynamiques qui peuvent s'adapter aux entrées de l'utilisateur et à l'évolution des données. aux entrées de l'utilisateur et à l'évolution des données.

Applications concrètes

L'enchaînement des invites est particulièrement efficace lorsqu'il s'agit de combiner traitement du langage naturel (NLP) avec d'autres modalités ou sources de données spécialisées.

Service client intelligent: Un système d'assistance peut utiliser une classification de texte pour classer la demande d'un utilisateur. Si le problème est identifié comme étant "technique", le flux de travail déclenche un processus de récupération et de génération améliorée (RAG). génération améliorée de recherche (RAG) (Génération assistée par récupération). Le système recherche des articles pertinents dans une base de connaissances techniques. LLM de synthétiser les informations récupérées en une réponse conviviale.
Contrôle de la qualité visuelle: Dans le domaine de la fabrication, un flux de travail peut enchaîner des textes et des images. fabrication, un flux de travail peut enchaîner texte et modèles de vision. Un utilisateur peut fournir une description textuelle d'un défaut (par exemple, "rayure sur la surface"). Cette Cette description est analysée pour configurer un modèle de vision par ordinateur (CV) tel que Ultralytics YOLO11. Le modèle de vision effectue détection d'objets sur le flux de la ligne d'assemblage, et les résultats de la détection sont réinjectés dans une invite finale afin de générer une d'inspection de la qualité automatisé.

Exemple de code

Les suivants Python suivant montre un simple maillon de chaîne. Il utilise les résultats d'un modèle de détection d'objets d'un modèle de détection d'objets YOLO11 pour construire une invite en langage naturel pour une étape suivante hypothétique.

from ultralytics import YOLO

# Load the YOLO11 model for object detection
model = YOLO("yolo11n.pt")

# Step 1: Run inference on an image
# The output contains detected objects which will fuel the next link in the chain
results = model("https://ultralytics.com/images/bus.jpg")

# Step 2: Process results to create input for the next link
# We extract class names to form a descriptive sentence
detected_objects = [model.names[int(c)] for c in results[0].boxes.cls]
next_prompt = f"I found these objects: {', '.join(detected_objects)}. Describe the scene."

# The 'next_prompt' variable is now ready to be sent to an LLM
print(next_prompt)

Chaînage d'invites : comparaison avec les concepts connexes

Il est utile de distinguer l'enchaînement d'invites d'autres termes dans le paysage de l'apprentissage automatique. dans le domaine de l'apprentissage automatique:

Prompt Engineering: Il s'agit d'une discipline plus large qui consiste à concevoir des entrées optimales pour guider le comportement du modèle. Le chaînage d'invites est un modèle architectural d'architecture spécifique de l' ingénierie des invites qui se concentre sur l'exécution séquentielle.
L'incitation à la chaîne de pensée: Cette technique encourage un modèle à raisonner "étape par étape" au sein d'un cycle unique d'incitation-réponse. réponse. En revanche, l'enchaînement d'invites implique plusieurs appels distincts, qui transmettent souvent des données entre différents modèles ou outils logiciels. modèles ou outils logiciels.
Prompt Tuning: A méthode d'optimisation de modèle qui met à jour les "invites douces" (paramètres pouvant être appris) pendant la formation. L'enchaînement des invites est une stratégie de temps d'inférence qui utilise des standard en langage naturel sans modifier les poids du modèle. du modèle.

En tirant parti de l'enchaînement d'invites, les développeurs peuvent surmonter les limites du contexte et les goulets d'étranglement du raisonnement des modèles autonomes. autonomes. Cette technique est indispensable pour construire des modèles d IA agentique qui intègrent la vision, le langage et la logique pour résoudre des problèmes complexes et dynamiques dans les domaines de la robotique et de l'automatisation. robotique et de l'automatisation.

Enchaînement de prompts

Former les modèlesYOLO d'Ultralytics pour rationaliser les flux de travail dans tous les secteurs d'activité

Solution de licence d'entreprise flexible pour dynamiser votre innovation

Former des modèles d'IA en quelques secondes avec Ultralytics YOLO

Comment fonctionne l’enchaînement d’invites

Applications concrètes

Exemple de code

Chaînage d'invites : comparaison avec les concepts connexes

En savoir plus dans cette catégorie

Tendances futures en matière de détection d'objets : 7 éléments clés à surveiller

Améliorer la réidentification des véhicules avec les modèlesYOLO 'Ultralytics

Améliorer la prédiction des collisions avec les modèles Ultralytics YOLO

Rejoindre la communauté Ultralytics