Prompt Chaining
Apprends comment le chaînage de prompts divise les tâches d'IA complexes en flux de travail fiables. Explore comment intégrer Ultralytics YOLO26 avec des LLM pour construire des agents IA avancés.
Le chaînage de prompts est un modèle architectural avancé dans le développement de l'Intelligence Artificielle (IA) où une tâche complexe est décomposée en une séquence de sous-tâches plus petites et gérables. Dans ce flux de travail, la sortie d'une étape—souvent générée par un Grand Modèle de Langage (LLM) ou un système de vision par ordinateur—sert d'entrée pour l'étape suivante. Contrairement à un prompt monolithique unique qui tente de résoudre un problème aux multiples facettes en une seule fois, le chaînage permet aux développeurs de créer des applications plus fiables, testables et performantes. Cette approche modulaire est essentielle pour créer des Agents IA sophistiqués capables de raisonner, de naviguer sur le web ou d'interagir avec des environnements physiques.
Link to this sectionLa mécanique du chaînage#
Au fond, le chaînage de prompts répond aux limitations des fenêtres de contexte et des capacités de raisonnement des Modèles de Fondation. Lorsqu'on demande à un modèle d'effectuer trop d'opérations distinctes en une seule requête (par exemple : « Analyse cette image, extrais le texte, traduis-le en espagnol et formate-le comme une facture JSON »), la probabilité d'erreur augmente. En divisant cela en un pipeline, les développeurs peuvent vérifier la précision de chaque étape.
Les chaînes efficaces utilisent souvent du « code de liaison » écrit en Python ou géré par des bibliothèques d'orchestration comme LangChain pour gérer la transformation des données entre les étapes. Cela permet l'intégration de technologies disparates, comme la combinaison de l'acuité visuelle de la Détection d'Objets avec la fluidité linguistique des modèles de texte génératif.
Link to this sectionApplications concrètes#
Le chaînage de prompts est particulièrement puissant pour combler le fossé entre différentes modalités de données, permettant aux Modèles Multi-Modaux de fonctionner dans des environnements industriels et commerciaux dynamiques.
-
Rapports visuels automatisés : Dans la Fabrication Intelligente, un système de contrôle qualité peut enchaîner un modèle de vision avec un LLM. D'abord, un modèle à haute vitesse comme Ultralytics YOLO26 scanne des composants sur une ligne d'assemblage. La sortie structurée (par exemple : « Classe : Dented_Can, Confiance : 0.92 ») est convertie en une chaîne de texte. Ce texte est ensuite transmis à un modèle de langage avec un prompt du type « Rédige une demande de maintenance basée sur ce défaut », générant ainsi un e-mail lisible par un humain pour le responsable d'atelier.
-
Support client conscient du contexte : Les chatbots intelligents utilisent souvent le chaînage pour naviguer dans des requêtes utilisateur complexes. Le premier maillon de la chaîne pourrait utiliser le Traitement du Langage Naturel (NLP) pour classer l'intention de l'utilisateur. Si l'intention est technique, le système déclenche un flux de travail Génération Augmentée par Récupération (RAG) : il génère des embeddings pour la requête, recherche dans une base de données vectorielle la documentation, et demande enfin à un LLM de synthétiser les segments récupérés en une réponse utile.
Link to this sectionExemple de code Vision-vers-Langage#
L'exemple suivant démontre le premier « maillon » d'une chaîne : utiliser la Vision par Ordinateur (CV) pour générer des données structurées qui servent de contexte pour un prompt en aval.
from ultralytics import YOLO
# Load the YOLO26 model (natively end-to-end and highly efficient)
model = YOLO("yolo26n.pt")
# Step 1: Run inference to 'see' the environment
results = model("https://ultralytics.com/images/bus.jpg")
# Step 2: Format visual detections into a natural language string
det_names = [model.names[int(c)] for c in results[0].boxes.cls]
prompt_context = f"The scene contains: {', '.join(det_names)}. Please describe the likely activity."
# The 'prompt_context' variable is now ready to be sent to an LLM API
print(prompt_context)Link to this sectionDistinguer les concepts apparentés#
Pour mettre en œuvre des architectures d'Apprentissage Automatique (ML) efficaces, il est utile de différencier le chaînage de prompts de termes similaires dans le paysage de l'IA :
- Vs. Prompting par Chaîne de Pensée (Chain-of-Thought) : La Chaîne de Pensée (CoT) est une technique utilisée au sein d'un seul prompt pour encourager un modèle à « montrer son travail » (par exemple, « Réfléchis étape par étape »). Le chaînage de prompts implique plusieurs appels API distincts où l'entrée de l'étape B dépend de la sortie de l'étape A.
- Vs. Ingénierie de Prompt : L'ingénierie de prompt est la discipline plus large consistant à optimiser les entrées textuelles pour obtenir de meilleures performances du modèle. Le chaînage est un modèle d'ingénierie spécifique qui se concentre sur le flux séquentiel des opérations et le contrôle de la logique.
- Vs. Ajustement de Prompt (Prompt Tuning) : L'ajustement de prompt est une méthode d'Optimisation de Modèle qui met à jour les paramètres apprenables (prompts doux) pendant une phase d'entraînement. Le chaînage de prompts se produit entièrement pendant l'Inférence en Temps Réel et ne modifie pas les Poids du Modèle.
En tirant parti du chaînage de prompts, les équipes peuvent construire des applications robustes qui intègrent la logique, la récupération de données et la Reconnaissance d'Action. Pour gérer les jeux de données et entraîner les modèles de vision qui alimentent ces chaînes, la Plateforme Ultralytics offre une solution centralisée pour l'annotation, l'entraînement et le déploiement.






