Context Engineering
Découvre comment le « context engineering » structure les charges utiles de données pour l'IA. Apprends des stratégies clés pour optimiser les LLM et les workflows de vision avec Ultralytics YOLO26.
L'ingénierie du contexte est l'art et la science de la conservation, de la gestion et de la structuration des informations fournies aux modèles d'intelligence artificielle pendant l'inférence. Alors que le Prompt Engineering se concentre principalement sur la rédaction d'instructions efficaces, l'ingénierie du contexte va plus loin en optimisant systématiquement la charge utile de jetons — tels que les données en temps réel, les connaissances externes et les retours d'outils — qui remplit la fenêtre de contexte d'un modèle. L'objectif est de s'assurer qu'un modèle de langage large (LLM) ou un modèle vision-langage (VLM) reçoit l'arrière-plan précis dont il a besoin pour raisonner avec précision sans subir de surcharge d'informations.
Comme souligné dans une étude complète récente sur l'ingénierie du contexte pour les LLM, la discipline implique la formalisation de la récupération, du traitement et de la gestion des informations. Elle agit essentiellement comme le pipeline de mémoire et d'intelligence pour les applications IA modernes.
Link to this sectionRaffinement du contexte métier de l'IA#
Pour les entreprises, les modèles d'IA généraux sont souvent limités par leur isolement vis-à-vis des données propriétaires. L'ingénierie du contexte facilite le raffinement du contexte métier de l'IA, ce qui signifie que les sorties d'un modèle sont spécifiquement ajustées aux flux de travail et aux flux de données en direct d'une organisation. En intégrant la génération augmentée par récupération (RAG), les entreprises peuvent intégrer de manière transparente le contexte du contexte — depuis les wikis internes, les systèmes de gestion de la relation client ou les API en temps réel — directement dans le pipeline de traitement du modèle.
L'une des percées les plus significatives dans ce domaine est le Model Context Protocol (MCP), une norme ouverte récemment introduite par Anthropic et hébergée par la Linux Foundation. Le MCP résout le problème massif de l'intégration des données en fournissant un connecteur universel pour les assistants IA, permettant aux développeurs de standardiser la manière dont ils injectent des connaissances organisationnelles contextuelles dans leurs flux de travail agentiques sans construire de pipelines personnalisés pour chaque nouvelle source de données.
Link to this sectionStratégies : mémoire contextuelle des rôles et optimisation#
Une ingénierie du contexte efficace repose sur une gestion stratégique de la mémoire pour empêcher le modèle d'oublier des instructions cruciales ou d'halluciner. En utilisant correctement ces techniques, tu peux passer de requêtes ponctuelles dans un chat à des systèmes autonomes hautement fiables capables d'exécuter des flux de travail d'entreprise en plusieurs étapes :
- Write Context : Injecter des données spécifiques à haute valeur ajoutée directement dans l'invite système pour guider le comportement immédiat.
- Select Context : Récupérer dynamiquement uniquement les extraits les plus pertinents à partir d'une base de données vectorielle pour fournir des connaissances organisationnelles en temps réel.
- Compress Context : Résumer des documents longs pour qu'ils tiennent dans les limites de mémoire des modèles à grande capacité comme GPT-4o ou Google Gemini.
- Isolate Context : Partitionner les tâches entre plusieurs sous-agents afin que chacun ne reçoive que l'arrière-plan nécessaire à son rôle spécifique, ce qui est souvent appelé gestion de la mémoire contextuelle des rôles.
Link to this sectionApplications réelles de l'IA#
L'ingénierie du contexte transforme activement les solutions d'IA basées sur le texte et sur la vision dans de multiples secteurs :
- Enterprise Multi-Tool Agents : Un assistant interne d'entreprise utilise l'ingénierie du contexte pour soutenir les équipes de vente. Au lieu qu'un utilisateur fasse des allers-retours avec des informations, l'IA récupère de manière sécurisée les données client en temps réel depuis un CRM via MCP. Elle résume ensuite les communications récentes et rédige un e-mail de suivi ciblé, rationalisant ainsi considérablement les opérations quotidiennes.
- Context-Aware Medical Imaging : Dans le domaine de la santé, les données visuelles seules sont rarement suffisantes. Un pipeline de computer vision peut utiliser Ultralytics YOLO26 pour détecter des anomalies dans des radiographies. L'ingénierie du contexte combine ces boîtes englobantes visuelles avec les dossiers médicaux électroniques du patient (âge, antécédents, médicaments actuels) avant de transmettre la charge utile unifiée à un modèle d'apprentissage profond pour un raisonnement diagnostique complet.
Link to this sectionIngénierie du contexte en computer vision#
Bien qu'elle soit souvent associée aux modèles de langage, l'ingénierie du contexte devient essentielle pour déployer des systèmes de détection d'objets robustes. Lors de l'intégration de modèles comme YOLO26 construits avec PyTorch ou TensorFlow, tu peux utiliser le contexte pour enrichir tes prédictions pour les analyses en aval.
L'exemple Python suivant montre comment extraire une inférence de predict en utilisant le package ultralytics et la formater avec des métadonnées externes pour créer une charge utile de contexte enrichie :
import json
from ultralytics import YOLO
# Load the recommended YOLO26 model
model = YOLO("yolo26n.pt")
# Execute inference on an image
results = model("patient_scan.jpg")
# Extract human-readable class names from the detected bounding boxes
detected_objects = [model.names[int(box.cls[0])] for box in results[0].boxes]
# Apply context engineering: merge visual AI outputs with external metadata
enriched_context = {
"patient_id": "PX-8923",
"clinical_history": "Chronic cough, non-smoker",
"yolo_visual_findings": detected_objects,
"scan_timestamp": "2026-06-25T09:03:00Z",
}
# Output the structured context, ready to be ingested by an MCP server or LLM
print(json.dumps(enriched_context, indent=4))Pour construire, annoter et gérer facilement des jeux de données pour ces pipelines de vision complexes, les équipes peuvent tirer parti de l'Ultralytics Platform. Pour les organisations déployant ces solutions commercialement dans des environnements privés, une Enterprise license garantit une intégration sécurisée et conforme d'architectures avancées d'ingénierie du contexte.






