Structured Outputs
Apprends comment les sorties structurées fournissent des données IA lisibles par machine. Explore l'application de schémas et les tâches de vision avec Ultralytics YOLO26 sur la plateforme Ultralytics.
Les sorties structurées désignent une méthodologie en intelligence artificielle où les réponses du modèle sont strictement tenues de respecter un format de données prédéfini, généralement un JSON Schema. Dans les grands modèles de langage (LLM) traditionnels, la génération de texte repose sur la prédiction probabiliste de jetons, ce qui aboutit souvent à un texte non structuré et libre. En utilisant des sorties structurées, tu peux garantir qu'un système d'IA renvoie des données prévisibles lisibles par machine, éliminant ainsi le besoin de scripts d'analyse fragiles et de gestion complexe des erreurs.
Link to this sectionComprendre les sorties structurées par rapport au mode JSON#
Alors que les premières itérations de l'IA générative proposaient un « mode JSON » basique, celui-ci garantissait uniquement que la sortie était un JSON valide sans assurer qu'elle contenait les clés ou types de données spécifiques demandés. Les sorties structurées résolvent ce problème grâce à une technique appelée décodage contraint. Pendant la génération, le moteur d'inférence filtre le vocabulaire du modèle à chaque étape, masquant les jetons qui violeraient le schéma fourni par le développeur. Cela garantit une conformité au schéma à 100 %.
Le concept d'appel de fonction (utilisation d'outils) est étroitement lié à cette méthodologie. Bien que l'appel de fonction permette aux modèles de déterminer quand exécuter un outil externe, il repose entièrement sur des sorties structurées pour renseigner avec précision les paramètres requis par l'outil sans hallucinations.
Link to this sectionAdoption par l'industrie et frameworks#
Entre 2024 et 2025, les principaux fournisseurs d'IA ont fait des sorties structurées une fonctionnalité native pour améliorer la fiabilité des systèmes d'entreprise. Par exemple, l'API OpenAI Structured Outputs permet aux développeurs de définir des schémas rigoureux en utilisant Pydantic en Python ou Zod en JavaScript. De même, les outils de sorties structurées de Claude d'Anthropic et les sorties structurées de Google Gemini prennent désormais en charge l'application stricte de schémas pour des prompts complexes.
Les écosystèmes open source exploitent également des frameworks comme vLLM et Outlines pour fournir des méthodologies de décodage contraint pour des modèles personnalisés construits avec PyTorch.
Link to this sectionApplications concrètes#
La mise en œuvre de sorties structurées transforme les réponses ambiguës de l'IA en données de modélisation prédictive exploitables. Les cas d'utilisation clés incluent :
- Pipelines d'extraction de données : les entreprises utilisent des sorties structurées pour extraire des entités spécifiques (comme des noms de candidats, des totaux de factures et des dates) à partir de documents bruts et non structurés, puis les intègrent directement dans des bases de données SQL sans saisie manuelle des données.
- Agents d'IA autonomes : les flux de travail agentiques s'appuient sur des données structurées pour naviguer dans des logiciels complexes. Un agent peut analyser la requête d'un utilisateur et produire une charge utile JSON stricte qui déclenche une API externe, faisant évoluer les opérations de manière sécurisée via des systèmes comme Databricks Model Serving.
Link to this sectionLes sorties structurées en vision par ordinateur#
Bien que largement discutées dans le traitement du langage naturel, les sorties structurées sont le principe de fonctionnement fondamental de la vision par ordinateur. Les modèles de vision ne produisent pas de texte libre ; ils génèrent nativement des tenseurs hautement organisés représentant des coordonnées, des classes et des scores de confiance. Par exemple, des modèles de pointe comme Ultralytics YOLO26 évaluent une image et renvoient des données spatiales strictement formatées, ce qui est idéal pour un déploiement de modèle transparent dans des environnements Edge à faible latence.
L'extrait suivant montre avec quelle facilité tu peux extraire des résultats structurés de détection d'objets en utilisant le package ultralytics :
from ultralytics import YOLO
# Load the recommended Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")
# Perform inference to generate structured visual data
results = model("image.jpg")
# The model strictly outputs structured bounding box objects
for box in results[0].boxes:
print(f"Class ID: {box.cls}, Confidence: {box.conf}, Coordinates: {box.xyxy}")En comblant le fossé entre la logique probabiliste de l'IA et les exigences logicielles déterministes, les sorties structurées constituent un composant critique pour construire des systèmes scalables et prêts pour la production sur la plateforme Ultralytics et au-delà.






