YAML

Apprends comment YAML rationalise les flux de travail IA. Découvre comment utiliser les fichiers YAML pour configurer les datasets et entraîner des modèles Ultralytics YOLO26 pour des MLOps plus rapides et plus faciles.

YAML (YAML Ain't Markup Language) est un standard de sérialisation de données lisible par l'humain, largement utilisé dans l'industrie logicielle pour rédiger des fichiers de configuration. Contrairement aux langages de balisage plus complexes, YAML privilégie un formatage épuré et une bonne lisibilité, ce qui en fait un excellent choix pour les développeurs et les data scientists ayant besoin d'inspecter ou de modifier rapidement des paramètres. Sa structure simple repose sur l'indentation plutôt que sur des crochets ou des balises, permettant aux utilisateurs de définir des structures de données hiérarchiques telles que des listes et des dictionnaires avec un minimum d'encombrement visuel. Dans le contexte de l'intelligence artificielle et du machine learning, YAML sert de pont essentiel entre l'intention humaine et l'exécution machine, stockant tout, des chemins de jeux de données aux paramètres de hyperparameter tuning, dans un format facile à versionner et à partager.

Link to this sectionPertinence dans le Machine Learning#

Dans les machine learning operations (MLOps) modernes, il est essentiel de maintenir des expériences reproductibles et organisées. Les fichiers YAML fonctionnent comme des plans pour ces expériences, encapsulant tous les détails de configuration nécessaires dans un seul document. Des frameworks comme les modèles Ultralytics YOLO26 s'appuient fortement sur ces fichiers de configuration pour définir les architectures de modèles et les protocoles d'entraînement.

Lorsque tu entraînes un modèle de vision par ordinateur, tu dois souvent spécifier où se trouvent tes training data, combien de classes tu détectes, et les noms de ces classes. Au lieu de coder ces valeurs en dur dans des scripts Python, ce qui peut mener à des bases de code confuses, tu sépares ces données dans un fichier YAML. Cette séparation des préoccupations permet aux chercheurs d'échanger des jeux de données ou d'ajuster les learning rates sans toucher à la base de code principale, facilitant ainsi un meilleur experiment tracking et une meilleure collaboration.

Link to this sectionYAML vs. JSON vs. XML#

Bien que YAML soit souvent comparé au JSON (JavaScript Object Notation) et au XML (eXtensible Markup Language), ils servent des objectifs légèrement différents dans l'écosystème IA.

YAML : Idéal pour les fichiers de configuration écrits et lus par les humains. Il prend en charge les commentaires, qui sont cruciaux pour documenter pourquoi certains model weights ou paramètres ont été choisis.
JSON : Idéal pour la communication machine-à-machine, comme les REST API ou pour enregistrer des inference results. Il est plus strict et plus difficile à modifier manuellement pour les humains en raison des guillemets et accolades nécessaires, et il ne prend pas en charge les commentaires.
XML : Un format plus verbeux souvent utilisé dans les systèmes hérités ou le stockage de documents complexes (comme les Pascal VOC annotations). Il est généralement considéré comme trop lourd pour des tâches de configuration simples dans les workflows de deep learning modernes.

Link to this sectionApplications concrètes en IA#

YAML trouve sa place dans plusieurs étapes critiques du cycle de développement IA :

Configuration de jeu de données : Lorsque tu travailles avec des jeux de données d'object detection comme COCO ou des données personnalisées sur l'Ultralytics Platform, un fichier YAML (data.yaml) définit généralement les chemins de répertoires pour les ensembles d'entraînement, de validation et de test. Il mappe également les indices de classe (0, 1, 2) aux noms de classe (person, bicycle, car), garantissant que le modèle comprend la structure des données.
Pipelines CI/CD : Dans les workflows de continuous integration, des outils comme GitHub Actions utilisent YAML pour définir les étapes d'automatisation. Cela peut inclure l'exécution de tests unitaires sur une nouvelle architecture de réseau neuronal ou le déploiement d'un modèle dans un Docker container chaque fois que du code est poussé vers un dépôt.

Link to this sectionExemple : Configuration d'une exécution d'entraînement YOLO#

L'exemple suivant démontre comment un fichier YAML typique agit comme une interface de jeu de données pour entraîner un modèle YOLO26. L'extrait Python ci-dessous montre comment la bibliothèque Ultralytics utilise ce fichier pour démarrer le processus d'entraînement.

1. Le fichier coco8.yaml (Concept) : Ce fichier contiendrait les chemins vers les images et une liste de noms de classes.

path: ../datasets/coco8  # dataset root dir
train: images/train  # train images (relative to 'path')
val: images/val  # val images (relative to 'path')

# Classes
names:
  0: person
  1: bicycle
  2: car
  ...

2. Utilisation en Python : Le code lit la configuration et lance l'entraînement en utilisant les paramètres spécifiés.

from ultralytics import YOLO

# Load the YOLO26 model (recommended for new projects)
model = YOLO("yolo26n.pt")

# Train the model using the dataset configuration defined in the YAML file
# The 'data' argument points directly to the YAML file
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)

Link to this sectionConcepts clés de la syntaxe#

Comprendre quelques règles de syntaxe clés permet d'éviter les erreurs courantes, telles que ScannerError ou ParserError, qui surviennent souvent à cause d'une indentation incorrecte.

Indentation : YAML utilise des espaces (des espaces, pas des tabulations) pour indiquer la structure. Les éléments imbriqués doivent être indentés davantage que leurs éléments parents.
Paires clé-valeur : Les données sont stockées sous la forme key: value. Par exemple, epochs: 100 définit le nombre de cycles d'entraînement.
Listes : Les séquences sont indiquées par un tiret -. C'est utile pour définir des listes d'étapes de data augmentation ou plusieurs sources d'entrée.
Commentaires : Les lignes commençant par # sont ignorées par le parser, te permettant de laisser des notes sur des hyperparameters spécifiques directement dans le fichier.

En maîtrisant YAML, les praticiens peuvent rationaliser leurs workflows de model training, réduire les erreurs de configuration et garantir que leurs projets IA restent évolutifs et faciles à maintenir.

Explore solutions

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

YAML

Link to this sectionPertinence dans le Machine Learning#

Link to this sectionYAML vs. JSON vs. XML#

Link to this sectionApplications concrètes en IA#

Link to this sectionExemple : Configuration d'une exécution d'entraînement YOLO#

Link to this sectionConcepts clés de la syntaxe#

Explore solutions

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

Construisons ensemble le futur de l'IA !