Glossaire

XML

Découvre comment XML alimente l'IA et la ML grâce à l'annotation, la configuration et l'échange de données. Apprends sa structure, ses utilisations et ses applications dans le monde réel !

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

XML, ou Extensible Markup Language, est un langage de balisage polyvalent créé par le World Wide Web Consortium (W3C) pour coder les documents de manière à ce qu'ils soient à la fois lisibles par l'homme et par la machine. Contrairement au HTML, qui se concentre sur la manière dont les données doivent être affichées, le rôle principal du XML est de décrire, de stocker et de transporter des données, en mettant l'accent sur la nature des données. Son format structuré et auto-descriptif le rend très adapté à l'échange d'informations entre différents systèmes et applications, y compris ceux utilisés dans l'intelligence artificielle (IA) et l'apprentissage automatique (ML). Comprendre XML est bénéfique pour toute personne travaillant avec divers ensembles de données ou intégrant différents outils au sein d'un pipeline ML.

Comprendre la structure XML

XML organise les données à l'aide de balises placées entre crochets (< >). Ces balises définissent les éléments, qui sont les blocs de construction fondamentaux représentant les structures de données. Les éléments peuvent contenir des données textuelles, d'autres éléments imbriqués ou une combinaison de ceux-ci, formant ainsi une structure hiérarchique arborescente. Les balises peuvent également avoir des attributs, qui fournissent des métadonnées supplémentaires sur un élément. Par exemple, un fichier XML décrivant les données d'un livre pourrait ressembler à ce qui suit <book category="fiction"><title>Example Novel</title><author>Jane Doe</author></book>. Cette structure explicite, bien que parfois plus verbeuse que d'autres formats, permet une validation rigoureuse par rapport à des schémas tels que XSD (Définition du schéma XML), assurant ainsi la cohérence des données, ce qui est crucial dans les cas complexes. prétraitement des données étapes.

Pertinence dans l'IA et la ML

Si des formats plus récents comme JSON et YAML sont de plus en plus populaires pour certaines tâches en raison de leur concision, XML reste pertinent dans plusieurs domaines clés de l'IA et de la ML :

XML vs. formats apparentés

Il est utile de distinguer XML des autres formats courants de sérialisation des données :

  • JSON (JavaScript Object Notation) : Par rapport à la syntaxe XML basée sur les balises, JSON utilise une structure plus légère de paires clé-valeur dérivée des objets JavaScript. Il est généralement moins verbeux et souvent plus facile à analyser pour les applications web et les API. Voir la norme officielle JSON pour plus de détails. Alors que le langage XML prend en charge les espaces de noms et les schémas, le langage JSON s'appuie généralement sur des conventions externes pour la validation.
  • YAML (YAML Ain't Markup Language) : YAML privilégie la lisibilité humaine, en utilisant l'indentation pour indiquer la structure au lieu des balises ou des crochets. Il est fréquemment utilisé pour les fichiers de configuration dans les projets de ML (y compris Ultralytics YOLO ) et les outils d'infrastructure en tant que code comme Kubernetes. Explore la spécification YAML pour plus d'informations.

Applications réelles de XML dans l'IA/ML

  1. Ensemble de données PASCAL sur les classes d'objets visuels (VOC) : Cet influent ensemble de données de détection d'objets, largement utilisé pour l'évaluation comparative de modèles tels que YOLOv8 et YOLO11utilise des fichiers XML pour ses annotations. Chaque fichier XML correspond à une image et contient des informations sur la source de l'image, la taille et les détails de chaque objet annoté, y compris son étiquette de classe (par exemple, "voiture", "personne") et les coordonnées de la boîte englobante (xmin, ymin, xmax, ymax). Tu peux trouver des détails sur le site officiel de PASCAL VOC et apprendre à l'utiliser avec les modèles Ultralytics dans la documentation du jeu de données VOC. Des plateformes comme Ultralytics HUB peuvent aider à gérer de tels ensembles de données pour l'entraînement de modèles personnalisés.
  2. Métadonnées d'imagerie médicale (DICOM) : La norme DICOM (Digital Imaging and Communications in Medicine) est omniprésente dans les soins de santé pour le stockage et la transmission des images médicales. Bien que DICOM soit un format binaire, XML est couramment utilisé pour représenter les nombreuses métadonnées associées à ces images, telles que les informations sur le patient, les paramètres d'acquisition et les résultats du diagnostic. Ces métadonnées structurées sont essentielles pour les tâches d'analyse des images médicales, permettant aux chercheurs et aux cliniciens de filtrer les ensembles de données, d'entraîner des modèles d'IA de diagnostic(IA en radiologie) et d'assurer la traçabilité dans les applications d'IA en matière de santé.

En résumé, bien qu'il ne soit pas toujours le format le plus concis, la nature structurée, l'extensibilité et les solides capacités de validation de XML garantissent son rôle continu dans des domaines spécifiques de l'IA et de la ML, en particulier dans les normes d'annotation des données, les formats d'échange de modèles comme PMML et l'intégration des données d'entreprise. Se familiariser avec XML est précieux pour naviguer dans diverses sources de données et outils sur le terrain.

Tout lire