Glossar

XML

Entdecken Sie, wie XML KI und ML mit Datenkommentaren, Konfiguration und Austausch unterstützt. Lernen Sie die Struktur, die Verwendung und die praktischen Anwendungen kennen!

XML (Extensible Markup Language) ist eine vielseitige Auszeichnungssprache, die vom World Wide Web Consortium (W3C) entwickelt wurde, um Dokumente so zu kodieren, dass sie sowohl für Menschen als auch für Maschinen lesbar sind. Im Gegensatz zu HTML, das sich auf die Darstellung von Daten konzentriert, besteht die Hauptaufgabe von XML in der Beschreibung, Speicherung und Übertragung von Daten, wobei der Schwerpunkt auf den Daten selbst liegt. Aufgrund seines strukturierten, selbstbeschreibenden Formats eignet es sich hervorragend für den Austausch von Informationen zwischen verschiedenen Systemen und Anwendungen, einschließlich derer, die in der künstlichen Intelligenz (AI) und im maschinellen Lernen (ML) verwendet werden. XML-Kenntnisse sind für jeden von Vorteil, der mit verschiedenen Datensätzen arbeitet oder verschiedene Tools in eine ML-Pipeline integriert.

Verstehen der XML-Struktur

XML organisiert Daten mit Hilfe von Tags, die in spitzen Klammern (< >). Diese Tags definieren Elemente, die die grundlegenden Bausteine für Datenstrukturen darstellen. Elemente können Textdaten, andere verschachtelte Elemente oder eine Kombination davon enthalten und eine hierarchische, baumartige Struktur bilden. Tags können auch Attribute haben, die zusätzliche Metadaten über ein Element enthalten. Eine XML-Datei, die Buchdaten beschreibt, könnte zum Beispiel wie folgt aussehen <book category="fiction"><title>Example Novel</title><author>Jane Doe</author></book>. Diese explizite Struktur ist zwar manchmal ausführlicher als andere Formate, ermöglicht aber eine strenge Validierung anhand von Schemata wie XSD (XML-Schema-Definition), um die Datenkonsistenz zu gewährleisten, die bei komplexen Datenvorverarbeitung Stufen.

Relevanz für KI und ML

Während neuere Formate wie JSON und YAML aufgrund ihrer Prägnanz für bestimmte Aufgaben immer beliebter werden, bleibt XML in mehreren Schlüsselbereichen von KI und ML relevant:

  • Daten-Anmerkungen: XML ist ein gängiges Format für die Speicherung von Kommentaren bei Computer-Vision-Aufgaben (CV). Bei der Objekterkennung werden in XML-Dateien häufig die Klassenbezeichnung und die Koordinaten der Bounding Box für jedes Objekt in einem Bild angegeben. In ähnlicher Weise kann es für die Definition von Polygonen bei der Bildsegmentierung verwendet werden. Viele Benchmark-Datensätze stützen sich auf XML für ihre Grunddaten. Die richtige Datenerfassung und -beschriftung ist ein wichtiger Schritt beim Training genauer Modelle.
  • Modell-Konfiguration: Obwohl YAML von Ultralytics häufig für Konfigurationsdateien bevorzugt wird, wird XML manchmal von anderen Frameworks oder älteren Systemen verwendet, um Modellarchitekturen, Trainingsparameter oder Experimenteinstellungen zu definieren. Seine strukturierte Natur ermöglicht komplexe Konfigurationen.
  • Interoperabilität von Modellen: Die Predictive Model Markup Language (PMML) ist ein XML-basierter Standard zur Darstellung trainierter statistischer und Data-Mining-Modelle. PMML ermöglicht es, dass Modelle, die in einem System (z. B. mit Scikit-learn) trainiert wurden, in einem anderen System (z. B. einer Produktions-Scoring-Engine) eingesetzt werden können, ohne dass der Code neu geschrieben werden muss, was den Einsatz der Modelle erleichtert. Damit wird eine zentrale Herausforderung bei MLOps (Machine Learning Operations) angegangen.
  • Datenaustausch: XML dient als robustes Format für den Austausch strukturierter Daten zwischen verschiedenen Komponenten eines KI-Systems oder zwischen Unternehmen. Durch seine Plattformunabhängigkeit wird sichergestellt, dass Daten in verschiedenen Softwareumgebungen zuverlässig geparst werden können, was für den Aufbau skalierbarer KI-Lösungen entscheidend ist.

XML vs. verwandte Formate

Es ist hilfreich, XML von anderen gängigen Datenserialisierungsformaten zu unterscheiden:

  • JSON (JavaScript Object Notation): Im Vergleich zur Tag-basierten XML-Syntax verwendet JSON eine einfachere, von JavaScript-Objekten abgeleitete Schlüssel-Wert-Paar-Struktur. Sie ist in der Regel weniger umfangreich und für Webanwendungen und APIs oft leichter zu analysieren. Weitere Informationen finden Sie im offiziellen JSON-Standard. Während XML über integrierte Unterstützung für Namespaces und Schemata verfügt, ist JSON in der Regel auf externe Konventionen zur Validierung angewiesen.
  • YAML (YAML Ain't Markup Language): YAML stellt die Lesbarkeit in den Vordergrund und verwendet Einrückungen zur Kennzeichnung der Struktur anstelle von Tags oder Klammern. Es wird häufig für Konfigurationsdateien in ML-Projekten (einschließlich Ultralytics YOLO-Modellen ) und Infrastructure-as-Code-Tools wie Kubernetes verwendet. Weitere Informationen finden Sie in der YAML-Spezifikation.

Praktische Anwendungen von XML in AI/ML

  1. PASCAL Visual Object Classes (VOC)-Datensatz: Dieser einflussreiche Datensatz zur Objekterkennung, der häufig für das Benchmarking von Modellen wie YOLOv8 und YOLO11 verwendet wird, nutzt XML-Dateien für seine Annotationen. Jede XML-Datei entspricht einem Bild und enthält Informationen über die Bildquelle, die Größe und Details für jedes annotierte Objekt, einschließlich der Klassenbezeichnung (z. B. "Auto", "Person") und der Bounding-Box-Koordinaten (xmin, ymin, xmax, ymax). Einzelheiten finden Sie auf der offiziellen PASCAL VOC-Website, und wie Sie es mit Ultralytics-Modellen verwenden können, erfahren Sie in der Dokumentation zum VOC-Datensatz. Plattformen wie Ultralytics HUB können bei der Verwaltung solcher Datensätze für das Training benutzerdefinierter Modelle helfen.
  2. Metadaten für medizinische Bilder (DICOM): Der DICOM-Standard (Digital Imaging and Communications in Medicine) ist im Gesundheitswesen für die Speicherung und Übermittlung medizinischer Bilder allgegenwärtig. Während DICOM selbst ein binäres Format ist, wird XML üblicherweise verwendet, um die umfangreichen Metadaten zu diesen Bildern darzustellen, wie z. B. Patienteninformationen, Aufnahmeparameter und Diagnoseergebnisse. Diese strukturierten Metadaten sind für Aufgaben in der medizinischen Bildanalyse unerlässlich und ermöglichen es Forschern und Klinikern, Datensätze zu filtern, diagnostische KI-Modelle zu trainieren(KI in der Radiologie) und die Rückverfolgbarkeit in KI-Anwendungen im Gesundheitswesen sicherzustellen.

Zusammenfassend lässt sich sagen, dass XML zwar nicht immer das prägnanteste Format ist, aber aufgrund seiner strukturierten Beschaffenheit, seiner Erweiterbarkeit und seiner robusten Validierungsfunktionen auch weiterhin eine wichtige Rolle in bestimmten Bereichen der KI und des ML spielen wird, insbesondere bei Standards für Datenkommentare, Modellaustauschformaten wie PMML und der Integration von Unternehmensdaten. Die Vertrautheit mit XML ist wertvoll für die Navigation durch verschiedene Datenquellen und Tools in der Praxis.

Werden Sie Mitglied der Ultralytics-Gemeinschaft

Beteiligen Sie sich an der Zukunft der KI. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert