XML

Lerne, wie XML Daten für maschinelles Lernen und Computer Vision strukturiert. Erkunde seine Rolle bei PASCAL VOC-Annotationen, medizinischer KI und dem Training von Ultralytics YOLO26.

Extensible Markup Language, meist als XML bezeichnet, ist ein flexibles, textbasiertes Format zum Speichern, Transportieren und Organisieren strukturierter Daten. Im Gegensatz zu HTML, das sich darauf konzentriert, wie Informationen auf einer Webseite dargestellt werden, widmet sich XML der Beschreibung dessen, was die Daten durch eine hierarchische Struktur aus benutzerdefinierten Tags darstellen. Diese Vielseitigkeit macht es zu einem grundlegenden Standard für den Datenaustausch in verschiedenen Computersystemen und im Internet. Im Kontext von Machine Learning (ML) spielt XML eine entscheidende Rolle bei der Verwaltung von Datensätzen und Konfigurationsdateien, wobei sichergestellt wird, dass komplexe Informationen sowohl für Menschen als auch für Maschinen lesbar bleiben, während sie gleichzeitig strikte Validierungsstandards einhalten, die vom World Wide Web Consortium (W3C) definiert wurden.

Link to this sectionDie Rolle von XML in der Künstlichen Intelligenz#

Im schnell wachsenden Bereich der Künstlichen Intelligenz (AI) dienen strukturierte Daten als Treibstoff für hochentwickelte Algorithmen. XML bietet ein robustes Framework für Datenannotation, das es Ingenieuren ermöglicht, Rohmedien – wie Bilder oder Text – mit reichhaltigen, beschreibenden Metadaten zu kapseln. Dieser strukturierte Ansatz ist für überwachtes Lernen (Supervised Learning) unerlässlich, bei dem Modelle klar gekennzeichnete Beispiele benötigen, um Muster und Merkmale zu identifizieren.

Während moderne Workflows oft die Ultralytics Platform für eine nahtlose cloudbasierte Annotation und das Training nutzen, ist XML nach wie vor tief in Altsystemen und speziellen akademischen Datensätzen verwurzelt. Seine strikte Syntax gewährleistet die Datenintegrität und macht es zur bevorzugten Wahl für die Integration in Unternehmen sowie für komplexe Computer-Vision-Aufgaben, bei denen Validierung von größter Bedeutung ist.

Link to this sectionPraxisanwendungen in AI/ML#

XML ist ein hilfreiches Werkzeug in mehreren praktischen Anwendungen, insbesondere dort, wo Datenstandardisierung, Portabilität und detaillierte Metadaten kritische Anforderungen sind.

Objekterkennungs-Datensätze (PASCAL VOC): Einer der beständigsten Einsatzzwecke von XML im Bereich Computer Vision ist das Format PASCAL Visual Object Classes (VOC). Bei diesem Standard ist jedes Bild in einem Datensatz mit einer XML-Datei verknüpft, die Annotationsdetails enthält. Diese Dateien definieren die Koordinaten der Bounding Box (xmin, ymin, xmax, ymax) sowie die Klassen-Labels für jedes Objekt. Hochmoderne Modelle wie YOLO26 können diese Annotationen (oft nach einer Konvertierung) verarbeiten, um zu lernen, wie Objekte lokalisiert werden – ein grundlegender Prozess bei der Objekterkennung.
Medizinische Bildgebung und Gesundheitswesen: Im spezialisierten Bereich der AI im Gesundheitswesen ist Interoperabilität lebenswichtig. Der Standard Digital Imaging and Communications in Medicine (DICOM), der universell für medizinische Scans verwendet wird, interagiert häufig mit XML, um komplexe Patientenmetadaten zu verarbeiten. XML ermöglicht die strukturierte Berichterstattung von Diagnoseergebnissen und Studienparametern, was eine präzise medizinische Bildanalyse erleichtert. Dies stellt sicher, dass AI-Modelle, die mit diesen Daten trainiert wurden, die strikte Einhaltung von Gesundheitsdatenstandards wie Health Level Seven (HL7) beibehalten.

Link to this sectionXML vs. JSON vs. YAML#

Obwohl XML leistungsstark ist, wird es häufig mit anderen Datenserialisierungsformaten verglichen, die in ML-Workflows verwendet werden. Die Unterschiede zu verstehen hilft dabei, das richtige Werkzeug für die jeweilige Aufgabe zu wählen.

XML vs. JSON: JavaScript Object Notation (JSON) ist im Allgemeinen leichtgewichtiger und für Webanwendungen einfacher zu parsen. Während sich JSON zum Standard für API-Antworten und viele moderne Datensätze (wie COCO) entwickelt hat, wird XML weiterhin für dokumentenzentrierte Daten und Umgebungen bevorzugt, die eine Schema-Validierung erfordern. Für einen tieferen Einblick in Web-Datenstrukturen bieten Ressourcen wie das Mozilla Developer Network exzellente Vergleiche.
XML vs. YAML: YAML ist für seine gute Lesbarkeit für Menschen und seine minimale Syntax bekannt und stützt sich eher auf Einrückungen als auf Tags. Dies macht YAML zur bevorzugten Wahl für Modell-YAML-Konfigurationsdateien in Frameworks wie Ultralytics YOLO, wo eine einfache Bearbeitung entscheidend ist. XML ist im Vergleich dazu wortreicher, bietet aber eine stärkere Durchsetzung der Struktur.

Link to this sectionXML für das Modelltraining parsen#

Wenn du mit alten Datensätzen wie denen im PASCAL VOC-Format arbeitest, musst du als Entwickler oft XML-Dateien parsen, um BBox-Koordinaten für das Training zu extrahieren. Die integrierten Bibliotheken von Python machen diesen Prozess unkompliziert.

Das folgende Beispiel demonstriert, wie man einen einfachen XML-Annotations-String parst, um Objektklassennamen und BBox-Koordinaten mithilfe der Python ElementTree API zu extrahieren.

import xml.etree.ElementTree as ET

# Example XML string simulating a PASCAL VOC annotation
voc_xml_data = """


        person

            50
            30
            200
            400



"""

# Parse the XML structure
root = ET.fromstring(voc_xml_data)

# Extract and print object details
for obj in root.findall("object"):
    class_name = obj.find("name").text
    bbox = obj.find("bndbox")
    # Convert coordinates to integers
    coords = [int(bbox.find(tag).text) for tag in ["xmin", "ymin", "xmax", "ymax"]]
    print(f"Detected Class: {class_name}, Bounding Box: {coords}")

Das Verständnis dafür, wie man diese Formate manipuliert, ist für die Vorbereitung von Trainingsdaten unerlässlich. Während automatisierte Tools auf der Ultralytics Platform diese Konvertierungen übernehmen können, bleibt das Wissen über das manuelle Parsen für das Debugging und für benutzerdefinierte Daten-Pipelines wertvoll. Für weiterführende Informationen über Datenstrukturen bietet der IBM XML Guide einen umfassenden Überblick über die Verwendung in Unternehmen.

XML

Link to this sectionDie Rolle von XML in der Künstlichen Intelligenz#

Link to this sectionPraxisanwendungen in AI/ML#

Link to this sectionXML vs. JSON vs. YAML#

Link to this sectionXML für das Modelltraining parsen#

Explore solutions

KI in der Robotik

KI in der Logistik

KI im Einzelhandel

KI im Gesundheitswesen

KI in der Fertigung

KI in der Automobilbranche

KI in der Landwirtschaft

KI in der Robotik

KI in der Logistik

KI im Einzelhandel

KI im Gesundheitswesen

KI in der Fertigung

KI in der Automobilbranche

KI in der Landwirtschaft

KI in der Robotik

KI in der Logistik

KI im Einzelhandel

KI im Gesundheitswesen

KI in der Fertigung

KI in der Automobilbranche

KI in der Landwirtschaft

Lass uns gemeinsam die Zukunft der KI bauen!