XML

了解 XML 如何为机器学习和计算机视觉构建数据。探索其在 PASCAL VOC 标注、医疗 AI 和训练 Ultralytics YOLO26 中的作用。

可扩展标记语言（Extensible Markup Language），通常简称为 XML，是一种灵活的文本格式，旨在存储、传输和组织结构化数据。与侧重于网页上信息显示方式的 HTML 不同，XML 致力于通过自定义标签的层次结构来描述数据所代表的含义。这种多功能性使其成为跨不同计算系统和互联网进行数据交换的基础标准。在机器学习 (ML) 的背景下，XML 在管理数据集和配置文件方面发挥着关键作用，确保复杂信息对人类和机器均可读取，同时符合由万维网联盟 (W3C) 定义的严格验证标准。

Link to this sectionXML 在人工智能中的作用#

在快速发展的人工智能 (AI) 领域中，结构化数据是复杂算法的燃料。XML 为数据标注提供了一个强大的框架，使工程师能够将原始媒体（如图像或文本）与丰富、具有描述性的元数据封装在一起。这种结构化方法对于监督学习至关重要，在这种学习方式中，模型需要清晰标注的示例来识别模式和特征。

虽然现代工作流程通常使用 Ultralytics Platform 来进行无缝的云端标注和训练，但 XML 仍然深入嵌入在遗留系统和特定的学术数据集中。其严格的语法确保了数据完整性，使其成为企业集成和复杂计算机视觉任务的首选，在这些任务中验证至关重要。

Link to this sectionAI/ML 中的实际应用#

XML 在多个实际应用中发挥着重要作用，特别是在数据标准化、可移植性和详细元数据作为关键需求的情况下。

目标检测数据集 (PASCAL VOC)： XML 在计算机视觉中最持久的用途之一是 PASCAL Visual Object Classes (VOC) 格式。在此标准中，数据集中的每张图像都配有一个包含标注细节的 XML 文件。这些文件定义了每个对象的 bounding box 坐标（xmin、ymin、xmax、ymax）和类别标签。像 YOLO26 这样最先进的模型可以处理这些标注（通常在转换后），从而学习如何定位对象，这是 object detection 中的一个基本过程。
医学影像与医疗保健： 在医疗保健 AI 这一专业领域，互操作性至关重要。医学数字成像和通信 (DICOM) 标准广泛用于医学扫描，经常与 XML 交互以处理复杂的患者元数据。XML 允许对诊断结果和研究参数进行结构化报告，从而促进精确的医学图像分析。这确保了在此类数据上训练的 AI 模型严格遵守健康级别 7 (HL7) 等健康数据标准。

Link to this sectionXML 与 JSON 与 YAML#

虽然 XML 功能强大，但它经常被拿来与其他 ML 工作流程中使用的序列化格式进行比较。理解其中的差异有助于为工作选择合适的工具。

XML 与 JSON： JavaScript 对象表示法 (JSON) 通常更轻量级，并且更容易为 Web 应用程序解析。虽然 JSON 已成为 API 响应和许多现代数据集（如 COCO）的标准，但 XML 在以文档为中心的数据和需要模式验证的环境中仍然受到青睐。若要深入了解 Web 数据结构，Mozilla 开发人员网络等资源提供了出色的比较。
XML 与 YAML： YAML 以其人类可读性和极简语法而闻名，依赖缩进而非标签。这使得 YAML 成为 Ultralytics YOLO 等框架中模型 YAML 配置文件的首选，其中易于编辑至关重要。相比之下，XML 更冗长，但提供了更强的结构强制执行能力。

Link to this section为模型训练解析 XML#

在使用 PASCAL VOC 格式等遗留数据集工作时，开发人员通常需要解析 XML 文件以提取用于训练的边界框坐标。Python 的内置库使这一过程变得简单明了。

以下示例演示了如何使用 Python ElementTree API 解析简单的 XML 标注字符串，以提取对象类名和边界框坐标。

import xml.etree.ElementTree as ET

# Example XML string simulating a PASCAL VOC annotation
voc_xml_data = """


        person

            50
            30
            200
            400



"""

# Parse the XML structure
root = ET.fromstring(voc_xml_data)

# Extract and print object details
for obj in root.findall("object"):
    class_name = obj.find("name").text
    bbox = obj.find("bndbox")
    # Convert coordinates to integers
    coords = [int(bbox.find(tag).text) for tag in ["xmin", "ymin", "xmax", "ymax"]]
    print(f"Detected Class: {class_name}, Bounding Box: {coords}")

了解如何操作这些格式对于准备训练数据至关重要。虽然 Ultralytics Platform 上的自动化工具可以处理这些转换，但手动解析知识对于调试和自定义数据管道仍然很有价值。有关数据结构的进一步阅读，IBM XML 指南提供了企业用途的全面概述。

Explore solutions

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

XML

Link to this sectionXML 在人工智能中的作用#

Link to this sectionAI/ML 中的实际应用#

Link to this sectionXML 与 JSON 与 YAML#

Link to this section为模型训练解析 XML#

Explore solutions

机器人技术中的 AI

物流中的 AI

零售业 AI

医疗保健中的 AI

制造业中的 AI

汽车中的 AI

农业中的 AI

机器人技术中的 AI

物流中的 AI

零售业 AI

医疗保健中的 AI

制造业中的 AI

汽车中的 AI

农业中的 AI

机器人技术中的 AI

物流中的 AI

零售业 AI

医疗保健中的 AI

制造业中的 AI

汽车中的 AI

农业中的 AI

让我们一起构建 AI 的未来！