术语表

XML

了解 XML 如何通过数据注释、配置和交换为人工智能和 ML 提供动力。了解其结构、用途和实际应用!

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

XML,即可扩展标记语言,是万维网联盟(W3C)创建的一种通用标记语言,用于以人类可读和机器可读的方式对文档进行编码。HTML 的重点是如何显示数据,而 XML 不同,它的主要作用是描述、存储和传输数据,强调的是数据什么。其结构化的自描述格式使其非常适合在不同系统和应用程序(包括人工智能(AI)机器学习(ML)中使用的系统和应用程序)之间交换信息。了解 XML 有利于任何人处理不同的数据集或在 ML 管道中集成不同的工具。

了解 XML 结构

XML 使用用角括弧()括起来的标记来组织数据。< >).这些标签定义了元素,它们是代表数据结构的基本构件。元素可以包含文本数据、其他嵌套元素或组合元素,形成树状分层结构。标签还可以有属性,提供有关元素的附加元数据。例如,描述图书数据的 XML 文件可能如下所示 <book category="fiction"><title>Example Novel</title><author>Jane Doe</author></book>.这种明确的结构虽然有时比其他格式更啰嗦,但却可以根据 XSD (XML 模式定义),确保数据的一致性,这对于复杂的 数据预处理 阶段。

人工智能和 ML 的相关性

虽然JSONYAML等较新的格式因其简洁性而在某些任务中越来越受欢迎,但 XML 在人工智能和 ML 的几个关键领域仍具有重要意义:

XML 与相关格式

将 XML 与其他常见的数据序列化格式区分开来很有帮助:

  • JSON(JavaScript 对象符号):与 XML 基于标记的语法相比,JSON使用一种从 JavaScript 对象派生出来的更轻便的键值对结构。它通常不那么冗长,网络应用程序和应用程序接口也更容易解析。详情请查看官方 JSON 标准。XML 内置支持命名空间和模式,而 JSON 通常依赖外部约定进行验证。
  • YAML(YAML 不是标记语言): YAML优先考虑人类的可读性,使用缩进来表示结构,而不是标签或括号。它常用于 ML 项目的配置文件(包括 Ultralytics YOLO模型)和Kubernetes 等基础设施即代码工具中的配置文件。探索YAML 规范,了解更多信息。

XML 在 AI/ML 中的实际应用

  1. PASCAL 视觉对象类别 (VOC) 数据集:这个极具影响力的物体检测数据集被广泛用于基准测试模型,如 YOLOv8YOLO11等模型的基准。每个 XML 文件对应一幅图像,包含图像来源、尺寸以及每个注释对象的详细信息,包括其类别标签(如 "车"、"人")和边界框坐标(xmin、ymin、xmax、ymax)。您可以在PASCAL VOC 官方网站上找到详细信息,并在VOC 数据集文档中了解如何将其与Ultralytics 模型一起使用。Ultralytics HUB等平台可以帮助管理此类数据集,用于训练自定义模型
  2. 医学影像元数据 (DICOM): DICOM(医学数字成像和通信)标准在医疗保健领域无处不在,用于存储和传输医学影像。DICOM 本身是一种二进制格式,而 XML 通常用于表示与这些图像相关的大量元数据,如患者信息、采集参数和诊断结果。这种结构化元数据对于医学图像分析任务至关重要,可帮助研究人员和临床医生过滤数据集、训练人工智能诊断模型(放射学中的人工智能),并确保人工智能医疗应用的可追溯性。

总之,虽然 XML 并不总是最简洁的格式,但其结构化的特性、可扩展性和强大的验证能力确保了它在人工智能和 ML 的特定领域中继续发挥作用,特别是在数据注释标准、PMML 等模型交换格式和企业数据集成方面。熟悉 XML 对于浏览领域内的各种数据源和工具非常有价值。

阅读全部