术语表

XML

了解 XML 如何通过数据注释、配置和交换为人工智能和 ML 提供动力。了解其结构、用途和实际应用!

XML(可扩展标记语言)是一种通用的、广泛使用的标记语言,用于将文档编码成人类可读和机器可读的格式。它由万维网联盟(W3C)开发,主要目的是存储和传输数据,而不是显示数据。与 HTML 等其他标记语言不同,XML 允许用户定义自己的标记,因此在创建自我描述的数据结构时非常灵活。这种可扩展性使其成为机器学习(ML)和其他数据密集型领域不同系统和平台间数据交换的基础技术。

人工智能和机器学习领域的 XML

人工智能(AI)计算机视觉(CV)领域,XML 在数据表示和配置方面发挥着至关重要的作用。其结构化的分层格式非常适合定义训练复杂模型所需的复杂注释。虽然现代应用通常偏爱更轻便的格式,但 XML 的健壮性和严格验证能力(通常通过XML 模式定义 (XSD) 等模式来执行)使其成为某些基于标准的任务不可或缺的工具。其主要用途包括数据注释、模型配置和模型交换格式(如预测模型标记语言 (PMML)),后者可实现跨不同平台的模型部署

XML 在 AI/ML 中的实际应用

XML 的结构化特性使其成为创建标准化数据集和元数据的可靠选择。两个突出的例子包括

  1. PASCAL 视觉对象类 (VOC) 数据集:这个极具影响力的对象检测数据集被广泛用于YOLOv8YOLO11 等模型的基准测试,其注释使用 XML 文件。每个 XML 文件对应一幅图像,包含图像来源、尺寸以及每个注释对象的详细信息,包括其类别标签(如 "汽车"、"人")和边界框坐标。您可以在PASCAL VOC 官方网站上找到详细信息,并在VOC 数据集文档中了解如何将其与 Ultralytics 模型一起使用。Ultralytics HUB等平台可以帮助管理此类数据集,用于训练自定义模型
  2. 医学影像元数据 (DICOM): DICOM(医学数字成像和通信)标准在医疗保健领域无处不在,用于存储和传输医学影像。DICOM 本身是一种二进制格式,而 XML 通常用于表示与这些图像相关的大量元数据,如患者信息、采集参数和诊断结果。这种结构化的元数据对医学图像分析任务至关重要,可帮助研究人员和临床医生过滤数据集、训练人工智能诊断模型,并确保人工智能医疗应用的可追溯性。

XML 与其他格式

虽然 XML 功能强大,但了解它与其他数据序列化格式的比较也很重要:

  • JSON(JavaScript 对象符号)由于 JSON 语法轻便、易于解析,在网络应用程序和应用程序接口中,JSON 已在很大程度上取代了 XML。由于 JSON 不使用结束标记,因此比 XML 更简洁。虽然 XML 非常适合结构化文档,但 JSON 通常是现代系统数据交换的首选。
  • YAML(YAML 不是标记语言)YAML 优先考虑人类的可读性,并使用缩进来表示数据结构,因此成为人工智能/ML 项目(包括Ultralytics YOLO模型配置)中配置文件的热门选择。XML 更为冗长,但其基于标签的结构对于需要严格验证的复杂嵌套数据来说更为明确。

总之,尽管 XML 并不总是最简洁的格式,但它的结构化特性、可扩展性和强大的验证功能确保了它在人工智能和 ML 的特定领域,特别是在数据注释、模型交换格式和企业数据集成方面继续发挥作用。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、合作和成长

立即加入
链接复制到剪贴板