敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024
词汇表

XML

了解 XML 如何通过数据注释、配置和交换来支持 AI 和 ML。了解它的结构、用途和实际应用!

XML(可扩展标记语言)是一种通用且广泛使用的标记语言,用于以人类可读和机器可读的格式编码文档。它由 万维网联盟 (W3C) 开发,其主要目的是存储和传输数据,而不是显示数据。与 HTML 等其他标记语言不同,XML 允许用户定义自己的标签,从而使其在创建自描述数据结构方面具有高度的灵活性。这种可扩展性使其成为 机器学习 (ML) 和其他数据密集型领域中跨不同系统和平台进行数据交换的基础技术。

人工智能和机器学习中的 XML

人工智能 (AI)计算机视觉 (CV)领域,XML在数据表示和配置中起着至关重要的作用。其结构化的分层格式非常适合定义训练复杂模型所需的复杂注释。虽然现代应用程序通常更喜欢更轻量级的格式,但XML的稳健性和严格的验证能力(通常通过XML Schema Definition (XSD)等模式强制执行)使其对于某些基于标准的任务不可或缺。主要用途包括数据注释、模型配置和模型交换格式,如预测模型标记语言 (PMML),它支持跨不同平台的模型部署

XML 在 AI/ML 中的实际应用

XML 的结构化特性使其成为创建标准化数据集和元数据的可靠选择。两个突出的例子包括:

  1. PASCAL Visual Object Classes (VOC) 数据集: 这种有影响力的目标检测数据集被广泛用于对诸如 YOLOv8YOLO11 等模型进行基准测试,它使用 XML 文件进行标注。每个 XML 文件对应一个图像,并包含有关图像来源、大小以及每个带标注目标的详细信息,包括其类别标签(例如,“汽车”、“人”)和边界框坐标。您可以在官方 PASCAL VOC 网站上找到详细信息,并学习如何在 VOC 数据集文档中将它与 Ultralytics 模型一起使用。诸如 Ultralytics HUB 等平台可以帮助管理此类数据集,以用于训练自定义模型
  2. 医学影像元数据 (DICOM): DICOM(医学数字成像和通信)标准在医疗保健领域中普遍用于存储和传输医学图像。虽然 DICOM 本身是一种二进制格式,但 XML 通常用于表示与这些图像关联的广泛元数据,例如患者信息、采集参数和诊断结果。这种结构化元数据对于医学图像分析中的任务至关重要,使研究人员和临床医生能够过滤数据集、训练诊断 AI 模型,并确保AI 医疗保健应用中的可追溯性。

XML 与其他格式的比较

虽然 XML 功能强大,但了解它与其他数据序列化格式的比较方式非常重要:

  • JSON (JavaScript 对象表示法): 由于其轻量级语法和易于解析的特性,JSON 在 Web 应用程序和 API 中已在很大程度上取代了 XML。JSON 比 XML 更简洁,因为它不使用闭合标签。虽然 XML 非常适合结构化文档,但在现代系统中,JSON 通常是数据交换的首选。
  • YAML (YAML Ain't Markup Language): YAML 优先考虑人类可读性,并使用缩进来表示数据结构,使其成为 AI/ML 项目中配置文件的热门选择,包括 Ultralytics YOLO 模型配置。XML 更加冗长,但其基于标签的结构对于需要严格验证的复杂嵌套数据可能更加明确。

总而言之,虽然 XML 并不总是最简洁的格式,但其结构化特性、可扩展性和强大的验证功能确保了它在 AI 和 ML 的特定领域(尤其是在数据标注、模型交换格式和企业数据集成中)中继续发挥作用。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入
链接已复制到剪贴板