XML

eXtensible Markup Language 可扩展标记语言

数字世界的基石(标签定义结构、属性补充细节),是一种用于标记电子文件使其具有结构性的标记语言,由 W3C 开发和维护。

主要设计目的是用于数据的存储、传输和交换,强调数据的结构和内容。它允许用户根据实际需求自定义标签(标签可扩展),以准确描述数据的含义和结构,使得不同系统之间能够方便地进行数据交互。区别于 HTML,常被用于描述服务接口和数据传输格式。

1. 基本特性

2. 语法规则

XML 文档是一个严格的树形结构,其语法约束比 HTML 更加严格。

  1. 标签必须成对出现或自闭合 <tag></tag><tag />

  2. 严格区分大小写 <Node><node> 是不同标签

  3. 标签必须正确嵌套,不允许交叉嵌套

  4. 属性值必须加上引号 attr="value"

  5. 有且仅有一个根元素

  6. 特殊字符转义 例如:<&lt;&&amp;

  7. 命名空间声明,当存在多套标签体系时,通过 xmlns 声明命名空间,并使用 URI 进行唯一标识

XML
<root>
</root>

XML Schema 验证

仅有“语法正确”的 XML 并不足以保证“语义正确”,因此引入了模式验证机制

常见 Schema 形式包括:

Schema 的作用本质上是:

将“自由文本结构”约束为“可验证的数据模型”

这在工程系统、接口设计、机器人描述文件中极其重要。

现代技术的应用

web 服务通信

早期 Web Service(如 SOAP)大量基于 XML 构建:

尽管现代 REST 更偏向 JSON,但 XML 在金融、电信、政务系统中仍被广泛使用。

系统配置管理

XML 广泛用于配置文件,例如:

其优势在于:

文档格式

大量文档标准基于 XML:XML 在此类场景中承担“语义骨架”的角色。

移动应用与嵌入式系统

在资源受限或对稳定性要求极高的系统中,XML 仍被使用于:

尽管 JSON 更轻量,但 XML 在“可验证性”和“结构严谨性”方面仍具有优势。