xml语言基础---简单介绍讲解
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
XML 解析
一、XML 基础
1) 什么是 XML
XML 是指可扩展标记语言(eXtensible Markup Language),它也是一种标记 语言,很类似 HTML。它被设计的宗旨是存储数据,而非显示数据。
Html 展示数据 XML 标签没有被预定义,需要用户自行定义标签。 XML 技术是 W3C 组织(World Wide Web Consortium 万维网联盟)发布的,目 前遵循的是 W3C 组织于 2000 年发布的 XML1.0 规范。
XML 被广泛认为是继 Java 之后在 Internet 上最激动人心的新技术。
W3CSchool(入门级)
2) XML 常见应用
用于数据存储 用在软件配置,用于描述模块之间的关系(如果著名的 Struts、Spring 和 Hibernate 都是基于 XML 作为配置文件的--SSH)android 都是 xml。 图形界 面都是用的 xml 在一个软件系统中,通过 XML 配置文件可以提高系统的灵活性。即程序的行 为是通过 XML 文件来配置的,而不是硬编码。 XML 是一种通用的数据交换格式。(跨平台)
二、XML 语法
语法较多,建议先直接上手写案例,成功之后再回来当回顾学习用 一个 XML 文件主要包括以下几个部分: 文档声明 元素 属性 注释 实体引用及 CDATA 区 处理指令(PI:Processing Instruction) Xml 约束
1) 文档声明
在编写 XML 文档时,需要先使用文档声明来声明 XML 文档。且必须出现在文 档的第一行。(前面注释都不允许) 最简单的语法: 用 encoding 属性说明文档所使用的字符编码。保存在磁盘上的文件编码要 与声明的编码一致。 如: 用 standalone 属性说明文档是否独立,即是否依赖其他文档。 如:
2) 元素
XML 元素指 XML 文件中出现的标签。一个标签分为起始和结束标签(不能省 略)。一个标签有如下几种书写形式: 包含标签主体:
一个标签中可以嵌套若干子标签,但所有标签必须合理的嵌套,不允许 有交叉嵌套。
一个 XML 文档必须有且仅有一个根标签,其他标签都是这个根标签的子标签 或孙标签。
对于 XML 标签中出现的所有空格和换行,XML 解析程序都会当作标签内容进
行处理。例如:下面两段内容的意义是不一样的。
<网址> ww.1000phone.copm 网址> <网址>ww.1000phone.copm网址> --DOM 解析
由于在 XML 中,空格和换行都作为原始内容被处理,所以,在解析 XML 文件 时要特殊处理下,绕过这些空格和换行符。
元素命名规范:一个 XML 元素可以包含字母、数字以及其它一些可见字符, 但必须遵守下面的一些规范 区分大小写,例如,和是两个不同的标记。(与 java、c 变量命 名一致) 不能以数字或"_" (下划线)开头。 不能以 xml(或 XML、或 Xml 等)开头。(xml 为关键字,所以不能重复) 不能包含空格。 名称中间不能包含冒号(:)。 一句话:像个正常人一样去写名称就行,不用关键字
3) 属性
一个元素可以有多个属性, 每个属性都有它自己的名称和取值, 例如:
在 XML 技术中,标签属性所代表的信息也可以被改成用子元素的形式来描述
4) 注释
XML 中的注释语法为: 注意: XML 声明之前不能有注释(xml 声明必须放在文档第一行) 注释不能嵌套
5) 实体引用及 CDATA 区
实体引用 在 XML 中,一些字符拥有特殊的意义。如果你把字符 "<" 放在 XML 元素 中,会发生错误,这是因为解析器会把它当作新元素的开始。如下这样会产 生 XML 错误:
为了避免此类错误,需要把字符 "<" 替换为实体引用,就像这样:
在 XML 中有 5 个预定义的实体引用:
< > & ' < > & ' 小于 大于 和号 省略号
"
"
引号
注意:严格地讲,在 XML 中仅有字符 "<"和"&" 是非法的。省略号、引号 和大于号是合法的,但是把它们替换为实体引用是个好的习惯。
CDATA 区 术语 CDATA 指的是不应由 XML 解析器进行解析的文本数据(Unparsed Character Data)。 在 XML 元素中,"<" 和 "&" 是非法的。 "<" 会产生错误,因为解析器会把该字符解释为新元素的开始。 "&" 也会产生错误,因为解析器会把该字符解释为字符实体的开始。 某些文本, 比如 JavaScript 代码, 包含大量 "<" 或 "&" 字符。 为了避免错误, 可以将脚本代码定义为 CDATA。 CDATA 部分中的所有内容都会被解析器忽略。 CDATA 部分由 "" 结束:
6) 处理指令(了解即可)
处理指令,简称 PI(Processing Instruction)。 作用:用来指挥软件如何解析 XML 文档。 语法:必须以“”作为开头,以“?>”作为结尾。 常用处理指令: XML 声明: xml-stylesheet 指令:作用:指示 XML 文档所使用的 CSS 样式 XSLT。
7) XML 约束(了解即可)
为什么需要约束: