xml语言基础---简单介绍讲解

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

XML 解析
一、XML 基础
1) 什么是 XML

XML 是指可扩展标记语言(eXtensible Markup Language),它也是一种标记 语言,很类似 HTML。它被设计的宗旨是存储数据,而非显示数据。
  
Html 展示数据 XML 标签没有被预定义,需要用户自行定义标签。 XML 技术是 W3C 组织(World Wide Web Consortium 万维网联盟)发布的,目 前遵循的是 W3C 组织于 2000 年发布的 XML1.0 规范。

XML 被广泛认为是继 Java 之后在 Internet 上最激动人心的新技术。


W3CSchool(入门级)
2) XML 常见应用
  用于数据存储 用在软件配置,用于描述模块之间的关系(如果著名的 Struts、Spring 和 Hibernate 都是基于 XML 作为配置文件的--SSH)android 都是 xml。 图形界 面都是用的 xml  在一个软件系统中,通过 XML 配置文件可以提高系统的灵活性。即程序的行 为是通过 XML 文件来配置的,而不是硬编码。  XML 是一种通用的数据交换格式。(跨平台)
二、XML 语法
语法较多,建议先直接上手写案例,成功之后再回来当回顾学习用 一个 XML 文件主要包括以下几个部分:        文档声明 元素 属性 注释 实体引用及 CDATA 区 处理指令(PI:Processing Instruction) Xml 约束

1) 文档声明
 在编写 XML 文档时,需要先使用文档声明来声明 XML 文档。且必须出现在文 档的第一行。(前面注释都不允许) 最简单的语法:  用 encoding 属性说明文档所使用的字符编码。保存在磁盘上的文件编码要 与声明的编码一致。 如:  用 standalone 属性说明文档是否独立,即是否依赖其他文档。 如:
2) 元素
 XML 元素指 XML 文件中出现的标签。一个标签分为起始和结束标签(不能省 略)。一个标签有如下几种书写形式:    包含标签主体:some content 不含标签主体:(有时也叫空标签)
一个标签中可以嵌套若干子标签,但所有标签必须合理的嵌套,不允许 有交叉嵌套。
 

一个 XML 文档必须有且仅有一个根标签,其他标签都是这个根标签的子标签 或孙标签。

对于 XML 标签中出现的所有空格和换行,XML 解析程序都会当作标签内容进

行处理。例如:下面两段内容的意义是不一样的。
<网址> ww.1000phone.copm <网址>ww.1000phone.copm --DOM 解析

由于在 XML 中,空格和换行都作为原始内容被处理,所以,在解析 XML 文件 时要特殊处理下,绕过这些空格和换行符。

元素命名规范:一个 XML 元素可以包含字母、数字以及其它一些可见字符, 但必须遵守下面的一些规范  区分大小写,例如,是两个不同的标记。(与 java、c 变量命 名一致)      不能以数字或"_" (下划线)开头。 不能以 xml(或 XML、或 Xml 等)开头。(xml 为关键字,所以不能重复) 不能包含空格。 名称中间不能包含冒号(:)。 一句话:像个正常人一样去写名称就行,不用关键字
3) 属性
 一个元素可以有多个属性, 每个属性都有它自己的名称和取值, 例如:    属性值一定要用引号(单引号或双引号)引起来。 属性名称的命名规范与元素的命名规范相同 元素中属性没有顺序要求,但是不准重复。


在 XML 技术中,标签属性所代表的信息也可以被改成用子元素的形式来描述
4) 注释
    XML 中的注释语法为: 注意: XML 声明之前不能有注释(xml 声明必须放在文档第一行) 注释不能嵌套
5) 实体引用及 CDATA 区
实体引用  在 XML 中,一些字符拥有特殊的意义。如果你把字符 "<" 放在 XML 元素 中,会发生错误,这是因为解析器会把它当作新元素的开始。如下这样会产 生 XML 错误:
if salary < 1000 then

为了避免此类错误,需要把字符 "<" 替换为实体引用,就像这样:
if salary < 1000 then
在 XML 中有 5 个预定义的实体引用:
< > & ' < > & ' 小于 大于 和号 省略号

"
"
引号

注意:严格地讲,在 XML 中仅有字符 "<"和"&" 是非法的。省略号、引号 和大于号是合法的,但是把它们替换为实体引用是个好的习惯。
CDATA 区 术语 CDATA 指的是不应由 XML 解析器进行解析的文本数据(Unparsed Character Data)。 在 XML 元素中,"<" 和 "&" 是非法的。 "<" 会产生错误,因为解析器会把该字符解释为新元素的开始。 "&" 也会产生错误,因为解析器会把该字符解释为字符实体的开始。 某些文本, 比如 JavaScript 代码, 包含大量 "<" 或 "&" 字符。 为了避免错误, 可以将脚本代码定义为 CDATA。 CDATA 部分中的所有内容都会被解析器忽略。 CDATA 部分由 "" 结束:
6) 处理指令(了解即可)
    处理指令,简称 PI(Processing Instruction)。 作用:用来指挥软件如何解析 XML 文档。 语法:必须以“”作为结尾。 常用处理指令:   XML 声明: xml-stylesheet 指令:作用:指示 XML 文档所使用的 CSS 样式 XSLT。
7) XML 约束(了解即可)
为什么需要约束:

相关文档
最新文档