第2章 格式良好的XML文档
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第32页
2.7.2 在标记中声明命名空间
命名空间是通过在标记中声明来建立的, 命名空间的声明必须放在开始标记里,而 且必须放在开始标记中标记名称的后面。
XML基础教程
第2章 格式良好的XML文档
第33页
2.7.3 命名空间的作用域
命名空间的作用域就是该命名空间的作用 范围。一个标记中如果使用了命名空间, 那么该命名空间的作用域是该标记及其所 有的子孙标记,除非其子孙标记又声明了 命名空间。
XML基础教程 第2章 格式良好的XML文档
第10页
2.3 XML声明
XML文档的第一行通常是XML声明,声明 以“<?xml”开始,以“?>”结束。声明 中包含了XML文档的相关信息。上面文档 的第一行就是XML声明: <?xml version ="1.0" encoding ="GB2312" standalone="yes" ?>
XML基础教程 第2章 格式良好的XML文档
第29页
如果文本内容中包含大量的“>”、“<” 、“&”、“‘”及“””等特殊符号,需要 花费很大的力气进行转换,转换后的文本 数据中就会出现很多实体引用,导致文本 的可读性变差,怎样解决这个问题呢?在 XML中,可以把这样的文本包含到CDATA (Character Data)段中,包含在CDATA 段中的文本不会被XML解析器解析,直接 提供给应用程序。
XML基础教程
第2章 格式良好的XML文档
第20页
名字中不能包含空格。 名字中不能出现XML保留的标识符,如 “<”“/”“>”等。 名字中尽可能不要使用冒号“:”,因为冒 号是为“名字空间”(namespaces)预 留的。 尽量避免在名字中使用中划线“-” 和 点 号“.”,因为有的软件不能正确识别。
第26页
2.5.5 元素的属性
XML中的属性也是由用户自己定义的,属 性可以为XML元素提供更多的信息。
XML基础教程
第2章 格式良好的XML文档
第27页
定义属性时应注意以下几点: 属性的命名规则同元素命名。 属性值必须用引号括起来。 属性只能包含在开始标记中。 特定的属性名称在同一个元素中只能出现 一次。
XML基础教程
第2章 格式良好的XML文档
第28页
2.6 实体引用和CDATA段
XML有5种字符属于特殊字符,包括:左尖 括号 “<”、右尖括号 “>”、与符号 “&” 、单引号“ ' ”和双引号“ " ”。对 于这些特殊字符,XML有特殊用途。所以 按W3C制定的规范,文本数据中不可以含 有这些特殊字符。 要想在文本数据中使用这些特殊字符,可 以通过实体引用的方法。
XML基础教程 第2章 格式良好的XML文档
第17页
2.5 XML元素的基本规则
元素是XML文档的基本单元,XML文档就 是由一对对嵌套的元素所组成。整个XML 文档从根元素开始,根元素包含若干子元 素,而每个子元素又可以包含若干子元素 ,从而组织成庞大的XML文档。
XML基础教程
第2章 格式良好的XML文档
XML文档由两部份组成:即文档序言和文 档元素(或文档节点)。序言出现在XML 文档的顶部,其中包含关于该文档的一些 信息,类似于HTML文档的<head>部分。 序言部分必须包含一个XML声明,还可以 包含注释、处理指令或者DTD。格式良好 的XML文档必须有一个文档元素,用来包 含可能有的其它内容,文档根元素可以包 含多个嵌套的子元素。
第2章 格式良好的XML文档
XML基础教程
第25页
元素之间的嵌套规则总结如下: 父元素的起始标记必须在子元素的起始标 记之前,父元素的结束标记必须在子元素 的结束标记之后。元素间不可交叉嵌套。 子元素与子元素间是兄弟关系。 两元素之间不能既是父子关系又是兄弟关 系。
XML基础教程 第2章 格式良好的XML文档
XML基础教程
第2章 格式良好的XML文档
第2页
本章的学习目标
XML文档的分类 XML文档的结构 XML声明的语法 XML元素的语法 XML对特殊字符的处理 XML的命名空间
XML基础教程
第2章 格式良好的XML文档
第3页
主要内容
2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 XML文档的分类 XML文档的整体结构 XML声明 XML文档的处理指令和注释 XML元素的基本规则 实体引用和CDATA段 命名空间 本章小结
第2章 格式良好的XML文档
XML基础教程
第30页
2.7 命名空间
当两个标记的名字相同时,它们可以通过 隶属不同的命名空间来相互区分。 由此可见,命名空间只是为XML元素指定 一个范围而已。通过为XML元素和属性指 定命名空间,可以更好地区分不同范围的 元素和属性。
XML基础教程
第2章 格式良好的XML文档
第18页
2.5.1 XML元素的命名规则
与HTML不同,XML没有预置任何元素, XML允许开发者自己定义元素。在XML中 ,基本没有什么保留字,所以可以随心所 欲地为元素命名。
XML基础教程
第2章 格式良好的XML文档
第19页
XML元素的命名必须遵守以下原则: 名字中可以包含字母、数字、下划线(_) 、中划线(-)、冒号(:)和点号(.)。 名字必须以字母或下划线(_)开始。 名字不能以XML(或者xml,Xml,xMl等任 意大小写组合)开始。
XML基础教程
第2章 格式良好的XML文档
第34页
2.8 本章小结
本章详细介绍了XML文档必需的基本语法 ,包括:XML文档的结构及文档规则, XML声明语句的写法,元素及属性的定义 ,字符和实体的引用,XML中的命名空间 的定义及使用等。其中最为重要的是XML 的文档规则,因为只有符合XML文档规则 的XML文档才是格式良好的XML文档,在 书写XML文档时一定要特别注意这一点。
第2章 格式良好的XML文档
XML基础教程
第35页
XML基础教程 第2章 格式良好的XML文档
第22页
2.5.3 元素的构成
一个XML元素由一个开始标记、一个结束 标记,以及夹在这两个标记之间的数据内 容所组成。其基本形式如下: <开始标记>数据内容</结束标记>
XML基础教程
第2章 格式良好的XML文档
第23页
带有属性的XML元素形式如下: <开始标记 属性1="属性值1" 属性2=="属 性值2"……>数据内容</结束标记>
XML基础教程
第2章 格式良好的XML文档
第4页
2.1 XML文档的分类
按照对XML文档规范的遵守程度,可将XML文档 分为3种类型: 格式不良好(malformed)的XML文档:完全没 有遵守XML文档基本规则的XML文档。 格式良好(well-formed)但无效的XML文档。 有效(valid)的XML文档。
格式良好但无效的XML文档已经是一份结构化的 文档,因此可以将其转换为树状结构。如果为格 式良好但无效的XML文档指定了DTD或Schema 定义的语义约束,而且该文档也遵守该语义约束, 那么这份文档就变成了有效的XML文档。
XML基础教程
第2章 格式良好的XML文档
第7页
2.2 XML文档的整体结构
XML基础教程
第2章 格式良好的XML文档
第16页
XML文档中的注释和HTML文档中的完全一 样,XML中的注释要满足以下规则: 注释以“<!--”开始,以“-->”结束。 注释不可以出现在XML声明之前。 注释不能出现在标记中。 注释中不能出现连续的两个连字符,即“-”。 注释不能嵌套。
XML基础教程
第2章 格式良好的XML文档
第11页
2.3.1 XML声明中的version属性
XML声明中的属性“version” 用于指出 该XML文件遵循哪个版本的XML规范,一 个XML声明可以只包含版本属性。如果声 明中还包含其它属性,则必须将版本属性 排在其它属性之前。目前,版本属性的值 只可以取1.0,而XML的1.1版本还没有正式 公布 。
XML基础教程 第2章 格式良好的XML文档
第21页
2.5.2 根元素
根元素具有以下特点: 每个XML文档必须有且只有一个根元素。 根元素是一个完全包括文档中其他所有元 素的元素。 根元素的起始标记要放在所有其他元素的 起始标记之前。 根元素的结束标记要放在所有其他元素的 结束标记之后。
XML的处理指令简称PI,其用途是给处理 XML文档的应用程序提供信息,告诉处理 程序该如何处理该文档。XML处理指令的 格式如下: <?target?>或<?target instruction?>
XML基础教程
第2章 格式良好的XML文档
第15页
XML文档中可以使用注释(Comment)对 语句进行某些提示或说明,以增加文档的 可读性和清晰性。XML解析器不会对注释 做任何处理,注释中的内容在解析时会被 忽略。
XML基础教程
第2章 格式良好的XML文档
第5页
2.1.1 格式不良好的XML文档
这种XML文档完全没有遵守XML文档规则,是最 差的XML文档,它甚至不是一份结构化的文档, 因此不能正常转换为树状结构。
标记语言的发展历史
XML基础教程 第2章 格式良好的XML文档
第6页
2.1.2 格式良好的XML文档
第2章 格式良好的XML文档
本章概述 本章的学习目标 主要内容
XML基础教程
第2章 格式良好的XML文档
第1页
本章概述
XML文档使用了自描述的和简单的语法,熟悉 HTML的读者会发现XML的语法和HTML非常相 似。本章重点介绍格式良好的XML文档的定义规 则和语法,只有掌握了XML文档的规则才能定义 出格式良好的XML文档,并为进一步学习XML的 深层知识打下坚实的基础。
XML基础教程
第2章 格式良好的XML文档
第12页
2.3.2 XML声明中的encoding属性
encoding属性表示XML文件所使用的编码 标准,该属性只可位于version属性之后, 但可以省略,省略时表示采用默认的UTF-8 编码方式。除此之外,常用的编码方式还 有:简体中文的编码方式 “GB2312”,繁 体中文的编码方式“BIG5”等。
第31页
2.7.1 有前缀和无前缀命名空间
命名空间用来区分相同名称的标记 ,XML 的命名空间分为有前缀命名空间和无前缀 命名空间。 声明有前缀的命名空间的语法如下: xmlns:前缀=命名空间的名字 无前缀的命名空间的声明语法如下: xmlns=命名空间的名字
XML基础教程 第2章 格式良好的XML文档
XML基础教程 第2章 格式良好的XML文档
第8页
XML文档的结构
XML基础教程 第2章 格式良好的XML文档
第9页
格式良好的XML文档,总的来说,应遵守 以下原则: XML文档必须以一个XML声明开始。 XML文档有且只能有一个根元素。 开始标记和结束标记必须成对出现。 各元素之间正确的嵌套。 XML标记都是大小写敏感的。 属性值必须使用引号""。
XML基础教程
第2章 格式良好的XML文档
第24页
来自百度文库
2.5.4 元素的嵌套
非空元素包含的内容中既可以有文本数据 也可以有子元素。当需要用“整体——部 分”关系来描述数据时,就可以使用非空 元素和子元素。但是当一个元素中包含子 元素时,有一个非常重要的要求——它们 之间必须正确地嵌套。也就是说,如果一 个元素在另一个元素内部开始,那么也必 须在同一个元素内部结束。
XML基础教程
第2章 格式良好的XML文档
第13页
2.3.3 XML声明中的standalone属性
standalone属性用来说明XML文件是否是 独立的,即是否与其他文件相关联,该属 性可以为“yes”或“no”,默认值是 “no”。
XML基础教程
第2章 格式良好的XML文档
第14页
2.4 XML文档的处理指令和注释