XML学习资料
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
XML
什么是XML
可扩展标记语言(extensible markup language,XML)
·标记语言:用某种“记号”来表示某种特殊信息的语言,它是一套标记符号和相关语法的集合
·两类标记语言:
①专用标记语言:基于特殊用途的需要,被某一种或者几种应用软件所支持来表示某种特殊信息;
HTML:应用在WWW上面的网页,其重点在于信息的显示
②通用标记语言:不针对某一特殊应用,只是用来描述数据的内容和结构,即(元标记语言),为不同应用提供数据交流的平台。
SGML:标准通用标记语言,由于其复杂,很难编写解释器,在其规范上,出于易用性考虑,发展了XML
XML( eXtensible Markup Language,可扩展标记语言)可以定
义自己的一组标签
使人们或程序能够理解这些标签
XML、SGML、HTML的关系
XML与SGML、HTML的关系:
⑴SGML是所有标记语言的母语言,HTML
和XML都派生自SGML;
⑵XML从根本上讲就是SGML的一个子集,
而HTML是SGML定义的一种应用;
⑶HTML只是一个有限标记集合,不能自
定义扩展,仅作为一种数据表示技术,不能
揭示数据的含义;
XML的特性
XML的核心是数据:在XML中数据与样式分离,提高XML文档
的利用率以及数据容量与质量
XML数据自我描述性
用户可以自己定义标记的名称
XML支持Unicode字符集
它允许使用双字节的字符来定义标记和编写程序,可以很方
便使用中文来命名XML文档中的元素和属性,具有可读性。
XML不仅仅作一个记录数据的数据格式,常与以下技术结合使
用。
①DTD(文档类型定义):为XML文档提供元素、属性、顺序
等规则,根据DTD来验证文档是否合法;
②DOM(文档对象模型):为应用程序提供相应处理文档的
接口
③CSS(层叠样式表):为元素指定显示格式
④XSL(可扩展样式语言)
元素和标记
XML文档由元素构成,每个元素由开始标记和结束标记组成,
或者表示为空元素标记。
元素的命名原则:
①元素名称的第一个字符必须是字母或下划线
②后续字符可以是字母、数字、下划线、连字符或点
③区分大小写,元素名称不能含空格
④可以使用中文名称
元素可以具有属性,属性是由等号分隔的一对名称和值。属
性必须放在元素的开始标记中,其值用双引号括起。格式:<元素名称属性名1=“值1” 属性名2=“值2” …>
属性命名:
①与元素命名相同;
②同一个元素不可以拥有两个相同的属性名称,但不同的元素可以拥有相同的属性名称
1. 对于使用属性还是元素没有一成不变的规则,一般来说使用元素扩展性更好,
而属性更适合简单的、没有子结构的数据。
2. 对于XML文档,CSS只能指定元素的样式,无法指定属性,必须使用XSL。
3.属性的值都是字符串,其不能包含字符< & “ ‘ >等
引用
XML为显示非ASCII码字符集中的字符提供了两种方法:实体
引用和字符引用。
①在XML中,所有的实体引用都是以&开头,以;结尾。
②XML中5个预定义的实体引用,分别用来代替文本中出现的& < > 双引号单引号
CDATA节
有时在XML中描述的内容很长,其中包含许多特殊符号,若要
把这些字符逐一替换成实体引用,工作量大,考虑使用CDATA
节,其内容不会解析。
格式:
注释
格式:
使用注释时要遵循的规则:
1. 注释的文本中不应包含“--”
2. 注释不应放在标记里面
3. 注释不能放在实体声明中,也不能放在 XML 声明之前
4. 不能用注释隠藏基本的标记
5. 注释不能嵌套
创建 XML 文档
构建 XML 文档的步骤
1. 陈述 XML 声明
2. 创建根元素
3. 创建 XML 代码
管理元素的规则
至少需要一个元素
XML 标签区分大小写
应正确使用结束标签
正确嵌套标签
应使用合法标签
标记名称的长度
应定义有效的属性
应验证文档
格式良好和有效的 XML 文档
被视为格式良好的 XML 文档的条件:
该文档满足最低要求集
如果文档不满足任何一个良好格式的要求,则将发生致命错
误
有效的XML 文档是符合Document Type Definition(文档类型
定义,DTD)的规则的格式良好的 XML 文档
总结
XML 是可扩展的,即可以定义自己的一组标签,并使其他的
人或程序能够理解这些标签
XML由SGML发展而来,是SGML的子集
XML的核心是数据,这些数据有自我描述性,支持Unicode字
符集
XML可以实现异构数据之间的数据交换。有较好的保值性,并
且有严格的语法要求。
一个XML文档可以分为序言区、主体区和尾声区
元素由开始标记、结束标记以及元素内容组成。
XML预定义了5种实体引用,用来代替在文档中出现的特殊字
符
CDATA中的内容不解析,原样显示
编写XML文档时从声明开始
所有非空元素都必须有闭合标记
空元素使用/>来闭合
标记区分大小写
什么是DTD
DTD包含在文档类型声明中,定义某种文档类型的所有规则。