第二章规范的xml文件.ppt.Convertor

合集下载

第二章 创建XML文档

第二章 创建XML文档

价格
春天
天籁之声音像公司
流行风
26
古筝曲
白天鹅音像公司
音乐吧,民乐坊
30
巴赫
北京音像公司
音乐吧
68
XML技术导论 XML技术导论
(Music.xml) Music.xml)
<?xml version="1.0" encoding="GB2312"?> <!DOCTYPE musiclibrary SYSTEM "Music.dtd"> <!--DVD information in Music.xml--> <!--DVD Music.xml--> <musiclibrary>
结论:XML优势在程序间或是说机器间的交互 优势在程序间或是说机器间的交互, 结论:XML优势在程序间或是说机器间的交互,而 不是在人机交互上。 不是在人机交互上。
第二章 创建XML文档 创建XML文档
第一个XML文档 第一个XML文档
DVD名称 DVD名称 发行公司 代理商行
XML技术导论 XML技术导论
(Music.xml) Music.xml) XML技术导论 XML技术导论 <?xml version=1.0 encoding=GB2312 ?> <!DOCTYPE musiclibrary SYSTEM "Music.dtd"> <!--DVD information in Music.xml--> <!--DVD Music.xml--> <music> <title>春天 <title>春天</title> 春天</title> (共7类错误 类错误) 共 类错误 <publisher>天籁之声音像公司 <publisher>天籁之声音像公司</publisher> 天籁之声音像公司</publisher> <shop>流行风 <shop>流行风</shop> 流行风</shop> <price pricetype=‘RMB’>26.00 <price pricetype=‘RMB’> pricetype=‘RMB’ pricetype=‘RMB’ <music> <title>古筝曲 <title>古筝曲</title> 古筝曲</title> <publisher>白天鹅音像公司 <publisher>白天鹅音像公司</publisher> 白天鹅音像公司</publisher> <shop 1>音乐吧</shop 1> 1>音乐吧 音乐吧</shop <2shop>民乐坊 <2shop>民乐坊</2shop> 民乐坊</2shop> <price pricetype=“RMB”>30.00 <price pricetype=“RMB”> pricetype=“RMB” pricetype=“RMB” </music> <music> <title>巴赫 <title>巴赫</title> 巴赫</title> <publisher>北京音像公司 <publisher>北京音像公司</Publisher> 北京音像公司</Publisher> <shop>音乐吧 <shop>音乐吧</shop> 音乐吧</shop> <price pricetype=‘RMB”>68.00 <price pricetype=“RMB”> pricetype=‘RMB” pricetype=“RMB” </music>

第2章 规范的XML文件.ppt

第2章 规范的XML文件.ppt
<空标记的名称 属性列表 /> <空标记的名称 />
作用
空标记的名称主要用于抽象带有属性的数据,该数据本身并 不需要用具体文本进行描述.
例如
<长方形 长=“30” 宽=“15”/>
9
XML标记-非空标记
非空标记必须由“开始标签”与“结束标签”组成, “开始标签”与“结束标签”之间是该标记所标记的 内容。
符,不能包含空格 标记区分大小写 非空标记应该对称的嵌套
例如:
<name>李云龙</name> <Name>李云龙</Name>
11
标记“顾客”包含的文本数据:
非空标记内容
¶ □□张三丰¶
□□
<?xml version="1.0" encodi¶ng="GB2312"? >
<顾客>¶ □□张三丰¶ □□<日期>2007年3月2日¶ □□</日期>¶ □□<商品>¶ □□□□脸盆¶
语法格式
<标记的名称 属性列表 > … </标记名称>
非空标记的内容
文本数据 子标记
作用:
非空标记包含的内容中既可以有文本数据也可以有子标记, 当需要用“整体-部分”关系来描述数据时,就可以使用非 空标记
10
标记名称
命名规范:
不能以数字开头,必须是字母或下划线 标记名称可以包含数字、中文、英文、_、.、-等字
18
CDATA段
<script> function matchwo(a,b) { if (a < b && a < 0) then { return 1 } else { return 0 } } </script>

XML基础教程(第2版)_第2章_规范的XML文件

XML基础教程(第2版)_第2章_规范的XML文件

2.3.2 非空标记_3.作用
非空标记包含的内容中既可以有文本数据也可以有子标记. 当需要用“整体-部分”关系来描述数据时,就可以使用非 空标记,XML文件中的可以有如下结构的标记: <学生> <姓名>张三</姓名> <学号>A1001</学号> </学生> 当需要使用文本来描述一个数据时,也需要使用非空标记
2.3.2 非空标记_1. 语法格式
非空标记必须由“开始标签”与“结束标签”构成,它们之 间是该标记的内容。 开始标签以“<”标识开始,用“>”标识结束,标识之间 是标记的名称和属性列表开始标签的语法格式分别为: <标记的名称 属性列表 > 或 <标记名称> 注意:在标识“<”和标记名称 之间不要含有空格,允许“>” 的前面可以有空格或回行。
以下是2个空标记(正确的空标记): <water /> <张三 age="28" sex="男" /> 错误的空标记:× <water />
< 张三 age="28" sex="男"/> < water />
2.3.1 空标记_2.作用
由于空标记不包含任何内容,因此在实际编写XML文件时, 空标记的名称主要用于抽象带有属性的数据,该数据本身并不需 要用具体文本进行描述,比如,如果XML需要描述宽12、长20 的长方形,但不准备有任何关于长方形的文字描述,那么就可以 使用如下的标记: <长方形 width="12" length=20 /> XML解析器主要关心空标记中的属性,并可以解析出这些 属性的值。

标准的xml文件格式

标准的xml文件格式

标准的xml文件格式XML(可扩展标记语言)是一种用于标记电子文档结构和数据的标准格式。

它被广泛应用于Web开发、数据交换和配置文件等领域。

标准的XML文件格式对于确保文档的正确性和可读性至关重要。

本文将介绍标准的XML文件格式,包括其基本结构、常见元素和属性,以及一些最佳实践。

XML文件由标签、元素、属性和数据组成。

标签是XML文档的基本构建块,用于定义元素和属性。

元素是标签的实例,用于表示文档中的数据结构。

属性是元素的附加信息,用于提供关于元素的额外描述。

数据则是元素或属性中的实际内容。

在标准的XML文件格式中,一个合法的XML文档必须包含一个根元素。

根元素是XML文档的顶层元素,所有其他元素都必须包含在根元素内部。

根元素还必须是唯一的,不能有多个根元素存在于同一个XML文档中。

除了根元素外,XML文档还可以包含注释、处理指令和空白字符。

注释用于向文档中添加说明性的文字,可以帮助他人理解文档的内容和结构。

处理指令用于指示解析器如何处理文档中的特定部分。

空白字符(如空格、制表符和换行符)用于格式化文档,但在某些情况下也可以影响文档的解析和处理。

在XML文件中,元素和属性的命名必须遵循一定的规则。

它们必须以字母、下划线或冒号开头,后面可以跟随任意数量的字母、数字、下划线、连字符或句点。

此外,元素和属性的命名是区分大小写的,因此<book>和<Book>被视为两个不同的元素。

另外,XML文件中还可以包含实体引用和CDATA部分。

实体引用用于表示一些特殊字符,如<表示小于号,&表示和号等。

CDATA部分用于包含文本块,其中的内容不会被解析器解析,而是作为原始数据处理。

在编写XML文件时,应该尽量遵循一些最佳实践,以确保文档的可读性和可维护性。

例如,应该使用缩进和换行来组织文档的结构,使其更易于理解和修改。

此外,应该为元素和属性选择描述性的名称,以便他人能够理解其含义和用途。

XML教程第2章 XML语法简明教程PPT课件

XML教程第2章 XML语法简明教程PPT课件




2.1 XML文档的序言
2.1.2
2.1.2.2

注释和处理指令
处理指令
XML的处理指令简称PI,用来给处理它的应用程 序提供信息的元素。当应用程序处理XML文档时, 如果遇到处理指令会解释这个指令,遵照它提供 的信息进行处理。 处理指令一般具有下列语法格式: <?处理指令名 处理指令信息 ?> 前面的xml声明就是一个处理指令: <?xml version="1.0" encoding="gb2312" ?>
2.1 XML文档结构


2.1.1 组成和声明
2.1.1.1 序言 XML文档以序言开始,用来表示XML数据的开始,描述字符 的编码方法,为XML解析器和应用程序提供其他一些配置线 索。序言部分包括XML文档的声明及注释,其中声明在XML 文档中是必不可少的,注释的主要目的就是便于对文档的理 解和阅读。 每个XML文档必须以一个文档声明语句开头,包括声明XML 的版本号、所使用的字符集,以及是否为独立文档等信息。 在XML声明的前面不允许再有任何其它的字符,甚至是空格, 也就是说XML声明必须是XML文档中的第一个内容。 例如: <?xml version="1.0" encoding="gb2312" standalone="yes" ?>

2.1 XML文档结构
2.1.1
2.1.1.2

组成和声明
尾部
XML文档尾部部分包括注释、处理指令和紧跟元素 树后的空白。尾部部分对于XML文档来说不起任何 作用,因为大多数的应用程序在文档根元素的结束 标记处就结束了,不再对尾部进行任何的处理。

第二章规范的xml文件.ppt.Convertor

第二章规范的xml文件.ppt.Convertor

第二章规范的XML文件XML的特点:1、是一种能够应用在各个领域进行设计的元标记语言。

2、XML的标记是可自由定义,使得XML文件能够很好地体现数据结构和含义。

3、XML文件必须符合一定的语法规则。

XML文件规范的XML文件(Well-Formed XML):符合W3C指定的基本语法规则。

有效的XML文件(Validated XML):规范的XML文件再符合额外的一些约束。

规范的XML文件有效的XML文件什么是规范的XML文件呢?符合W3C指定的基本语法规则的XML文件称为有效的XML文件. W3C指定的基本语法规则是指比如,文件用”XML声明”开始,文件有且仅有一个根标记,其他标记必须都封装在根标记中,文件的标记必须是树状结构,非空标记必须由”开始标记”与”结束标记”组成,空标记没有”开始标记”和”结束标记”,等等.什么是有效的XML文件规范的XML文件再符合额外的一些约束就称为有效的XML文件.通常人们认为不规范的XML文件是没有价值的文件,甚至是不能叫做一个XML文件.我们所说的XML文件都是W3C所指定的规范标准.也就是规范的XML文件.规范的XML的组成:可选的序言:声明及注释文档的主体由一个或多个元素组成,其形式为一个可能包含字符数据的文档树可选的尾部:注释、处理指令和紧跟元素树后的空白。

主要内容XML声明XML标记CDATA区段标记的属性名称空间XML声明一个规范的XML文档通常以XML声明开始,通过XML元素来组织XML数据。

XML声明是处理指令的一种,它告诉浏览器或其他处理程序这个文档是XML文档。

声明必须放在第一行,前面不能有空白、注释或其它处理命令。

XML声明XML声明中的版本属性XML声明中的编码属性XML声明中的独立属性其格式如下:<?xml 版本信息[编码信息] [文档独立性信息] ?>例子:<?xml version=“1.0” encoding=“UTF-8” standalone=“yes” ?>一对中括号([ ])中的部分表示是可选信息XML声明中的版本属性一个最基本的XML声明:<?xml version="1.0" ?>注:V ersion属性不能省略且必须在属性列表的第一位,指明所采用的XML的版本号,用来保证对XML未来版本的支持。

第2章 XML文件的规则

第2章  XML文件的规则
<note &:C others:B. </note >
解析器会把“>”和“<”误认为XML的标记而不会当做大于号和小于 号。如图所示:
2.3 特殊字符处理 (2)
如果在标记内容当中需要用到这些字符,就需要通过实体引用的 方法。对于上面的5个特殊字符,XML有对应的5个预定义实体,见下 表:
结束标记以“</”标识开始,用“>”标识结束。“</”与“>” 之间是标记的名称,结束标记不含有属性。结束标记的格式为:
</非空标记名称 >
非空标记的设置 (2)
“开始标记”和“结束标记”之间的是该标记所标记的内容。例如:
<name>小王</name>
注意:开始标记中“<”与标记名称之间不能有空格,“>”前面 可 以有空格或回车。结束标记中“</”与标记名称之间不能 有 空格,“>”前面可以有空格或回车。结束标记的名称要与 开 始标记的名称一致。 返回
非空标记的内容设置 (1)
非空标记的标记内容可以由文本数据和标记构成。其中的标 记称为该标记的子标记。文本数据可以由任何的可见或不可见字 符组成。例如 :
<name > 小王 <sex>男</sex> </name >
“<name>”标记所标记的文本数据是“小王”。它还包含一个子标 记“<sex>”,该子标记所标记的文本数据是“男”
XML声明中的编码属性 (2)
如果XML文档使用中文标记或出现中文内容,就应该在XML声明 中使用“GB2312”编码,例如:
<?xml version=”1.0” encoding=”gb2312” ?> <persions> <persion> <name>小李</name> <tel>1234567</tel>

XML实用教程第2章

XML实用教程第2章

一个规范的 XML 文件必须满足 W3C 所指 定的标准,比如,文件用“XML声明”开始、 文件有当且仅有一个根标记、非根标记都必 须封装在根标记中、文件的标记必须是树型 结构、非空标记必须由“开始标记”与“结 束标记”组成、空标记没有“开始标记”和 “结束标记”等等。 规范的XML文件如果再符合额外的一些约束 就称为有效的 XML 文件。本章介绍规范的 XML 文件,下一章讲解有效的XML文件 .
2009-10-11
11
§2.8 名称空间_1
名称空间的目的是有效的区分名字相同的标记,当两个标记 的名字相同时,它们可以通过隶属不同的名称空间来相互区分。 名称空间通过使用声明名称空间来建立,分为有前缀名称空 间和无前缀名称空间
有前缀的名称空间的语法如下: xmlns: 前缀=名称空间的名
字 例如:
xmlns:person="China.dalian"
xmlns =
12
无前缀的名称空间声明语法如下:xmlns=名称空间的名字
例如:
2009-10-11
§2.8 名称空间_2
标记中声明名称空间 名称空间的声明必须在标记的“开始标记”里面,而且名称空 间的声明必须放在开始标记中标记名字的后面,例如:
2009-10-11
8
§2.5 XML的优势 一个标记的内容可以有两部分构成:文 本数据部分和子标记部分。一个标记的文 本数据中可以有普通字符、CDATA段、和 实体引用。
例题2-2 p16
2009-10-11
9
§2.6 属性
属性是指标记的属性,可以为标记添加附加信息。 属性是一个名值对,即属性必须由名字和值组成。属 性必须在非空标记的开始标记或空标记中声明,用“=” 为属性指定一个值。 例:

XML简介 ppt课件

XML简介 ppt课件

26
使用XML企业应用开发
总结 2-2
元素由开始标记、结束标记以及元素内容组成。 XML预定义了5种实体引用,用来代替在文档中出
现的特殊字符 CDATA中的内容不解析,原样显示 编写XML文档时从声明开始 所有非空元素都必须有闭合标记 空元素使用/>来闭合 标记区分大小写
27
使用XML企业应用开发
XML文档结构:
由一个或多个元素 组成层次数,只能
一个XML文档大体可以分为三个区域:包含唯一根元素
序言区、主体区、尾声区(可选)
序言区
主体区
尾声区可选:包含注释、处理指令等
12
使用XML企业应用开发
示例
<?xml version = "1.0“ encoding=“GB2312”?> XML 声明- 定义 XML 版本
16
使用XML企业应用开发
引用
XML为显示非ASCII码字符集中的字符提供了两 种方法:实体引用和字符引用。
①在XML中,所有的实体引用都是以&开头,以; 结尾。
②XML中5个预定义的实体引用,分别用来代替 文本中出现的& < > 双引号 单引号
实体引用
对应字符
&amp;
&
&lt; &gt;
< >
<ZIP> 20056 </ZIP>
<Email> </Email>
</CONTACT>
<CONTACT>
...
</CONTACT>
</Details>

XML配置文件PPT课件

XML配置文件PPT课件
清单5-5:STUDENT元素和它的子元素的 DTD(STUDENT.dtd)
list\5-5.doc
14
2020/10/13
外部参数实体(续)
清单5-6:使用STUDENTDTD的有效文档
list\5-6.doc
15
2020/10/13
外部参数实体(续)
清单5-7:包含了对STUDENTDTD引用的完 整SCHOOLDTD
12
2020/10/13
外部参数实体
可用外部参数实体把较小的DTD组成大型的 DTD
将DTD分解为小的、更便于管理的组块,使得 对DTD的分析处理更加简便
描述一组元素的DTD中采用较小的、模块化的 结构,使得不同的人或组织创建的DTD之间的 组合和匹配更加简便
13
2020/10/13
外部参数实体(续)
外部实体
– 清单5-12:非ASCIIISOLatin-1字符的DTD
list\5-12.doc
21
2020/10/13
结构完整的文档中的实体和DTD(续)
外部实体
– 清单5-13:为使用ASCIIISOLatin-1字母而使用实 体引用的无效完整文档
list\5-13.doc
22
2020/10/13
list\5-7.doc
16
2020/10/13
外部参数实体(续)
清单5-8:EDUCATIONDTD list\5-8.doc
17
2020/10/13
结构完整的文档中的实体和DTD
内部实体
– 清单5-9:DTD中的ERH实体引用产生了结构完整 但不合法的文档
list\5-9.doc
18
2020/10/13

《XML实用教程》课件

《XML实用教程》课件
XML文档的遍历和操作
学习如何遍历XML文档的元素树结构,并 进行增删改查等操作。
XML的应用场景
在Web开发中的应用
在数据交换中的应用
探索XML在Web开发领域中的广 泛应用,如网页模板和数据传输。
了解XML如何实现不同系统之间 的数据交流和信息共享。
在配置文件中的应用
讨论XML作为配置文件格式的优 点和常见应用场景。
《XML实用教程》PPT课 件
欢迎来到《XML实用教程》PPT课件!在本课程中,我们将深入了解XML的概 念、语法规则以及应用场景,以帮助您更好地理解和应用XML技术。
XML概念和语法规则
XML的定义和作用
介绍XML的基本概念和它在数据交换和配置文件 中的重要作用。
XML文档的元素和属性
讨论XML文档中的元素和属性的定义和用法。
1 总结XML的基本概念和应用
回顾本课程中所学的关键概念,加深对XML 技术的理解。
2 基于XML实现一个简单的应用
通过一个实践练习,使用所学的XML知识构 建一个简单但有趣的应用。
XML文档的基本结构和声明
解释XML文档的整体结构以及必须的声明部分。
XML命名空间的使用
介绍在XML中使用命名空间来避免元素命名冲突 的技术。
XML文档的解析和处理
1
使用DOM和SAX解析XML文档
2
深入了解DOM和SAX解析器的工作原理,
并比较它们的优缺点。
3ቤተ መጻሕፍቲ ባይዱ
解析XML文档的方法和工具
探讨解析XML文档的不同方法,如DOM和 SAX,并介绍常用的解析工具。
XML的拓展技术
XML Schema的使用
介绍XML Schema语言和其在XML文档验证和数据类型定义方面的应用。

XML实用教程PPT课件

XML实用教程PPT课件

§2.4 CDATA段
CDATA段用“<![CDATA[”做为段的开始, 用“]]>”作为段的结束,段开始和段结束之 间称为CDATA段的内容,解析器不对CDATA 段的内容做分析处理 。
CDATA段中的内容可以包含任意的字符。 但是,W3C规定,CDATA段中不可以嵌套另 一个CDATA段。
§2.5 XML的优势
一个简单的XML文件_ first.xml
<?xml version="1.0" ?>
1.XML 声明
<学生>
<姓名> 薛校好
<性别> 男 </性别>
<出生日期> 1991/8/15 </出生日期>
</姓名> <姓名> 姚笔叶
<性别> 女 </性别>
2. 标记
3.根标记
<出生日期> 1992/10/31 </出生日期>
《Xቤተ መጻሕፍቲ ባይዱL实用教程》
§1.1 什么是XML
XML是eXtensible Markup Language的缩写,是 由万维网联盟(W3C)定义的一种语言,称之为可扩 展标记语言。所谓可扩展性是指XML允许用户按着 XML规则自定义标记。
XML文件是由标记以及它所包含的内容构成的文 本文件,这些标记可自由定义,其目的是使得XML文 件能够很好地体现数据的结构和含义。W3C推出XML 的主要目的是使得Internet网络上的数据相互交流 更方便,让文件的内容更加显而易懂。
<?xml version="1.0" encoding="UTF-8" ?> <!-- 简单的XML文件 --> <root>

第二章XML基础语法PPT课件

第二章XML基础语法PPT课件

• 文本字符串中有特殊字符时,需要使用实体引用。 例如:<比较符>1+1<3</比较符>
实体名称 &lt; &gt;
&amp; &quot; &apos;
字符 < > & “ ‘
• 正确写法:<比较符>1+1&lt;3</比较符>
12
CDATA段
• CDATA段不被解析器解析处理,变成直接文本 • CDATA段的语法格式:
<桌子 width="300" height="600" length="1000">
吃饭用的 </桌子> </root>
10
字符数据
• 开始标记和结束标记之间的文本为字符数据 • 字符数据可以是 “<” 以外的任何合法
(Unicode) 字符
<NAME> 成龙 </NAME>
字符 数据
11
实体引用
1
整体 概述
一 请在这里输入您的主要叙述内容

请在这里输入您的主要 叙述内容
三 请在这里输入您的主要叙述内容
2
XML基本操作案例—— 通信录
输入XML文档内容 —>保存源文档 —>用IE浏览源文档
3
XML基本操作案例—— 通信录
4
XML声明
XML文档第一行是XML声明。
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>

xml课件--第2章_文档编写

xml课件--第2章_文档编写
2013-7-21 13
2.3.4 空元素


所谓空元素是指没有内容的元素,即在开始标记与 结束标记之间既无数据内容也无子元素。例如下面 的元素: <RESUME></RESUME> 此种情况下,可将上面的空元素写成: <RESUME/> 在<RESUME/>这一种写法中, <与RESUME 之间也不能有空格
2013-7-21 9
2.3.1 XML标记的命名规则(续)
例如下面的标记就是合法标记: <Name> <name> <_name> <lisongtao_name> <>
2013-7-21
10
2.3.2 标记的使用规则
1.必须具有根标记且根标记必须惟一 2.开始标记和结束标记需配对使用(注:空标记除外) 3.标记不能交错使用
2013-7-21
12
2.3.3 非空元素




绝大多数XML元素为非空元素,即在其起始标记 和结束标记之间通常会有一定的内容,元素的内容 也称为元素的数据,它可以是文本、也可以是该元 素所包含的若干个子元素。 如:<first>David</first> 注意 :起始标记中,<与first之间不能含有空格 结束标记中,</与first之间不能含有空格 起始标记与结束标记之间的所有字符都是元素的内 容。 如<first> David </first>,David之前的空 格和David之后的空格和David都是元素的内容。
2013-7-21 18
2.5 特殊字符的使用
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二章规范的XML文件XML的特点:1、是一种能够应用在各个领域进行设计的元标记语言。

2、XML的标记是可自由定义,使得XML文件能够很好地体现数据结构和含义。

3、XML文件必须符合一定的语法规则。

XML文件规范的XML文件(Well-Formed XML):符合W3C指定的基本语法规则。

有效的XML文件(Validated XML):规范的XML文件再符合额外的一些约束。

规范的XML文件有效的XML文件什么是规范的XML文件呢?符合W3C指定的基本语法规则的XML文件称为有效的XML文件. W3C指定的基本语法规则是指比如,文件用”XML声明”开始,文件有且仅有一个根标记,其他标记必须都封装在根标记中,文件的标记必须是树状结构,非空标记必须由”开始标记”与”结束标记”组成,空标记没有”开始标记”和”结束标记”,等等.什么是有效的XML文件规范的XML文件再符合额外的一些约束就称为有效的XML文件.通常人们认为不规范的XML文件是没有价值的文件,甚至是不能叫做一个XML文件.我们所说的XML文件都是W3C所指定的规范标准.也就是规范的XML文件.规范的XML的组成:可选的序言:声明及注释文档的主体由一个或多个元素组成,其形式为一个可能包含字符数据的文档树可选的尾部:注释、处理指令和紧跟元素树后的空白。

主要内容XML声明XML标记CDATA区段标记的属性名称空间XML声明一个规范的XML文档通常以XML声明开始,通过XML元素来组织XML数据。

XML声明是处理指令的一种,它告诉浏览器或其他处理程序这个文档是XML文档。

声明必须放在第一行,前面不能有空白、注释或其它处理命令。

XML声明XML声明中的版本属性XML声明中的编码属性XML声明中的独立属性其格式如下:<?xml 版本信息[编码信息] [文档独立性信息] ?>例子:<?xml version=“1.0” encoding=“UTF-8” standalone=“yes” ?>一对中括号([ ])中的部分表示是可选信息XML声明中的版本属性一个最基本的XML声明:<?xml version="1.0" ?>注:V ersion属性不能省略且必须在属性列表的第一位,指明所采用的XML的版本号,用来保证对XML未来版本的支持。

XML声明中的编码属性<?xml version="1.0" encoding=“UTF-8” ?>编码属性指定了文本的编码系统,即规定了XML文档采用哪种字符集进行编码。

这是一个指定了编码方式的xml声明。

我们说encoding指定的编码方式要和其xml的保存方式相一致。

————————————————接下来我们就介绍一下我们常用的编码方式和保存方式。

XML声明中的编码属性常用的编码方式及其保存方式UTF-8gb2312ISO-8859-1如果我们指定encoding的属性值是“UTF-8”那么保存时我们也必须选择其编码是UTF-8。

采用这种编码方式,那么标记及标记的内容就可以使用汉字,英文,日文,法文等等。

如果我们的xml文件有特殊要求只准使用ASCII字符和汉字,那么我们可以指定encoding 的属性值是“gb2312”那么保存时我们也必须选择其编码是ANSI。

如果这时在我们的xml 文档中出现日文,韩文等,IE及xml解析器就不能正确显示而要抱错了。

如果我们只准备使用ASII字符,那么我们就可以将encoding的属性值设为“ISO-8859-1”那么保存时我们也必须选择其编码是ANSI。

————————————————————那么有些同学就会问了,为什么会有这么多的编码方式呢?他们有什么区别?有什么用呢?那么先让我们看几幅图片。

不同的字符集ASCII字符集American Standard Code for Information Interchange(美国标准信息交换码)ISO字符集国际标准组织(ISO)定义了几个不同的字符集,其中最突出的是ISO-8859-1(通常叫做Latin-1 )ASCII字符集是我们最熟悉的,它是一个原始的字符集,而且是到目前为止最通用的。

所有的字符集都是对它的扩展。

字符的编码是0~127国际标准组织(ISO)定义了几个不同的字符集,它们是在ASCII码基础上增加了其他语言和地区需要的字符。

其中最突出的是ISO-8859-1,通常叫做Latin-1。

Latin-1包括了书写所有西方欧洲语言不可缺少的附加字符,其中0~127的字符与ASCII码相同。

那么我们保存文件用的ANSI编码又是一个什么字符集呢?它是Windows 对Latin-1版本的扩展,使用更多的可打印字符代替介于130和159之间的非打印控制字符,从而进一步扩展了使用范围。

不同的字符集Unicode字符集由UNICODE协会管理并接受其技术上的修改。

Unicode使用0~65,535的双字节无符号数对每一个字符进行编码。

Unicode中0~`255的字符与Latin-1中的一致。

UTF-8字符集UTF-8是一个压缩的Unicode版本是XML的默认字符集但是这些编码仅仅是针对罗马文字的国家,而我们需要的是一种得到大家的认可并且编码了全世界各种文字的字符集。

建立这样的字符集很难,需要对成百上千种语言和文字有细致的了解。

不过这方面的努力一直在进行,终于创建了一个符合要求的字符集;Unicode。

而且主要卖方(微软、苹果、IBM、Sun、Be等)正逐步趋向于使用它。

Unicode字符集由UNICODE 协会管理并接受其技术上的修改。

Unicode使用0~65,535的双字节无符号数对每一个字符进行编码。

目前已经定义了40,000多个不同的Unicode字符,剩余25,000个空缺留给将来扩展之用。

其中大约20,000个字符用于汉字,另外11,000左右的字符用于韩语音节。

Unicode 中0~`255的字符与Latin-1中的一致。

这么庞大的字符库仍然没有覆盖全部历史上的文字,特别是亚洲东部的语言,它只定义了中国、日本、朝鲜和古越南使用的80万象形文字中的20万个左右。

但大部分国家的“字母表”字母都是Unicode字符集中的一个字符。

Unicode 使用双字节表示一个字符,因此使用Unicode的英文文本文件大小是使用ASCII码或Latin-1文件的两倍UTF-8是一个压缩的Unicode版本,使用单个字节表示最常用的字符,即0到127的ASCII 字符,较少见的字符使用三个字节表示,特制是韩国音节和汉字。

如果主要使用英文,UTF-8能够将文件压缩为原来的一半。

如果主要使用汉语、朝语或者日语,UTF-8会使文件的尺寸增加50% 。

这是一个用java编写的输出汉字“你”和希腊字母“a”的utf-8编码的效果。

到目前为止我们介绍了4种编码集该表列出了目前大部分常用的字符集的正式名称,即出现在XML编码属性中的名称XML声明中的独立属性<?xml versio n="1.0" encoding=“UTF-8” standalone=“yes” ?>如果我们的文档不依赖于外部文档,即所有必须的实体声明都包含在文档中。

在XML声明中,我们可以通过standalone=“yes”声明这个文档是独立的文档.如果文档依赖于外部文档,即需要外部的DTD(文档类型定义),可以通过standalone=“no”来声明.XML的标记XML的标记分为非空标记与空标记.XML标记空标记非空标记开始标记结束标记XML是基于文本的标记语言,标记是XML文档最基本的组成部分。

在黑板上举两个例子.非空标记和空标记XML的空标记空标记的语法格式<空标记的名称属性列表/>或<空标记的名称/>“<”与“标记名称”之间不要含有空格“/>”可以有空格和换行我们知道了XML是由标记和标记内容构成的文本文件,标记分为空标记和非空标记。

空标记即不标记任何内容的标记,对于空标记,按其是否含有属性,有两种语法格式。

我们在实验课中知道,<和名称之间前面不能有空格,后面可以有空格或者是换行都行,但是/〉必须紧邻。

XML中的空标记例子:<王菲age=“35”sex=“女”/><李亚鹏/><谢霆锋age=“26”sex=“男”/>XML中的非空标记非空标记必须由“开始标记”与“结束标记”组成,两者之间是该“标记的内容”。

例子:<超级女生>我喜欢这个节目</超级女生>开始标记以“<”标识开始,用“>”标识结束,“<”标识与“>”标识之间是标记的名称和属性列表XML中的非空标记非空标记语法格式开始标记格式<标记的名称属性列表>或<标记名称>结束标记</标记名称>例子:<王菲sex=“女”></王菲>“<”与标记名称之间不要含有空格“>”可以有空格和换行在黑板上写两个例子一对一错非空标记的内容开始标记与结束标记之间是标记的内容。

标记内容是有两部分组成:文本数据与标记。

标记内容中的标记称作该标记的子标记非空标记的内容1.<goods>电脑</goods>2.<goods>电脑</goods>这两个非空标记内容是否相同?文本数据包括空格和回车标记的名称规则:名称可以由字母、数字、下划线、点或连字符组成,但必须以字母或下划线开头。

标记名称区分大小写<name>与<Name>如果用UTF-8编码,字母不仅包括通常的拉丁字母,还包括汉字、日文。

XML的根标记XML文件必须有且仅能有一个根标记,其他标记都必须封装在根标记中。

最后XML文件的标记必须形成树状结构。

XML的根标记<root><性别>男<出生日期></性别>1980年8月6日</出生日期></root>×这不是一个规范的XML文件,标记未形成树状结构。

性别与出生日期标记有交叉XML文件中的特殊字符XML文件中有五种特殊字符:<、>、&、’、”XML标记内容中的文本数据不能含有特殊字符这五种特殊字符对于XML有特殊的用途。

我们知道标记的内容可以由两部分构成:文本数据和标记,其中文本数据包含空格和回车,但不能包含这5个特殊字符。

XML特殊字符但是如果我们想要包含的时候怎么办呢?有2种方法:实体引用和字符引用。

相关文档
最新文档