第2章 格式良好的XML文档
XML文件格式及特点
XML文件格式的特点1. 具有良好的格式XML 文档格式属于良好格式的文件。
HTML 文件中的标记,有些是不需要结尾标记的,如<br>,有些网页缺少若干结尾标记,照样能正确显示。
而XML 的标记一定要拥有结尾标记,例如:<name>张三</name>即,XML 标记一定是成双成对的。
如果没有结尾标记,那么在结束的“>”前,需要有“/”,表示开头和结尾是在同一标记内,例如:<book sales="yes"/>2. 具有验证机制XML 的标记是程序员自己定义的,标记的定义和使用是否符合语法,需要验证。
XML有两种验证方法。
一种是DTD,它是一个专门的文件,用来定义和检验XML 文档中的标记。
另一种是XML Schema,用XML 语法描述。
它比DTD 更优越,多个Schema 可以复合使用XML 名称空间,可以详细定义元素的内容及属性值的数据类型。
3. 灵活的Web 应用在 XML 中数据和显示格式是分开设计的,XML 元数据文件就是纯数据的文件,可以作为数据源,向HTML 提供显示的内容,显示样式可以随HTML 的变化而丰富多彩。
也就是说,HTML 描述数据的外观,而XML 描述数据本身,是文本化的小型数据库表达语言。
HTML 数据和显示格式混在一起,显示出一种样式。
XML 采用的标记是自己定义的,这样数据文件的可读性就能大大提高,也不再局限于HTML 文件中的那些标准标记了。
由于XML 是一个开放的基于文本的格式,它可以和HTML 一样使用HTTP 进行传送,不需要对现存的网络进行改变。
数据一旦建立,XML 就能被发送到其他应用软件、对象或者中间层服务器中做进一步的处理,或者可以被发送到桌面用浏览器浏览。
XML 和HTML、脚本、公共对象模式一起为灵活的3 层Web 应用软件的开发提供了所需的技术。
4. 丰富的显示样式XML 数据定义打印、显示排版信息主要有3 种方法:用CSS(Cascading Style Sheet)定义打印和显示排版信息,用XSLT 转换到HTML 进行显示和打印,用XSLT 转换成XSL(eXtensible Stylesheet Language)的FO(Formatter Object) 进行显示和打印。
第2讲:XML的规范性:格式良好
DTD称为文档类型定义(Document Type Declaration),主要用 于确定XML文档的合法性。文档类型定义是以<!DOCTYPE…>的结 构在XML文档中出现 <!DOCTYPE 产品信息[ <!ELEMENT 产品信息(产品*)> <!ELEMENT 产品(名称,价格,数量)> <!ELEMENT 名称(#PCDATA)> <!ELEMENT 价格(#PCDATA)> <!ELEMENT 数量(#PCDATA)> ]>
是一个URI引用, 其功能是区分不同 的命名空间,具有 惟一性和持久性。
命名空间前缀 <person:personlist xmlns:person=“personlist.dtd”> <person:person> <person:name>Tom Smith</person:name> 命名空间名 <person:tel>86541234</person:tel> <person:address>whut</person:address> </person:person> </ person:personlist > <person:supervisor xmlns:manager=“manager.dtd”> <manager:name>Jack Chen</manager:name> <manager:tel> <manager:Stel>86541234</nanager:Stel> <manager:mobile>123456789</manager:mobile> </ manager:tel> </person:supervisor> 命名空间并不是一个真实的地址,而只是一个修饰而已
xml2第二部分
第2章创建并显示第一个X M L文档本章对创建并在We b浏览器中显示X M L文档的全过程有一个总体介绍。
首先,将创建一个简单的X M L文档,了解文档的结构,并且学习创建一个格式正确的X M L文档的基本规则。
接着,将通过创建并附带一个告诉浏览器怎样格式化文档中元素的简单样式表来了解怎样在M i c r o s o f tInternet Explorer 5 We b浏览器中显示文档。
本章提供了这些主题的简要内容,本书其余部分将深入讨论这些主题。
2.1 创建一个X M L文档因为X M L文档是用纯文本写成的,所以可以使用你最喜欢的文本编辑器来创建它。
例如,可以使用Microsoft Wi n d o w s附带的写字板编辑器。
或者,使用一种可使源代码输入更方便的编程编辑器,例如Microsoft Visual Studio文本编辑器(与Microsoft Visual C++、Microsoft Vi s u a lI n t e r D e v、Microsoft Visual J++和其他Visual Studio应用程序一起发行的文本编辑器)。
2.1.1 创建X M L文档1) 在文本编辑器中打开一个新的空文本文件,并输入程序清单2 - 1中所示的X M L文档。
(你将在本书附带的光盘上文件名为I n v e n t o r y. x m l的文件中发现该程序清单的拷贝)。
如果你愿意,则可以忽略一些B O O K元素。
你无需输入全部8个B O O K元素—输入三或四个即可。
(B O O K元素由< B O O K >和< / B O O K >标签加上它们之间的所有文本组成。
)2) 使用文本编辑器的“保存(S a v e)”命令把文档保存在硬盘上,并赋予文件名I n v e n t o r y. x m l。
程序清单2 - 1I n v e n t o r y. x m l<?xml version="1.0"?><!--File Name:Inventory.xml -->< I N V E N T O R Y >< B O O K ><TITLE>The Adventures of Huckleberry Finn</TITLE><AUTHOR>Mark Twain</AUTHOR><BINDING>mass market paperback</BINDING>< P A G E S > 2 9 8 < / P A G E S >< P R I C E > $ 5 . 4 9 < / P R I C E >< / B O O K >< B O O K ><TITLE>Leaves of Grass</TITLE><AUTHOR>Walt Whitman</AUTHOR>< B I N D I N G > h a r d c o v e r < / B I N D I N G >< P A G E S > 4 6 2 < / P A G E S >< P R I C E > $ 7 . 7 5 < / P R I C E >< / B O O K >< B O O K ><TITLE>The Legend of Sleepy Hollow</TITLE><AUTHOR>Washington Irving</AUTHOR><BINDING>mass market paperback</BINDING>< P A G E S > 9 8 < / P A G E S >< P R I C E > $ 2 . 9 5 < / P R I C E >< / B O O K >< B O O K ><TITLE>The Marble Faun</TITLE><AUTHOR>Nathaniel Hawthorne</AUTHOR><BINDING>trade paperback</BINDING>< P A G E S > 4 7 3 < / P A G E S >< P R I C E > $ 1 0 . 9 5 < / P R I C E >< / B O O K >< B O O K >< T I T L E > M o b y - D i c k < / T I T L E ><AUTHOR>Herman Melville</AUTHOR>< B I N D I N G > h a r d c o v e r < / B I N D I N G >< P A G E S > 7 2 4 < / P A G E S >< P R I C E > $ 9 . 9 5 < / P R I C E >< / B O O K >< B O O K ><TITLE>The Portrait of a Lady</TITLE><AUTHOR>Henry James</AUTHOR><BINDING>mass market paperback</BINDING>< P A G E S > 2 5 6 < / P A G E S >< P R I C E > $ 4 . 9 5 < / P R I C E >< / B O O K >< B O O K ><TITLE>The Scarlet Letter</TITLE><AUTHOR>Nathaniel Hawthorne</AUTHOR><BINDING>trade paperback</BINDING>< P A G E S > 2 5 3 < / P A G E S >< P R I C E > $ 4 . 2 5 < / P R I C E >< / B O O K >< B O O K ><TITLE>The Turn of the Screw</TITLE><AUTHOR>Henry James</AUTHOR><BINDING>trade paperback</BINDING>< P A G E S > 3 8 4 < / P A G E S >< P R I C E > $ 3 . 3 5 < / P R I C E >< / B O O K >< / I N V E N T O R Y >2.1.2 XML文档剖析一个X M L文档,例如刚才输入的示例文档有两个主要组成部分:序言(p r o l o g)和文档元素(document element)(文档元素也就是众所周知的根元素),如图2 - 1所示。
第二章 XML语法规则
3
小结
软件学院
标记语言的基本概念
4
标记语言的基本特点:在表示数据内容的基础上, 插入各种具有明确含义的标记,以起到对数据内 容进行解释、说明、限制等作用。 标记的表示方法:<>,一般成对使用。 <a href=>yahoo</a> 标记的命名规则
28
软件学院
属性与子元素的有关问题
属性的表达方式:
<Student ID="100"> <Name>TOM</Name> </Student>
29
子元素的表达方式:
<Student > <id> 100</id> <Name>TOM</Name> </Student>
软件学院
属性与子元素的有关问题(续)
软件学院
25
元素(续)
XML元素的内容 : 元素内容的类型:嵌套元素/字符数据/实体引用/ CDATA节/处理指令/注释 有三类XML元素的内容:
– 混合内)
XML元素命名与Java、C的命名规则类似: – 元素名必须是以字母、下划线开始的字符串;
21
软件学院
元素(续)
那么原来的应用程序会中断或者崩溃么
22
?
不会。应用程序仍然会正确的解读<to>, <from>, 和<body> 等元素,并且产生同样 的输出。
软件学院
元素(续)
23
XML文档是可以扩展的!
软件学院
元素(续)
元素之间的关系:子元素/父元素、祖先/后代
XML2——XML文档的元素、属性、实体
XML2——XML⽂档的元素、属性、实体对于XML⽂档来说,<?处理指令必须要顶格写,前⾯不能有任何的空⽩。
XML元素可以具有属性,属性的形式为“属性名="属性值",⽐如gender="male"。
属性值需要使⽤单引号或双引号括起来。
多个属性之间使⽤空格分开。
通过样式,我们可以实现XML内容与展现形式的分离。
XML的注释:<!-- comments -->,注释不允许嵌套。
在⼀个元素上相同的属性值只能出现⼀次。
格式正规( well formed)的XML⽂档就是符合XML语法要求的XML⽂档就是格式正规的XML⽂档。
第⼀⾏是XML声明,以下是XML处理指令的例⼦。
处理指令以<?开始,⽽以?>结束。
在?后的第⼀个单词是处理指令名,在本例中是xml。
<?xml version="1.0" encoding="utf-8" standalone="yes"?>XML声明有version和standalone两个特性。
特性是由等号分开的“名称-数值对”。
位于等号左边的是特性名,⽽其值位于等号的右边,并⽤双引号或单引号括起来。
每⼀个XML⽂档都以⼀个XML声明开始,⽤以指明所⽤的XML的版本。
在上例中,version特性表明这个⽂档符合XML 1.0规范。
XML声明还有standalone特性,这告诉我们⽂档是否在这⼀个⽂件⾥还是需要从外部导⼊⽂件。
在本例中,所有的⽂档都在⼀个⽂件⾥完成,因⽽standalone特性的值要设置为yes。
<?xml version="1.0" encoding="utf-8" standalone="yes"?><GREETING>Hello world!</GREETING>总体上说,这三⾏组成了GREETING元素。
创建格式良好的XML文档
实验1 创建格式良好的XML文档【开发语言及实现平台或实验环境】配置有windows记事本、写字板 或 XMLSpy 2006开发环境的计算机设备【实验目的】(1)通过本实验,使学生能够熟悉XML文档编辑、解析、浏览工具。
(2)掌握XML文档的基本语法。
(3)能够得到格式良好、有效的XML文档。
【实验要求】(1)能熟练进行XMLSpy下载,安装(2)能在写字板、XMLSpy中创建“个人信息”XML文件(3)能在XMLSpy中验证XML文件格式的正确性、有效性(4)能在浏览器中打开XML文件,体会其结构的严格性【实验原理】一 XML名字空间是说明XML文件中的所有标记定义的来源说明二 XML元素定义不能交叉,必须完全嵌套或不完全不嵌套三 XML元素标记最好使用与内容相关的定义【实验步骤】1.熟悉了解xml(1)创建一个名为“个人信息”的记事本文件,并在其中输入要求的源文件,结束输入后存为后缀名为.xml的文件。
(2)(3)检查是否良好(xml-Check Well-Formedness)2、设想有这样一本书:书名:xml指南第一章 xml入门简介1.1节什么是html1.2节什么是xml第二章 xml语法2.1节 xml元素必须有结束标签2.2节 xml元素必须正确地嵌套试使用xml文档进行描述,并上机实现过程如下:<?xml version="1.0" encoding="UTF-8"?><book name="xml指南"><章><章号>第一章</章号><名字>xml入门简介</名字><b1.1>什么是html</b1.1><b1.2>什么是xml</b1.2><章号>第二章</章号><名字>xml语法规则</名字><b2.1>xml元素必须有结束标签</b2.1><b2.2>xml元素必须正确地嵌套</b2.2></章></book>2. 创建一个格式良好的xml文档,存储学生成绩的信息,包括:学号number、姓名name、成绩score上机实现并在浏览器中进行查看用浏览器浏览:思考题:(1)如果允许XML中的元素相互交叉,其缺点是什么?a文档不规范b容易造成内容与现实混合c.结构不够清晰(2) XML文件中的名字空间有什么用处?名字空间的英文名字是namespace,顾名思义也就是允许你通过一个网址指向来识别你的标签。
第2章 规范的XML文件.ppt
作用
空标记的名称主要用于抽象带有属性的数据,该数据本身并 不需要用具体文本进行描述.
例如
<长方形 长=“30” 宽=“15”/>
9
XML标记-非空标记
非空标记必须由“开始标签”与“结束标签”组成, “开始标签”与“结束标签”之间是该标记所标记的 内容。
符,不能包含空格 标记区分大小写 非空标记应该对称的嵌套
例如:
<name>李云龙</name> <Name>李云龙</Name>
11
标记“顾客”包含的文本数据:
非空标记内容
¶ □□张三丰¶
□□
<?xml version="1.0" encodi¶ng="GB2312"? >
<顾客>¶ □□张三丰¶ □□<日期>2007年3月2日¶ □□</日期>¶ □□<商品>¶ □□□□脸盆¶
语法格式
<标记的名称 属性列表 > … </标记名称>
非空标记的内容
文本数据 子标记
作用:
非空标记包含的内容中既可以有文本数据也可以有子标记, 当需要用“整体-部分”关系来描述数据时,就可以使用非 空标记
10
标记名称
命名规范:
不能以数字开头,必须是字母或下划线 标记名称可以包含数字、中文、英文、_、.、-等字
18
CDATA段
<script> function matchwo(a,b) { if (a < b && a < 0) then { return 1 } else { return 0 } } </script>
XML基础教程(第2版)_第2章_规范的XML文件
2.3.2 非空标记_3.作用
非空标记包含的内容中既可以有文本数据也可以有子标记. 当需要用“整体-部分”关系来描述数据时,就可以使用非 空标记,XML文件中的可以有如下结构的标记: <学生> <姓名>张三</姓名> <学号>A1001</学号> </学生> 当需要使用文本来描述一个数据时,也需要使用非空标记
2.3.2 非空标记_1. 语法格式
非空标记必须由“开始标签”与“结束标签”构成,它们之 间是该标记的内容。 开始标签以“<”标识开始,用“>”标识结束,标识之间 是标记的名称和属性列表开始标签的语法格式分别为: <标记的名称 属性列表 > 或 <标记名称> 注意:在标识“<”和标记名称 之间不要含有空格,允许“>” 的前面可以有空格或回行。
以下是2个空标记(正确的空标记): <water /> <张三 age="28" sex="男" /> 错误的空标记:× <water />
< 张三 age="28" sex="男"/> < water />
2.3.1 空标记_2.作用
由于空标记不包含任何内容,因此在实际编写XML文件时, 空标记的名称主要用于抽象带有属性的数据,该数据本身并不需 要用具体文本进行描述,比如,如果XML需要描述宽12、长20 的长方形,但不准备有任何关于长方形的文字描述,那么就可以 使用如下的标记: <长方形 width="12" length=20 /> XML解析器主要关心空标记中的属性,并可以解析出这些 属性的值。
标准的xml文件格式
标准的xml文件格式XML(可扩展标记语言)是一种用于标记电子文档结构和数据的标准格式。
它被广泛应用于Web开发、数据交换和配置文件等领域。
标准的XML文件格式对于确保文档的正确性和可读性至关重要。
本文将介绍标准的XML文件格式,包括其基本结构、常见元素和属性,以及一些最佳实践。
XML文件由标签、元素、属性和数据组成。
标签是XML文档的基本构建块,用于定义元素和属性。
元素是标签的实例,用于表示文档中的数据结构。
属性是元素的附加信息,用于提供关于元素的额外描述。
数据则是元素或属性中的实际内容。
在标准的XML文件格式中,一个合法的XML文档必须包含一个根元素。
根元素是XML文档的顶层元素,所有其他元素都必须包含在根元素内部。
根元素还必须是唯一的,不能有多个根元素存在于同一个XML文档中。
除了根元素外,XML文档还可以包含注释、处理指令和空白字符。
注释用于向文档中添加说明性的文字,可以帮助他人理解文档的内容和结构。
处理指令用于指示解析器如何处理文档中的特定部分。
空白字符(如空格、制表符和换行符)用于格式化文档,但在某些情况下也可以影响文档的解析和处理。
在XML文件中,元素和属性的命名必须遵循一定的规则。
它们必须以字母、下划线或冒号开头,后面可以跟随任意数量的字母、数字、下划线、连字符或句点。
此外,元素和属性的命名是区分大小写的,因此<book>和<Book>被视为两个不同的元素。
另外,XML文件中还可以包含实体引用和CDATA部分。
实体引用用于表示一些特殊字符,如<表示小于号,&表示和号等。
CDATA部分用于包含文本块,其中的内容不会被解析器解析,而是作为原始数据处理。
在编写XML文件时,应该尽量遵循一些最佳实践,以确保文档的可读性和可维护性。
例如,应该使用缩进和换行来组织文档的结构,使其更易于理解和修改。
此外,应该为元素和属性选择描述性的名称,以便他人能够理解其含义和用途。
XML教程第2章 XML语法简明教程PPT课件
2.1 XML文档的序言
2.1.2
2.1.2.2
注释和处理指令
处理指令
XML的处理指令简称PI,用来给处理它的应用程 序提供信息的元素。当应用程序处理XML文档时, 如果遇到处理指令会解释这个指令,遵照它提供 的信息进行处理。 处理指令一般具有下列语法格式: <?处理指令名 处理指令信息 ?> 前面的xml声明就是一个处理指令: <?xml version="1.0" encoding="gb2312" ?>
2.1 XML文档结构
2.1.1 组成和声明
2.1.1.1 序言 XML文档以序言开始,用来表示XML数据的开始,描述字符 的编码方法,为XML解析器和应用程序提供其他一些配置线 索。序言部分包括XML文档的声明及注释,其中声明在XML 文档中是必不可少的,注释的主要目的就是便于对文档的理 解和阅读。 每个XML文档必须以一个文档声明语句开头,包括声明XML 的版本号、所使用的字符集,以及是否为独立文档等信息。 在XML声明的前面不允许再有任何其它的字符,甚至是空格, 也就是说XML声明必须是XML文档中的第一个内容。 例如: <?xml version="1.0" encoding="gb2312" standalone="yes" ?>
2.1 XML文档结构
2.1.1
2.1.1.2
组成和声明
尾部
XML文档尾部部分包括注释、处理指令和紧跟元素 树后的空白。尾部部分对于XML文档来说不起任何 作用,因为大多数的应用程序在文档根元素的结束 标记处就结束了,不再对尾部进行任何的处理。
第二章规范的xml文件.ppt.Convertor
第二章规范的XML文件XML的特点:1、是一种能够应用在各个领域进行设计的元标记语言。
2、XML的标记是可自由定义,使得XML文件能够很好地体现数据结构和含义。
3、XML文件必须符合一定的语法规则。
XML文件规范的XML文件(Well-Formed XML):符合W3C指定的基本语法规则。
有效的XML文件(Validated XML):规范的XML文件再符合额外的一些约束。
规范的XML文件有效的XML文件什么是规范的XML文件呢?符合W3C指定的基本语法规则的XML文件称为有效的XML文件. W3C指定的基本语法规则是指比如,文件用”XML声明”开始,文件有且仅有一个根标记,其他标记必须都封装在根标记中,文件的标记必须是树状结构,非空标记必须由”开始标记”与”结束标记”组成,空标记没有”开始标记”和”结束标记”,等等.什么是有效的XML文件规范的XML文件再符合额外的一些约束就称为有效的XML文件.通常人们认为不规范的XML文件是没有价值的文件,甚至是不能叫做一个XML文件.我们所说的XML文件都是W3C所指定的规范标准.也就是规范的XML文件.规范的XML的组成:可选的序言:声明及注释文档的主体由一个或多个元素组成,其形式为一个可能包含字符数据的文档树可选的尾部:注释、处理指令和紧跟元素树后的空白。
主要内容XML声明XML标记CDATA区段标记的属性名称空间XML声明一个规范的XML文档通常以XML声明开始,通过XML元素来组织XML数据。
XML声明是处理指令的一种,它告诉浏览器或其他处理程序这个文档是XML文档。
声明必须放在第一行,前面不能有空白、注释或其它处理命令。
XML声明XML声明中的版本属性XML声明中的编码属性XML声明中的独立属性其格式如下:<?xml 版本信息[编码信息] [文档独立性信息] ?>例子:<?xml version=“1.0” encoding=“UTF-8” standalone=“yes” ?>一对中括号([ ])中的部分表示是可选信息XML声明中的版本属性一个最基本的XML声明:<?xml version="1.0" ?>注:V ersion属性不能省略且必须在属性列表的第一位,指明所采用的XML的版本号,用来保证对XML未来版本的支持。
xml标准文件说明
北京xx有限公司XML标准文件说明1. 绪论 (2)1.1 开发者和开发目标 (2)1.2 术语 (3)2. 文档 (4)2.1 格式良好的(Well-Formed)XML文档 (4)2.2 字符 (5)2.3 通用句法成分 (5)2.4 字符数据和标记 (6)2.5 注释 (7)2.6 处理指令 (7)2.7 CDATA段 (8)2.8 序言(prolog)和文档类型声明 (8)2.9 独立文档声明 (10)2.10 空白域处理 (11)2.11 行尾处理 (11)2.12 语言标识 (12)2.13字符集错误 (13)2.14标签分类 (13)2.15标签要求 (13)2.16 xml嵌套子元素 (13)2.17 xml嵌套子元素 (14)2.18 整体结构 (15)3. 逻辑结构 (15)3.1 起始标记,结束标记和空元素标记 (16)3.2 元素类型声明 (17)3.2.1 元素内容 (18)3.2.2 混合型内容(Mixed Content) (19)3.3 属性表声明 (19)3.3.1 属性类型 (20)3.3.2 属性缺省值 (21)3.3.3 属性-值对的规范化(Attribute-Value Normalization) (22)3.4 条件段(Conditional Sections) (22)5. 一致性(Conformance) (23)5.1 进行验证和不进行验证的处理器(Validating and Non-Validating Processors) (23)5.2 使用XML处理器 (24)6. 符号(Notation) (24)7 完整的XML DEMO (25)1. 绪论可扩展标记语言,缩写为XML,描述了一类称为XML文档的数据对象,同时也部分地描述了处理这些数据对象的计算机程序的行为。
XML是SGML(标准通用标记语言[ISO 8879])针对应用的一个子集,或者说是SGML的一种受限形式。
第2章 XML语法
XML文档-元素2-2
• 所有的XML文档必须有一个根元素 XML文档中的第一个元素就是根元素 • XML元素是相互关联的 XML元素之间是父元素和子元素的关系 • XML元素有不同的内容 XML元素内容指的是从该元素的开始标签到 结束标签之间的这部分 • XML元素可以拥有一个或更多的属性 XML属性或属性值可以是强制的或可选择的
内部实体(预定义实体)
• 一些字符有特殊含义,”<”已用作标 签使用,不能出现在XML文件中,如:
2.4 XML文档内容
XML文档-元素 (Element)
• 在层次结构的 XML 文档中,元素是最基本 的组成单元(Building Block)。 • 元素的语法格式如下所示:
<element_name> ――开始标记 ...content... ――文本内容 </element_name> ――结束标记
2.3 XML声明
• XML 文档以 XML 声明作为开始,它向 解析器提供了关于文档的基本信息 • XML声明由“<?”开始,“?>”结束。 • 例如:<?xml version="1.0" encoding="GB2312" ?>
实例1:
<?xml version="1.0" encoding="gb2312"?> <!--注释--> XML声明 <Person> 属性 根元素 <name id=“1”>张三</name> <birth>03/11/1961</birth> 文本 元素 <occupation>医生</occupation> <email>tom@</email> </Person>
XML实用教程第2章
一个规范的 XML 文件必须满足 W3C 所指 定的标准,比如,文件用“XML声明”开始、 文件有当且仅有一个根标记、非根标记都必 须封装在根标记中、文件的标记必须是树型 结构、非空标记必须由“开始标记”与“结 束标记”组成、空标记没有“开始标记”和 “结束标记”等等。 规范的XML文件如果再符合额外的一些约束 就称为有效的 XML 文件。本章介绍规范的 XML 文件,下一章讲解有效的XML文件 .
2009-10-11
11
§2.8 名称空间_1
名称空间的目的是有效的区分名字相同的标记,当两个标记 的名字相同时,它们可以通过隶属不同的名称空间来相互区分。 名称空间通过使用声明名称空间来建立,分为有前缀名称空 间和无前缀名称空间
有前缀的名称空间的语法如下: xmlns: 前缀=名称空间的名
字 例如:
xmlns:person="China.dalian"
xmlns =
12
无前缀的名称空间声明语法如下:xmlns=名称空间的名字
例如:
2009-10-11
§2.8 名称空间_2
标记中声明名称空间 名称空间的声明必须在标记的“开始标记”里面,而且名称空 间的声明必须放在开始标记中标记名字的后面,例如:
2009-10-11
8
§2.5 XML的优势 一个标记的内容可以有两部分构成:文 本数据部分和子标记部分。一个标记的文 本数据中可以有普通字符、CDATA段、和 实体引用。
例题2-2 p16
2009-10-11
9
§2.6 属性
属性是指标记的属性,可以为标记添加附加信息。 属性是一个名值对,即属性必须由名字和值组成。属 性必须在非空标记的开始标记或空标记中声明,用“=” 为属性指定一个值。 例:
XML文件格式的特点
10个方面描写XML文件格式的特点1. 具有良好的格式XML 文档格式属于良好格式的文件。
HTML 文件中的标记,有些是不需要结尾标记的,如<br>,有些网页缺少若干结尾标记,照样能正确显示。
而XML 的标记一定要拥有结尾标记,例如:<name>张三</name>即,XML 标记一定1. 具有良好的格式XML 文档格式属于良好格式的文件。
HTML 文件中的标记,有些是不需要结尾标记的,如<br>,有些网页缺少若干结尾标记,照样能正确显示。
而XML 的标记一定要拥有结尾标记,例如:<name>张三</name>即,XML 标记一定是成双成对的。
如果没有结尾标记,那么在结束的“>”前,需要有“/”,表示开头和结尾是在同一标记内,例如:<book sales="yes"/>2. 具有验证机制XML 的标记是程序员自己定义的,标记的定义和使用是否符合语法,需要验证。
XML有两种验证方法。
一种是DTD,它是一个专门的文件,用来定义和检验XML 文档中的标记。
另一种是XML Schema,用XML 语法描述。
它比DTD 更优越,多个Schema 可以复合使用XML 名称空间,可以详细定义元素的内容及属性值的数据类型。
3. 灵活的Web 应用在XML 中数据和显示格式是分开设计的,XML 元数据文件就是纯数据的文件,可以作为数据源,向HTML 提供显示的内容,显示样式可以随HTML 的变化而丰富多彩。
也就是说,HTML 描述数据的外观,而XML 描述数据本身,是文本化的小型数据库表达语言。
HTML 数据和显示格式混在一起,显示出一种样式。
XML 采用的标记是自己定义的,这样数据文件的可读性就能大大提高,也不再局限于HTML 文件中的那些标准标记了。
由于XML 是一个开放的基于文本的格式,它可以和HTML 一样使用HTTP 进行传送,不需要对现存的网络进行改变。
xml文档格式整理
xml文档格式整理XML(可扩展标记语言)是一种用于存储和传输数据的标记语言,它具有自我描述性和可扩展性的特点。
在整理XML文档格式时,我们可以考虑以下几个方面:1. 声明,XML文档的开头通常包含一个声明,用于指定XML版本和字符编码。
示例,<?xml version="1.0" encoding="UTF-8"?>。
2. 根元素,XML文档必须有一个根元素,它包含了整个文档的内容。
根元素应该有一个有意义的名称,并且应该在开始和结束标签之间包含其他所有元素。
3. 元素,XML文档中的元素用标签表示,标签由开始标签和结束标签组成。
元素可以包含文本内容、属性和子元素。
4. 属性,元素可以拥有属性,属性提供有关元素的额外信息。
属性通常以键值对的形式出现在开始标签中。
示例, <bookid="001" category="fiction">。
5. 命名空间,如果XML文档中使用了命名空间,应该在根元素中声明命名空间。
命名空间可以避免元素和属性名称的冲突,并允许在文档中引用外部定义的元素和属性。
6. 注释,XML文档中可以包含注释,注释用于提供对文档内容的说明和备注。
注释以<!--开始,以-->结束。
示例,<!-这是一个注释 -->。
7. CDATA节,如果XML文档中包含特殊字符(如<、>、&),可以使用CDATA节来表示这些字符,以避免解析错误。
CDATA节以<![CDATA[开始,以]]>结束。
8. 文档类型定义(DTD)或XML模式定义(XSD),XML文档可以使用DTD或XSD定义其结构和约束。
这些定义可以确保文档符合特定的规则和要求。
9. 缩进和换行,为了增加XML文档的可读性,可以使用缩进和换行符。
缩进和换行可以按照层次结构来表示元素的嵌套关系,使文档更易于阅读和理解。
XML基础教程第2章
2.2 XML文档元素
2.2.1 元素的基本形式
元素的基本形式: <标记名>元素内容</标记名> 注意: 1.XML标记的名称也是该元素的名称。 2.开始标记和结束标记必须成对出现。 3.XML文档中的标记名必须用半角字符“<”和“>”括 起来,以便和元素内容进行区分。
4.在XML文档中,可以按照自己的需求来定义和使用标记。 5.XML元素的开始标记和结束标记必须同名,在结束标记的 前面加上一个斜杠。 6.各个元素的开始标记和结束标记可以嵌套使用,但不能交 叉使用。 7.空元素标记可以省略结束标记,但必须以“/”结束。
standalone=“yes”:表示文档的内容是否依赖来自外部源 的信息 。 值“yes”或“no”要小写。 ?>:表示文档声明的结束。
文档声明举例: <?xml version="1.0"
encoding="gb2312" standalone="yes"?> <!文件名:例2-1.xml> <!文档声明举例> <学生人员名单> <姓名>张三</姓名> <院系>经管学院</院系> <年龄>20</年龄> </学生人员名单>
2.1.2 XML文档处理指令
处理指令(processing instruction,PI)是用来给 XML解析器提供信息的,表示 XML 处理指令文本的开头。基 本格式为:
<?目标名 处理指令信息?> 参数说明: 目标名:用于指明哪个应用程序需要PI控制,要注意目 标名的大小写,它可以保留而不被其他的处理软件或脚本程 序占用。 处理指令信息:指传送到处理软件或脚本程序的信息, 可由除“?>”之外的任何连续字符组成。 例如: <?xml stylesheet type="text/xsl" href="mystyle.xsl"?>
xml文档正确格式
xml文档正确格式符合语法的XML文档称为结构良好的XML文档。
通过DTD验证的XML文档称为有效的XML文档。
--------------------------------------------------------------------------------"结构良好的" XML文档一个结构良好的XML文档应该使用正确的语法。
一个结构良好的XML文档应该遵守XML语法规则,前面一章给出的例子就是一个结构良好的XML文档:<?xml version="1.0" encoding="ISO-8859-1"?><note><to>Tove</to><from>Jani</from><heading>Reminder</heading><body>Don't forget me this weekend!</body></note>--------------------------------------------------------------------------------"有效的" XML文档一个有效的XML文档应该遵守DTD的描述。
一个有效的XML文档也是一个结构良好的XML文档,同时还必须符合DTD的规则。
<?xml version="1.0" encoding="ISO-8859-1"?><!DOCTYPE note SYSTEM "InternalNote.dtd"><note><to>Tove</to><from>Jani</from><heading>Reminder</heading><body>Don't forget me this weekend!</body></note>--------------------------------------------------------------------------------XML DTDDTD定义了XML文档中可用的合法元素。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
XML基础教程
第2章 格式良好的XML文档
第4页
2.1 XML文档的分类
按照对XML文档规范的遵守程度,可将XML文档 分为3种类型: 格式不良好(malformed)的XML文档:完全没 有遵守XML文档基本规则的XML文档。 格式良好(well-formed)但无效的XML文档。 有效(valid)的XML文档。
XML基础教程 第2章 格式良好的XML文档
第21页
2.5.2 根元素
根元素具有以下特点: 每个XML文档必须有且只有一个根元素。 根元素是一个完全包括文档中其他所有元 素的元素。 根元素的起始标记要放在所有其他元素的 起始标记之前。 根元素的结束标记要放在所有其他元素的 结束标记之后。
XML基础教程
第2章 格式良好的XML文档
第11页
2.3.1 XML声明中的version属性
XML声明中的属性“version” 用于指出 该XML文件遵循哪个版本的XML规范,一 个XML声明可以只包含版本属性。如果声 明中还包含其它属性,则必须将版本属性 排在其它属性之前。目前,版本属性的值 只可以取1.0,而XML的1.1版本还没有正式 公布 。
第2章 格式良好的XML文档
XML基础教程
第35页
第26页
2.5.5 元素的属性
XML中的属性也是由用户自己定义的,属 性可以为XML元素提供更多的信息。
XML基础教程
第2章 格式良好的XML文档
第27页
定义属性时应注意以下几点: 属性的命名规则同元素命名。 属性值必须用引号括起来。 属性只能包含在开始标记中。 特定的属性名称在同一个元素中只能出现 一次。
XML基础教程
第2章 格式良好的XML文档
第12页
2.3.2 XML声明中的encoding属性
encoding属性表示XML文件所使用的编码 标准,该属性只可位于version属性之后, 但可以省略,省略时表示采用默认的UTF-8 编码方式。除此之外,常用的编码方式还 有:简体中文的编码方式 “GB2312”,繁 体中文的编码方式“BIG5”等。
XML基础教程
第2章 格式良好的XML文档
第20页
名字中不能包含空格。 名字中不能出现XML保留的标识符,如 “<”“/”“>”等。 名字中尽可能不要使用冒号“:”,因为冒 号是为“名字空间”(namespaces)预 留的。 尽量避免在名字中使用中划线“-” 和 点 号“.”,因为有的软件不能正确识别。
XML基础教程
第2章 格式良好的XML文档
第28页
2.6 实体引用和CDATA段
XML有5种字符属于特殊字符,包括:左尖 括号 “<”、右尖括号 “>”、与符号 “&” 、单引号“ ' ”和双引号“ " ”。对 于这些特殊字符,XML有特殊用途。所以 按W3C制定的规范,文本数据中不可以含 有这些特殊字符。 要想在文本数据中使用这些特殊字符,可 以通过实体引用的方法。
第32页
2.7.2 在标记中声明命名空间
命名空间是通过在标记中声明来建立的, 命名空间的声明必须放在开始标记里,而 且必须放在开始标记中标记名称的后面。
XML基础教程
第2章 格式良好的XML文档
第33页
2.7.3 命名空间的作用域
命名空间的作用域就是该命名空间的作用 范围。一个标记中如果使用了命名空间, 那么该命名空间的作用域是该标记及其所 有的子孙标记,除非其子孙标记又声明了 命名空间。
XML基础教程
第2章 格式良好的XML文档
第2页
本章的学习目标
XML文档的分类 XML文档的结构 XML声明的语法 XML元素的语法 XML对特殊字符的处理 XML的命名空间
XML基础教程
第2章 格式良好的XML文档
第3页
主要内容
2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 XML文档的分类 XML文档的整体结构 XML声明 XML文档的处理指令和注释 XML元素的基本规则 实体引用和CDATA段 命名空间 本章小结
XML基础教程
第2章 格式良好的XML文档
第5页
2.1.1 格式不良好的XML文档
这种XML文档完全没有遵守XML文档规则,是最 差的XML文档,它甚至不是一份结构化的文档, 因此不能正常转换为树状结构。
标记语言的发展历史
XML基础教程 第2章 格式良好的XML文档
第6页
2.1.2 格式良好的XML文档
第18页
2.5.1 XML元素的命名规则
与HTML不同,XML没有预置任何元素, XML允许开发者自己定义元素。在XML中 ,基本没有什么保留字,所以可以随心所 欲地为元素命名。
XML基础教程
第2章 格式良好的XML文档
第19页
XML元素的命名必须遵守以下原则: 名字中可以包含字母、数字、下划线(_) 、中划线(-)、冒号(:)和点号(.)。 名字必须以字母或下划线(_)开始。 名字不能以XML(或者xml,Xml,xMl等任 意大小写组合)开始。
XML基础教程 第2章 格式良好的XML文档
第29页
如果文本内容中包含大量的“>”、“<” 、“&”、“‘”及“””等特殊符号,需要 花费很大的力气进行转换,转换后的文本 数据中就会出现很多实体引用,导致文本 的可读性变差,怎样解决这个问题呢?在 XML中,可以把这样的文本包含到CDATA (Character Data)段中,包含在CDATA 段中的文本不会被XML解析器解析,直接 提供给应用程序。
XML基础教程 第2章 格式良好的XML文档
第17页
2.5 XML元素的基本规则
元素是XML文档的基本单元,XML文档就 是由一对对嵌套的元素所组成。整个XML 文档从根元素开始,根元素包含若干子元 素,而每个子元素又可以包含若干子元素 ,从而组织成庞大的XML文档。
XML基础教程
第2章 格式良好的XML文档
XML基础教程 第2章 格式良好的XML文档
第8页
XML文档的结构
XML基础教程 第2章 格式良好的XML文档
第9页
格式良好的XML文档,总的来说,应遵守 以下原则: XML文档必须以一个XML声明开始。 XML文档有且只能有一个根元素。 开始标记和结束标记必须成对出现。 各元素之间正确的嵌套。 XML标记都是大小写敏感的。 属性值必须使用引号""。
第2章 格式良好的XML文档
本章概述 本章的学习目标 主要内容
XML基础教程
第2章 格式良好的XML文档
第1页
本章概述
XML文档使用了自描述的和简单的语法,熟悉 HTML的读者会发现XML的语法和HTML非常相 似。本章重点介绍格式良好的XML文档的定义规 则和语法,只有掌握了XML文档的规则才能定义 出格式良好的XML文档,并为进一步学习XML的 深层知识打下坚实的基础。
第2章 格式良好的XML文档
XML基础教程
第25页
元素之间的嵌套规则总结如下: 父元素的起始标记必须在子元素的起始标 记之前,父元素的结束标记必须在子元素 的结束标记之后。元素间不可交叉嵌套。 子元素与子元素间是兄弟关系。 两元素之间不能既是父子关系又是兄弟关 系。
XML基础教程 第2章 格式良好的XML文档
XML基础教程
第2章 格式良好的XML文档
第16页
XML文档中的注释和HTML文档中的完全一 样,XML中的注释要满足以下规则: 注释以“<!--”开始,以“-->”结束。 注释不可以出现在XML声明之前。 注释不能出现在标记中。 注释中不能出现连续的两个连字符,即“-”。 注释不能嵌套。
第31页2.7.1 有前缀和 Nhomakorabea前缀命名空间
命名空间用来区分相同名称的标记 ,XML 的命名空间分为有前缀命名空间和无前缀 命名空间。 声明有前缀的命名空间的语法如下: xmlns:前缀=命名空间的名字 无前缀的命名空间的声明语法如下: xmlns=命名空间的名字
XML基础教程 第2章 格式良好的XML文档
格式良好但无效的XML文档已经是一份结构化的 文档,因此可以将其转换为树状结构。如果为格 式良好但无效的XML文档指定了DTD或Schema 定义的语义约束,而且该文档也遵守该语义约束, 那么这份文档就变成了有效的XML文档。
XML基础教程
第2章 格式良好的XML文档
第7页
2.2 XML文档的整体结构
XML基础教程
第2章 格式良好的XML文档
第34页
2.8 本章小结
本章详细介绍了XML文档必需的基本语法 ,包括:XML文档的结构及文档规则, XML声明语句的写法,元素及属性的定义 ,字符和实体的引用,XML中的命名空间 的定义及使用等。其中最为重要的是XML 的文档规则,因为只有符合XML文档规则 的XML文档才是格式良好的XML文档,在 书写XML文档时一定要特别注意这一点。
XML基础教程
第2章 格式良好的XML文档
第13页
2.3.3 XML声明中的standalone属性
standalone属性用来说明XML文件是否是 独立的,即是否与其他文件相关联,该属 性可以为“yes”或“no”,默认值是 “no”。
XML基础教程
第2章 格式良好的XML文档
第14页
2.4 XML文档的处理指令和注释
第2章 格式良好的XML文档
XML基础教程
第30页
2.7 命名空间
当两个标记的名字相同时,它们可以通过 隶属不同的命名空间来相互区分。 由此可见,命名空间只是为XML元素指定 一个范围而已。通过为XML元素和属性指 定命名空间,可以更好地区分不同范围的 元素和属性。