XML入门精解之结构与语法
xml的语法
XML(Extensible Markup Language)是一种元标记语言,可以用来描述数据。
XML提供了一种标准化的方式,使程序和应用程序可以有效地共享数据,而不受数据类型和平台的限制。
XML的语法包括文档格式、元素、属性和实体等。
一、XML文档格式XML文档是一个标记文档,包含一个XML声明,一个根元素和其他元素。
XML声明用来声明文档的版本号、编码方式和其他信息。
根元素是文档的起始点,它可以包含其他元素和属性。
其他元素是根元素的子元素,可以包含其他元素和属性。
属性是元素的附加信息,可以用来描述元素的语义。
二、XML元素XML元素是文档的基本单位,用来描述数据。
元素可以包含子元素,也可以包含属性。
元素的起始标签和结束标签之间的内容是元素的内容。
元素的内容可以是文本、其他元素、属性或实体。
三、XML属性XML属性是元素的附加信息,可以用来描述元素的语义。
属性的值可以是字符串、数值、日期或其他类型的数据。
属性的名字应该使用驼峰命名法,即首字母小写,其余字母大写。
属性的值应该使用双引号括起来,以区分属性的名字和值。
四、XML实体XML实体是一个名称,可以用来表示一个完整的文本或其他数据。
实体可以用来替换XML中的文本或其他数据,以提高XML文档的可读性和可维护性。
五、XML语法错误XML文档的语法错误可能会导致XML解析器无法解析文档。
常见的XML语法错误包括:1. 缺少元素或属性的起始标签或结束标签。
2. 元素或属性的名字错误,或者名字不符合驼峰命名法。
3. 元素或属性的值不符合XML的语法规则,例如字符串值缺少引号或实体值缺少引号。
4. 属性的名字与元素的名字相同。
5. 文档格式不正确,例如缺少XML声明或根元素。
六、XML文档解析XML文档可以使用XML解析器解析,以获取文档的内容。
XML解析器可以使用SAX(Simple API for XML)或DOM(Document Object Model)等方式解析文档。
xml结构描述文件
xml结构描述文件XML(可扩展标记语言)是一种用于描述数据结构和数据的文本格式。
它具有易于阅读、易于编写和易于解析的特点,因此在许多领域得到了广泛的应用。
下面将详细介绍XML结构描述文件的相关知识。
1.XML结构简介XML是基于XML规范的一种树状结构。
它由一系列的元素组成,每个元素包括开始标签、结束标签和中间的内容。
XML文件由一个根元素开始,然后分为多个子元素,子元素也可以分为多个孙元素。
这种层次结构使得XML具有良好的可读性和易于理解。
2.XML的基本语法XML的基本语法包括以下几点:- 开始标签:每个元素都以开始标签表示,例如```<element>```。
- 结束标签:每个元素都以结束标签表示,例如```</element>```。
两个斜杠(```/```)表示结束标签。
- 空格:XML元素可以包含空格,以提高可读性。
- 注释:XML允许在元素中添加注释,以提供对代码的说明。
注释以```<!--```开始,以```-->```结束。
- CDATA段:CDATA段用于包含不解析的特殊字符,以避免XML解析器将其解析为标签或属性。
CDATA段以```<![CDATA[```开始,以```]]>```结束。
3.XML的应用场景XML广泛应用于以下场景:- 数据存储:XML文件可以用于存储结构化数据,便于数据的备份和传输。
- 数据交换:XML具有良好的可读性和易于解析性,可用于不同系统之间的数据交换。
- 配置文件:许多软件使用XML文件作为配置文件,以便于用户自定义设置。
- 文档编写:XML可应用于文档编写,如使用TEI(Text Encoding Initiative)规范对文本进行编码。
4.XML的优势与局限性XML的优势:- 结构清晰:XML采用树状结构,使数据层次关系一目了然。
- 易于阅读和编写:XML采用类似于HTML的语法,易于阅读和编写。
xml语言结构
xml语言结构
XML(可扩展标记语言)是一种标记语言,用于描述数据的结构和内容。
它使用一系列简单的标记来描述数据,这些标记可以告诉计算机数据的类型、含义和结构。
XML语言结构主要包括以下部分:
1.元素:XML文档由各种元素组成,每个元素都可以包含其他元素。
元素以起始标记开
始,以结束标记结束。
例如,<example>是一个元素,</example>是该元素的结束标记。
2.标记:标记是用来定义元素的关键字,例如<example>和</example>。
标记必须成对出现,
且必须有一个起始标记和一个结束标记。
3.属性:属性是元素的附加信息,它们由名称和值组成,并放在起始标记中。
例如,<example
attr="value">中,“attr”是属性名称,“value”是属性值。
4.文本内容:元素可以包含文本或其他元素,文本内容是XML文档中的实际数据。
5.命名空间:为了解决不同XML文档中可能存在的命名冲突问题,可以使用命名空间来
区分不同的元素和属性。
6.DTD(文档类型定义):DTD用来定义XML文档的结构和内容。
它提供了有关文档中
允许的内容和结构的规则。
7.XML Schema:XML Schema是另一种定义XML文档结构和内容的方式,它提供了更强
大和灵活的数据类型和验证机制。
总的来说,XML语言结构使得数据可以被标准化、组织和共享,被广泛应用于各种领域,如网页开发、数据交换、配置文件等。
第二章xml语法
Sunshine男 Sunshine男
主要内容
• XML文件结构 XML文件结构 • XML基本语法 XML基本语法 • 合格的XML文件 合格的XML文件 • 有效的XML文件 有效的XML文件
XML文件逻辑结构 XML文件逻辑结构
XML文件中要素的组织方式: XML文件中要素的组织方式: 文件中要素的组织方式 一个XML文件可 看作是由“ 一个XML文件可`看作是由“序 文件可` 言” 和“文件实体”、“尾部”组 文件实体” 尾部” 成。
• 一般常见的处理指令用来告诉处理程序
(通常是浏览器),将一个样式单和xml数 (通常是浏览器),将一个样式单和xml数 据关联起来,而且可以在指定的地方找到 样式单。
举例: 举例: <?xml- stylesheet type=“text/xsl” href=“d:\mystyle.xsl”?>
• standalone
standalone属性是可选的,如果值为yes说明所有 standalone属性是可选的,如果值为yes说明所有 必须的实体声明都包含在文档中,如果是no则说 必须的实体声明都包含在文档中,如果是no则说 明需要外部的DTD 明需要外部的DTD
处理指令(PI) 处理指令(PI)
• 处理指令(Process Instrument)是 处理指令( Instrument)
XML分析必须扫描的指令 XML分析必须扫描的指令 • PI含有应用程序所使用的标记信息 PI含有应用程序所使用的标记信息 • PI的命令格式以 PI的命令格式以 <? 处理指令名 处理指令信息?> 处理指令信息?> 其中处理指令名是必须部分,而且是有 其中处理指令名是必须部分, 效的xml名称 用于xml声明的处理指令名 名称。 效的xml名称。用于xml声明的处理指令名 xml。 是xml。
xml格式和语法
<title>The Power of Now</title> <author>Eckhart Tolle</author> <year>1997</year> </book> </bookstore> ``` 在这个示例中,`bookstore`是根元素,`book`是子元素,`category`是`book`元素的属 性,`title`、`author`和`year`是`book`元素的子元素,它们包含了书籍的相关信息。
xml格式和语法
XML(eXtensible Markup Language)是一种用于描述数据的标记语言。它使用标签来 标识数据的结构和含义,以便于数据的存储、传输和解析。XML的语法规则如下:
1. 标签:XML使用尖括号(< >)来定义标签,标签可以包含标签名和属性。标签名用于 标识数据的类型或名称,属性用于提供额外的描述或信息。
4. 文本内容:元素可以包含文本内容,表示数据的具体值或描述。文本内容放置在开始标 签和结束标签之间。
5. 注释:注释用于在XML文档中添加注释或解释信息。注释以<!--开头,以-->结尾。
6. 嵌套:XML允许元素嵌套,即一个元素可以包含其他元素。
xml格式和语法
7. 命名空间:命名空间用于区分不同来源或类型的XML元素。它通过为元素或属性添加 命名空间前缀来标识所属的命名空间。
下面是一个简单的XML示例: ```xml <bookstore>
<book category="fiction"> <title>The Great Gatsby</title> <author>F. Scott Fitzgerald</author> <year>1925</year>
xml 教程
xml 教程XML(可扩展标记语言)是一种常用的数据交换格式,被广泛应用于各种领域,特别是在互联网和Web服务中。
它的设计目标是提供一种简单且人类可读的标记语言,用于描述和交换结构化的数据。
本篇教程将为你介绍XML的基本概念、语法规则和应用场景,帮助你快速入门并掌握XML技术。
一、XML的基本概念1. 标记语言:XML是一种标记语言,它使用尖括号(< >)标记开始和结束元素,来定义数据的结构和属性。
2. 可扩展性:XML具有可扩展性,即你可以根据需要定义自己的标签和属性,无需受到固定标准的限制。
3. 结构化数据:XML是一种用于描述和交换结构化数据的语言,数据可以按照自定义的层次结构和关系进行组织。
二、XML的语法规则1. 声明:XML文档以声明(Declaration)开头,使用<?xml?>标记,用于指定XML版本和编码方式。
2. 标签(Element):XML文档由标签组成,标签可以嵌套和包含其他标签,用于表示数据的不同层次和关系。
3. 属性(Attribute):标签可以包含属性,属性包含在标签的开始标记中,用于提供关于标签的额外信息。
4. 内容:标签可以包含文本内容或其他标签,用于描述数据或表示数据间的关系。
5. 注释:XML文档可以包含注释(<!-- -->),用于给文档添加说明和注解。
6. 实体引用:某些字符在XML中具有特殊的意义,使用实体引用(Entity Reference)表示这些字符,如<表示小于号(<), >表示大于号(>)等。
三、XML的应用场景1. 数据交换:XML可以作为一种通用的数据交换格式,用于不同系统之间的数据传输和共享。
2. Web服务:XML用于描述和传输Web服务的请求和响应数据,如SOAP(Simple Object Access Protocol)和REST (Representational State Transfer)。
xml文本解析
xml文本解析此文档介绍了xml文本的解析技术,详细介绍了XML文本的结构和解析方法,以及一些软件工具对xml文本的解析方法。
一、XML文本结构1、XML文本由根元素(root element)和子元素(child element)组成。
每个元素都包含一个开始标记,一个结束标记,以及包含内容的文本节点(text node),并且可以包含属性标记(attribute)。
2、XML文本不区分大小写,所有的标记和属性名称都可以用大写或者小写表示。
3、XML文本的文档声明必须是第一行文本,格式如下:<?xml version='1.0' encoding='[字符集]'?>4、XML文档必须有一个根元素,所有元素都必须在根元素内。
5、XML文档中的所有元素必须有正确的结束标记。
6、XML文档中所有元素包含在开始标记和结束标记之间,且不能出现重叠。
7、XML文档中必须使用双引号来定义属性,且属性值必须使用双引号括起来。
二、XML文本解析方法1、DOM(Document Object Model)文档对象模型:DOM采用基于树型结构的模型,将XML文档转换为一颗树,DOM 会把XML文档分解成节点,然后以此为基础来解析XML文档。
2、SAX(Simple Api for XML):SAX采用事件驱动的模式,它把XML文档作为一个流来处理,只会一行一行的顺序读取XML文档,不会将XML文档以语法树的形式解析出来。
三、XML文档解析软件1、XmlSpy:XmlSpy是一款可视化的XML文档解析软件,它可以创建,解析,测试,打开,编辑,以及调试XML文档。
2、XmlPad:XmlPad是一款功能强大的XML文档解析软件,它拥有智能编辑、实时格式化、标准规范和折叠展开等功能,可以让用户更加轻松地进行XML文档的编辑。
3、XmlFox:XmlFox是一款支持XML文档的可视化编辑软件,它支持语法高亮显示,多种编码,可以同时编辑多个文件,可以轻松查看每个元素的结构等特性,从而让XML文档的编辑变得更加容易。
跟我学XML基本语法及文档结构应用示例
<?……?>表示该行是一条指令;<?后的XML表示该文件是一
个XML文件。其中:
version=1.0
表
示该文件遵循 XML1.0规范,它必 须在属性列表中排 在第一位 encoding=gb2312 表示该文件使用的 是gb2312字符集 standalone=yes 表示该文件未引用 其它外部的XML文 件
<?xml-stylesheet type=“text/xsl” href=“JavaXML.xsl”?> <!DOCTYPE RootTag SYSTEM “someDTDFile.dtd">
(3)XML文档声明部分的内容
<?xml version="1.0" encoding="gb2312" standalone="yes"?> 说明:
4 、 XML 和 HTML 的 标签的比较
5、XML技术的主要应用 (1)XML用于数据交换---内容与表现形式的分离 一个XML文档中几乎所有的内容都是数据和数据结构,它主 要用于传递数据;对数据的表现完全被剥离。
(2)XML用于通信---Web Service中的SOAP协议 因为XML数据不与任何类型的客户方栓在一起,所以它提供 了一种很容易在网络上传输的非常简单的数据表示方式。
跟我学XML基本语法及文档结构应用示例
跟我学XML基本语法及文档结构应用示例
在本讲您能了解如下知识点 XML技术概述及应用 XML文档的结构 Well-formed XML Valid XML
1、XML技术产生的背景 (1)Java技术的产生解决了跨平台的软件开发,但没有解 决如何实现跨平台的数据交换
XML入门简单易懂教程
XML入门简单易懂教程1.XML的基本概念2.XML的语法规则XML的语法规则非常简单,只需遵循以下几个基本规则:-XML文档必须包含一个根元素,并且所有的元素必须嵌套在根元素中。
-属性由名称和值组成,名称和值之间用等号连接,并且值必须使用引号或单引号括起来。
3.XML的实例下面是一个简单的XML实例,表示一本书的信息:```xml<book category="fiction"><title>Harry Potter</title><author>J.K. Rowling</author><year>2001</year><price>19.99</price></book>```4.嵌套元素XML允许元素嵌套,即一个元素可以包含另一个元素。
例如,下面是一个表示图书馆中多本书的XML示例:```xml<library><book><title>Harry Potter</title><author>J.K. Rowling</author><year>2001</year><price>19.99</price></book><book><title>The Lord of the Rings</title><author>J.R.R. Tolkien</author><year>1954</year><price>25.99</price></book></library>```在这个例子中,\<library>是根元素,它包含两个\<book>元素,每个\<book>元素表示一本书的信息。
xml语法格式
xml语法格式1.XML⽂档声明<?xml version="1.0" encoding="UTF-8"?>2.标记(元素/标签/节点)XML⽂档,由⽂个个的标记组成.语法:开始标记(开放标记): <标记名称>结束标记(闭合标记): </标记名称>标记名称: ⽂定义名称,必须遵循以下命名规则:1.名称可以含字母、数字以及其他的字符2.名称不能以数字或者标点符号开始3.名称不能以字符“xml”(或者 XML、Xml)开始4.名称不能包含空格,不能包含冒号(:)5.名称区分⽂⽂写标记内容: 开始标记与结束标记之间 ,是标记的内容.例如 ,我们通过标记, 描述⽂个⽂名:<name>李伟</name>3.⽂个XML⽂档中,必须有且且仅允许有⽂个根标记.正例:<names><name>张三</name><name>李四</name></names>反例:<name>李四</name><name>⽂⽂</name>4.标记可以嵌套, 但是不允许交叉.正例:<person><name>李四</name><age>18</age></person>反例:<person><name>李四<age></name> 18</age></person>5.标记的层级称呼(⽂标记,⽂标记,兄弟标记,后代标记,祖先标记)例如:<persons><person><name>李四</name><length>180cm</length></person><name>李四</name><length>200cm</length></person></persons>name是person的⽂标记.也是person的后代标记name是persons的后代标记.案例:语法进阶CDATA(了解)name是length的兄弟标记.person是name的⽂标记.persons是name的祖先标记.6.标记名称允许重复7.标记除了开始和结束,还有属性.标记中的属性, 在标记开始时描述, 由属性名和属性值组成.格式: 在开始标记中, 描述属性.可以包含0-n个属性, 每⽂个属性是⽂个键值对!属性名不允许重复 , 键与值之间使⽂等号连接, 多个属性之间使⽂空格分割.属性值必须被引号引住.属性值必须被引号引住.案例:<persons><person id="10001" groupid="1"><name>李四</name><age>18</age></person><person id="10002" groupid="1"><name>李四</name><age>20</age></person></persons>8.注释注释不能写在⽂档⽂档声明前注释不能嵌套注释格式:注释开始: <!--注释结束: -->9.CDATACDATA是不应该由XML解析器解析的⽂本数据。
xml文件语法
xml文件语法XML文件语法简介XML(eXtensible Markup Language)是一种可扩展的标记语言,用于描述数据的结构和内容。
XML文件由标签、属性和文本组成,具有自我描述性和可读性强的特点。
本文将介绍XML文件的基本语法和常见用法。
一、XML文件基本语法1. 声明部分:XML文件的第一行必须是声明部分,用于指定XML 版本和字符编码。
例如:```xml<?xml version="1.0" encoding="UTF-8"?>```2. 标签:XML文件使用标签来定义数据的结构和内容。
标签由尖括号包围,可以有起始标签和结束标签。
例如:```xml<book><title>XML入门指南</title><author>张三</author><price>29.99</price></book>```3. 属性:标签可以包含属性,用于提供关于元素的附加信息。
属性由名称和值组成,中间用等号连接。
例如:```xml<book category="编程"><title>XML入门指南</title><author>张三</author><price>29.99</price></book>```4. 文本:标签可以包含文本内容,用于表示数据的值。
例如:```xml<book><title>XML入门指南</title><author>张三</author><price>29.99</price></book>```二、XML文件常见用法1. 数据存储:XML文件可以用来存储和传输结构化数据。
xml格式讲解
xml格式讲解XML(eXtensible Markup Language)是一种用于描述和传输数据的标记语言。
它能够通过自定义标签来定义数据的结构和内容。
本文将对XML格式进行详细讲解。
一、XML的基本语法XML采用了类似于HTML的标签语法,但与HTML不同的是,XML标签必须自行定义,且对大小写敏感。
以下是XML的基本语法要点:1. 标签:XML使用尖括号(< >)来定义标签,标签通常成对出现,分为开始标签和结束标签。
例如:<book>...</book>2. 元素(Element):元素由开始标签、结束标签和标签内容组成。
例如:<name>John</name>3. 属性(Attribute):属性为元素提供更多的信息,通常出现在开始标签中。
例如:<book category="novel">...</book>4. 注释:注释用于添加对XML代码的说明,以"<!--"开头,以"-->"结尾。
例如:<!-- This is a comment -->二、XML的文档结构一个合法的XML文档必须包含一个根元素,并且所有的元素都必须严格嵌套。
以下是一个简单的XML文档示例:<?xml version="1.0" encoding="UTF-8"?><library><book><title>《Pride and Prejudice》</title><author>Jane Austen</author></book><book><title>《1984》</title><author>George Orwell</author></book></library>在上述示例中,根元素是"library",它包含了两个子元素"book",并且每个"book"元素分别包含了"title"和"author"元素。
XML入门教程
XML入门教程本教程将向初学者介绍XML的基础知识,包括语法、元素、属性、命名空间、文档类型定义等内容。
1.XML语法:XML使用尖括号(<>)来标记开始和结束,如<element>。
每个XML文档必须有一个根元素,所有其他元素必须嵌套在根元素内。
2.XML元素:XML文档由元素构成,元素由开始标记和结束标记包围,如<element>data</element>。
元素可以嵌套在其他元素中,形成层次结构。
3.XML属性:元素可以包含属性,属性用于为元素提供额外的信息。
属性由名称和值组成,如<element attribute="value">data</element>。
4.XML命名空间:XML命名空间用于解决元素和属性名称冲突的问题。
通过为元素和属性添加命名空间前缀,可以将其归属于特定的命名空间。
例如:<ns:element>。
5.XML文档类型定义(DTD):DTD定义了XML文档的结构和规则。
它可以定义允许的元素、元素顺序、元素类型、元素属性等。
DTD还可以定义实体和符号,用于表示特殊字符和文本片段。
6.XML解析和生成:XML解析是将XML文档解析为可供程序使用的数据结构的过程。
常用的XML解析技术包括DOM(文档对象模型)和SAX(简单API for XML)。
XML生成是将程序数据转换为XML文档的过程,可以使用XML库或编程语言提供的API来生成XML文档。
7.XML相关技术:XML还有许多相关技术,例如XSLT(可扩展样式表语言转换)、XPath(XML路径语言)、XQuery(XML查询语言)和XML Schema(XML模式定义语言)。
这些技术通过增强XML的功能和表达能力,使得XML在数据转换、数据查询和数据验证方面变得更加强大和灵活。
希望这个XML入门教程可以帮助初学者快速上手XML,了解XML的基础知识和相关技术。
xml 格式解析
xml 格式解析一、XML的基本概念XML是一种纯文本格式的标记语言,被设计用来传输和存储数据。
它通过使用标签来描述数据的结构和语义,实现了数据与平台无关的交互。
与HTML相比,XML不仅仅局限于描述显示效果,而是更注重数据的组织和含义。
二、XML的语法规则1. 标签:XML使用尖括号包围标签,标签通常成对出现,包括一个起始标签和一个结束标签。
例如:<book>...</book>。
2. 元素:在XML中,标签的内容称为元素,可以包含文本、属性和子元素。
元素的结构和层次关系决定了数据的组织形式。
3. 属性:元素可以包含属性,属性用于描述元素的额外信息。
属性由名称和值组成,例如:<book category="novel">...</book>。
4. 命名空间:XML支持使用命名空间来避免元素和属性名称的冲突,提高数据的可读性和灵活性。
5. 注释:XML中可以使用注释来对数据进行解释和说明,注释以<!--开头,以-->结尾。
三、XML的应用场景1. Web开发:XML在Web开发中被广泛应用,例如用于描述网页的内容结构、配置文件的格式、数据的传输和交换格式等。
2. 数据存储:XML可以作为一种数据存储格式,将结构化的数据以纯文本的方式进行存储,方便后续的数据检索和处理。
3. 数据传输:XML可以用于不同平台和系统之间的数据传输,通过将数据转换为XML格式,实现不同系统之间的数据共享和交互。
4. 数据库:XML可以用于描述和存储数据库中的数据结构,提供一种灵活的方式来管理和查询数据。
四、XML在Web开发中的应用1. XML与HTML:XML可以作为HTML的补充,用于描述数据的结构和语义。
通过将数据存储为XML格式,可以实现数据和样式的分离,提高网页的可维护性和可扩展性。
2. AJAX:XML在AJAX(Asynchronous JavaScript and XML)中扮演了重要的角色,用于实现异步数据交互。
xml 语法定义
xml 语法定义(原创版)目录1.XML 的概述2.XML 的语法定义3.XML 的基本结构4.XML 的元素和属性5.XML 的注释和 PI6.XML 的 DTD 和 XML Schema7.XML 的应用场景正文XML(可扩展标记语言)是一种用于描述数据结构的文本格式。
它源于 1998 年由万维网联盟(W3C)推出的标准。
XML 的设计目标是简化数据的共享和传输,使得不同的系统和平台之间能够方便地交换信息。
XML 的语法定义主要基于一系列规则,这些规则包括:1.文档类型声明(DTD):DTD 定义了 XML 文档的合法结构和元素。
每个 XML 文档都必须引用一个 DTD,以确保文档的正确性。
2.XML Schema:XML Schema 是 XML 的一种数据模型,它提供了比 DTD 更强大的描述能力。
XML Schema 基于 XML 语法,可以定义元素、属性、类型、组合和约束等。
XML 的基本结构包括以下几个部分:1.声明:声明部分包括文档类型声明(DTD)或 XML Schema,以及文档的编码方式和字符集。
2.元素:XML 文档由一系列嵌套的元素组成。
每个元素由一个开始标记、一个结束标记和中间的内容组成。
元素可以包含属性,以提供关于元素的附加信息。
3.注释:注释是 XML 文档中对某些内容的解释或描述,它以“<!--”开始,以“-->”结束。
4.PI(处理指令):PI 是 XML 文档中用于指示处理器如何处理文档的指令,它以“<?”开始,以“?>"结束。
XML 的应用场景非常广泛,包括数据交换、配置文件、数据存储和传输等。
由于其结构化、可扩展和可验证的特点,XML 已经成为许多行业和领域的标准数据格式。
总之,XML 的语法定义是其能够实现数据结构化和信息共享的关键。
XML文件结构和基本语法
XML⽂件结构和基本语法XML⽂件的结构性内容,包括节点关系以及属性内容等等。
元素是组成XML的最基本的单位,它由开始标记,属性和结束标记组成。
就是⼀个元素的例⼦,每个元素必须有⼀个元素名,元素可以若⼲个属性以及属性值。
xml⽂件和html⽂件⼀样,实际上是⼀个⽂本⽂件。
显然⼤家⽴刻就会明⽩,创建xml⽂件最普通的⼯具和html⼀样,就是“记事本”了。
⼀个xml⽂件的例⼦ 现在我们暂且使⽤“记事本”来创建我们的xml⽂件吧。
先看⼀个xml⽂件: 例1 〈?xml version="1.0" encoding="gb2312" ?〉 〈参考资料〉 〈书籍〉 〈名称〉xml⼊门精解〈/名称〉 〈作者〉张三〈/作者〉 〈价格货币单位="⼈民币"〉20.00〈/价格〉 〈/书籍〉 〈书籍〉 〈名称〉xml语法〈/名称〉 〈!--此书即将出版--〉 〈作者〉李四〈/作者〉 〈价格货币单位="⼈民币"〉18.00〈/价格〉 〈/书籍〉 〈/参考资料〉 —————————————————————— 这是⼀个典型的xml⽂件,编辑好后保存为⼀个以.xml为后缀的⽂件。
我们可以将此⽂件分为⽂件序⾔(prolog)和⽂件主体两个⼤的部分。
在此⽂件中的第⼀⾏即是⽂件序⾔。
该⾏是⼀个xml⽂件必须要声明的东西,⽽且也必须位于xml⽂件的第⼀⾏,它主要是告诉xml解析器如何⼯作。
其中,version是标明此xml⽂件所⽤的标准的版本号,必须要有;encoding 指明了此xml⽂件中所使⽤的字符类型,可以省略,在你省略此声明的时候,后⾯的字符码必须是unicode字符码(建议不要省略)。
⽂件的其余部分都是属于⽂件主体,xml⽂件的内容信息存放在此。
我们可以看到,⽂件主体是由开始的〈参考资料〉和结束的〈/参考资料〉控制标记组成,这个称为xml⽂件的“根元素”;〈书籍〉是作为直属于根元素下的“⼦元素”;在〈书籍〉下⼜有〈名称〉、〈作者〉、〈价格〉这些⼦元素。
XML的树结构与语法规则
XML的树结构与语法规则㈠概念什么是 XML?⑴XML 指可扩展标记语⾔(EXtensible Markup Language)⑵XML 是⼀种标记语⾔,很类似 HTML⑶XML 的设计宗旨是传输数据,⽽⾮显⽰数据⑷XML 标签没有被预定义,需要⾃⾏定义标签。
⑸XML 被设计为具有⾃我描述性。
⑹XML 是 W3C 的推荐标准㈡XML 与 HTML 的主要差异⑴XML 不是 HTML 的替代。
⑵XML 和 HTML 为不同的⽬的⽽设计。
⑶XML 被设计为传输和存储数据,其焦点是数据的内容。
⑷HTML 被设计⽤来显⽰数据,其焦点是数据的外观。
⑸HTML 旨在显⽰信息,⽽ XML 旨在传输信息。
XML 不会替代 HTML,XML 是对 HTML 的补充。
在⼤多数 web 应⽤程序中,XML ⽤于传输数据,⽽ HTML ⽤于格式化并显⽰数据。
对 XML 最好的描述是:XML 是独⽴于软件和硬件的信息传输⼯具。
㈢XML 的⽤途⑴XML 应⽤于 web 开发的许多⽅⾯,常⽤于简化数据的存储和共享。
⑵XML 把数据从 HTML 分离:通过 XML,数据能够存储在独⽴的 XML ⽂件中。
这样你就可以专注于使⽤ HTML 进⾏布局和显⽰,并确保修改底层数据不再需要对 HTML 进⾏任何的改变。
⑶XML 简化数据共享:计算机系统和数据使⽤不兼容的格式来存储数据。
XML 数据以纯⽂本格式进⾏存储,因此提供了⼀种独⽴于软件和硬件的数据存储⽅法。
㈣XML 树结构⑴XML ⽂档必须包含根元素。
该元素是所有其他元素的⽗元素。
⑵XML ⽂档中的元素形成了⼀棵⽂档树。
这棵树从根部开始,并扩展到树的最底端。
⑶所有元素均可拥有⼦元素。
⑷⽗、⼦以及同胞等术语⽤于描述元素之间的关系。
⽗元素拥有⼦元素。
相同层级上的⼦元素成为同胞(兄弟或姐妹)。
⑸所有元素均可拥有⽂本内容和属性(类似 HTML 中)。
㈤XML 语法规则⑴所有 XML 元素都没有关闭标签。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
XML入门精解之结构与语法■创建XML文件的工具XML文件和HTML文件一样,实际上是一个文本文件。
显然大家立刻就会明白,创建XML文件最普通的工具和HTML一样,就是“记事本”了。
除了“记事本”之外,当然还有一些更加方便的工具,如XML Notepad、XML Pro、CLIP!XML Editor等,这些工具的一大特点是:能够检查你所建立的XML文件是否符合XML规范。
不过,现在这些工具都只有英文版的,并且需要付费使用。
当然,你仍然能够使用FrontPage、DreamWeaver等工具,不过使用起来不是很方便。
随着XML的逐渐普及,相信在不久后,也会出现非常好用的创建XML文件的工具。
■一个XML文件的例子现在我们暂且使用“记事本”来创建我们的XML文件吧。
先看一个XML文件:例1——————————————————————〈?xml version="1.0" encoding="gb2312" ?〉〈参考资料〉〈书籍〉〈名称〉XML入门精解〈/名称〉〈作者〉张三〈/作者〉〈价格货币单位="人民币"〉20.00〈/价格〉〈/书籍〉〈书籍〉〈名称〉XML语法〈/名称〉〈!--此书即将出版--〉〈作者〉李四〈/作者〉〈价格货币单位="人民币"〉18.00〈/价格〉〈/书籍〉〈/参考资料〉——————————————————————这是一个典型的XML文件,编辑好后保存为一个以.xml为后缀的文件。
我们可以将此文件分为文件序言(Prolog)和文件主体两个大的部分。
在此文件中的第一行即是文件序言。
该行是一个XML文件必须要声明的东西,而且也必须位于XML文件的第一行,它主要是告诉XML解析器如何工作。
其中,version是标明此XML文件所用的标准的版本号,必须要有;encoding指明了此XML文件中所使用的字符类型,可以省略,在你省略此声明的时候,后面的字符码必须是Unicode字符码(建议不要省略)。
因为我们在这个例子中使用的是GB2312字符码,所以encoding这个声明也不能省略。
在文件序言部分还有一些声明语句,我们在后面给予介绍。
文件的其余部分都是属于文件主体,XML文件的内容信息存放在此。
我们可以看到,文件主体是由开始的〈参考资料〉和结束的〈/参考资料〉控制标记组成,这个称为XML文件的“根元素”;〈书籍〉是作为直属于根元素下的“子元素”;在〈书籍〉下又有〈名称〉、〈作者〉、〈价格〉这些子元素。
货币单位是〈价格〉元素中的一个“属性”,“人民币”则是“属性值”。
〈!--此书即将出版--〉这一句同HTML一样,是注释,在XML文件里,注释部分是放在“〈!--”与“--〉”标记之间的部分。
大家可以看到,XML文件是相当简单的。
同HTML一样,XML文件也是由一系列的标记组成,不过,XML文件中的标记是我们自定义的标记,具有明确的含义,我们可以对标记中的内容的含义作出说明。
■XML文件的语法对XML文件有了初步的印象之后,我们就来详细地谈一谈XML文件的语法。
在讲语法之前,我们必须要了解一个重要的概念,就是XML解析器(XML Parse)。
1.XML解析器解析器的主要功能就是检查XML文件是否有结构上的错误,剥离XML文件中的标记,读出正确的内容,以交给下一步的应用程序处理。
XML是一种用来结构化文件信息的标记语言,XML规范中对于如何标记文件的结构性有一个详细的法则,解析器就是根据这些法则写出来的软件(多用Java写成)。
同HTML一样,在浏览器中,必须有HTML的解析器,这样浏览器才能够“读懂”各种用HTML标记所组成的网页,将它们显示在我们面前。
如果有浏览器的HTML解析器读不懂的标记,将会返回给我们错误信息。
由于现在的HTML标记实际上相当混乱,存在大量不规范的标记(有的网页用IE能正常显示,而用Netscape Navigator则不行),所以从一开始,XML的设计者就严格规定了XML的语法和结构,我们编写的XML文件必须遵循这些规定,否则XML解析器将毫不留情地给你显示错误信息。
有两种XML文件,一种是Well-Formed XML文件,一种是Validating XML文件。
如果一个XML文件满足XML规范中的某些相关法则,且没有使用DTD(文件格式定义——后详述)时,可称这份文件是Well-Formed。
而如果一个XML文件是Well-Formed,且正确地使用了DTD,DTD中的语法又是正确的,那么这个文件就是Validating。
对应两种XML文件,有两种XML解析器,一种是Well-Formed 解析器,一种是Validating解析器。
IE 5中就内含Validating解析器,Validating解析器也可用来解析Well-Formed XML文件。
检查它是否满足了Well-Formed的条件。
我们可以将刚才编辑的第一个XML 文件用IE 5以上版本的浏览器打开。
大家可能要问为什么在浏览器中的显示和我的源文件一样?没错,因为对于XML文件,我们仅仅关心它的内容,而它的显示形式是交给CSS或XSL来完成的。
这里,我们并没有给这个XML文件定义它的CSS或XSL文件,所以它按照原来的形式来显示。
实际上,对于电子数据交换,仅仅需要一个XML文件即可,如果要将它以某种形式显示出来,我们就必须编辑CSS或XSL文件(这个问题会在以后讨论)。
2.Well-Formed的XML文件我们知道,XML必须是Well-Formed的,才能够被解析器正确地解析出来,显示在浏览器中。
那么什么是Well-Formed的XML文件呢?主要有下面几个准则,我们在创建XML 文件的时候,必须满足它们。
首先,XML文件的第一行必须是声明该文件是XML文件以及它所使用的XML规范版本。
在文件的前面不能够有其它元素或者注释。
第二,在XML文件中有且只能够有一个根元素。
我们的第一个例子中,〈参考资料〉... 〈/参考资料〉就是此XML文件的根元素。
第三,在XML文件中的标记必须正确地关闭,也就是说,在XML文件中,控制标记必须有与之对应的结束标记。
如:〈名称〉标记必须有对应的〈/名称〉结束标记,不像HTML,某些标记的结束标记可有可无。
如果在XML文件中遇到自成一个单元的标记,就是类似于HTML 中的〈img src=.....〉的这些没有结束标记的时候,XML把它称为“空元素”,必须用这样的写法:〈空元素名/〉,如果元素中含有属性时写法则为:〈空元素名属性名=“属性值”/〉。
第四,标记之间不得交叉。
在以前的HTML文件中,可以这样写:〈B〉〈H〉XXXXXXX〈/B〉〈/H〉,〈B〉和〈H〉标记之间有相互重叠的区域,而在XML中,是严格禁止这样标记交错的写法,标记必须以规则性的次序来出现。
第五,属性值必须要用“ ”号括起来。
如第一个例子中的“1.0”、“gb2312”、“人民币”。
都是用“ ”号括起来了的,不能漏掉。
第六,控制标记、指令和属性名称等英文要区分大小写。
与HTML不同的是,在HTML〈Name〉这样的标记是不同的。
第七,我们知道,在HTML文件中,如果我们要浏览器原封不动地将我们所输入的东西显示出来,可以将这些东西放到〈pre〉〈/pre〉或者〈xmp〉〈/xmp〉标记中间。
这对于我们创建HTML教学的网页是必不可少的,因为网页中要显示HTML的源代码。
而在XML 中,要实现这样的功能,就必须使用CDATA标记。
在CDATA标记中的信息被解析器原封不动地传给应用程序,并且不解析该段信息中的任何控制标记。
CDATA区域是由:“〈![CDATA[”为开始标记,以“]]〉”为结束标记。
例如:例2中的源码,除了“〈![CDATA[”和“]]〉”符号,其余的内容解析器将原封不动地交给下游的应用程序,即使CDATA区域中的开始和结尾的空白以及换行字符等,都同样会被转交(注意CDATA是大写的字符)。
例2〈![CDATA[飞翔的xml〉〉〉〉〉,:-)oooo〈〈〈〈〈〈〈]]〉第八,XML处理空白字符和HTML不一样。
HTML标准规定,不管有多少个空白,都当作一个空白来处理;而在XML中规定,所有标记以外的空白,解析器都要忠实地交给下游的应用程序处理。
这样,我们有时必须摒弃编写HTML文件时的缩排习惯,因为缩排的空格,解析器也要处理。
如:〈作者〉张三〈/作者〉和〈作者〉张三〈/作者〉上述内容对于解析器来说是不同的(后者在〈作者〉〈/作者〉标记之内除了张三这个字符以外,还包括两个换行记号以及“张三”前的文字缩排符号)。
所以解析器在去掉标记后将信息传给应用程序将有不同的处理结果。
如果我们想明确地告诉XML程序,标记中的空白有明确的含义,不要随便去掉(如在一些诗中,空格有它具体的意义),则可在标记中加入一个XML内置的属性——xml:space 。
如(注意属性名称和值的大小写):〈诗歌xml:space="preserver"〉祖国啊!祖国!我的祖国!〈/诗歌〉另外,在XML文件中,如果要用到表1的特殊字符,必须用相应符号代替。
表1 特殊字符替代符号&& &< ⁢> >" "' '在此做个小结:符合上述规定的XML文件就是Well-Formed的XML文件。
这是编写XML文件的最基本要求。
可以看到XML文件的语法规定比HTML要严格多了。
由于有这样的严格规定,软件工程师编写XML的解析器就容易多了,不像编写HTML语言的解析器,必须费尽心思去适应不同的网页写法,提高自己浏览器的适应能力。
实际上,这对于我们初学者来说,也是一件好事。
该怎样就怎样,不必像原来那样去疑惑各种HTML的写法。
我们看到,在XML文件中,用的大多都是自定义的标记。
但是大家考虑一下,如果两品的价格信息,而B公司可能用〈售价〉来表示价格信息。
如果一个XML应用程序来读取他们各自的XML文件中的信息时,如果它只知道〈价格〉标记里表示的是价格信息,那么B公司的价格信息就读不出来,必将产生错误。
显然,对于想利用XML文件来交换信息的实体来说,他们之间必须有一个约定——即编写XML文件可以用哪些标记,母元素中能够包括哪些子元素,各个元素出现的顺序,元素中的属性怎样定义等。
这样他们在用XML交换数据时才能够畅通无阻。
这种约定称为DTD(Document Type Definition,文档格式定义)。
可以把DTD看作编写XML文件的模板。
对于同行业之间的XML数据交换,有一个固定的DTD将会方便很多。