xml教程_microsoft 精简
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
<?处理指示名 处理指示信息 ?>
例:<?xml-stylesheet type="text/xsl" href="mystyle.xsl"?> 该处理指令来指定与XML文件配套使用的样式单的类型及文件名。
元素
• 在xml中元素由开始标签,元素内容和结束标签构成,对于空元素,由空 元素标签构成。 • 每一个元素有一个用名字标识的类型,同时它可以有一个属性说明集,每 一个属性说明有一个名字和一个值。 • 在给元素命名的时候要遵守下列规范: • 1 名称只能以字母,下划线或者冒号开头(尽可能不使用冒号,冒号在名 称空间中被用于分隔名称空间前缀和本地部分) • 2 名称中可以包含字母,数字,下划线以及其他在xml标准中允许的字符
• 3 名称中不能包含空格
元素的四种表示形式
• • • • • • • • • • • • • • 空元素 <employer/> 带有属性的空元素 <employer name="zhangsan" age="20"/> 带有内容的元素 <employer> 职工信息 <name>zhangsan</name> <age>20</age> <employer/> 带有内容和属性的元素 <employer name="zhangsan"> <age>20</age> </employer>
属性是一个元素的开始标记中的名称-值对。一个元素可有 多个属性。
<标记名 (属性名=“属性取值”)* >
XML 文档中的属性有两个规则: 属性必须有值 那些值必须用引号括起
属性必须有用引号括起的值
CDATA段
CDATA :在XML文档中使用特殊实体,有时会降低其可读性。 XML提供了一个特殊的标记 CDATA。在此标记下,所有 的标记、 XML的保留字都被忽略,而被XML处理程序当 作字符数据看待。
实体
实体定义 <?xml version="1.0" encoding="gb2312" ?> <!DOCTYPE 联系人列表 [ <!ENTITY A公司地址 "北京市五街1234号"> <!ENTITY B公司地址 "上海南京路9876号"> ]> <联系人列表> <联系人> <姓名>张三</姓名> <公司>A公司</公司> <地址>&A公司地址;</地址> </联系人> <联系人> <姓名>李四</姓名> <公司>B公司</公司> <地址>&B公司地址;</地址> </联系人> <联系人> <姓名>王五</姓名> <公司>B公司</公司> <地址>&B公司地址;</地址> </联系人> </联系人列表>
格式良好的XML文档可以保证文档的结构清晰、完整,减轻XML应用程 序的负担。而有效的XML文档又可以根据不同的应用领域对标 记集和文档结构进行约束,并以此验证文档内容的有效性。
cdcatalog
检查和验证XML文档的最简单的方法之一是用 IE XML TOOLS 打开要 验证的XML文档。 可以从下面的网站下载 IE 的 XML 有效性验证工具∶ http://www.microsoft.com/xml
7
xml和html的不同
比较内容 可扩展性 侧重点 语法要求 可读性及可维护性 不具有扩展性 侧重于如何表现信息 不要求标记的嵌套、配对等,不要 求标记之间具有一定的顺序 难于阅读、维护 HTML XML 是元标记语言,可用于定义新的标 记语言 侧重于如何结构化地描述信息 严格要求嵌套、配对,和遵循DTD 的树形结构 结构清晰,便于阅读、维护
Editplus
Xml语法
Xml的组成
• 文档由文档声明,文档类型声明, 注释,字符引用和处理指令,元素组成, 所有这些都是通过显式的标记(markup)来指明的。 • xml标记包括开始标签,结束标签,空元素标签,实体引用,字符引用, 注释,CDATA段定界符,文档类型声明,处理指令,xml声明以及任何在 文档实体顶层的空白(文档元素(根元素)乊外,且丌在任何标记乊内的)。 其他所有非标记的文本组成文档的字符数据。
1984年国际标准化组织(iso)开始对此提案迚行认论,并亍1986年正式发
布了为生成标准化文档而定义的标记语言标准(ISO8879),成为新的语言 sgml,即标准通用标记语言. Sgml功能非常强大,是定义标记语言的元语言.
Xml的产生
1998年2月,w3c发布了xml1.0标准,其目的是为了在web
Xml声明
•
• xml文档总是以一个xml声明开始,格式如下:
<?xml 版本信息[编码信息][文档独立性信息]?>
版本信息(version) 这个属性指明所采用的XML的版本号。它必须在属性列表中排在第一位,通常为1.0。 编码信息(encoding) 这个属性表明该XML文件的字符编码。常见的有: 简体中文码:GB2312 繁体中文码:BIG5 Unicode字符:UTF-8 文档独立性信息(standalone) 这个属性表明该XML文件是否和一个独立的标记声明文件配套使用。 yes为没有,no为 有(也可能没有)。
注释
• 与HTML一样,XML的注释以 <!-- 开始,以 --> 结束。注释可以出现在文档 的任何位置,但不要把注释文本放在文档的第一行或标记之中。注释也不 能被嵌套。注释内的任何标记都被忽略。 • <!-- 一个注释 -->
处理指令
处理指令: 处理指令(Process Instruction, 简称 PI)是用来给处理XML文件的应 用程序提供信息的。处理指令应该遵循下面的格式:
把置标语言分为元置标语言和实例置标语言的话,SGML和XML都是元置标
语言,而HTML和由XML派生的XHTML都是实例置标语言。
xml和html的不同
• • • • • • • • • • • • • • • • • • • • • • • • • <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>春晓</title> </head> <body> <center> <h2> <font color="blue">春晓</font></h2> <b>作者:孟浩然</b><hr style="color: Red" /> <p> <b><i><font size="3" color="green">春眠不觉晓,处处闻啼鸟.夜来风雨声,花落知多少.</font></i></b></p> </center> </body> </html> <?xml version="1.0" encoding="UTF-8"?> <诗> <诗名>春晓</诗名> <作者>孟</作者> <内容> <行>春眠不觉晓</行> <行>处处闻啼鸟</行> <行>夜来风雨声</行> <行>花落知多少</行> </内容> </诗>
Xml简明教程
江西微软技术中心 2011-08
Xml概述
什么叫sgml?
在80年代早期,ibm提出在各文档乊间共享一些相似的属性,例如字体大
小和版面.ibm设计了一种文档系统,通过在文挡中添加标记,来标识文档
中的各种元素,ibm把这种标识语言叫做通用标记语言,即generallized markup language(gml).
实体声明: <!ENTITY 实体名 “文本内容”> 实体引用:&实体名; 其实,特殊实体就是一种内部
预定义的实体.
格式良好的XML文档
在编写XML文档时必须严格遵守XML的基本规定。这样的XML文档被称 为格式良好的XML文档。格式良好的XML文档应该满足以下几个 主要条件:
5
Sgml,html,xml乊间的关系
HTML是SGML的一个实例,它的DTD作为标准被固定下来,因此,HTML
不能作为定义其它置标语言的元语言。XML是SGML的一个子集,严格地讲
,XML也还是SGML。与HTML不同的是,XML有DTD,因而也可以象
SGML那样,作为元语言,来定义其它文件系统,或称其它置标语言。如果
读xml的几种方法
1:使用XML控件
2:使用DOM技术 3:使用DataSet对象
4:文本方式读取
使用XML控件
使用DOM技术
使用XmlDocument是一种基于文档结构模型的方式 来读取XML文件.在XML文件中,我们可以把XML看作 是由文档声明(Declare),元素(Element),属性 (Attribute),文本(Text)等构成的一个树.最开始的一个 结点叫作根结点,每个结点都可以有自己的子结点. 得到一个结点后,可以通过一系列属性或方法得到这 个结点的值或其它的一些属性
Xml文件的读写
Xml文件读取模式
在程序中访问进而操作XML文件一般有两种模型,分别是 使用DOM(文档对象模型)和流模型,使用DOM的好处 在于它允许编辑和更新XML文档,可以随机访问文档中的 数据,可以使用XPath查询,但是,DOM的缺点在于它需 要一次性的加载整个文档到内存中,对于大型的文档,这 会造成资源问题。流模型很好的解决了这个问题,因为它 对XML文件的访问采用的是流的概念,也就是说,任何时 候在内存中只有当前节点,但它也有它的不足,它是只读 的,仅向前的,不能在文档中执行向后导航操作。
上能以现有的超文本标记语言(html)的使用方式提供,接
收和处理通用的sgml .xml是sgml的一个简化子集,它以
一种开方的,自我描述的方式定义了数据结构.在描述数据
内容的同时能突出对结构的描述,从而体现出数据于数据
之间的关系.
什么叫xml
XML,既可扩展标记语言,是一种你可以按一定的规则来创建和组织自己的 标记和数据的标记语言。 XML = eXtensible Markup Language 具体地讲: • XML是可扩展的标记语言; • XML在风格上类似HTML语言; • XML是用来对数据进行描述的语言; • XML中的标记需要你自己去定义,而不是预先定义的; • XML中用 DTD 或 XML Schema 来对数据进行描述; • 带 DTD 或 XML Schema 的 XML 具有自描述性。
文档必须包含一个或多个元素; 文档中只存在一个根元素;
元素必须正确关闭;
元素间不得交叉重叠; 元素中的属性名不能重复;
属性值必须加引号。
有效的xml文档
一个XML文档被称为有效的XML文档,首先它必须是格式良好的,并且 还要对标记集和文档结构进行约束。这种约束是通过DTD或XML Schema来进行的。
元素内容的构成
• 元素的内容可以包含子元素,字符数据,字符引用和实体引用,CDATA段。 • 字符数据不能有<,&,]]>
字符 < > “ ‘ &
字符引用十进制 < > " ' &
预定义实体引用 < > " ' &
属性
Xml文档类型声明
• dtd(document type definition),文档类型定义。 • xml从sgml集成了用于定义语法规则的dtd机制,但dtd本身并不要求遵循 xml规则,几乎所有的xml应用都是使用dtd来定义的。html就有一个标准的 dtd文件,所以其组织结构和所有的标签都是固定的。dtd文件也是一个文 本文件,通常以.dtd作为其扩展名。 • 通过文档类型声明,指出xml文档所用的dtd.文档类型声明有两种形式。一 种是声明dtd在一个外部的文件中,另外一种是直接在xml文档中给出dtd.
数据和显示的关系
保值性 编辑及浏览工具
内容描述与显示方式整合为一体
不具有保值性 已有大量的编辑、浏览工具
内容描述与显示方式相分离
具有保值性 编辑、浏览工具尚不成熟
Xml编辑工具
XMLwriter
XML Spy
Stylus Studio
Visual XML
பைடு நூலகம்
Microsoft XML Notepad
Xray
CDATA的形式是:〈![CDATA[文本内容]]〉
实体
实体:是XML中用来指代其它复杂结构的机制。一个简单的实体可以代表一大 段文本内容。 实体声明:实体的声明应该放在XML声明之后,XML根元素之前。这样一来, XML文件就变为下面的形式: <?xml version=“1.0”?> <!DOCTYPE 文件根元素名 [ 实体声明部分 ]> <文件根元素名> 具体数据内容 </文件根元素名>