XML概述
处理XML数据
24.1 XML概述
• XML是一种由国际标准化组织创建的基于互联网的 标记语言,它的许多先进特性决定了它被各类行 业广泛的使用。本节就XML及其基本特性做一介绍。
24.1.1 理解XML
• XML是Extensible Markup Language的缩写,即可 扩展标记语言,它是一种用户可以用来创建自己 的标记的标记语言。它由万维网协会(W3C)创建, 用来克服HTML(即超文本标记语言)的局限。和 HTML一样,XML基于SGML―标准通用标记语言 (Standard Generalized Markup Language)。
24.1.2 XML的特性
• XML继承了SGML的许多特性。 • (1)可扩展性。(2)灵活性。(3)自描述性。 (4)简明性。
24.1.3 SQL Server 2005数据库对xml的 支持
• SQL Server对XML的支持已集成到SQL Server 2005数据库产品的所有组件中,这种支持主要体 现在以下几个方面。 • 支持xml数据类型。 • 可以针对xml类型的列和变量中存储的XML数据使 用XQuery查询。 • 增强了OPENROWSET以允许批量加载XML数据。 • 增强了FOR XML子句和OPENXML函数的功能。
24.2.2 使用OPENXML
• OPENXML可以理解为FOR XML的逆向操作,用户可 以使用函数OPENXML解析XML文档并以行集的形式 表示数据。若要使用OPENXML编写对XML文档执行 的查询,必须先调用sp_xml_preparedocument存 储过程。它将分析XML文档并向准备使用的“已分 析文档”返回一个句柄。“已分析文档”以文档 对象模型(DOM)树的形式说明XML文档中的各种 节点。该文档通过内存句柄传递给OPENXML。然后 OPENXML根据传递给它的参数提供一个该文档的行 集视图,(具体内容请参照书。)
XML与数据库概述
XML与数据库概述XML(eXtensible Markup Language)是一种用于描述数据的标记语言,它使用可扩展的标记来定义数据的结构和内容。
XML广泛应用于数据存储和数据交换的场景中。
而数据库是一种用于管理数据的系统,它提供数据的存储、检索、更新和删除等功能,使得数据更容易访问和管理。
数据库是一个可持久化存储的数据集合,用于在不同的应用程序之间共享和管理数据。
数据库以表的形式组织数据,表由行和列组成,支持复杂的查询和事务处理。
数据库具有高效的数据检索和更新能力,可以大大提高数据的访问效率。
此外,数据库还提供了数据完整性和安全性的机制,可以确保数据的有效性和保密性。
在实际应用中,XML和数据库往往用于不同的场景和目的。
XML适用于以下情况:1.数据交换:XML可以作为一种通用的数据交换格式,在不同的系统和平台间传递和共享数据。
例如,两个企业之间的数据交换可以采用XML格式,以确保数据的一致性和互操作性。
2.配置文件:XML通常用于定义应用程序的配置文件,例如网站的配置信息、服务器的配置参数等。
通过使用XML,可以将配置信息以易读易懂的方式存储和管理。
3.文档存储:对于具有复杂结构的文档,如科技论文、技术规范等,XML能够准确地描述其层次结构和内容,便于存储和检索。
4. 数据描述:XML可以作为元数据的一种表示形式,用于描述数据的结构和语义。
例如,可以使用XML Schema(一种XML的模式语言)定义数据的结构,并对数据进行验证和约束。
而数据库适用于以下情况:1.数据持久化:数据库是数据的持久化存储介质,可以长期保存数据,确保数据的可靠性和一致性。
2.大规模数据处理:对于大规模数据的存储和分析,数据库具有高效的查询和处理能力,能够提高数据的处理效率。
3.数据共享和协作:数据库可以提供多用户的并发访问和协同工作机制,支持多个用户同时访问和修改数据。
4.数据一致性和完整性:数据库支持事务处理,能够确保数据的一致性和完整性。
1 XML概述PPT课件
一、X M L 二、X M L文档的组成部分(XML语法)
一、X M L简介
基本内容
XML是什么?
eXtensible Markup Language:可扩展置标语言。
什么是置标语言 是一种用来给文本添加标记的语言。如HTML
语言。XML同样是一种置标语言。
如HTML中:<CENTER> TEXT </CENTER>。 该标记用于使“TEXT”显示时居中。
基于XML的其它置标语言
5、面向电子商务的置标语言
cXML: Commerce XML
Common eBussiness language
tpaML: Electronic Trading-Partner Agreement for Electronic
xCBL :Common Business Library
<html xmlns="> <head> <title>第一个XHTML文档</title> </head> <body> <p>欢迎访问 <a href="">XML中国论坛</a>。 </p> </body>
</html>
基于XML的其它置标语言
2、MathML(数学置标语言)
MathML专门用于描述数学符号和公式的语言。从表现形式和语意 两个不同的角度定义了两大类标记。
XML是一种严格语法的元语言 元语言:XML没有预定义的标记集。
XML的优势一
XML打破了标记定义的垄断。
XML不规定预定义的标签。任何个人或机构都可以定 义自己的标记集。
XML技术概述
在上面讨论了XML和HTML的区别,得知XML使用标记来描述结构化的数据,而HTML则定义了一组显示数据的机制(标记)。XML的特点和功能如下所示。
定义专业领域的标记语言以前一些专业领域的信息是无法用一般的标记语言来描述的。现在,可以使用XML制定该专业的标记语言来表达。例如,CML(Chemical Markup Language)就是使用XML制定的描述化学专业的语言。
如果上面的代码是XML文档,那么其中的标记就不具有任何含义,其内容仅是说明以下内容。
有一个名为<table>的标记,在这个标记里面包含了一些文本。
有一个名为<tr>的标记;的标记,在这个标记里包含了一些文本。
如果把以上代码作为一个XML文件(文件的扩展名为.xml)在浏览器打开,可以看到其结果如图6-2所示。从图6-2中可以看出,IE解析该XML文档并将其显示出来。需要注意的是,IE并没有对这个XML文档进行任何处理,仅是显示文档。同样,浏览器也知道如何解析XML文档。由于XML标记不定义格式,所以文档不会得到格式,于是原样显示这些标记。
1.XML的定义
XML是互联网联盟W3C(World Wide Web Consortium)创建的一组规范,以便于软件开发人员和用户在网页上组织信息,其目的不仅在于满足不断增长的网络应用需要,同时还希望借此确保在通过网络进行交互作用时,具有良好的可靠性和互操作性。
与HTML一样,XML也源于SGML,它保留了SGML的大部分特性。尽管如此,XML却有着HTML语言所欠缺的丰富的可伸缩性与灵活性。XML不再像HTML一样有着一成不变的固定标记。XML实际上是一种定义语言,即我们可以定义无限的标记来描述文件中的任何数据元素,从而突破了HTML固定标记集合的结束,使文件的内容更丰富、更复杂并组成一个信息结构。
简单xml文件示例
简单xml文件示例摘要:1.XML 文件的概述2.XML 文件的结构3.XML 文件的元素和属性4.XML 文件的注释5.XML 文件的编码6.XML 文件的应用正文:1.XML 文件的概述XML(可扩展标记语言)是一种用于存储和传输数据的标记语言。
它由万维网联盟(W3C)于1998 年推出,被广泛应用于各种场景,如配置文件、数据交换和网页设计等。
XML 文件是由一系列的元素、属性、注释和编码组成的。
2.XML 文件的结构一个XML 文件的基本结构如下:```<?xml version="1.0" encoding="UTF-8"?><根元素><子元素1><!-- 注释1 --><子元素2><!-- 注释2 --></子元素2></子元素1><!-- 注释3 --></根元素>```其中,`<?xml version="1.0" encoding="UTF-8"?>`是XML 文件的声明,指定了XML 文件的版本和编码。
`<根元素>`表示XML 文件的根元素,所有的子元素都包含在根元素内部。
3.XML 文件的元素和属性XML 文件中的元素由尖括号(`<`)包围,如`<根元素>`。
元素可以包含子元素和属性。
属性是元素的特性,由“属性名=属性值”的形式表示,如`<子元素1 attr1="值1" attr2="值2">`。
4.XML 文件的注释XML 文件中的注释以`<!--`开始,以`-->`结束,如`<!-- 注释1 -->`。
注释不会被解析器解析,对文档的结构和内容没有影响,主要用于对文档的描述和解释。
xml exi 编码
xml exi 编码(实用版)目录1.XML 和 EXI 编码的概述2.XML 的基本结构和语法规则3.EXI 编码的定义和特点4.XML 与 EXI 编码的比较5.XML 和 EXI 编码的应用场景正文1.XML 和 EXI 编码的概述XML(可扩展标记语言)是一种用于描述数据结构和数据交换的文本格式。
它源于 1998 年由万维网联盟(W3C)推出的标准。
XML 的设计目标是简化数据的共享和传输,使得不同的系统和平台之间能够方便地交换信息。
EXI(XML Encoding Initiative)编码是一种用于表示 XML 文档的编码方式。
它采用二进制格式来表示 XML 文档,使得 XML 数据在存储和传输过程中更加紧凑和效率。
EXI 编码是基于 ISO/IEC 14496-3:2002 标准制定的,该标准是针对 XML 文档进行编码和压缩的一种国际标准。
2.XML 的基本结构和语法规则XML 文档的基本结构包括文档类型声明(DTD)、XML 声明、正文部分(包含根元素和子元素)以及可选的 processing instruction(处理指令)。
XML 的语法规则包括以下几点:- 文档必须有一个根元素,即包含在<根元素>标签中的元素。
- 元素可以包含属性,属性以"属性名=属性值"的格式表示。
- 元素可以包含子元素,子元素用<子元素>标签表示。
- 文档中必须有一个且仅有一个根元素。
- 所有的元素必须有一个关闭标签,即以</元素>结尾。
3.EXI 编码的定义和特点EXI 编码是一种用于表示 XML 文档的二进制编码方式。
它将 XML 文档转换成一种紧凑的二进制格式,以提高存储和传输效率。
EXI 编码的主要特点如下:- 紧凑性:EXI 编码采用二进制格式表示 XML 数据,相比文本格式,其存储空间和传输带宽需求更小。
- 可扩展性:EXI 编码支持对 XML 文档进行压缩,以减小数据量。
xml将字符串转换为数字的方法
xml将字符串转换为数字的方法(原创版3篇)目录(篇1)1.XML 简介2.字符串转换为数字的背景和需求3.XML 中字符串转换为数字的方法4.实例解析5.总结正文(篇1)1.XML 简介XML(eXtensible Markup Language,可扩展标记语言)是一种用于描述数据结构的文本格式。
它源于 1998 年由万维网联盟(W3C)推出的标准。
XML 的设计目标是简化数据的共享和传输,使得不同的系统和平台之间能够方便地交换信息。
XML 具有结构化、可扩展、易于阅读和编写等特点,被广泛应用于各种场景,如配置文件、数据存储和传输等。
2.字符串转换为数字的背景和需求在处理数据时,我们常常需要将字符串转换为数字。
例如,在 XML 文档中,某个元素的值可能是字符串形式的,但为了进行计算或其他操作,我们需要将其转换为数字。
这种需求在处理财务数据、年龄、分数等场景时尤为常见。
3.XML 中字符串转换为数字的方法在 XML 中,可以使用内置的函数或者自定义的 XPath 表达式来实现字符串转换为数字的功能。
这里我们介绍两种常用方法:(1)内置函数:XML 提供了一个名为"number()"的函数,可以将字符串转换为数字。
使用该函数时,需将字符串作为参数传递。
例如:```xml<result><value>number("123")</value><value>number("abc")</value></result>```当传递的字符串可以转换为数字时,"number()"函数将返回相应的数字;否则,返回 NaN(Not a Number)。
(2)XPath 表达式:除了内置函数,我们还可以使用 XPath 表达式来实现字符串转换为数字。
例如,我们可以使用"substring()"和"number()"函数的组合来提取字符串中的数字部分并转换为数字。
XML资料
XML概述为什么要学xml?1)XML 是一种通用的数据交换格式2)许多系统的配置文件都使用XML格式3)JSP文档也逐步向XML格式过渡4)许多项目都使用XML作为数据交换格式5)掌握XML是软件开发人员的一项基本技能1.1 XML的起源与作用我们知道,Internet广泛用于信息通信与交换。
既然现在的多数业务都是通过Web 进行的,则有必要在全世界的不同平台上共享数据。
Web应用程序以与所有平台兼容的格式展示数据是非常重要的。
XML就是这样的一种语言,它为描述数据提供了一种格式。
目前许多系统的配置文件都使用XML格式。
什么是配置文件?配置文件就是记录应用程序配置信息的文件。
例如,某个程序要连接网络上的数据库系统时,需要指定数据库服务器的IP地址,服务器的网络监听端口号,数据库的名称,用户名和密码等信息,这些信息可以作为应用程序的配置信息来对待,即不要将这些信息写死在源程序中,而是写在一个文本文件中。
应用程序要连接数据库系统时,从该文本文件中读取所需要的信息,如果连接的数据库系统的信息发生了改变,则只需要修改该文本文件,而不用修改源程序,这个文本文件就是应用程序的配置文件。
传统的配置文件通常采用如下格式:#Db.PropertiesDBServer=192.168.0.100Port=1443Database=empUsername=xxxPassword=123上面这种格式的配置文件只能表述一些简单的信息,而很难表达具有层次结构和数据项目要动态增加的信息。
例如,如果要在一个文件中表达出“一个国家中的每个省及省长的名称,每个省下面的每个市及市长的名称,每个市下面的每个镇及镇长名称”,则上面使用的格式就很难表达。
采用XML格式的配置文件很容易表达出这种层次结构。
比较HTML和XML 标记语言XML和HTML一样,都衍生于SGML(Standard Generalized Markup Language,标准通用化标记语言)。
xml书写格式
xml书写格式【实用版】目录1.XML 的概述2.XML 的书写格式3.XML 的优点4.XML 的应用领域正文1.XML 的概述XML(可扩展标记语言)是一种用于标记电子文档结构和数据的标准化语言。
它源于 1998 年由万维网联盟(W3C)推出的标准。
XML 的设计目标是简化数据的共享和传输,使得不同的系统和平台之间能够方便地交换信息。
2.XML 的书写格式XML 文档的基本结构包括以下几个部分:(1)声明:在 XML 文档的开头,需要声明 XML 的版本和编码方式。
例如:```<?xml version="1.0" encoding="UTF-8"?>```(2)根元素:XML 文档的根元素是文档结构的起点。
例如,一个简单的图书信息的 XML 文档可以如下所示:```<catalog>```(3)子元素:根元素下面可以包含一个或多个子元素,子元素以“<”开始,以“/>”结束。
例如:```<book><author>Gambardella, Matthew</author><title>XML Developer"s Guide</title><price>44.95</price></book>```(4)属性:XML 元素可以包含属性,属性是用于描述元素的额外信息。
属性以“attr”为前缀,例如:```<book id="bk101"><author>Gambardella, Matthew</author><title>XML Developer"s Guide</title><price>44.95</price></book>```(5)注释:XML 文档中可以包含注释,注释以“<!--”开始,以“--></comment>”结束。
XML基础知识课件
PPT学习交流
7
XML与HTML的比较
• HTML将数据和其显示效果混在一起,它是一种表现技术 ; XML 文档只是存储了数据和描述了数据之间的关系,没有规定该如何 显示数据。
• HTML的格式要求比较松散 ;而XML是非常严格的标记语言。
• HTML的标记集合是固定的;而XML只是提供了一个标准,人们 可以按照这个标准来定义自己专用的标记。
PPT学习交流
13
元素的标记名称建议
• 不要使用“.”,因为在很多程序语言中,“.”用于引用对象的属性。 • 最好不要用减号(-),而以下划线(_)代替,以避免与表达式中的
减号(-)运算符发生冲突。 • 名称尽量简短,以减少XML文档的大小。 • 名称的大小写尽量采用同一标准,要么全部大写,要么全部小写。 • 名称可以使用非英文字符,例如中文,但是有些软件可能不支持非英
11
元素定义
• 一个XML元素由一个标记来定义,包括开始和结束标记以及其中 的内容,例如:
<书名>Java就业培训教程</书名>
• 一个元素中可以嵌套若干子元素。
• 格式良好的XML文档必须有且仅有一个根元素,其它元素都是这 个根元素的子孙元素。
• 空元素可以不使用结束标记,但必须在起始标记的结束定界符 (>)前面增加一个正斜杠(/)字符,例如:
PPT学习交流
4
XML的起源与作用
• 在线电子商务活动交换的电子文档必须采用某种标准格式,统一电 子文档的标准规范是电子商务的基础。
• HTML不适合作为电子商务的文档标准。 • SGML(Standard Generalized Markup Language)过于复杂,无法
canoe中 xml原则
canoe中 xml原则Canoe中XML原则XML(可扩展标记语言)是一种用于描述数据和文档的标记语言。
它的设计宗旨是允许数据的结构化描述,同时保持数据的可读性和可扩展性。
在Canoe中使用XML原则是一种很重要的做法,它可以帮助我们更好地组织和管理数据,促进系统的可维护性和通信的可靠性。
本文将探讨Canoe中XML原则的相关内容。
一、Canoe中的XML概述XML是一种通用的、可扩展的标记语言,可以用于表示结构化的文本和数据。
它使用标签来定义数据的结构和属性,并使用起始标签和结束标签来表示数据的开始和结束。
在Canoe中,XML被广泛应用于配置文件、数据交换和存储等方面。
二、Canoe中的XML优势1. 可读性强:XML使用人类可读的文本格式来存储和传输数据,易于理解和解析。
2. 可扩展性强:XML的结构可以根据需要进行灵活扩展和修改,适应不同的业务需求。
3. 跨平台性好:XML是独立于语言和平台的,可以在不同的系统和应用程序之间进行数据交换和共享。
4. 数据描述能力强:XML支持自定义的标签和属性,可以准确描述数据的结构和含义。
三、Canoe中的XML应用1. 配置文件:Canoe中的许多配置信息都可以使用XML进行描述,例如系统设置、用户权限、界面布局等。
2. 数据交换:Canoe与其他系统之间的数据交换通常采用XML格式,通过定义特定的标签和文档结构,实现数据的无缝对接和共享。
3. 存储和检索:Canoe中的数据存储可以借助XML格式进行,将数据以结构化的方式存储在XML文件中,方便后续的检索和处理。
4. 网络通信:Canoe中的网络通信协议可以使用XML来定义,通过在数据包中嵌入XML格式的数据,实现系统之间的数据传输和交互。
四、Canoe中的XML实例假设我们有一个Canoe系统用于管理学生信息,可以使用XML来描述学生的基本信息和成绩情况。
一个示例的XML文件如下:```xml<?xml version="1.0" encoding="UTF-8"?><students><student><name>张三</name><age>18</age><gender>男</gender><scores><score subject="数学">90</score> <score subject="英语">85</score> </scores></student><student><name>李四</name><age>19</age><gender>女</gender><scores><score subject="数学">95</score> <score subject="英语">92</score> </scores></student></students>```以上示例中,我们使用XML标签来定义学生的信息,如姓名(<name>)、年龄(<age>)和性别(<gender>)。
java dom解析
java dom解析**一、XML概述**XML(可扩展标记语言)是一种用于存储和传输数据的标记语言。
它具有结构清晰、易于阅读和编写等特点。
XML文档由元素、属性、文本和注释组成。
在Java开发中,解析XML数据是一种常见的需求。
**二、DOM解析原理**DOM(文档对象模型)是一种编程接口,用于表示和操作XML文档。
DOM解析就是将XML文档转换为Java对象的过程。
DOM解析器读取XML 文档,构建一棵对象树,树的节点对应XML文档的元素、属性和文本。
开发者可以通过操作这棵树来访问和修改XML文档内容。
**三、Java DOM解析库介绍**Java提供了内置的DOM解析库,主要包括以下两类:1.JDK自带的XML解析库:提供了对XML文档的基本操作,如解析、查询、修改等。
2.第三方解析库:例如Apache Commons XML、Jackson等。
这些库提供了更丰富、高效的API,以及更好的异常处理和性能优化。
**四、Java DOM解析实例**以下是一个使用Java内置DOM解析库解析XML文档的示例:```javaimport java.io.File;import javax.xml.parsers.DocumentBuilder;import javax.xml.parsers.DocumentBuilderFactory;import org.w3c.dom.Document;import org.w3c.dom.Element;public class JavaDOMParseExample {public static void main(String[] args) throws Exception { File file = new File("example.xml");DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();DocumentBuilder dBuilder =dbFactory.newDocumentBuilder();Document doc = dBuilder.parse(file);doc.getDocumentElement().normalize();Element rootElement = doc.getDocumentElement();System.out.println("Root element: " + rootElement.getNodeName());// 遍历和操作XML文档的其他节点// ...}}```**五、DOM解析优缺点分析**1.优点:DOM解析具有较好的可读性和可控性,开发者可以直接操作XML文档的结构,易于理解和实现。
xml文件格式化显示方法
xml文件格式化显示方法随着互联网的不断发展,XML文件的使用越来越广泛。
XML文件是一种标记语言,用于存储和传输数据。
由于XML文件的结构化和可扩展性,它已经成为数据交换和存储的标准格式之一。
然而,XML文件通常包含大量的标签和属性,如果不进行格式化显示,可能会影响阅读和理解。
因此,本文将介绍一种XML文件格式化显示的方法,以便更好地理解和使用XML文件。
一、XML文件概述XML文件是一种基于XML标记的语言,用于存储和传输数据。
它使用标签来定义数据结构,使用属性来描述数据属性。
XML文件通常包含大量的标签和属性,因此在进行格式化显示时需要考虑到这一点。
二、格式化显示方法1. 使用文本编辑器使用文本编辑器打开XML文件,并使用适当的格式设置来显示XML数据。
这通常包括调整字体、字号、缩进和换行等。
通过这种方式,可以更清晰地看到XML 数据的结构和关系。
2. 使用XML解析器使用XML解析器可以将XML文件转换为可读的格式,如HTML或纯文本。
常用的XML解析器包括DOM、SAX和pull解析器等。
使用解析器可以方便地查看XML数据的结构和内容,同时还可以进行样式表和脚本的集成,以实现更丰富的显示效果。
3. 使用第三方工具有许多第三方工具可以帮助我们格式化显示XML文件。
例如,可以使用工具如“XMLFormatter”或“XML Notepad”等软件,它们可以将XML文件转换为易于阅读的格式。
这些工具通常提供了多种显示风格和布局选项,以满足不同的需求。
三、格式化显示示例假设我们有一个简单的XML文件,内容如下:```xml<?xml version="1.0" encoding="UTF-8"?><data><item name="item1"><price>10.00</price><description>Description for item1</description></item><item name="item2"><price>20.00</price><description>Description for item2</description></item></data>```使用文本编辑器打开该文件,可以调整字体、字号、缩进等格式设置,以更好地显示XML数据。
XML基础教程
1.5 XML的应用
1.5.1 XML的应用领域
1.数据交换 2.Web服务 3.Web集成 4.电子商务 5.数据库应用 6.网络出版 7.特定文档的组织 8.系统配置文件
1.5.2 XML的延伸语言
1.XHTML(可扩展超文本标记语言) 2.VML(矢量标记语言) 3.PGML(精确图形标记语言) 4.SVG(可缩放矢量图形语言) 5.WML(无线标记语言) 6.基于XML的其他语言
1.2.2 HTML文档基本架构
HTML使用各种不同的HTML标记符 号来分别标识和设定不同的网页元素,这 样的网页元素也被称为HTML元素。每个 元素通常由开始标记、结束标记,以及夹 在这两个标记中的内容所组成。 一个完整的HTML文档由文档头部和 文档正文两个部分组成,其基本结构如下。
<HTML> <HEAD> <TITLE> 网页标题 </TITLE> </HEAD> <BODY> <P>这是正文部分!</P> </BODY> </HTML>
1.3 XML解决方案 1.3.1 XML的实现机制
XML使用能够说明数据本质而不是其表象的标记来标注 数据,并且把数据的样式信息从文档中分离出来,而将 其放入相关的样式表文件中。 XML的标记总是成对出现,就像通常使用的括号一样, 同时又具有引号的功能,并可采用常见的树型结构进行 多层嵌套,这就为程序员的编程处理提供了极大的方便。 XML是一种电子文档信息的自定义语言——任何人、任 何行业都可遵循这些规则,自己定义各种标记来描述信 息中的所有数据元素,使信息能够“自我描述”,然后 通过一种被称为解析器的小型程序进行处理。
XML 入门
XML 语法
<?xml version="1.0" encoding="ISO-8859-1"?> encoding="ISO-8859<note> <to>Lin</to> <from>Ordm</from> <heading>Reminder</heading> <body>Don't forget me this weekend!</body> </not 文档必须有一个根元素 所有的
XML文档中的第一个元素就是根元素
XML中的注释 中的注释
<!-- 这是一个注释 -->
XML 语法(续)
XML元素可以拥有属性。 元素可以拥有属性。 元素可以拥有属性
属性值必须使用引号,单引号、双引号都可以 使用数据既可以存储在子元素中也可以存储在属性中
XML解析器
有不同的方法来划分解析器种类:
验证或非验证解析器
验证解析器(Validating parser)在解析 XML 文档同时进行验证 非验证解析器(Non-validating parser) 忽略所有的验证错误
支持 Document Object Model (DOM) 的解析器 支持 Simple API for XML (SAX) 的解析器
xml入门1
<poem>
<title>静夜思</title>
<author>李白</auther>
<content>
<line>床前明月光</line><line>疑似地上霜</line>
<line>举头望明月</line><line>低头思故乡</line>
</content>
</poem>
xml文档不能表示文件排版和文件表现形式。它只是用于描述数据和数据结构。如果应用不同的样式,显示不同的形式,而不会改变文档内容。xml表示数据做到了数据独立于应用系统,并且数据能够重用。一份数据可以应用不同的场合,xml有时候变现为数据文档化。
3,格式良好的xml文档形成了一种层次树结构,而这个树的树根都是文档实体,与其他的实体不同,文档实体没有名字,只是用于表示文档树的根。xml文档的根元素被称为文档元素(document element)
,它和在其外部出现的处理指令,注释等作为文档实体的子节点,而根元素本身和其内部的子元素也是一棵树。
第一讲 XML基础及CNML总体概述
XML的优点
XML的主要优点:
良好的可扩展性 内容与形式的分离 遵循严格的语法要求 便于不同系统之间信息的传输 具有较好的保值性
XML的优点:良好的可扩展性
各个不同的行业可能会有一些独特的要求, XML 允许各个组织、个人建立适合他们自己需 要的标记库,并且,这个标记库可以迅速地投 入使用。 要想定义一套各行各业能够普遍应用的标记既 困难,也没有必要。比起那些追求大而全的臵 标语言的做法, XML 采取具体问题具体分析的 方法,实际上更有助于臵标语言的发展。
XML的定义(续)
什么是“臵标”——Markup
臵标:为了处理的目的,在数据中加入附加信息, 这种附加信息称为臵标。
什么是“臵标语言”——ML
臵标语言:运用臵标法描述结构化数据的形式语言 。 如SGML、HTML、XML...
XML的定义(续)
什么是可扩展的臵标语言?
XML并非象HTML那样,提供了一组事先已经定义好 了的标记,而是提供了一个标准,利用这个标准,可 以根据实际需要定义自己的新的臵标语言,并为这个 臵标语言规定它特有的一套标记 XML是一种元臵标语言,它允许程序开发人员根据它 所提供的规则,制定各种各样的臵标语言
XML声明 处理指令
各个元素
逻辑结构之一——XML声 明
一个XML文档最好以一个XML声明作为开始,它的作用 就是告诉XML处理程序:“下面这个文档是按照XML文 档的标准对数据进行臵标的” <?xml version="1.0" encoding="GB2312" standalone= "no"?> • version 属性:指明所采用的XML版本号 • standalone属性:这个属性表明该XML文档是否和一个 外部的文档类型定义DTD配套使用 • encoding 属性:指明XML数据所采用的编码标准
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
在实际开发中,由于不同操作系统存储数据的格式不兼容,当这些系统在进行数据传输时,会变得很困难。
为此,W3C组织推出了一种新的数据交换标准—XML,它是一种通用的数据交换格式,可以使数据在各种应用程序之间轻松地实现数据的交换。
XML即可扩展标记语言(eXtensible Markup Language)。
标记是指计算机所能理解的信息符号,通过此种标记,计算机之间可以处理包含各种信息的文章等。
如何定义这些标记,既可以选择国际通用的标记语言,比如HTML,也可以使用象XML这样由相关人士自由决定的标记语言,这就是语言的可扩展性。
XML是从SGML中简化修改出来的。
它主要用到的有XML、XSL和XPath等。
在现实生活中,很多事物之间都存在着一定的关联关系,例如中国有很多省份,每个省份下又有很多城市。
这些省市之间的关联关系可以通过一张树状结构图来描述,具体如图1-1所示。
图1-1直观的描述了中国与所辖省、市之间的层次关系。
但是对于程序而言,解析图片内容是非常困难的,这时,可以采用XML文件保存这种具有树状结构的数据。
若通过一个XML文档来描述图1-1所示的关系,如图1-2。
图1-2
上面是对XML的一个基本定义,一个被广泛接受的说明。
简单说,XML 就是一种数据的描述语言,虽然它是语言,但是通常情况下,它并不具备常见语言的基本功能——被计算机识别并运行。
只有依靠另一种语言,来解释它,使它达到你想要的效果或被计算机所接受。
假如你是刚接触XML的新手,那么可能并无法从定义上是了解XML是什么。
也许,你可以换个角度来认识XML是什么;从应用面来认识XML,从XML 可以做些什么来认识它,这应该能比那更空洞的定义对你更有帮助。
XML应用面主要分为两种类型,文档型和数据型。
下面介绍一下几种常见的XML应用:
1、自定义XML+XSLT=>HTML,最常见的文档型应用之一。
XML存放整个文档的XML数据,然后XSLT将XML转换、解析,结合XSLT中的HTML 标签,最终成为HTML,显示在浏览器上。
2、XML作为微型数据库,这是最常见的数据型应用之一。
我们利用相关的XML API(MSXML DOM、JAVA DOM等)对XML进行存取和查询。
留言板的实现中,就经常可以看到用XML作为数据库。
同时,数据库和数据库系统这两个概念是不同的。
这里顺便提一下XML对数据库系统的影响。
在新版本的传
统数据库系统中,XML成为了一种数据类型。
和“传统”相对的就是一种新形态的数据库,完全以XML相关技术为基础的数据库系统。
目前比较知名的eXist。
3、作为信息传递的载体。
为什么说是载体呢?因为这些应用虽然还是以XML为基本形态,但是都已经发展出具有特定意义的格式形态。
最典型的就是WEB SERVICE,将数据包装成XML来传递,但是这里的XML已经有了特定的规格,即SOAP。
不过这里还不得不说AJAX,AJAX的应用中,相信也有一部分的应用是以自定义XML为数据,不过没有成为工业标准,这里不做详述。
4、应用程序的配置信息数据。
最典型的就是J2EE配置WEB服务器时用的web.XML。
这个应用估计是很容易理解的了。
我们只要将需要的数据存入XML,然后在我们的应用程序运行载入,根据不同的数据,做相应的操作。
这里其实和应用2,有点类似,所不同的在于,数据库中的数据变化是个常态,而配置信息往往是较为静态,缺少变化的。
5、其他一些文档的XML格式。
如WORD、EXCEL等。
6、保存数据间的映射关系。
如Hibernate。
这几种常见应用中,我们还可以根据其应用广泛程度,分为:自定义XML 和特定意义XML。
在1和2就是属于自定义XML的范畴;3至6则属于特定意义XML,或者说是XML的延伸。
这里介绍的6种应用,基本涵盖了XML的主要用途。
总之,XML是一种抽象的语言,它不如传统的程序语言那么具体。
要深入的认识它,应该先从它的应用入手,选择一种你需要的用途,然后再学习如何使用。