XML文件读取的资料

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

XML文档对象模型也就是(DOM)

就像层次结构的树,主要用于在内存中表示XML文档

1)DOM树定义了XML文档的逻辑结构,给出了一种应用程序访问和处理XML文档的方法。

2)在DOM树中,有一个根节点,所有其他的节点都是根节点的后代。

3) 在应用过程中,基于DOM的XML分析器将一个XML文档转换成一棵DOM树,应用程序通过对DOM树的操作,来实现对XML文档数据的操作。

三、XML文档对象(XML DOM)模型分析

XML DOM对象提供了一个标准的方法来操作存储在XML文档中的信息,DOM应用编程接口(API)用来作为应用程序和XML文档之间的桥梁。

DOM可以认为是一个标准的结构体系用来连接文档和应用程序(也可以是剧本语言)。MSXML解析器允许你装载和创建一个文档,收集文档的错误信息,得到和操作文档中的所有的信息和结构,并把文档保存在一个XML 文件中。DOM提供给用户一个接口来装载、到达和操作并序列化XML文档。DOM提供了对存储在内存中的XML文档的一个完全的表示,提供了可以随机访问整个文档的方法。DOM允许应用程序根据MSXML解析器提供的逻辑结构来操作XML文档中的信息。利用MSXML所提供的接口来操作XML。

实际上MSXML解析器根据XML文档生成一个DOM树结构,它能够读XML 文档并根据XML文档内容创建一个节点的逻辑结构,文档本身被认为是一个包含了所有其他节点的节点。

DOM使用户能够把文档看成是一个有结构的信息树,而不是简单的文本流。这样即使不知道XML的语义细节,应用程序或者是脚本也能够方便地操作该结构。DOM包含两个关键的抽象:一个树状的层次、另一个是用来表示文档内容和结构的节点集合。树状层次包括了所有这些节点,节点本身也可以包含其他的节点。这样的好处是对于开发人员来说,他可以通过这个层次结构来找到并修改相应的某一个节点的信息。DOM把节点看成是一个通常的对象,这样就有可能创建一个剧本来装载一个文档,然后遍历所有的节点,显示感兴趣的节点的信息。注意节点可以有很多中具体的类型,比如元素、属性和文本都可以认为是一个节点。

微软的MSXML解析器读一个XML文档,然后把它的内容解析到一个抽象的信息容器中称为节点(NODES)。这些节点代表文档的结构和内容,并允许应用程序来读和操作文档中的信息而不需要显示知道的XML的语义。在一个文档被解析以后,它的节点能够在任何时候被浏览而不需要保持一定的顺序。

对开发人员来说,最重要的编程对象是DOMDocument。DOMDocument对象通过暴露属性和方法来允许浏览、查询和修改XML文档的内容和结构,每一个接下来的对象暴露自己的属性和方法,这样就能够收集关于对象实

例的信息,操作对象的值和结构,并导航到树的其他对象上去。

MSXML.DLL的主要的COM接口

MSXML.DLL所包括的主要的COM接口有:

(1)DOMDocument

DOMDocument对象是XML DOM的基础,你可以利用它所暴露的属性和方法来允许你浏览、查询和修改XML文档的内容和结构。DOMDocument表示了树的顶层节点。它实现了DOM文档的所有的基本的方法并且提供了额外的成员函数来支持XSL和XSLT。它创建了一个文档对象,所有其他的对象都可以从这个文档对象中得到和创建。

(2)IXMLDOMNode

IXMLDOMNode是文档对象模型(DOM)中的基本的对象,元素,属性,注释,过程指令和其他的文档组件都可以认为是IXMLDOMNode,事实上,DOMDocument对象本身也是一个IXMLDOMNode对象。

(3)IXMLDOMNodeList

IXMLDOMNodeList实际上是一个节点(Node)对象的集合,节点的增加、删除和变化都可以在集合中立刻反映出来,可以通过“for...next”结构来遍历所有的节点。

(4)IXMLDOMParseError

IXMLDOMParseError接口用来返回在解析过程中所出现的详细的信息,包括错误号,行号,字符位置和文本描述。

下面主要描述一个DOMDocument对象的创建过程,这里用VC描述创建一个文档对象的过程。

HRESULT hr;

IXMLDomDocument* pXMLDoc;

IXMLDOMNode* pXDN;

Hr=CoInitialize(NULL); //COM的初始化

//得到关于IXMLDOMDocument接口的指针pXMLDOC。

hr=CoCreateInstance(CLSID_DOM

Document,NULL,CLSCTX_INPPROC_SERVER,

IID_IXMLDOMDocument,(void**) &pXMLDoc);

//得到关于IXMLDOMNode接口的指针pXDN。

hr=pXMLDoc->QueryInterface (IID_IXMLDOMNode,(void**)&pXDN);

编辑本段MSXML解析器使用

解析标志

在MSXML解析器使用过程中,我们可以使用文档中的createElement方法来创建一个节点装载和保存XML文件。通过load或者是loadXML方法可以从一个指定的URL来装载一个XML文档。Load(LoadXML)方法带有两个参数:第一个参数xmlSource表示需要被解析的文档,第二个参数isSuccessful表示文档装载是否成功。Save方法是用来把文档保存到一个指定的位置。Save方法有一个参数destination用来表示需要保存的对象的类型,对象可以是一个文件,一个ASP Response方法,一个XML文档对象,或者是一个能够支持持久保存(persistence)的客户对象。下面是save 椒ㄊ褂玫囊桓黾虻サ睦??具体程序请参见/swm/200101/利用MSXML解析XML文本)。

同时,在解析过程中,我们需要得到和设置解析标志。利用不同的解析标志,我们可能以不同的方法来解析一个XML文档。XML标准允许解析器验证或者不验证文档,允许不验证文档的解析过程跳过对外部资源的提取。另外,你可能设置标志来表明你是否要从文档中移去多余的空格。

为了达到这个目的,DOMDocument对象暴露了下面几个属性,允许用户在运行的时候改变解析器的行为:

(1)Async(相对于C++是两个方法,分别为get_async和put_async)

(2)ValidateOnparse(相对于C++是两个方法,分别为get_validate OnParse和put_validateOnParse)

(3)ResolveExternals(相对于C++是两个方法,分别为get_ Resolve Externals和put_ ResolveExternals)

(4)PersercveWhiteSpace(相对于C++是两个方法,分别为get_ Perser cveWhiteSpace和put_ Persercve WhiteSpace)

每一个属性可以接受或者返回一个Boolean值。缺省的,anync,vali dateOnParse,resolveExternals的值为TRUE,perserveWhiteSpace的值跟XML文档的设置有关,如果XML文档中设置了xml:space属性的话,该值为FALSE。

文档信息的信息

同时在文档解析过程中可以收集一些和文档信息的信息,实际上在文档解析过程中可以得到以下的信息:

相关文档
最新文档