HTML DOM树的结构和访问
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一:概念
DOM是一种与平台和语言无关的接口,它允许程序和脚本动态访问和修改文档的内容、结构和类型。它定义了一系列的对象和方法对Html DOM树的节点进行各种随机操作。
二:Html DOM树
DOM(DocumentObjectModel)解析器将XML文档一次性解析,生成一个位于内存中的对象树用以描述该文档。
◆Document对象:作为树的最高节点,Document对象是对整个文档进行操作的入口。
◆Element和Attr对象:这些节点对象都是文档某一部分的映射,节点的定级层次恰好反映了文档的结构。
◆Text对象:作为Element和Attr对象的子节点,Text对象表达了元素或属性的文本内容。Text节点不再包含任何子节点。
◆集合索引:DOM提供了几种集合索引方式,可以对节点按指定方式进行遍历。索引参数都是从0开始记数的。
Html DOM树中的所有节点都是从Node对象继承而来的。Node对象定义了一些最基本的属性和方法,利用这些方法可以实现对树的遍历,同时,根据属性还可以得知节点的名称、取值并判断其类型。
利用DOM,开发人员可以动态地创建XML、遍历文档、增加/删除/修改文档内容。DOM 提供的API与编程语言无关,所以对一些DOM标准中没有明确定义的接口,不同解析器的实现方法也可能有所差别。
三:Html DOM树的结构
加载文档大体上分为三步:
1.使用CreateObject方法创建分析器实例;
2.设置async属性为False,禁止异步加载,这样当文档加载完毕,控制权才会返回给调用进程,如果想获取文档加载状态,可以读取readyState属性值;
3.使用load方法加载指定文档。
XMLDOM还提供了一种loadXML的方法可以把XML字符串加载到Html DOM树中,使用时只要把XML字符串直接作为该方法的参数即可。
四:Html DOM树的访问
在文档加载完毕之后就可以使用documentElement属性访问根元素:
一旦建立了对Html DOM树中某个节点(例如根节点)的引用,就可以根据节点间的等级关系调用适当的方法进行遍历。
下面以books.xml为例说明各种方法的使用:
建立对第二个
◆根节点:theNode.ownerDocument返回Document节点,指向XML文档本身;
◆兄弟节点:theNode.previousSibling返回第1个
◆父节点:theNode.parentNode返回
◆子节点:theNode.firstChild返回
获得节点的引用后,就可以读取节点的相关信息:
◆节点类型:theNode.nodeType,本例为1,Document对象类型为9,元素类型为1,属性类型为2;
◆节点名称:theNode.nodeName,本例为book;
◆节点值:theNode.nodeValue,本例为null,对于Attr节点,返回的是属性值,而对于Element节点,返回的是null。
在MSXML中,对Node对象还提供了一些额外的方法和属性:
◆nodeTypeString:用字符串的方式显示节点类型,如theNode.nodeTypeString的结果是“element”;
◆text:显示当前节点及其所有子节点的文本内容;
◆xml:获取XML文档数据,通常是从根元素开始的所有内容。
五:XML格式的动态转换
把XSL载入DOM对象的步骤基本上与XML文档的载入过程是一样的(XSL本身就是XML 文档):
DOM提供了两个函数进行这种转换,作用对象可以是树中任何节点。这样就可以实现对Html DOM树的任意的部分进行格式转换。
◆transformNodeToObject方法:该方法需要两个参数,第一个参数指向XSL文件,第二个参数存放转换后的XML数据的节点。例如:
◆transformNode方法:该方法只需要一个参数指明XSL文件。如下例是将源节点转换为一个字符串变量str: