JDOM生成和解析XML
基于JDOM的XML文档解析研究
< a e B s c语言< n e n >a i m /a > m
<lso> / e sn < l s o s / e sn >
用于解析 X L文档 的 J V M AA源 代码框架如下:
p b c l s X E i u l c a s ml d i t
{ p b i m E i { u l cX l d t ) 0 p b i t t c v i a n S r n r s ] u l c s a i o dm i (t i g a g [)
(/ / 读取文件信 息
Fi e n u S r a i e n n l ; lptte l m f I = u l l Fi u p t t e i u = u ; e t u S r a f e t n l 1O m 1O 1
关 键 词 :XML文 档 ;J DOM ; A A JV
中图分 类号 : P 1 文献标识码 : T 31 A 文章编号 :10- 59 21) 6 0 — 2 07 99 ( 20 - 12 0 0 1
一
、
引言
<le o ss n>
在 W B开发 中,X L作为一种通用 数据 交换工具 ,其作用 E M 非常重要 , 针对 X L文档 的操 作亦 成为常事 , M 相关 ) L文件 的 【 M 处理组件便不断 出现 ,D M和 SX是 常用 的两种 。它们然都 O A 能实现对 X L文档 的操作 ,但缺 陷也很 明显 。例 如,D M是用 M O I L定义的跨语言 A I D P ,只 限于所有编程 语言都能提供的特性 和 类, 样既不能充分利用 J v , 这 a a 也不符合 J v a a的最佳做法 、 命 名规则和编码标准 。另外 ,D M通过在 内存 中建立一个 X L O M 元 素树 实现对 X L数据 的访 问, M 其缺 点是维护 一个树形 数据 结 构 需 占用大量 内存资源 。A S X面 向标签采用回调方式访 问 X L M, 不需建立树,内存 占用少 , 点是 S X只能进行顺序检索 ,不 缺 A 支 持随机访 问文件 ,很少被单独使用 。为解决 以上 问题 ,J O DM 作 为一种新的 X L文档处理组件 出现 。J O M D M基 于树 型结构, 是 一个开放源代码 A I P ,采用 纯 J v a a技术 实现对 x L文档的 M 分 析、建立、处理和序列化 。 JO D M结合 了 S X与 D M的优 点。 D M相似 , D M将 X L A O 与 O JO M 文档表 示为树,包括元素 、属 性、处理指令 、说 明等 ,树的数 据 可以来 自 J v 程序 中的直接量 、计算结果或数据库之类 的 aa 非 X L 。J O M库 D M自身不带分析器 ,将 XL文档 读取到 J O M D M中 时,是采用 S X分析器 。另外 ,J O A D M亦可将 DMD c m n 对 O o u e t 象转换成 J O o u e t对象 ,从而 将 D M程序 的输 出导向 D M D cm n O JO D M程序的输入 。J O D M既能读入 D M或 S X的数据 ,也能输 O A 出 D M和 S X可接收的格式 。 O A 二、JO D M包 J O 的最新 版本可 从 h t :/ d m o g 下载 ,这里 以 DM tp / jo . r JO 10 D M . 为例 ,主要包 括 以下几个包 : o g j o ,解析 X L文件用到的所有数据类型 的 J v r . d m包 M aa 类 : ogjo.nu 包 , 包 含 读 取 XL 文 档 的 类 ; r . dm i p t M o g j o . dp e s 包 , 是 与 D M 适 配 的 j v 类 ; r.dmaatr O aa o g j o . i t r ,M r . d m f e 包 X L文档过滤器类 ; r . dm t a s o m l o g jo .r n f r 包 , 将 JO X L 文 档 转 换 为 其 他 X L 文 档 接 口 ; DM M M o g j o . u p t ,用于文档转换输 出。 r.dmotu 包 三、利用 J O 析 X L文档 D M解 M JO D M可用来解析现有 X L文档 ,且 十分 方便 。大致过程 M 说明如下: ( ) 一 构造一个 o g j o . n u .A B i d r 象,采用 r . dm ip t S X u le 对 简 单无 变元构造函数:
JavaXML解析的四种方法(连载)
JavaXML解析的四种⽅法(连载)1. xml简介 XML:指可扩展标记语⾔, Extensible Markup Language;类似HTML。
XML的设计宗旨是传输数据,⽽⾮显⽰数据。
⼀个xml⽂档实例:1 <?xml version="1.0" encoding="UTF-8"?>2 <company name="Tencent" address="深圳市南⼭区">3 <department deptNo="001" name="development">4 <employee id="devHead" position="minister">许刚</employee>5 <employee position="developer">⼯程师A</employee>6 </department>7 <department deptNo="002" name="education">8 <employee position="minister" telephone="1234567">申林</employee>9 <employee position="trainee">实习⽣A</employee>10 </department>11 </company> 第⼀⾏是 XML 声明。
它定义 XML 的版本 (1.0) 和所使⽤的编码. 下⼀⾏描述⽂档的根元素:<company>开始,该根元素具有2个属性“name”,"address"。
扣丁学堂_Java_17_XML
课程大纲1、什么是XML2、XML的用途3、DOM XML解析4、SAX解析XML5、JDOM解析XML6、DOM4J解析XML7、通过对象生成XML文件8、各种解析方法比较什么是1、什么是XMLp g gXML(Extensible Markup Language 可扩展标记语言),XML是一个以文本来描述数据的文档。
个XML文档示例:一个<?xml version="1.0" encoding="UTF‐8"?><person><teacher id1>id="1"><name>老郭</name><desc>一个成熟稳重有魄力的人desc>/teacher</teacher><teacher id="2"><name>威哥</name>个快乐风有内的技术男/<desc>一个快乐风趣有内涵的技术男</desc></teacher></person>2、XML的用途XML技术的用途:(1)充当显示数据(以XML充当显示层)(2)存储数据(存储层)的功能(3)以XML描述数据,并在联系服务器与系统的其余部分之间传递。
描述数据并在联系服务器与系统的其余部分之间传递从某种角度讲,是数据封装和消息传递技术XML是数据封装和消息传递技术。
3、DOM解析XMLJAVA 解析XML 通常有两种方式,DOM 和SAXDOM:Document Object Model(文档对象模型)DOM的特性:定义一组Java 接口,基于对象,与语言和平台无关将XML 文档表示为树,在内存中解析和定义组J接口基于对象与语言和平台无关将文档表示为树在内存中解析和存储XML 文档,允许随机访问文档的不同部分。
XML解析技术
2.4 面向文档的指针式解析技术
前面提到的面向文档的流式解析效率较高,但易用性差,而对象式解析易用性强,却效率较低,这两种方式似乎处于两个极端。其效率问题主要在于两种方式都是提取解析模式,即解析时,提取一部分源文件,一般来说是一个字符串,然后在内存中进行解析构建。这种解析模式注定了需要大量的创建和销毁对象,而且还存在更新效率问题,在DOM中(SAX并不支持更新),每一次改动都需要将DOM模型重新完整的解析成XML字符串,原文件并没有被利用,即DOM并不支持增量更新。为了解决这些问题,提出了一种较新颖的指针式解析技术,即VTD-XML.
而且VTD-XML还可以高效的实现增量更新,例如,如果想在一个大型XML文档中找出一个节点元素并删除它,那么只需要找到这个元素的VTD,将这个VTD从VTD数组中删除,然后再利用所有的VTD写出到另一个二进制数组中就可以了,因为删除的VTD标明了要删除的元素的位置,所以在新写入的二进制数组中就不会出现这段元素了。用VTD写入新的二进制数组的过程实际上就是一个二进制数组的拷贝过程,其效率是非常高的[2].
SAX中的核心事件处理程序是一个实现了ContentHandler接口的类。此接口中定义了处理与XML文档本身关联的事件的方法,如 startDocument、endDocument、startElement、endElement、Characters等
SAX解析技术具有所有流式解析技术的优点和缺点,但是由于在整个解析过程中,解析器掌握着控制权直到文档结束,应用程序很难在获得所需的部分数据后停止解析过程(可以通过抛出异常的方式终止解析过程,但较为复杂,而且终止后也无法继续解析过程),因此产生了由应用程序掌握控制权的拉式解析方式。
VTD(Virtual Token Descriptor,虚拟令牌描述符)是一个64bits长度的数值类型,记录了每个元素的起始位置,长度,深度以及令牌的类型等信息,如图3所示。64bits固定长度使得可以用数组这种高效的结构来组织VTD,大幅提高性能。VTD是实现无提取解析的关键,它类似于XML文档中元素的指针,通过它可以快速定位到某个元素。
读写XML的四种方法
读写XML的四种方法XML(eXtensible Markup Language)是一种用于表示和传输数据的标记语言。
它具有良好的可读性和扩展性,被广泛应用于Web开发、数据交换和配置文件等领域。
在读写和处理XML数据时,有许多方法可供选择。
本文将介绍四种常见的读写XML的方法:DOM、SAX、JDOM、和XMLStreamReader/XMLStreamWriter。
1. DOM(Document Object Model):DOM是一种基于树形结构的解析器,它将整个XML文档加载到内存中,并将其表示为一个对象树。
在DOM中,每个XML元素都被表示为一个节点(Node),可以通过节点的属性和方法对其进行操作。
读取XML文档时,可以使用DOM解析器将其转换为一个DOM树,然后通过节点的方法访问和修改树结构。
写入XML文档时,可以通过创建和修改节点来构建DOM树,并使用DOM解析器将其保存为XML文档。
使用DOM读取XML文档的基本步骤如下:- 创建一个DocumentBuilderFactory对象。
- 根据DocumentBuilderFactory对象创建一个DocumentBuilder对象。
- 使用DocumentBuilder对象解析XML文档,并返回一个Document对象。
- 通过Document对象的方法遍历和操作XML文档的节点。
使用DOM写入XML文档的基本步骤如下:- 创建一个DocumentBuilderFactory对象。
- 根据DocumentBuilderFactory对象创建一个DocumentBuilder对象。
- 使用DocumentBuilder对象创建一个Document对象。
- 通过Document对象的方法创建和添加元素节点、属性节点等。
- 使用TransformerFactory和Transformer对象将Document对象保存为XML文档。
DOM的优点是易于使用和理解,可以方便地遍历和修改XML文档。
关于XML字符串和XML Document之间的转换
在web项目中,XML作为一种重要的数据存储和传输介质,被广泛使用。
XML 文件,XML字符串和XML Document对象是XML存在的三种形式,XML文件无需多言,和普通的文本并无二致;倒是在做一般的XML数据交换过程中,经常要使用XML字符串和XML Document对象,因此在这两种形式之间进行转化成为了使用XML的必备技术。
在所有操控XML的技术中,都提供了这两种形式XML之间的转换方法。
下面我就各种XML技术对此问题的解决方法做个总结,和大家分享,也方便自己今后查阅。
一,使用JDOM(这是我最常使用的一种技术)1.字符串转Document对象String xmlStr = ".....";StringReader sr = new StringReader(xmlStr);InputSource is = new InputSource(sr);Document doc = (new SAXBuilder()).build(is);2.Document对象转字符串Format format = Format.getPrettyFormat();format.setEncoding("gb2312");//设置xml文件的字符为gb2312,解决中文问题XMLOutputter xmlout = new XMLOutputter(format);ByteArrayOutputStream bo = new ByteArrayOutputStream();xmlout.output(doc,bo);String xmlStr = bo.toString();注:Document为org.jdom.Document二,使用最原始的javax.xml.parsers,标准的jdk api 1.字符串转Document对象String xmlStr = "......";StringReader sr = new StringReader(xmlStr);InputSource is = new InputSource(sr);DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); DocumentBuilder builder=factory.newDocumentBuilder();Document doc = builder.parse(is);2.Document对象转字符串TransformerFactory tf = TransformerFactory.newInstance();Transformer t = tf.newTransformer();t.setOutputProperty("encoding","GB23121");//解决中文问题,试过用GBK不行ByteArrayOutputStream bos = new ByteArrayOutputStream();t.transform(new DOMSource(doc), new StreamResult(bos));String xmlStr = bos.toString();注:Document为org.w3c.dom.Document三,使用dom4j(这是最简单的方法)1.字符串转Document对象String xmlStr = "......";Document document = DocumentHelper.parseText(xmlStr);2.Document对象转字符串Document document = ...;String text = document.asXML();注:Document为org.dom4j.Document四,在JavaScript中的处理1.字符串转Document对象var xmlStr = ".....";var xmlDoc = new ActiveXObject("Microsoft.XMLDOM"); xmlDoc.async=false;xmlDoc.loadXML(xmlStr);//可以处理这个xmlDoc了var name = xmlDoc.selectSingleNode("/person/name"); alert(name.text);2.Document对象转字符串var xmlDoc = ......;var xmlStr = xmlDoc.xml注:Document为javaScript版的XMLDOM。
初识---Qt解析XML文件(QDomDocument)
初识---Qt解析XML⽂件(QDomDocument)关于XML及其使⽤场景不在此多做介绍,今天主要介绍Qt中对于XML的解析。
QtXml模块提供了⼀个读写XML⽂件的流,解析⽅法包含DOM和SAX,两者的区别是什么呢? DOM(Document Object Model):将XML⽂件保存为树的形式,操作简单,便于访问。
SAX(Simple API for XML):接近于底层,速度较快,但不便于访问。
建议阅读:这篇博客,最好做⼀下试验!因为下vs2013下开发Qt有些库需要⼿动添加!!!QXml,QSql,,⼀般出现这个问题都是库⽂件没有添加造成,这⾥使⽤QtNetwork就要加QtNetwork的库⽂件,在debug模式下需要加Qt5Networkd.lib库⽂件,在release模式下需要加QtNetwork5.lib库⽂件在哪⾥添加呢,⼀共有两个地⽅需要添加,缺⼀不可1. 项⽬->属性->c/c++->常规->附加包含⽬录->在弹出的对话框中,点那个⽂件夹形状的按钮添加新⾏,输⼊$(QTDIR)\include\QtNetwork2. 项⽬->属性->连接器->输⼊->附加依赖项,添加 Qt5Networkd.lib(debug模式)或者 Qt5Network.lib(release模式)person.xml⽂件如下所⽰:解析⽅法:void ParseXML::parse(QString file_name){if(file_name.isEmpty())return;QFile file(file_name);if(!file.open(QFile::ReadOnly | QFile::Text)){QMessageBox::information(NULL, QString("title"), QString("open error!"));return;}QDomDocument document;QString error;int row = 0, column = 0;if(!document.setContent(&file, false, &error, &row, &column)){QMessageBox::information(NULL, QString("title"), QString("parse file failed at line row and column") + QString::number(row, 10) + QString(",") + QString::number(column, 10));return;}if(document.isNull()){QMessageBox::information(NULL, QString("title"), QString("document is null!"));return;}QDomElement root = document.documentElement();//root_tag_name为personsQString root_tag_name = root.tagName();if(root.hasAttribute("name")){//name为QtQString name = root.attributeNode("name").value();}//获取id="1"的节点QDomElement person = root.firstChildElement();if(person.isNull())return;QString person_tag_name = person.tagName();//id为1QString id = person.attributeNode("id").value();//获取⼦节点,数⽬为2QDomNodeList list = root.childNodes();int count = list.count();for(int i=0; i{QDomNode dom_node = list.item(i);QDomElement element = dom_node.toElement();//获取id值,等价QString id_1 = element.attributeNode("id").value();QString id_2 = element.attribute("id");//获取⼦节点,数⽬为4,包括:name、age、email、websiteQDomNodeList child_list = element.childNodes();int child_count = child_list.count();for(int j=0; j{QDomNode child_dom_node = child_list.item(j);QDomElement child_element = child_dom_node.toElement();QString child_tag_name = child_element.tagName();QString child__tag_value = child_element.text();}}//按照name、age、email、website的顺序获取值QDomElement element = person.firstChildElement();while(!element.isNull()){QString tag_name = element.tagName();QString tag_value = element.text();element = element.nextSiblingElement();}}XML⽂件如下所⽰:<?xml version="1.0" encoding="GBK"?><Catalog name = "树形⽬录"><View id = "default"><任务年度/><任务编号/><任务名称/></View><View id = "1"><任务名称/><任务年度/><任务编号/></View><View id = "2"><任务年度/><任务名称/><任务编号/></View></Catalog> 读⽂件:if("" == fileName){qDebug()<<"Filename is Null";return;}QFile file(DirectorOf("xml").absoluteFilePath(fileName));if(!file.open(QFile::ReadOnly | QFile::Text))qDebug()<<"open file"<<fileName<<"failed, error:"<<file.errorString();/*解析Dom节点*/QDomDocument document;QString strError;int errLin = 0, errCol = 0;if( !document.setContent(&file, false, &strError, &errLin, &errCol) ) {qDebug()<<"parse file failed at line"<<errLin<<",column"<<errCol<<","<<strError;return;}if( document.isNull() ) {qDebug()<<"document is null !";return;}QDomElement root = document.documentElement();qDebug()<<root.tagName();QDomElement catalogs = root.firstChildElement();if( catalogs.isNull() )return;elseqDebug()<<catalogs.tagName();while(!catalogs.isNull()){QString tag = catalogs.attributeNode("id").value();QStringList child;QPair<QString,QStringList> pair;for(int i = 0;i < catalogs.childNodes().size();i++)child<<catalogs.childNodes().at(i).nodeName();pair.first = tag;pair.second = child;catalogList.append(pair);catalogs = catalogs.nextSiblingElement();}file.close();写⼊XMLQFile file(DirectorOf("xml").absoluteFilePath(xmlName));if (!file.open(QFile::ReadOnly | QFile::Text))return false;QString errorStr;int errorLine;int errorColumn;QDomDocument doc;if (!doc.setContent(&file, false, &errorStr, &errorLine, &errorColumn))return false;file.close();QDomElement root = doc.documentElement();if(root.tagName() != "Catalog")return false;QDomElement element = doc.createElement("View");QDomAttr idAttr = doc.createAttribute("id");element.setAttributeNode(idAttr);element.setAttribute("id",typeName);for(int i = 0;i < catalogs.size();i++){QDomElement cataItem = doc.createElement(catalogs.at(i));element.appendChild(cataItem);}root.appendChild(element);/* QDomProcessingInstruction instruction;instruction = doc.createProcessingInstruction("xml","version=\"1.0\" encoding=\"GBK\""); doc.appendChild(instruction);*/QFile f(DirectorOf("xml").absoluteFilePath(xmlName));if(!f.open(QFile::WriteOnly | QFile::Text))return false;QTextStream out(&f);doc.save(out,4);f.close();return true;。
xml的四种解析方法及源代码
xml的四种解析方法及源代码(SAX、DOM、JDOM、DOM4J)第二种:DOM解析DOM中的核心概念就是节点。
DOM在分析XML文档时,将将组成XML文档的各个部分(元素、属性、文本、注释、处理指令等)映射为一个对象(节点)。
在内存中,这些节点形成一课文档树。
整棵树是一个节点,树中的每一个节点也是一棵树(子树),可以说,DOM就是对这棵树的一个对象描述,我们通过访问树中的节点来存取XML文档的内容。
PS:属性节点是附属于元素的,不能被看做是元素的子节点,更不能作为一个单独的节点DOMPrinter.javaJava代码import org.w3c.dom.Document;import dNodeMap;import org.w3c.dom.Node;import .apache.xerces.internal.parsers.DOMParser;public class DOMPrinter{public static void main(String[] args){try{/** *//** 获取Document对象 */DOMParser parser = new DOMParser();parser.parse("db.xml");Document document = parser.getDocument();printNode(document);} catch (Exception e){e.printStackTrace();}}public static void printNode(Node node){short nodeType=node.getNodeType();switch(nodeType){case Node.PROCESSING_INSTRUCTION_NODE://预处理指令类型 printNodeInfo(node);break;case Node.ELEMENT_NODE://元素节点类型printNodeInfo(node);printAttribute(node);break;case Node.TEXT_NODE://文本节点类型printNodeInfo(node);break;default:break;}Node child=node.getFirstChild();while(child!=null){printNode(child);child=child.getNextSibling();}}/** *//*** 根据节点类型打印节点* @param node*/public static void printNodeInfo(Node node){if (node.getNodeType() == Node.ELEMENT_NODE){System.out.println("NodeName: " + node.getNodeName()); }else if (node.getNodeType() == Node.TEXT_NODE){String value = node.getNodeValue().trim();if (!value.equals(""))System.out.println("NodeValue: " + value);elseSystem.out.println();}else{System.out.println(node.getNodeName()+" : "+node.getNodeValu e());}}/** *//*** 打印节点属性* @param aNode 节点*/public static void printAttribute(Node aNode){NamedNodeMap attrs = aNode.getAttributes();if(attrs!=null){for (int i = 0; i < attrs.getLength(); i++){Node attNode = attrs.item(i);System.out.println("Attribute: " + attNode.getNodeName() + "=\"" + attNode.getNodeValue()+"\"");}}}DOM生成XML文档:DOMCreateExample.javaJava代码import java.io.FileNotFoundException;import java.io.FileOutputStream;import java.io.IOException;import javax.xml.parsers.DocumentBuilder;import javax.xml.parsers.DocumentBuilderFactory;import javax.xml.parsers.ParserConfigurationException;import org.w3c.dom.Document;import org.w3c.dom.Element;import .apache.xml.internal.serialize.XMLSerializer;public class DOMCreateExample{public static void main(String[] args) throws ParserConfiguratio nException{//DOMImplementation domImp = DOMImplementationImpl.getDOMImple mentation();DocumentBuilderFactory builderFact = DocumentBuilderFactory.ne wInstance();DocumentBuilder builder = builderFact.newDocumentBuilder();Document doc = builder.newDocument();//Document doc = domImp.createDocument(null, null, null);Element root = doc.createElement("games");Element child1 = doc.createElement("game");child1.appendChild(doc.createTextNode("Final Fantasy VII")); child1.setAttribute("genre", "rpg");root.appendChild(child1);doc.appendChild(root);XMLSerializer serial;try{serial = new XMLSerializer(new FileOutputStream("domcreate.x ml"), null);serial.serialize(doc);} catch (FileNotFoundException e1){e1.printStackTrace();} catch (IOException e){e.printStackTrace();}}}第三种JDOM解析JDOM利用了java语言的优秀特性,极大地简化了对XML文档的处理,相比DOM 简单易用。
读取xml的五种方法
124 * @throws SAXException */
125 public void endElement(String namespaceURI, String localName,String qName) throws SAXException{
28 System.exit(1);
29 }
30 //获得根节点StuInfo
31 Element elmtStuInfo = doc.getDocumentElement();
32 //得到所有student节点
33 NodeList nlStudent = elmtStuInfo.getElementsByTagNameNS(
23 } catch (DOMException dom) {
24Message());
25 System.exit(1);
26 } catch (IOException ioe) {
27 System.err.println(ioe);
在java环境下读取xml文件的方法主要有5种:DOM、SAX、JDOM、JAXB、dom4j
最常用、最好用的dom4j
1. DOM(Document Object Model)
此 方法主要由W3C提供,它将xml文件全部读入内存中,然后将各个元素组成一棵数据树,以便快速的访问各个节点 。 因此非常消耗系统性能 ,对比较大的文档不适宜采用DOM方法来解析。 DOM API 直接沿袭了 XML 规范。每个结点都可以扩展的基于 Node 的接口,就多态性的观点来讲,它是优秀的,但是在 Java 语言中的应用不方便,并且可读性不强。
JAVA 解析XML 文件的三种解析方法
创建解析XML文件的三种解析方法1、第一种用w3c解析package w3c;import java.io.File;import java.io.FileOutputStream;import java.util.Random;import javax.xml.parsers.DocumentBuilder;import javax.xml.parsers.DocumentBuilderFactory;import javax.xml.transform.OutputKeys;import javax.xml.transform.Transformer;import javax.xml.transform.TransformerFactory;import javax.xml.transform.dom.DOMSource;import javax.xml.transform.stream.StreamResult;import org.w3c.dom.Document;import org.w3c.dom.Element;import org.w3c.dom.NodeList;public class w3c {public static void main(String[] args) throws Exception{ createXml();}//创建XML文档并创建节点public static void createXml() throws Exception{//获取XML解析器工厂类DocumentBuilderFactory dbf=DocumentBuilderFactory.newInstance();//获取XML解析器DocumentBuilder db = dbf.newDocumentBuilder();//获取操作的document对象Document document = db.newDocument();//设置XML文件的版本document.setXmlVersion("1.0");//创建根节点Element root = document.createElement("students");//将根节点添加到document对象中document.appendChild(root);//声明一个姓名的数组String nameList[] = {"吕布","赵云","马超","张飞","关羽","许褚","孙策","周瑜","夏侯渊","张颌","于禁","黄忠","典韦","曹仁","程普"};String sexList[] = {"男","女"};//循环添加数据for(int i = 0 ;i < 20 ; i++){//创建根元素节点Element rootelement = document.createElement("student");//声明参数IDString id ="";//循环生成一个9为的随机ID数for(int j = 0; j< 9 ; j ++ ){id += new Random().nextInt(8)+1;}//设置根元素节点的属性rootelement.setAttribute("id",id);//将根元素节点添加到根节点中root.appendChild(rootelement);//设置元素节点Element name = document.createElement("name");Element sex = document.createElement("sex");Element age = document.createElement("age");Element phone = document.createElement("phone");//给元素节点赋值name.setTextContent(nameList[newRandom().nextInt(nameList.length)]);sex.setTextContent(sexList[newRandom().nextInt(sexList.length)]);age.setTextContent(new Random().nextInt(20)+20+"");String tel ="";for(int k = 0; k< 7 ; k++ ){tel += new Random().nextInt(9);}phone.setTextContent("0756-"+tel);//将元素节点添加到根元素节点中rootelement.appendChild(name);rootelement.appendChild(sex);rootelement.appendChild(age);rootelement.appendChild(phone);}//开始把Document映射到文件TransformerFactory transFactory =TransformerFactory.newInstance();Transformer transFormer = transFactory.newTransformer();//生成的XML文件File file = new File("w3c.xml");//判断XML文件存不存在,如果不存在则创建if(file.exists()){file.createNewFile();}//设置是否添加空格transFormer.setOutputProperty(OutputKeys.INDENT, "yes");//设置输出文件的格式transFormer.setOutputProperty(OutputKeys.ENCODING, "utf-8");//输出XML文件transFormer.transform(new DOMSource(document), newStreamResult(new FileOutputStream(file)));//输出XML文件的路径System.out.println(file.getAbsolutePath());}//解析XML文档public static void resolving() throws Exception{//获取XML解析器工厂类DocumentBuilderFactory dbf=DocumentBuilderFactory.newInstance();//获取XML解析器DocumentBuilder db = dbf.newDocumentBuilder();//获取操作的document对象Document document = db.parse(new File("w3c.xml"));//获取XML文件的根元素节点NodeList root = document.getElementsByTagName("student");//循环根元素节点信息for(int i = 0 ; i < root.getLength() ;i++){Element student = (Element)root.item(i);System.err.println("id = "+student.getAttribute("id")+" name = "+student.getElementsByTagName("name").item(0).getTextContent()+" sex = "+student.getElementsByTagName("sex").item(0).getTextContent()+" age = "+student.getElementsByTagName("age").item(0).getTextContent()+" phone = "+student.getElementsByTagName("phone").item(0).getTextContent());}}}2、第二种用jdom解析package jdom;import java.io.FileOutputStream;import java.util.Iterator;import java.util.List;import java.util.Random;import org.jdom.Document;import org.jdom.Element;import org.jdom.input.SAXBuilder;import org.jdom.output.Format;import org.jdom.output.XMLOutputter;public class jdom {private static String xmlpath = "jdom.xml";public static void main(String[] args) throws Exception{ //resolving();createXml();}//创建XML文件并添加节点public static void createXml() throws Exception{ //创建document对象Document document = new Document();//创建根节点Element root = new Element("students");//将根节点添加到document对象中document.addContent(root);for(int i = 0 ;i < 20 ; i++){//创建根元素节点Element student = new Element("student");//声明参数IDString id ="";//循环生成一个9为的随机ID数for(int j = 0; j< 9 ; j ++ ){id += new Random().nextInt(8)+1;}//设置跟元素节点的属性student.setAttribute("id",id);//将根元素节点添加到根节点中root.addContent(student);//声明一个姓名的数组String nameList[] = {"吕布","赵云","马超","张飞","关羽","许褚","孙策","周瑜","夏侯渊","张颌","于禁","黄忠","典韦","曹仁","程普"};String sexList[] = {"男","女"};//创建元素节点Element name = new Element("name");Element sex = new Element("sex");Element age =new Element("age");Element phone = new Element("phone");//设置根元素节点的文本值name.setText(nameList[newRandom().nextInt(nameList.length)]);sex.setText(sexList[new Random().nextInt(sexList.length)]);age.setText(new Random().nextInt(20)+20+"");String tel ="";for(int k = 0; k< 7 ; k++ ){tel += new Random().nextInt(9);}phone.setText("0756-"+tel);//将元素节点添加到根元素节点中student.addContent(name);student.addContent(sex);student.addContent(age);student.addContent(phone);}//设置XML输出排版Format format = Format.getPrettyFormat();XMLOutputter out = new XMLOutputter(format);//输出XML文件out.output(document, new FileOutputStream(xmlpath));}//解析XML文档@SuppressWarnings("rawtypes")public static void resolving() throws Exception{//获取XML解析器SAXBuilder builder = new SAXBuilder();//获取document对象Document doucment = builder.build(xmlpath);//获取根节点Element students = doucment.getRootElement();//获取根元素节点List studentList = students.getChildren("student");//循环获取元素文本值,第一种方法for(int i = 0 ; i< studentList.size() ; i++ ){Element student = (Element)studentList.get(i);System.out.println("id ="+student.getAttributeValue("id")+" name = "+student.getChildText("name")+" sex = "+student.getChildText("sex")+" age = "+student.getChildText("age")+" phone = "+student.getChildText("phone"));}System.err.println("\n---------------------------------------------------------------------");//循环获取元素文本值,第二种方法for(Iterator iter=studentList.iterator();iter.hasNext();){ Element student = (Element)iter.next();System.out.println("id ="+student.getAttributeValue("id")+" name = "+student.getChildText("name")+" sex = "+student.getChildText("sex")+" age = "+student.getChildText("age")+" phone = "+student.getChildText("phone"));}}}3、第三种用dom4j解析package dom4j;import java.io.File;import java.io.FileWriter;import java.util.Iterator;import java.util.List;import java.util.Random;import org.dom4j.Document;import org.dom4j.DocumentHelper;import org.dom4j.Element;import org.dom4j.io.OutputFormat;import org.dom4j.io.SAXReader;import org.dom4j.io.XMLWriter;public class dom4j {private static String xmlpath = "dom4j.xml";public static void main(String[] args)throws Exception{//createXml();resolving();}public static void createXml() throws Exception{//创建document对象Document document = DocumentHelper.createDocument();//创建根节点Element root = DocumentHelper.createElement("studnets");//将根节点添加到document对象中document.setRootElement(root);for(int i = 0 ;i < 20 ; i++){//创建根元素节点并将根元素节点添加到根节点中Element student = root.addElement("student");//设置根元素节点的值//声明参数IDString id ="";//循环生成一个9为的随机ID数for(int j = 0; j< 9 ; j ++ ){id += new Random().nextInt(8)+1;}student.addAttribute("id",id);//创建元素节点并将元素节点添加到根元素节点中Element name = student.addElement("name");Element sex = student.addElement("sex");Element age = student.addElement("age");Element phone = student.addElement("phone");//声明一个姓名的数组String nameList[] = {"吕布","赵云","马超","张飞","关羽","许褚","孙策","周瑜","夏侯渊","张颌","于禁","黄忠","典韦","曹仁","程普"};String sexList[] = {"男","女"};//设置元素节点的文本值name.setText(nameList[newRandom().nextInt(nameList.length)]);sex.setText(sexList[new Random().nextInt(sexList.length)]);age.setText(new Random().nextInt(20)+20+"");String tel ="";for(int k = 0; k< 7 ; k++ ){tel += new Random().nextInt(9);}phone.setText("0756-"+tel);}//设置XML文件输出的格式OutputFormat format = new OutputFormat("\t", true);format.setEncoding("utf-8");XMLWriter xmlWriter = new XMLWriter(new FileWriter(xmlpath), format);//输出XML文件xmlWriter.write(document);xmlWriter.close();}//解析XML文件@SuppressWarnings("rawtypes")public static void resolving() throws Exception{//获取XML解析器SAXReader saxReader = new SAXReader();//获取document对象Document document = saxReader.read(new File(xmlpath));//获取根节点Element root = document.getRootElement();//获取根元素节点List chindList = root.elements();//循环获取元素文本值,第一种方法for(Iterator iter = chindList.iterator(); iter.hasNext();){ Element student =(Element)iter.next();System.out.println("id = "+student.attributeValue("id")+" name = "+student.elementText("name")+" sex = "+student.elementText("sex")+" age = "+student.elementText("age")+" phone = "+student.elementText("phone"));}System.err.println("\n---------------------------------------------------------------------");//循环获取元素文本值,第二种方法for(int i = 0 ; i< chindList.size() ; i++ ){Element student = (Element)chindList.get(i);System.out.println("id = "+student.attributeValue("id")+" name = "+student.elementText("name")+" sex = "+student.elementText("sex")+" age = "+student.elementText("age")+" phone = "+student.elementText("phone"));}}}。
如何利用Java语言进行XML编程的研究报告
如何利用Java语言进行XML编程的研究报告随着计算机技术的不断发展,XML(可扩展标记语言)已经成为Web数据交换的一种标准方式。
它是一种使用标签描述数据的语言,具有自我描述性以及能够方便地扩展的特点。
而Java语言可以很好地与XML技术相结合,用于XML编程。
本文将介绍如何利用Java语言进行XML编程的方法和技巧。
一、读取XML文件Java语言中提供了许多读取XML文件的工具,如DOM、SAX、JDOM、XMLBeans等。
其中DOM(文档对象模型)是最常用的读取XML文件的方式。
DOM是一种树状结构,将XML文档中的标签、属性、内容等信息以节点的形式表示,每个节点都有一个唯一的节点名和一个节点值。
通过使用DOM解析器,Java程序可以将XML文档转换为DOM树,然后通过遍历DOM树的方式实现对XML文档的读取。
二、创建XML文档Java语言中也提供了多种创建XML文档的方式,如DOM、JDOM、XOM、StAX等。
其中DOM仍然是最常用的方式。
通过DOM创建XML文档的过程与读取XML文档的过程类似,只不过是反过来了。
先创建一个空的DOM树,然后按照XML文档的结构,在树中添加标签、属性和文本节点等元素,最后将DOM树转换为XML文档。
三、解析XML文件解析XML文件是将XML文档转换为Java对象,使程序能够方便地使用XML数据。
Java语言中可以使用JAXB、Castor、XMLBeans等工具进行XML文件的解析。
其中,JAXB(Java Architecture for XML Binding)是最常用的XML解析工具之一。
JAXB通过将XML数据映射到Java对象上,实现了XML文档的解析和Java对象的序列化过程。
四、使用XPath查询XML数据XPath是一种用于在XML文档中查询信息的语言,它可以实现XML数据的定位、筛选和排序等操作。
在Java语言中,可以使用JDOM、DOM4J等工具实现XPath查询XML数据的功能。
Jdom的安装和使用
Jdom的安装和使用一、Jdom的下载和安装Jdom的下载可至jdom官网,目前最新的是2.05,不过要是怀旧用了jdk1.2到1.4,也可以用1.1.3,不得不说,老外的开源软件的确是好。
上次搞gcc2.85去编译raw的时候,发现那作者居然从1998年维护到2002年,不容易啊!使用两个版本,区别只是导出包的时候,包名是org.jdom还是org.jdom2;下载后,将jdom.jar(2.05版为jdom-2.0.5.jar,解压后即可见到;1.1.3版为jdom-1.1.3.jar,解压后在build 目录下),将jar文件放到一个可靠的位置,相对专业的位置是classpath,比如楼主参考放在了C:\Program Files\Java\jre6\lib\ext,实际上,这个位置可以任意,因为是需要添加jar文件路径工场的build path的,不过编程也需要专业一点,以及方便归档,所以建议还是放到lib/ext。
至此,安装完毕二、Jdom使用准备—生成XML文件新建工程GenerateXML,并添加jar文件至工程build path,如图:准备以下代码,代码抄自ltb6w不过此时eclipse会有报错:Access restriction: The type Element is not accessible due to restriction on required library C:\Program Files\Java\jre6\lib\ext\jdom-1.1.3.jar对于这个问题,删除build path里的JRE System Library,然后再添加即可。
添加过程中,选择Add Library——JRE System Library到如下界面选择如下:三、XML文件解析新建XMLParse工程搞定!在读取xml文件时,记得dom4j有elementtext方法,直接获取每一个Element的属性值即可,而jdom的解析貌似都是从根节点开始再getChildText获取节点值,各有所长吧。
dom4j解析XML文档
将dom4j-1.6.1.jar添加到系统CLASSPATH环境变量中
Dom4j常用的API 【重点掌握】
Element Branch Document
Cloneable
Node
Attribute
DocumentType
CharacterData
ProcessingInstruction
CDATA
<list> <book>疯狂XML讲义</book> <game>扫雷</game> <sport>乒乓球</sport> </list>
在获取<list…/>节点之后,如果希望获取它包含的3个子节点的数 节点之后,如果希望获取它包含的 个子节点的数 在获取 节点之后 据,需要使用如下代码
//获取list元素下的所有子元素 NodeList itemList=list.getChildNodes(); //遍历每个子元素 for(int I=0;I<itemList.getLength();I++){ System.out.println(itemList.item(j).getTextContent().trim()); }
Vistor接口的方法
visit(Attribute node) visit(CDATA node)
简单说明
当Visitor对象访问属性节点时将回调该方法 当Visitor对象访问CDATA片段时将回调该方法 当Visitor对象访问注释节点时将回调该方法 当Visitor对象访问文档根节点时将回调该方法 当Visitor对象访问DTD内容将回调该方法 当Visitor对象访问元素节点将回调该方法 当Visitor对象访问Entity节点将回调该方法 当Visitor对象访问命名空间时回调该方法 当Visitor对象访问处理指令时回调该方法 当Visitor对象访问文档内容时将回调该方法
JDOM 介绍及使用指南
JDOM 介绍及使用指南一、JDOM 简介JDOM是一个开源项目,它基于树型结构,利用纯JAVA的技术对XML文档实现解析、生成、序列化以及多种操作。
JDOM 直接为JAVA编程服务。
它利用更为强有力的JAVA语言的诸多特性(方法重载、集合概念以及映射),把SAX和DOM的功能有效地结合起来。
在使用设计上尽可能地隐藏原来使用XML过程中的复杂性。
利用JDOM处理XML文档将是一件轻松、简单的事。
JDOM 在2000年的春天被Brett McLaughlin和Jason Hunter开发出来,以弥补DOM及SAX在实际应用当中的不足之处。
这些不足之处主要在于SAX没有文档修改、随机访问以及输出的功能,而对于DOM来说,JAVA 程序员在使用时来用起来总觉得不太方便。
DOM的缺点主要是来自于由于Dom是一个接口定义语言(IDL),它的任务是在不同语言实现中的一个最低的通用标准,并不是为JAVA特别设计的。
JDOM的最新版本为JDOM Beta 9。
最近JDOM被收录到JSR-102内,这标志着JDOM成为了JAVA平台组成的一部分。
二、JDOM 包概览JDOM是由以下几个包组成的org.JDOMorg.JDOM.inputorg.JDOM.outputorg.JDOM.adaptersorg.JDOM.transform三、JDOM 类说明org.JDOM这个包里的类是你解析xml文件后所要用到的所有数据类型。
AttributeCDATAComentDocTypeDocumentElementEntityRefNamespaceProscessingInstructionTextorg.JDOM.transform在涉及xslt格式转换时应使用下面的2个类JDOMSourceJDOMResultorg.JDOM.input输入类,一般用于文档的创建工作SAXBuilderDOMBuilderResultSetBuilderorg.JDOM.output输出类,用于文档转换输出XMLOutputterSAXOutputterDomOutputterJTreeOutputter使用前注意事项:1.JDOM对于JAXP 以及 TRax 的支持JDOM 支持JAXP1.1:你可以在程序中使用任何的parser工具类,默认情况下是JAXP的parser。
Java相关课程系列笔记之五XML学习笔记(建议用WPS打开)
>XML学习笔记Java相关课程系列笔记之五笔记内容说明XML(范传奇老师主讲,占笔记内容100%);目录一、 XML基本语法 0XML介绍 0XML元素 0XML属性 0实体引用 0CDATA段 (1)DTD声明元素 (1)DTD声明元素:声明空元素 (2)DTD声明元素:含有PCDATA (2)DTD声明元素:带有子元素(子元素列表)的元素 (2)DTD声明元素:声明只出现一次的元素 (3)DTD声明元素:声明可多次出现的元素 (3)DTD声明元素:子元素只能是其中之一的情况 (3)DTD声明元素:子元素可以是元素也可以是文本 (3)DTD声明元素:总结 (4)DTD中声明元素的属性 (4)属性类型 (4)属性值的约束 (4)DTD命名空间介绍 (4)二、 Schema简介 (5)Schema的作用 (5)Schema文件的扩展名xsd (5)三、 Java解析XML (6)Java与XML共同点 (6)Java解析XML有两种方式 (6)JDOM/DOM4J (6)DOM解析 (6)SAX解析 (6)案例:使用DOM4J包的核心API解析xml文件 (6)案例:使用DOM4J包的核心API写入xml文件 (6)四、 XPath语言 (8)XPath基本介绍 (8)使用XPath的好处 (8)XPath基本语法 (8)DOM4J对XPath的支持 (8)五、附文件 (9)一、XML基本语法XML介绍1)XML是可扩展标记语言(EXtensible Markup Language)。
2)XML是独立于软件和硬件的信息传输工具。
3)XML是以文本的形式存在于一个文本文件中的,一般该文件的后缀名就是“.xml”,例如:。
4)XML的设计宗旨是传输信息(尤其是结构比较复杂的数据),而不是显示数据。
5)XML可以描绘树状结构的数据。
因为这个特点,除了传输数据外,更多时候我们使用XML作为配置文件。
java解析xml详解及示例
java解析xml详解及示例java 解析xml的几种方法第一种:DOMDOM的全称是Document Object Model,也即文档对象模型。
在应用程序中,基于DOM 的XML分析器将一个XML文档转换成一个对象模型的集合(通常称DOM树),应用程序正是通过对这个对象模型的操作,来实现对XML文档数据的操作。
通过DOM接口,应用程序可以在任何时候访问XML文档中的任何一部分数据,因此,这种利用DOM接口的机制也被称作随机访问机制。
DOM接口提供了一种通过分层对象模型来访问XML文档信息的方式,这些分层对象模型依据XML的文档结构形成了一棵节点树。
无论XML文档中所描述的是什么类型的信息,即便是制表数据、项目列表或一个文档,利用DOM所生成的模型都是节点树的形式。
也就是说,DOM强制使用树模型来访问XML文档中的信息。
由于XML本质上就是一种分层结构,所以这种描述方法是相当有效的。
DOM树所提供的随机访问方式给应用程序的开发带来了很大的灵活性,它可以任意地控制整个XML文档中的内容。
然而,由于DOM 分析器把整个XML文档转化成DOM树放在了内存中,因此,当文档比较大或者结构比较复杂时,对内存的需求就比较高。
而且,对于结构复杂的树的遍历也是一项耗时的操作。
所以,DOM分析器对机器性能的要求比较高,实现效率不十分理想。
不过,由于DOM分析器所采用的树结构的思想与XML 文档的结构相吻合,同时鉴于随机访问所带来的方便,因此,DOM分析器还是有很广泛的使用价值的。
Java代码import java.io.File;import javax.xml.parsers.DocumentBuilder;import javax.xml.parsers.DocumentBuilderFactory;import org.w3c.dom.Document;import org.w3c.dom.Element;import org.w3c.dom.NodeList;public class DomT est1{public static void main(String[] args) throws Exception{// step 1: 获得dom解析器工厂(工作的作用是用于创建具体的解析器)DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();// System.out.println("class name: " + dbf.getClass().getName());// step 2:获得具体的dom解析器DocumentBuilder db = dbf.newDocumentBuilder();// System.out.println("class name: " + db.getClass().getName());// step3: 解析一个xml文档,获得Document对象(根结点)Document document = db.parse(new File("candidate.xml"));NodeList list = document.getElementsByTagName("PERSON");for(int i = 0; i < list.getLength(); i++){Element element = (Element)list.item(i);String content =element.getElementsByTagName("NAME").item(0).getFirstC hild().getNodeValue();System.out.println("name:" + content);content =element.getElementsByTagName("ADDRESS").item(0).getFir stChild().getNodeValue(); System.out.println("address:" + content);content =element.getElementsByTagName("TEL").item(0).getFirstChil d().getNodeValue();System.out.println("tel:" + content);content =element.getElementsByTagName("FAX").item(0).getFirstChil d().getNodeValue();System.out.println("fax:" + content);content =element.getElementsByTagName("EMAIL").item(0).getFirstC hild().getNodeValue();System.out.println("email:" + content);System.out.println("--------------------------------------");}}}Java代码import java.io.File;import javax.xml.parsers.DocumentBuilder;import javax.xml.parsers.DocumentBuilderFactory;import org.w3c.dom.Attr;import /doc/723478280.html,ment;import org.w3c.dom.Document;import org.w3c.dom.Element;import/doc/723478280.html,dNodeMap;import org.w3c.dom.Node;import org.w3c.dom.NodeList;/*** 使用递归解析给定的任意一个xml文档并且将其内容输出到命令行上* @author*/public class DomT est3{public static void main(String[] args) throws Exception{DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();DocumentBuilder db = dbf.newDocumentBuilder();Document doc = db.parse(new File("student.xml"));//获得根元素结点Element root = doc.getDocumentElement();parseElement(root);}private static void parseElement(Element element){String tagName = element.getNodeName();NodeList children = element.getChildNodes();System.out.print("<" + tagName);//element元素的所有属性所构成的NamedNodeMap对象,需要对其进行判断 NamedNodeMap map = element.getAttributes();//如果该元素存在属性if(null != map){{//获得该元素的每一个属性Attr attr = (Attr)map.item(i);String attrName = attr.getName();String attrValue = attr.getValue();System.out.print(" " + attrName + "=\"" + attrValue + "\""); } }System.out.print(">");for(int i = 0; i < children.getLength(); i++){Node node = children.item(i);//获得结点的类型short nodeType = node.getNodeType();if(nodeType == Node.ELEMENT_NODE){//是元素,继续递归parseElement((Element)node);}else if(nodeType == Node.TEXT_NODE){//递归出口System.out.print(node.getNodeValue());}else if(nodeType == /doc/723478280.html,MENT_NODE) {System.out.print("System.out.print(data);System.out.print("-->");}}System.out.print("");}}第二种 sax:SAX的全称是Simple APIs for XML,也即XML简单应用程序接口。
Java常见数据交换格式——xml、json、yaml
Java常见数据交换格式——xml、json、yaml⽬录数据交换格式 每⼀种编程语⾔都有不同的数据结构,在多个应⽤程序之间,如果编写每⼀个应⽤程序的编程语⾔都不同,那么他们的数据是不能直接传递的,需要将他们转换为特定的格式,然后再进⾏传输,保证发送⽅和接收⽅都能正确的读取数据。
另外,不同操作系统,不同平台之间实现数据共享,也需要将数据转换为两个平台或者操作系统都能读取的格式。
数据交换格式就是“应⽤程序间通信时使⽤的数据格式”,⽽常见的数据交换格式包括:XML、JSON、YAML。
下⾯就是⽤Java来实现上⾯这3种格式的操作。
XML xml(eXtensible Markup Language),可扩展标记语⾔,详细的介绍可以⾃⾏查阅。
⼀个标准的xml⽂件内容如下(⽰例⽂件名为books.xml):<?xml version="1.0" encoding="utf-8"?><books><book id="one"><name>Java加密与解密的艺术</name><price>89</price><language>Chinese</language><author>梁栋</author></book><book id="two"><name>Effective Java</name><price>59</price><language>English</language></book></books> 在xml中,有⼏个专业术语: 节点:⽐如上⾯的<books>、<book>、<name>、<price>、<language>、<author>; 节点值:⽐如"Effective Java" 是< name>节点的值; 属性:⽐如<book>节点的id属性; 属性值:<book>节点的id属性值分别为1、2. 注意,每⼀个节点都可以有⼦节点,⽐如<books>的⼦节点有<book>节点,⽽<book>的⼦节点包括<name>、<price>、<language>、<author>; 在使⽤Java来操作xml的时候,⼀般就是对于上⾯这⼏个内容进⾏处理,⽐如获取节点名称和及节点值、节点属性和属性值。
java xml 调用函数
java xml 调用函数Java XML 调用函数一、介绍XML(可扩展标记语言)是一种用于存储和传输数据的标记语言,而Java是一种广泛使用的编程语言。
在Java中,我们可以使用各种库和工具来处理XML数据。
在本文中,我们将学习如何使用Java来调用XML函数。
二、XML解析在Java中,我们可以使用许多库来解析XML文件。
其中最常用的是DOM(文档对象模型)和SAX(简单API for XML)。
DOM解析器将整个XML文档加载到内存中,使我们可以随意访问和操作XML数据。
而SAX解析器则逐行读取XML文档,适用于大型XML文件。
1. DOM解析DOM解析器提供了一系列的API,我们可以使用这些API来解析和操作XML文档。
下面是一个示例代码,演示了如何使用DOM 解析器来解析XML文件。
```javaimport org.w3c.dom.*;import javax.xml.parsers.*;import java.io.*;public class DOMParserExample {public static void main(String[] args) {try {File inputFile = new File("input.xml");DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();Document doc = dBuilder.parse(inputFile);doc.getDocumentElement().normalize();System.out.println("Root element: " + doc.getDocumentElement().getNodeName());NodeList nList = doc.getElementsByT agName("student"); System.out.println("----------------------------");for (int temp = 0; temp < nList.getLength(); temp++) { Node nNode = nList.item(temp);System.out.println("\nCurrent Element: " + nNode.getNodeName());if (nNode.getNodeType() == Node.ELEMENT_NODE) { Element eElement = (Element) nNode;System.out.println("Student roll no: " + eElement.getAttribute("rollno"));System.out.println("First Name: " + eElement.getElementsByTagName("firstname").item(0).getText Content());System.out.println("Last Name: " + eElement.getElementsByTagName("lastname").item(0).getText Content());System.out.println("Nick Name: " + eElement.getElementsByTagName("nickname").item(0).getTex tContent());System.out.println("Marks: " + eElement.getElementsByTagName("marks").item(0).getTextCo ntent());}}} catch (Exception e) {e.printStackTrace();}}}```2. SAX解析SAX解析器是一种事件驱动的解析器,它逐行读取XML文件并触发相应的事件。
Dom4J、JDOM、DOM、SAX和Pull技术解析XML文件
解析XML文件的五种技术1.1SAX技术SAX处理的优点非常类似于流媒体的优点。
分析能够立即开始,而不是等待所有的数据被处理。
而且,由于应用程序只是在读取数据时检查数据,因此不需要将数据存储在内存中。
这对于大型文档来说是个巨大的优点。
事实上,应用程序甚至不必解析整个文档;它可以在某个条件得到满足时停止解析。
一般来说,SAX还比它的替代者DOM快许多。
选择DOM还是选择SAX?对于需要自己编写代码来处理XML文档的开发人员来说,选择DOM 还是SAX解析模型是一个非常重要的设计决策。
DOM采用建立树形结构的方式访问XML文档,而SAX采用的事件模型。
DOM解析器把XML文档转化为一个包含其内容的树,并可以对树进行遍历。
用DOM解析模型的优点是编程容易,开发人员只需要调用建树的指令,然后利用navigation APIs访问所需的树节点来完成任务。
可以很容易的添加和修改树中的元素。
然而由于使用DOM解析器的时候需要处理整个XML文档,所以对性能和内存的要求比较高,尤其是遇到很大的XML文件的时候。
由于它的遍历能力,DOM解析器常用于XML文档需要频繁的改变的服务中。
SAX解析器采用了基于事件的模型,它在解析XML文档的时候可以触发一系列的事件,当发现给定的tag的时候,它可以激活一个回调方法,告诉该方法制定的标签已经找到。
SAX对内存的要求通常会比较低,因为它让开发人员自己来决定所要处理的tag.特别是当开发人员只需要处理文档中所包含的部分数据时,SAX这种扩展能力得到了更好的体现。
但用SAX解析器的时候编码工作会比较困难,而且很难同时访问同一个文档中的多处不同数据。
1.1.1 SAX语法简介SAX是一个解析速度快并且占用内存少的xml解析器,非常适合用于Android等移动设备。
SAX 解析XML文件采用的是事件驱动,也就是说,它并不需要解析完整个文档,在按内容顺序解析文档的过程中,SAX会判断当前读到的字符是否合法XML语法中的某部分,如果符合就会触发事件。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
package com.alisoft.facepay.framework.bean;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.util.List;
import org.jdom.Document;
import org.jdom.Element;
import org.jdom.JDOMException;
import org.jdom.input.SAXBuilder;
import org.jdom.output.XMLOutputter;
/**
*
* @author hongliang.dinghl
* JDOM 生成与解析XML文档
*
*/
public class JDomDemo implements XmlDocument {
public void createXml(String fileName) {
Document document;
Element root;
root=new Element("employees");
document=new Document(root);
Element employee=new Element("employee");
root.addContent(employee);
Element name=new Element("name");
name.setText("ddvip");
employee.addContent(name);
Element sex=new Element("sex");
sex.setText("m");
employee.addContent(sex);
Element age=new Element("age");
age.setText("23");
employee.addContent(age);
XMLOutputter XMLOut = new XMLOutputter();
try {
XMLOut.output(document, new FileOutputStream(fileName)); } catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
public void parserXml(String fileName) {
SAXBuilder builder=new SAXBuilder(false);
try {
Document document=builder.build(fileName);
Element employees=document.getRootElement();
List employeeList=employees.getChildren("employee");
for(int i=0;i
Element employee=(Element)employeeList.get(i);
List employeeInfo=employee.getChildren();
for(int j=0;j
System.out.println(((Element)employeeInfo.get(j)).getName()+":"+((Element)em ployeeInfo.get(j)).getValue());
}
}
} catch (JDOMException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
}。