python读取xml文件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

python读取xml文件

还可以参见网址/uid-22183602-id-3036442.html

/uid-22183602-id-3036442.html

2014-03-04 23:43 by 虫师, 13913 阅读, 1 评论, 收藏, 编辑

关于python读取xml文章很多,但大多文章都是贴一个xml文件,然后再贴个处理文件的代码。这样并不利于初学者的学习,希望这篇文章可以更通俗易懂的教如何使用python 来读取xml 文件。

什么是xml?

xml即可扩展标记语言,它可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。

abc.xml

4

Python

测试

Zope

Ok ,从结构上,它很像我们常见的HTML超文本标记语言。但他们被设计的目的是不同的,超文本标记语言被设计用来显示数据,其焦点是数据的外观。它被设计用来传输和存储数据,其焦点是数据的内容。

那么它有如下特征:

首先,它是有标签对组成,

标签可以有属性:

标签对可以嵌入数据:abc

标签可以嵌入子标签(具有层级关系):

获得标签属性

那么,下面来介绍如何用python来读取这种类型的文件。

#coding=utf-8import xml.dom.minidom

#打开xml文档

dom = xml.dom.minidom.parse('abc.xml')

#得到文档元素对象

root = dom.documentElement print root.nodeName print root.nodeValue print root.nodeType print root.ELEMENT_NODE

mxl.dom.minidom 模块被用来处理xml文件,所以要先引入。

xml.dom.minidom.parse() 用于打开一个xml文件,并将这个文件对象dom变量。

documentElement 用于得到dom对象的文档元素,并把获得的对象给root

每一个结点都有它的nodeName,nodeValue,nodeType属性。

nodeName为结点名字。

nodeValue是结点的值,只对文本结点有效。

nodeType是结点的类型。catalog是ELEMENT_NODE类型

现在有以下几种:

'ATTRIBUTE_NODE'

'CDATA_SECTION_NODE'

'COMMENT_NODE'

'DOCUMENT_FRAGMENT_NODE'

'DOCUMENT_NODE'

'DOCUMENT_TYPE_NODE'

'ELEMENT_NODE'

'ENTITY_NODE'

'ENTITY_REFERENCE_NODE'

'NOTATION_NODE'

'PROCESSING_INSTRUCTION_NODE'

'TEXT_NODE'

NodeTypes - 有名常数

/xmldom/dom_nodetype.asp

获得子标签

现在要获得catalog的子标签以的标签name

4

Python

测试

Zope

对于知道元素名字的子元素,可以使用getElementsByTagName方法获取:

#coding=utf-8import xml.dom.minidom

#打开xml文档

dom = xml.dom.minidom.parse('abc.xml')

#得到文档元素对象

root = dom.documentElement

bb = root.getElementsByTagName('maxid')

b= bb[0]print b.nodeName

bb = root.getElementsByTagName('login')

b= bb[0]print b.nodeName

如何区分相同标签名字的标签:

4

Python

测试

Zope

标签不止一个如何区分?

#coding=utf-8import xml.dom.minidom

#打开xml文档

dom = xml.dom.minidom.parse('abc.xml')

#得到文档元素对象

root = dom.documentElement

相关文档
最新文档