xml教程(精)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章
XML基础
XML主要内容
• • • • •
XML概述 DTD和Schema的建立与应用 CSS和XSLT显示XML DOM SAX
本章主要内容
• • • • •
标记语言 XML的定义 XML的历史 XML的优势 XML的文档规则
标记语言
GML(1969)
通用标记语言 标准通用标记语言 可扩展标记语言
XML---字符数据
• 开始标记和结束标记之间的文本被定义为
“字符数据” • 字符数据可以是“<”以外的任何合法 (Unicode) 字符
– <book>Java夜未眠</book>
XML---字符数据
• 字符数据分类
– PCDATA --- 普通字符数据 • 将由解析器解析 – CDATA • 不会由解析器解析
XML的优势
• 优势
– – – – 数据重用 数据和表示分离 可扩展性 语意信息
自定义标记
• 可以按照自己的需要定义标记 • 使应用有更大的灵活性
异构系统整合
XML例子
• • • • • • • • • • • • • • •
<?xml version="1.0" encoding="gb2312" ?> <书籍列表> <计算机书籍> <书名>xml</书名> <价格>66.00</价格> </计算机书籍> <计算机书籍> <书名>xml</书名> <价格>66.00</价格> </计算机书籍> <计算机书籍> <书名><![CDATA[<xml>]]></书名> <价格>66.00</价格> </计算机书籍> </书籍列表>
超文本标记语言
HTML(1996)
SGML(1986)
XML(1998)
XHTML
SVG
SMIL
HDML
…
OEB
可扩展超文 可缩放矢量 同步多媒体 手持设备 本标记语言 图形语言 综合语言 标记语言
开放电子 结构规范
SGML
• 标准通用标记语言
• 多种的输出格式(纯文字,HTML 等) 为所有的文件提供
• type="text/css" 或者 type="text/xsl"
• •
•
元素
元素TITLE
<TITLE> CSUINFOSOFT Ltd.</TITLE>
开始标记 <TITLE/> 空元素TITLE
内容
结束标记 <TITLE ID="101"/>
空元素TITLE
元素之间的关系:子元素/父元素、祖先/后代 元素内容的类型:嵌套元素/字符数据/实体引用/ CDATA节/处理指令/注释
记语言。 • XML由万维网协会(W3C)创建
XML---简介
XML 声明- 定义 XML 版本 包含数据的 XML 标签
XML和Html比较
比较内容 HTML XML
可扩展性
不具有扩展性
是元标记言,可用于定义新 的标记语言 侧重于如何结构化地描述信 息
侧重点
侧重于如何表现信息
语法要求
不要求标记的嵌套、配对等, 严格要求嵌套、配对,并遵 循DTD的树形结构 不要求标记之间具有一定的 顺序 难于阅读、维护 结构清晰,便于阅读、维护
标记
• 标记是左尖括号(<)和右尖括号(>)之
间的文本。有开始标记(例如 <name>) 和结束标记(例如 </name>) • 不能省去任何结束标记。 • 如果一个元素根本不包含标记,则称为空 元素;HTML 换行(<br>)就是个例子。在 XML 文档的空元素中,您可以把结束斜杠 放在开始标记中。
文本内容PCDATA
• XML支持Unicde字符集,因此可以在文本中包
•
含字母/数字/标点/符号等。 注意:因为XML使用<,>,和&界定标记,如果 在文本中包含有这些字符,必须使用实体替代。
CDATA
• 在特殊的标记CDATA下,所有的标记、实体引用都被忽略,
而被XML处理程序一视同仁地当作字符数据看待。 • CDATA的形式如下: 〈![CDATA[文本内容]]〉 • <计算机书籍> • <书名><![CDATA[ • <name>Acer</name> • <password>Aspire3020</password> • ]]></书名> • <价格>66.00</价格> • </计算机书籍>
XML 声明
<?xml version="1.0" encoding="UTF-8"?> • XML声明一般是XML文档的第一行 • XML声明由以下几个部分组成:
– version - -文档符合XML1.0规范 – encoding - -文档字符编码,默认为"UTF-8"
处理指示
• 处理指示是用来给处理XML文件的应用程序提供
可读性及可维护性
数据和显示的关系
内容描述与显示方式整合为 一体 已有大量的编辑、浏览工具
内容描述与显示方式相分离
编辑及浏览工具
编辑、浏览工具
XML的历史
• 1969 GML •
IBM Research
•
• •
(Generalized markup Language) 1986 SGML ISO-8897 (Standard Generalized markup Language) 1996 HTML Tim Berners Lee(MIT) (HyperText Markup Language) 1998 XML (eXtensible Markup Language)
根元素
• XML 文档必须包含在一个单一元素中。这个单一元素称为
• • • • •
根元素,它包含文档中所有文本和所有其它元素。 而不包含单一根元素的文档不管该文档可能包含什么信息, XML 解析器都会拒绝它。 每个XML文档必须有且只有一个根元素 根元素是一个完全包括文档中其他所有元素的元素。 根元素的起始标记要放在所有其他元素的起始标记之前。 根元素的结束标记要放在所有其他元素的结束标记之后。
了一致的外观,wk.baidu.com与管理与维护
HTML
• HTTP (HyperText Transfer Protocol), • HTML是设计用来做人机交流用的 • HTML对外观、布局很擅长,但缺乏对内容,即资讯内涵
表达的能力
XML的定义
• XML(eXtensible Markup Language) • XML 可扩展标记语言 • XML是一种您可以用来创建自己的标记的标
信息的。然后,这个应用程序来解释这个指示, 遵照它所提供的信息进行处理,或者再把它原封 不动地传给下一个应用程序。XML声明就是一个 处理指示。 所有的处理指示应该遵循下面的格式: 〈?处理指示名 处理指示信息?〉
EX:样式表指令 – <?xml-stylesheet type="type" href="uri" ?>
XML基础
XML主要内容
• • • • •
XML概述 DTD和Schema的建立与应用 CSS和XSLT显示XML DOM SAX
本章主要内容
• • • • •
标记语言 XML的定义 XML的历史 XML的优势 XML的文档规则
标记语言
GML(1969)
通用标记语言 标准通用标记语言 可扩展标记语言
XML---字符数据
• 开始标记和结束标记之间的文本被定义为
“字符数据” • 字符数据可以是“<”以外的任何合法 (Unicode) 字符
– <book>Java夜未眠</book>
XML---字符数据
• 字符数据分类
– PCDATA --- 普通字符数据 • 将由解析器解析 – CDATA • 不会由解析器解析
XML的优势
• 优势
– – – – 数据重用 数据和表示分离 可扩展性 语意信息
自定义标记
• 可以按照自己的需要定义标记 • 使应用有更大的灵活性
异构系统整合
XML例子
• • • • • • • • • • • • • • •
<?xml version="1.0" encoding="gb2312" ?> <书籍列表> <计算机书籍> <书名>xml</书名> <价格>66.00</价格> </计算机书籍> <计算机书籍> <书名>xml</书名> <价格>66.00</价格> </计算机书籍> <计算机书籍> <书名><![CDATA[<xml>]]></书名> <价格>66.00</价格> </计算机书籍> </书籍列表>
超文本标记语言
HTML(1996)
SGML(1986)
XML(1998)
XHTML
SVG
SMIL
HDML
…
OEB
可扩展超文 可缩放矢量 同步多媒体 手持设备 本标记语言 图形语言 综合语言 标记语言
开放电子 结构规范
SGML
• 标准通用标记语言
• 多种的输出格式(纯文字,HTML 等) 为所有的文件提供
• type="text/css" 或者 type="text/xsl"
• •
•
元素
元素TITLE
<TITLE> CSUINFOSOFT Ltd.</TITLE>
开始标记 <TITLE/> 空元素TITLE
内容
结束标记 <TITLE ID="101"/>
空元素TITLE
元素之间的关系:子元素/父元素、祖先/后代 元素内容的类型:嵌套元素/字符数据/实体引用/ CDATA节/处理指令/注释
记语言。 • XML由万维网协会(W3C)创建
XML---简介
XML 声明- 定义 XML 版本 包含数据的 XML 标签
XML和Html比较
比较内容 HTML XML
可扩展性
不具有扩展性
是元标记言,可用于定义新 的标记语言 侧重于如何结构化地描述信 息
侧重点
侧重于如何表现信息
语法要求
不要求标记的嵌套、配对等, 严格要求嵌套、配对,并遵 循DTD的树形结构 不要求标记之间具有一定的 顺序 难于阅读、维护 结构清晰,便于阅读、维护
标记
• 标记是左尖括号(<)和右尖括号(>)之
间的文本。有开始标记(例如 <name>) 和结束标记(例如 </name>) • 不能省去任何结束标记。 • 如果一个元素根本不包含标记,则称为空 元素;HTML 换行(<br>)就是个例子。在 XML 文档的空元素中,您可以把结束斜杠 放在开始标记中。
文本内容PCDATA
• XML支持Unicde字符集,因此可以在文本中包
•
含字母/数字/标点/符号等。 注意:因为XML使用<,>,和&界定标记,如果 在文本中包含有这些字符,必须使用实体替代。
CDATA
• 在特殊的标记CDATA下,所有的标记、实体引用都被忽略,
而被XML处理程序一视同仁地当作字符数据看待。 • CDATA的形式如下: 〈![CDATA[文本内容]]〉 • <计算机书籍> • <书名><![CDATA[ • <name>Acer</name> • <password>Aspire3020</password> • ]]></书名> • <价格>66.00</价格> • </计算机书籍>
XML 声明
<?xml version="1.0" encoding="UTF-8"?> • XML声明一般是XML文档的第一行 • XML声明由以下几个部分组成:
– version - -文档符合XML1.0规范 – encoding - -文档字符编码,默认为"UTF-8"
处理指示
• 处理指示是用来给处理XML文件的应用程序提供
可读性及可维护性
数据和显示的关系
内容描述与显示方式整合为 一体 已有大量的编辑、浏览工具
内容描述与显示方式相分离
编辑及浏览工具
编辑、浏览工具
XML的历史
• 1969 GML •
IBM Research
•
• •
(Generalized markup Language) 1986 SGML ISO-8897 (Standard Generalized markup Language) 1996 HTML Tim Berners Lee(MIT) (HyperText Markup Language) 1998 XML (eXtensible Markup Language)
根元素
• XML 文档必须包含在一个单一元素中。这个单一元素称为
• • • • •
根元素,它包含文档中所有文本和所有其它元素。 而不包含单一根元素的文档不管该文档可能包含什么信息, XML 解析器都会拒绝它。 每个XML文档必须有且只有一个根元素 根元素是一个完全包括文档中其他所有元素的元素。 根元素的起始标记要放在所有其他元素的起始标记之前。 根元素的结束标记要放在所有其他元素的结束标记之后。
了一致的外观,wk.baidu.com与管理与维护
HTML
• HTTP (HyperText Transfer Protocol), • HTML是设计用来做人机交流用的 • HTML对外观、布局很擅长,但缺乏对内容,即资讯内涵
表达的能力
XML的定义
• XML(eXtensible Markup Language) • XML 可扩展标记语言 • XML是一种您可以用来创建自己的标记的标
信息的。然后,这个应用程序来解释这个指示, 遵照它所提供的信息进行处理,或者再把它原封 不动地传给下一个应用程序。XML声明就是一个 处理指示。 所有的处理指示应该遵循下面的格式: 〈?处理指示名 处理指示信息?〉
EX:样式表指令 – <?xml-stylesheet type="type" href="uri" ?>