xml即可扩展标记语言介绍

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Xml(Extensible Markup Language)简介

或称为可扩展标记语言,是一种您可以用来创建自己的标记的标记语言。它由万维网协会(W3C)创建,用来克服HTML(即超文本标记语言(Hypertext Markup Language),它是所有网页的基础)的局限。和HTML 一样,XML 基于SGML —标准通用标记语言(Standard Generalized Markup Language)。

XML文档是Unicode码的文本文件,在这个文件中包括数据和用来定义数据结构的标记!由万维网协会(W3C—World Wide Web Consortium)管理,可以在/XML网站中找到XML的规范。

XML与HTML比较

第一点

Html的目的就是当数据要打印或者显示时描述数据是什么样式。最终目的就是实现数据的呈现格式,而XML定义它所包含的数据的结构,而不是呈现样式。

比如:

科比.布莱恩特


星光大道101号


深圳市,广州省417000

HTML 的问题在于它是为人设计的。即使不用浏览器查看上面的HTML 文档,您和我也会知道那是某个人的邮政地址。作为人,您和我具有理解大多数文档的含义和意图的智慧。遗憾的是机器不能做到。尽管这个文档中的标记告诉浏览器如何显示该信息,但标记没有告诉浏览器信息是什么。您和我知道它是一个地址,但机器不知道。

为了完成对样本HTML 文档的讨论,请考虑从该地址抽取邮政编码的任务。下面是一个在HTML 标记中查找邮政编码的算法(我有意使用脆弱的算法):

如果您找到有两个
标记的段落,那么邮政编码就是第二个换行标记下面第一个逗号之后的第二个词。

尽管该算法对于这个示例起作用,但对于全世界许多完全有效的地址,该算法根本不起作用。即使您可以编写算法来找出任何用HTML 编写的地址的邮政编码,但许多具有两个换行标记的段落根本不包含地址。即便有可能编写算法来查看任意HTML 段落并找出其中的任意邮政编码,也是极其困难的。

现在让我们来看一个样本XML 文档。使用XML,您可以给文档中的标记赋予某种含意。更重要的是,机器也容易处理这样的信息。您只需通过找到 标记之间的内容(技术上称为 元素),就可以从该文档抽取邮政编码。

java工程师

科比

布莱恩特

星光大道101号

深圳市

广州省

417000

有三个通用术语用来描述XML 文档的组成部分:标记、元素和属性。下面的样本文档说明了这些术语:

✓标记是左尖括号(<)和右尖括号(>)之间的文本。有开始标记(例如)和结束标记(例如

✓元素是开始标记、结束标记以及位于二者之间的所有内容。在上面的样本中, 元素包含三个子元素:、<first-name> 和<last-name>。</p><p>✓属性是一个元素的开始标记中的名称-值对。在该示例中,state 是<city> 元素的属性;</p><p>而在前面的示例中,<state> 是元素(请参阅样本XML 文档)。</p><p>⏹第二点</p><p>XML为了适应不同种类的数据,可以定义新的标签集和属性集,而HTML则只能使用一套固定的标签来呈现数据。因此,XML是可扩展的。</p><p>XML文档规则</p><p>无效、有效以及格式良好的文档</p><p>有三种XML 文档:</p><p>无效文档没有遵守XML 规范定义的语法规则。如果开发人员已经在DTD 或模式中定义了文档能够包含什么,而某个文档没有遵守那些规则,那么这个文档也是无效的。(请参阅定义文档内容以获得对XML 文档的DTD 和模式的专门介绍。)</p><p>有效文档既遵守XML 语法规则也遵守在其DTD 或模式中定义的规则。</p><p>格式良好的文档遵守XML 语法,但没有DTD 或模式。</p><p>根元素</p><p>XML 文档必须包含在一个单一元素中。这个单一元素称为根元素,它包含文档中所有文本和所有其它元素。在下面的示例中,XML 文档包含在一个单一元素<greeting> 中。请注意文档有一行注释在根元素之外;那是完全合乎规则的。</p><p><?xml version="1.0"?></p><p><!-- A well-formed document --></p><p><greeting></p><p>Hello, World!</p><p></greeting></p><p>下面是一个不包含单一根元素的文档:</p><p><?xml version="1.0"?></p><p><!-- An invalid document --></p><p><greeting></p><p>Hello, World!</p><p></greeting></p><p><greeting></p><p>Hola, el Mundo!</p><p></greeting></p><p>不管该文档可能包含什么信息,XML 解析器都会拒绝它。</p><p>元素不能重叠</p><p>XML 元素不能重叠。下面是一些不合乎规则的标记:</p><p><!-- NOT legal XML markup --></p><p><p></p><p><b>I <i>really</p><p>love</b> XML.</p><p></i></p><p></p></p><p>如果您在<b> 元素中开始了<i> 元素,则必须在<b> 元素中结束<i> 元素。如果您希望文本XML 以斜体出现,那么您需要添加第二个<i> 元素以更正标记:</p><p><!-- legal XML markup --></p><p><p></p><p><b>I <i>really</p><p>love</i></b></p><p><i>XML.</i></p><p></p></p><p>XML 解析器将只接受这种标记;大多数Web 浏览器中的HTML 解析器对于两者都接受。</p><p>结束标记是必需的</p><p>不能省去任何结束标记。在下面第一个示例中,标记是不合乎规则的,因为没有结束段落(</p>)标记。尽管这在HTML(以及某些情况下在SGML)中可以接受,但XML 解析器将拒绝它。</p><p><!-- NOT legal XML markup --></p><p><p>Yada yada yada...</p><p><p>Yada yada yada...</p> </div> </div> </div> </div> </div> <div id="rightcol" class="viewcol"> <div class="coltitle">相关文档</div> <ul class="lista"> <li><a href="/doc/033672555.html" target="_blank">电子专业词汇表</a></li> <li><a href="/doc/125428167.html" target="_blank">计算机系统一些专业名词的中文英文对照</a></li> <li><a href="/doc/2e5399792.html" target="_blank">计算机文化基础中国石油大学第九版第六章</a></li> <li><a href="/doc/256774654.html" target="_blank">标记语言复习资料</a></li> <li><a href="/doc/63713052.html" target="_blank">第五章可扩展商务报告语言</a></li> <li><a href="/doc/677380873.html" target="_blank">网页设计与制作练习题</a></li> <li><a href="/doc/6412829945.html" target="_blank">[0834]《网页设计》 在线作业及参考答案</a></li> <li><a href="/doc/7318481748.html" target="_blank">会计继续教育《可扩展商业报告语言及企业会计准则通用分类标准基础知识》课堂练习答案</a></li> <li><a href="/doc/861037380.html" target="_blank">名词解释:XML</a></li> <li><a href="/doc/8b3095353.html" target="_blank">ml语言基础---简单介绍</a></li> </ul> <div class="coltitle">最新文档</div> <ul class="lista"> <li><a href="/doc/0311496293.html" target="_blank">兴安盟2012年第一季度材料市场价格</a></li> <li><a href="/doc/0711496294.html" target="_blank">经销商大会发言稿</a></li> <li><a href="/doc/0b11496295.html" target="_blank">2012-012关于中央公园“学雷锋志愿服务活动”的信息快报</a></li> <li><a href="/doc/0b11496296.html" target="_blank">化氏垂钓口诀</a></li> <li><a href="/doc/0b11496297.html" target="_blank">2001-2010考研数学一真题完整版</a></li> <li><a href="/doc/0b11496298.html" target="_blank">Supporting Nomadic Users within Virtual Private Networks</a></li> <li><a href="/doc/021149630.html" target="_blank">别了,我的流光岁月--告别初中_六年级作文</a></li> <li><a href="/doc/0111496300.html" target="_blank">学校公共策划</a></li> <li><a href="/doc/0211496301.html" target="_blank">稻城亚丁三座神山各代表什么</a></li> <li><a href="/doc/0211496302.html" target="_blank">八年级下册语文生字词的拼音和解释</a></li> </ul> </div> </div> <script> var did = "85425638"; var ext = 'doc'; var docId = '03z4uvii9mxn0di5so6w'; var totalPage = 71; const pageNum = '71'; </script> <div class="clearfloat"></div> <div id="footer"> <div class="ft_info"> <a href="https://beian.miit.gov.cn">闽ICP备16038512号-3</a> <a href="/tousu.html" target="_blank">侵权投诉</a>  ©2013-2023 360文档中心,www.360docs.net | <a target="_blank" href="/sitemap.html">站点地图</a><br> 本站资源均为网友上传分享,本站仅负责收集和整理,有任何问题请在对应网页下方投诉通道反馈 </div> <script>foot()</script> </div> </body> </html>