置标语言(SGML、HTML、XML)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
♦ 开放性:
– XML 所采用的标准技术在 Web 上是完全开放的 ,可以免费获 得。W3C 组织的成员已经较早地得到了这些标准 ,不过一旦此 标准完成了 ,结果就是大家都可获得的。XML 文档自身也较为 开放 ,任何人都可以对一个结构良好的 XML 文档进行语法分 析 ,如果提供了DTD ,还可以校验这个文档。
好 好 好 好 好 好 易 多 否 是 是
谢谢大家!如有不当之处,望大家指正。
♦ 信息的再利用性
– SGML 文件的内 容 可 以 重 复 利 用 , 或 者 被 其 它 的SGML 文件使用 ,不须重新产生内容。同一份文件内容也 可以通过不同的 DTD 来定义 ,用不同的样式表呈现出来。
SGML的局限性:
♦ 应用程序不易开发。 ♦ SGML 文 件 不 易 在 Web 上 传 播 。 要 想 传 送 SGML 文件 ,必须有特定的 DTD 和样式表。 ♦ 缺乏商家的支持。
置标语言(SGML、HTML、XML)
——整理:张发亮、焦克非
郑州大学信息管理系
课题大纲:
♦ 置标语言的定义、分类 ♦ SGML、HTML、XML三者的简介、优点及局
限性
♦ SGML、HTML、XML三者的关系
一,置标语言
♦ 置标就是给文档中某些具有特殊含义的部 就是给文档中某些具有特殊含义的部
2.2 HTML简介、优点,局限性
♦ HTML简介:
1989 年 ,欧洲粒子物理研究中心使用 SGML 的一个语法 ,以一 个 DTD 为基础 ,开发了 HTML。HTML 不能称为元数据 ,更多地关 注文本的呈现形式。HTML 是一种专为 WWW 网页显示及浏览 而 设 计 的 简 易 标 记 语 言 , 目 前 是WWW 上 制 作 网 页 的 标 准 语 言 格 式。HTML 创造出来的文件可在不同的操作平 台间移动。可移植性与简易性是 HTML 的两大特征。HTML 文件除 了包含文字信息外 ,还可包括声音、影像等多媒体信息 ,而HTML 的超链接除了网页内的链接 ,也包括网页之间的链接。 HTML 标签指明浏览器应该怎样显示文献。通常 ,HTML 标签有 两部分 ,一个标头和一个标尾 ,其中含有被定义的文献。然而 , 有时标尾是不被要求的。HTML 文献结构包含头标区、主体区及元 素。头标区含有一个标题和其它信息。主体区含有正文、图象和 链接。
2.3 XML简介、优点、局限性
♦
XML简介:
– XML 是W 3C 在 1996 年底提出的标准, 它是从 SGML 衍生出 来的简化格式, 也是一种元语言,可以用来定义任何一种新的 标记语言。XML 的制定是为了补足HTML 的不完美, 使得在 Web 上能够传输、处理各类复杂的文件, 它去除了 SGML 复 杂不常用及不利于在Web 传送的选项功能, 让使用者可以很 容易地定义属于自己的文件类型, 程序设计员也能在更短的 时间开发 XML 相关应用程序。它从一诞生就在软件业引起了 轰动,Microsoft和Netscapt都宣布将在新的Internet浏览器 中支持XML,甚至还专门成立了XML研究中心。 XML是一种可以用于Web上的标准的、可扩展的数据格式 描述语言。它可以描述各种各样结构的信息,并且由于它的 数据内容独立性原则和可自解释性,使得用它表示的数据信 息可以很方便地被不同的数据使用者使用。XML的出现使得网 上数据的使用效率大大地提高。
SGML的优点:
♦ 灵活性
– 在 SGML 中 ,置标是不固定的 ,用户可以根据自己的理解 来添加置 标 ,可以 用置标来标识结构非常复杂的文档。SGML 能描述任何的信 息结构与任何复杂的文件 ,其应用可以简单如 HTML ,也可 以复杂得像 TEI、EAD、CIMI。
♦ 通用性
– SGML与平台独立,与系统独立,不属于特定的平台和特定的 应用系统。可以在不兼容的系统直接进行数据交换。避免 数据交换中的信息遗失 ,撰写的文档能够长久保存。
♦ 置标一般分为程序性置标和描述性置标。
1.1 程序性置标(Procedural Markup)
– 是用专属的指令来执行对文的处理 ,关注的是文件呈现的外 观 ,包括字体的大小、字型、字形、页面、段落、注以及左 右页边距等的设置。程序性置标
1.2
描述性置标(Descriptive Markup)
– 一般称之为“通用的置标”,所关注的是文件的内容或结构 元素 ,而不是文件呈现的版面样式 ,描述文件结构的方式是 以标识文件构成的元素进行的。
分加上标记的过程 ,置标的符号就是该过 置标的符号就是该过 程的具体实现。 年代早期, 程的具体实现。在 20 世纪 80 年代早期, IBM 设计了一种文档系统 ,通过在文档中 通过在文档中 附加一些标签 ,从而可以标识文档中的各 从而可以标识文档中的各 种元素。 种元素。IBM 把这样的标记语言称为通用 置标 语 言 ( Generalized markup Language ,GML) 。1986 年国际标准化组 织认为 IBM提出的概念很好 ,并发布了为 提出的概念很好 并发布了为 生成标准化文档而定义的标识语言标准 , 称为标准通用置标语言 ( Standard 称为 Generalized Markup Language , SGML) 。
♦ 强大的超链接机制 :
XML除了支持象HTML的简单链接以外,还提供了两种更为强大的超链接 机制;X link和X pointer;其中,X Link完全支持现有的Web的URL链 接格式,X Pointer则允许利用文件的结构定址,这一点与HTML有很 大不同,HTML的文件内部超链接必须指定文件中的绝对位置,一旦文 件内容改变,通常必须更新链结。X Pointer;利用文件结构来定址所 指定的是相对位置,只要文件结构没有改变,就算内容改变了也不会 影响链接
2.3 XML的优点:
♦ 良好的扩展性
:
Байду номын сангаас
– XML 在两个意义上是可扩展的。首先, 它允许开发者创建他们自己的 DTD, 有效地创建可被用于多种应用的“可扩展的”标签集。其次, 使用几个附加的标准, 您可以对XML 进行扩展, 这些附加标准可以向 核心的XML 功能集增加样式、链接和参照能力。作为一个核心标准, XML为可能产生的别的标准提供了一个坚实的基础。
2.3 XML的优点: ♦ 灵活性 :
– XML 的灵活性表现在两个方面 :一是 XML文档也是纯文本文 件 ,同 HTML 一样 ,各种编 辑 工 具 创 建 的 XML 文 档 都 能 被WWW 浏览器所显示 ;二是 XML 允许自定义标签 ,这 种优势使得 HTML 应用无法与XML 的应用相比。
HTML的局限性:
♦ 结构方面:HTML 最大的局限就是它的标签集是固定的,
而这些标签主要用来指定网页的显示格式, 这个特性 使得HTML 只能支持固定、简单的文件结构, 而且在信 息再利用、资料交换与机读方面都存在很大的局限。 ♦ 在信息的利用方面:统一内容要实现不同的呈现形式 需要有不同的Web 版本 。 ♦ 信息的交换方面:无法支持精确查询。 ♦ 维护方面:HTML 的不断修订增加了许多网站额外的维 护工作。
HTML的特点:
♦
HTML 的DTD 设计主要是满足网上显示的需求。许 多标签纯粹是用来指定网页的显示细节, 例如: br 是换 行; hr 是画一条平行线; b 表示粗体字。 ♦ HTML 有内建的样式 (style)。这使得 H TM L 更为简 单易用, 但缺点是灵活性差, 同样的文件内容只能设定 一种显示样式。 ♦ HTML 引用 SGML 的标记最简化特征。这是为了尽 量减少 HTML 文件标记的数量, 使H TM L 的标记更简 单。 ♦ HTML 没有采用 SGML 的超链接机制。H TM L 的超 链接是利用标签< a> 的“href”属性来指向W eb 上的任 意文件。
2.3 XML局限性:
♦ 信息的再利用性较差。
三、 SGML 、 HTML 和 XML 的比较
♦ HTML 是 SGML 的 应 用 , XML 是SGML 的一个子集。
HTML 和 XML 都 是由一 个固 定的 SGML 定 义和 一个 DTD 定义组成。XML 不像 HTML 只有内建的样式 ,XML 提供了样式表标准 ,称为可扩展样式语言。XML 除了 支持像 HTML 的简单链接 ,也提供了几种功能更强大 的超链接机制预算
SGML 、 HTML 和 XML 的比较
SGML HTML XML
灵活性 开放性 简单性 通用性 可扩展性 信息的再利用性 应用程序开发的难易 商家的支持 DTD是否必备 是否支持精确查询 是否无标识语言
好 较差 差 好 好 好 难 少 是 是 是
较差 好 好 差 不好 较差 易 多 否 否 不是
二,置标语言(SGML,HTML,XML)三者简介、 优点及局限性 2.1 SGML简介、优点、局限性
SGML简介:
SGML 是 ISO 在 1986 年所制定的描述文档资料的结构 与内容、实现文档交换和共享的国际标准。它是数据描述、 数据模型化和数据交换的标准 ,同时又是一种元语言 ,元语 言是一套可以用来定义其它更专门性的标记语言的通用规则。 普通的 SGML 文档一般由三部分组成:SGML 声明、文档类型 定义及 SGML 文档实例。SGML 声明定义文档使用的语言集、 参考语法规则、SGML 可选特性等;文档类型定义(DTD) 描述 文档的结构模板、逻辑框架结构以及元素的属性等 ,它确定 文档类别、规定文档结构规则、列出文档实例中所允许的全 部元素及其次序 ; SGML文档实例是文档内容的主要部分 , 由许多元素及元素的正文按 DTD 规定的框架结构组织而成。