网络数据管理.ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
9.6.2 Web数据存储
目前,Web数据的存储方法主要有以下几种:
➢ 使用基于文件系统的存储管理技术 ➢ 使用基于层次数据库的存储管理技术 ➢ 建立一个具有特定目的的存储半结构化数据的数据
库系统 ➢ 使用基于关系数据库的存储管理技术 ➢ 使用基于面向对象数据库的存储管理技术
第9章 网络数据管理
10
第9章 网络数据管理
4
9.6.1 XML
➢ 可扩展样式语言
XSL本身便是XML的应用,共分为两部分:第一部分 XSL转换工具(XSLT,XSL Transformation),负责将XML 文档转换为可浏览或可输出的格式;第二部分XSL格式对象 (XSL-FO,XSL-Formatted Object),提供大量的格式化命 令,可用来配合印刷或屏幕显示,精确地设定外观样式。
(2)Web查询语言的评价因素 Web查询语言的目的是从Web文档中抽取信息,并对
抽取出的信息进行重构,因此它需要从如下几个方面加以 考虑:
➢ 数据模型 ➢ 表达能力 ➢ 语义与合成
第9章 网络数据管理
13
9.6.4 Web信息集成
1. Web信息集成系统
Web信息集成系统的目标是支持对Web 上多个数据源 的查询。
同的用户应用。 ➢ 需要智能Web代理根据个人用户的需要增减信息内容
的应用。
第9章 网络数据管理
8
9.6.1 XML
建立一个XML应用通常需要遵循以下主要步骤: ➢ 选择或编写一个DTD或Schema。 ➢ 生成XML文档。 ➢ 解析XML文档。 ➢ 显示XML文档。
举例讲解
第9章 网络数据管理
9
6
9.6.1 XML
2. XML的特点
➢ 开放性 ➢ 可扩展性 ➢ 交互性好 ➢ 语义性强 ➢ 简单通用 ➢ 半结构化
第9章 网络数据管理
7
9.6.1 XML
3. XML的应用
XML的应用主要体现在以下四个方面:
➢ 网络用户在两个或更多异质数据库之间进行通信的应 用。
➢ 需要把大部分处理从Web服务器转到客户端的应用。 ➢ 需要客户端将同样的数据以不同的浏览形式提供给不
➢ 文档类型定义(DTD,Document Type Definition)或 XML模式(XML Schema)
➢ 可扩展样式语言(XSL,Extensible Stylesheet Language) ➢ 可扩展链接语言(XLL,Extensible Link Language) 还存在一些与XML有关的重要技术规范:
第9章 网络数据管理
9.6.3 Web数据查询
1. Web查询技术
目前Web上的查询主要基于搜索引擎的关键词索引技术, 但是,由于用户给出的查询关键词很难与所查文档精确匹配, 检索效果不理想。因此,出现了一些新技术来从各方面改善 信息查询的性能,主要包括:
➢ 基于链接的相关度排序 ➢ 基于概念的检索技术 ➢ 基于相关度的反馈 ➢ 检索结果的联机聚类
Web信息集成系统主要包括:
➢ 采用数据仓库技术的信息集成系统
将从多个数据源中抽取出的数据装入数据仓库中, 用户查询直接映射到数据仓库上。
➢ 采用中介技术的信息集成系统
其核心是中介模式,数据集成系统通过中介模式 将各数据源的数据集成起来,而局部数据源通过包装 器对数据进行转换使之符合中介模式。用户的查询基 于中介模式。
9.6 Web数据管理
9.6.1 XML 9.6.2 Web数据存储 9.6.3 Web数据查询 9.6.4 Web信息集成 9.6.5 Web Services
第9章 网络数据管理
1
9.6.1 XML
Web数据管理是指在Web环境下,对复杂信息的有效组 织与集成,方便而准确的信息查询与发布。
从技术上讲,Web数据管理融合了WWW技术、数据库 技术、信息检索技术、移动计算技术、多媒体技术以及数据 挖掘技术。
可扩展标记语言(XML,Extensible Markup Language) 是标准通用标记语言(SGML,Standard Generalized Markup Language)的子集,也是一种元语言。
第9章 网络数据管理
2
9.6.1 XML
1. XML的组成
XML技术主要包括三大模块结构组件:
DTD一般包括标记声明或参数实体引用,有时还包括外 部实体的ID。标记声明可以是元素类型声明、属性表声明、 实体声明或符号声明。
➢ XML Schema
XML Schema为一类文档建立了一个模式,规范了文档 中的标签和文本可能的组合形式。它不仅包括了DTD能实现 的所有功能,而且它本身就是规范的XML文档。
➢ 文档对象模型(DOM,Document Object Model) ➢ XML简单应用程序接口(SAX,Simple API for XML)等。
第Fra Baidu bibliotek章 网络数据管理
3
9.6.1 XML
➢ 文档类型定义
DTD是一种用来定义有效文件结构的语言,它作为基本 XML文件的语法,是XML语言的一部分。DTD可以定义元素 的嵌套规则以及数据的基本类型。
档的应用程序接口。它定义了表示和处理文档的接口和对象、 这些接口和对象的语义,以及它们之间的关系。
➢ SAX SAX是一个XML的Java应用程序接口标准,Java应用程
序可以使用支持SAX的XML解析器来接受解析事件。使用 SAX比使用DOM要节省很多内存开销,但DOM提供了更丰富 的程序接口。
第9章 网络数据管理
➢ XLink
XML还存在引用和链接到其它的资源和文档的机制,这 制就是XLink。
XLink可以实现使用HTML的基于URL超文本链接和定位
可获得的任何功能。除此之外,它还支持多方位的链接。在
XLink中,任何XML元素都可以成为链接元素。
第9章 网络数据管理
5
9.6.1 XML
➢ DOM DOM是基于树结构的程序访问以及维护HTML和XML文
第9章 网络数据管理
11
9.6.3 Web数据查询
2. Web查询语言
(1)Web查询语言分类
➢ 基于HTML的查询语言 第1代Web查询语言 第2代Web查询语言
➢ 基于XML的查询语言 单文档查询语言 图形化查询语言 多文档查询语言
第9章 网络数据管理
12
9.6.3 Web数据查询