数据集成与网格:关于数据网格的组织结构问题

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

精选ppt
12
一、数据集成与网格
信息源在包装层支持如下两个抽象层面:
▪ 资源视图层:作为可用信息源的外部抽象观察,起到隔离内部组织结构
的作用,并提供数据集成平台的高度资源独立性。 ▪ 应用视图层:建立在资源视图之上,用以表示外部应用(或应用集合) 对于给定信息源的信息提取需求,使得信息源可以独立于外部应用统一地 提供可互操作信息的同时,让外部应用可以按自身需要向信息源定义面向 应用的个性化数据服务。
资源获取与系统互操作性平面:提供网格环境下数据访问与集成 的基础设施。
高级集成形式支撑层面:支持数据联邦、数据中介、数据汇集等 高级数据集成形式的实现.
精选ppt
15
二、关于数据网格的组织结构问题
资源获取与系统互操作性平台
提供网格环境下数据访问与集成所需基础设施的大部分功能特性已经由网 格中间件OGSA-DAI所提供,其目的包括: 允许各种数据集藏结合到OGSA框架之中,并通过标准的网格服务接口进 行访问。 以统一的方式访问差异显著的异质数据资源。 支持数据资源注册与发现、以及不同数据集藏系统之间进行互访。
精选ppt
10
一、数据集成与网格
语义冲突 不同数据集藏之间可能在两个层面上发生语义冲突. · 数据层面:相同数据可能具有不同的表示和解释. ·模式层面:同类信息对象的表示可能使用不同逻辑结构 能有效表现概念层次结构和语义模型的本体被广泛运用于解决信息集 成中的语义冲突问题.
精选ppt
11
一、数据集成与网格
精选ppt
17
二、关于数据网格的组织结构问题
资源节点提供的服务与接口
终端客户或应用程序
帐户及访问权限管理 元数据服务 查询服务 应用视图监视代理服务:提供 持续信息支持 块加载服务(数据上传) 资源调度及事务协调服务
网格服务接口
元 数 据 服 务
查 询 代 理
视图 监视 代理
事 务 代 理
精选ppt
3
一、数据集成与网格
Michael D. Stefano:《Distribution Data Management For Grid Computing 》
计算网格平面 网格计算环境 数据网格平面
精选ppt
4
一、数据集成与网格
数据集成
实现多信息源共享,使得任何信息源产生的数据可以被其他信息处 理系统有效利用。
精选ppt
13
一、数据集成与网格
例:试用于政务应用中的跨组织数据传播与汇集系统



数据仓库
数据仓库
集成器
集成器

监视代理



应用视图层
资源视图层
监视代理 应用视图层 资源视图层
数据源1
数据源2
精选ppt
14
二、关于数据网格的组织结构问题
数据网格系统: 提供一个可跨越组织和地域分布动态地按各种形 式实现数据集成的平台,在组织结构上,这样一个平台可以分为两 个层面构造.
DB1
DB2
DB3
DB4
精选ppt
7
一、数据集成与网格
数据中介系统
通过模式集成支持 一个虚拟数据库以提供 对多数据源集成数据的 透明访问。
结果
用户查询
协调器 结果
查询 结果 查询
包装器
包装器
查询 结果
结果
查询
数据源1
数据源2
精选ppt
8
一、数据集成与网格
数据汇集
结果
用户查询
来自多个数据源的数据被归 并物理地存储在一个系统中, 称之为数据仓库。为使数据仓 库内容与信息源按照某种相容 性要求保持一致,数据仓库必 须按照适当的方式进行更新, 称之数据仓库维护。
·多种集成方式:多数据库(multi-database),联邦数据库(federated database),数据中介系统(mediator),数据仓库(data warehouse).
·不同数据集藏类型:传统的数据集成研究主要考虑由通用DBMS管 理的结构化数据库(如关系数据库,对象-关系数据库等),目前已经扩 展到考虑以其他组织形式存在的各种信息资源的集成,如文件系统、网站、 文档管理系统和科学数据库等。
块 加 载 服 务
调度 账 及户
数据集成与网格:
关于数据网格的组织结构问题
精选ppt
1
数据集成与网格 关于数据网格的组织结构问题
精选ppt
2
一、数据集成与网格
网格与数据网格
网格:支持资源集成与共享,它通过互联网将跨越地域和组织分布的 计算机系统、数据库、仪器设备等各种资源有机地集成为一体,以实现广 域范围的共享。
数据网格:支持跨越地域和组织分布的数据集成与共享。 ·数据本身是最重要的共享资源. ·数据网格的建立是实现网格计算的基础和复杂度极高的工作内容。
跨组织信息集成问题:
▪ 安全互操作性问题: 不同组织信息系统间良好互操作性与内部信息安全性
之间的冲突消解。信任管理与内部结构隐蔽 ▪ 资源独立性: 保护遗产,并使得信息源自主进行的增量扩充与调整不造成 对集成平台的影响。 ▪ 协同开销最小: 信息源为提供组织外互操作性在改造扩充自身系统或抽取 与传送信息方面所需消耗的资源(其中包括人力与财力)尽可能小
数据仓 库
合成器
抽取器
抽取器
数据源1
数据源2
精选ppt
9
一、数据集成与网格
异构性问题
结构冲突 同类的信息内容存在于具有不同组织形式的数据集 藏之中.
·模式翻译:XML支持以统一的半结构化数据模型相容地观察这些 不同性质的数据存储实体。
· 同构化处理:即使不同的数据集藏使用相同的信息表示方法(数据 模型),相同的信息可能被作了不同结构化处理.
精选ppt
5
一、数据集成与网格
分布式数据库与异质多数据库 统一的全局概念模式,完全的透明访问与全局完整性控制。
全局事务
全局事务管理
全局事务管理
子事务
全局事务管理
全局事务管理
全局事务管理
局部数据库系统
局部数据库系统
局部数据Fra Baidu bibliotek系统
局部数据库系统
局部事务
精选ppt
6
一、数据集成与网格
联邦数据库
通过模式翻译与联 合实现在各信息源之间 按对等方式(peer to peer)进行无缝互访
精选ppt
16
二、关于数据网格的组织结构问题
OGSA-DAI支持的对等初等数据网格
资源节点
OGSA-DAI
资源节点
资源节点
资源节点
考虑到以及跨组织集 成的壁垒问题以及对各种 高级集成方式的实现支持, 我们需要:
·对各信息源提供适当的 数据包装机制和完备的服 务功能。
· 扩展EII实现技术以适配 网格计算环境的高层集成 方式.
相关文档
最新文档