异构平台简介

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

平台简介
1应用背景:
随着IT业的飞速发展、计算机技术的普及和深入,企业也在发展过程中不断的建立自己的计算机应用系统。

在这个过程中,企业积累了大量数据,并为存储和管理这些数据不断投资,其主要手段是使用数据库管理系统。

然而由于实施数据管理系统的阶段性、一技术性以及不同部门之间业务独立性,使得即使在同一单独企业中,不同的信息服务和管理系统所采用的数据库管理系统都大不相同,随着时间的推移,这些由不同技术构建的信息系统形成了一个个“信息孤岛”,而它们各自的数据构成了企业的异构数据源。

数据库的异构性主要体现在两方面:一方面是数据库管理系统的差异,不同的数据库管理系统,对数据的访问和管理方式是不同的;另一方面是语义的不同,包括数据库模式的差别及数据含义、类型上的冲突。

随着企业的发展,会突显出部门间协同合作的需求,这必然导致越来越多的新应用需要访问企业的异构数据源。

但是异构性严重阻碍了应用程序间的互相协同、对数据库资源的共享。

数据库集成成了企业进一步发展的需要,它的目标就是实现对各个异构数据源的数据共享,从而有效的利用已有资源。

现有的方案:
异构数据库集成方法大概可以分为两种:数据仓库和虚拟视图法。

数据仓库一般用于数据分析,通常被称为只读集成。

而虚拟视图法则是语义层次上的集成,关注于数据库模式,在此基础上可以实现异构数据库间的互操作。

采用虚拟视图法集成异构数据库主要有两种体系结构,即联邦数据库系统和中介系统。

(1)数据仓库法
该方法需要建立一个存储数据的仓库,由ETL (Extract, Transform and Load)工具定期从数据源过滤数据,然后装载到数据仓库,供用户查询,这种方法被称为Eage:方法。

相反的,采用虚拟视图法时,当用户提交查询请求时,系统根据命令操作数据源的数据,称之为Lazy 方法。

数据仓库的主要好处是查询处理性能高,缺点是创建数据仓库比较费时费力,通常需要6至18个月的时间,而且当有新数据源加入或己有数据源发生变化时对仓库的修改代价也比较高。

(2)联邦数据库系统
联邦数据库系统(Federated Database System, FDBS)是由参与联邦的半自治的数据库系统组成,目的是实现数据库系统间部分数据的共享。

联邦中的每个数据库的操作是独立于其它数据库和联邦的,但是又都有彼此访问的接口,所以称之为半自治。

FDBS中实现互操作最常用的方法是将每个数据库模式分别和其它所有数据库模式进行映射,这样在联邦中需要建立N* (N} 1)个模式映射规则,当参与联邦的数据库很多时,建立映射规则的任务变得不可行了。

所以,联邦数据库系统适合于自治数据库数量比较小的情况,随着数据资源变得越来越庞大,FDBS显然不是一个很好的解决方案。

(3)中间件系统
中间件系统使用虚拟视图法来集成异构数据源,这里的数据源不仅限于数据库,还可以是遗留系统、Web数据源等。

该系统提供给用户一个全局模式,用户提交的查询是针
对该全局模式的,并不需要知道和个数据源的位置、模式及访问方法。

中间件系统与联邦数据库系统的区别包括: 中间件系统可以集成非数据库资源; 中间件系统中的数据源是完全自治,这就意味着很容易向系统中添加/删除数据源,中间件系统通过包装器来集成异构数据源。

我们的平台
平台提供一种轻量级的数据库集成中间件,这是一个中间件系统的方法,支持虚拟视图。

在用户提交一个业务后,将用户业务翻译成一个或多个对数据源的业务,然后将数据源的业务结果进行综合处理,并将处理结果返回给用户。

这种方式很好的保持了各组件数据库的自治性。

同时连接着发送方业务系统与目标业务系统。

以不同的端口提供不同的业务服务,每个端口都有一个名字、输入消息模板、输出消息模板。

该平台旨在解决企业级业务数据集成问题。

特点:
使用标准的XML数据包格式,打通了各个业务系统间的信息孤岛。

平台采用了J2EE 的规范设计与开发,并在系统的稳定性、可靠性、互联性方面进行了强化设计。

使得平台具备极强的业务级的集成能力,非常适应于企业级的业务集成需要。

目标:
分布的透明性和异构数据库的透明性,分布的透明性位置透明性和分布式存取透明,而异构数据库的透明性是屏蔽异构性,即不同DBMS间的差异和不同的数据库模式上的差异。

用户看到的是统一的视图,并以统一的方式来访存数据
优势:
数据库集成技术包括数据仓库、联邦数据库和中间件系统。

数据仓库和联邦数据库的应用成功解决了许多数据集成问题,然而也使一般用户望而却步,主要是因为:
①数据库集成是面向主题的:在进行集成工作之前,各数据源的本地模式是己知的,数据库集成的目标是明确的,构建导出模式或建立包装器是局限于己知应用,由于主题的多样性,必然丧失了灵活性与适应性。

②全局模式难以建立:在联邦数据库中,由于本地设计自治的需要,导出模式差异较大,要建立与各种导出模式相协调的联邦模式比较困难。

对于包装器和协调器模式的数据库集成,有些系统甚至不能提供全局模式,转而依赖于匹配算法等方式来进行模式集成。

③数据库集成是重量级的:联邦数据库和数据仓库一般面向大型应用,在数据集成工作之后还要进行分析处理等工作,其集成模式并不适用于部分简单应用。

相关文档
最新文档