异构数据库的集成技术
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
异构数据库集成技术在高校学生信息管理系统中的应用引言
随着校园的信息化建设的飞速发展,异构数据库集成技术起着越来越重要的作用。由于部门业务和功能归属不同,各应用系统开发时采用了不同的软硬件环境.数据的这种按部门或功能进行组织和管理,把很多信息都分开化啦!正好,异构数据集成是把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享。不同的数据库所存储的形式也各不相同,比如,教学管理数据库主要就是用于储存管理应用处理层所需的数据资料。不同教育机构建立的各自的应用控制系统中也建设了各自的数据库,但由于缺乏统一协调,各数据库系统在建立时都是从各自的需求出发,没有统一的数据库,这就使得各数据库之间无法互连!互通,信息资源无法融合共享论文对异构数据库集成展开研究,建立教学管理综合数据库系统,以适应不同平台!不同部门数据库之间的数据共享。要怎么才能实现网络环境下的信息共享?就要求必须联合各个异构数据库即集成多个数据库系统,实现不同数据库之间的数据信息资源合并和共享,显然,每个数据库系统在加入异构数据库集成系统之前本身就已存在,拥有自己的DBMS。异构数据库系统是指异构的多数据库系统,即组成它的成员数据库具有的硬件、系统软件(例如操作系统)或通信支持不同,或者成员数据库具有不同的DBMS或具有不同的数据语义DBMS的不同表现在表达(结构和限制)和语
义两方面。网络上存在着大量异构的数据库,它们的异构性表现在多个方面,如数据的类型不同,数据的表示不同,管理数据的软件不同,以及系统运行的环境不同。随着企业合作和政务电子化的发展,许多信息系统需要访问这些异构数据库中的数据。因此,需要一种新的系统框架来解决多个异构数据库的信息集成,其前提是必须对用户透明,并保持本地数据库的自治性。
1 异构数据库集成技术
1.1 联邦数据库技术
联邦数据库系统(FederatedDatabases)"祸合较松一些"没有单一的全局策略,每个局部数据库维护一个本地输入输出策略,输出策略指明了本地系统提供的全局共享数据,输入策略指明了允许输入本地系统的来自远程节点的数据"局部输入输出策略构成了全局策略的一部分"这种系统只集成局部系统中的部分数据,因而使得局部系统有较好的自治性"联邦数据库是最简单的一种异构数据库集成方式:各个数据源是相互独立的.但通过数据源之间的数据交换格式进行一一映射.这种映射可以让数据源DB1使用数据源DB2理解的术语来访问DB2数据源也就是说.不同的数据源之间使用数据转换接口网关或调用接口来实现数据互访.这样一个数据源就可以访问任何其他数据源的信息。同时,如果有l1个异构数据源需要互连,那么我们就要去构造n (n—l1个映射程序来支持这n个异构数据源之间的互相访问。
图1.1 利用联邦数据库系统建立的校园管理系统
1.2 数据仓库技术
传统的数据库技术与现在的数据库是有一定的区别的,传统的数据库是以单一的数据资源,即数据库为中心,进行事务处理、决策分析等各种不同数据处理工作,我们把它主要划分为两大类:第一类是操作型处理;第二类是分析型处理。操作型处理还有另外一种叫法,它又叫事务处理,对数据库联机的日常操作其实就是事务处理,通常是对一个或一组纪录的查询和修改,主要为企业的特定应用服务的,对数据的安全性和完整性有一定的注意力。
数据仓库是决策支持系统机制和联机分析应用数据源的结构化数据环境。数据仓库的结构体系由三部分组成:综合信息集
成服务平台,集成后的数据仓库,数据集成机制。数据仓库中,密集的数据更新处理性能和系统的可靠性是所有联机事务处理必须强调的,却并不强调数据查询的方便与快捷。联机分析和事务处理对系统的要求不同,即使是同一个数据库,它们在理论上都难以做到两全。数据仓库研究和解决从数据库中获取信息的问题。数据仓库异构数据源的谋略是由几个异构数据源的数据副本构成.按照一定的要求,进行预处理、转换,以符合数据仓库的模式,并存储到数据仓库中。让读者在使用时就感觉像在使用普通的数据库一般。只要把数据存储在数据仓库.使用者使用查询时就和以前在单一数据库中的查询大同小异,感觉仍然在原来单一的查询中使用。
图1.2.1 数据仓库系统结构
多种数据资源的集成(Excel 数据和文本文件)除了访问传统的RDBMS外,还可以从其他地方获取数据,比如从用户所持有的Excel 数据和文本文件中。可以在同一个报表上,制成从数据仓库得到的销售实绩数据和Excel的预算数据等,这样可提高数据的利用率。
数据仓库是面对整个企业的数据应用,而构筑数据中心是针对各个部门的信息应用。数据中心的数据是按部门从数据仓库中抽取,并进行加工处理。数据中心构筑工具,就是提供从数据仓
库自动进行数据的抽出、变换功能,具有ETL功能,可以大幅提高运行效率。
数据仓库最根本的特点是物理地存放数据,而且这些数据并不是最新的、专有的,而是来源于其它数据库的。建立数据仓库并不是要取代数据库,它是为了使信息更加完善和全面,主要应用于支持高层决策分析,而上面所提到的事务处理数据库在企业的信息环境中的任务是对日常的操作。数据仓库是数据库技术的一种新的应用,数据仓库还是用关系数据库管理系统来管理其中的数据。数据仓库的优点是可以很方便的进行联机分析和数据挖掘.它的缺点是数据存储太重复、不能及时使它得到更新。数据仓库中的数据分为四个级别:早期细节级、当前细节级、轻度综合级、高度综合级。把源数据综合后,首先进入的是早期前细节级,再进入当前细节,然后根据所需进后进一步的综合后,最后进入轻度综合级乃至高度综合级。
数据仓库的特点包括稳定性、时变性,面向主题和集成性、这四大方面。
1) 稳定性
大量的经集成、加工过的综合性历史数据被保存在数据仓库中,数据仓库的数据是供企业决策分析之用的,所涉及的数据操作主要是查询,一般情况下并不轻易进行修改操作,即数据仓库的用户进行分析处理时不进行数据更新操作
2) 时变性
数据仓库由于时间的改变而改变,,所有数据仓库中的数据都永远不变,而是随时间不断变化的数据仓库中的数据不可更新是针对应用来说的,由于数据仓库中包含大量的综合数据,而这些综合数据中很多与时间有关,故随着时间的变化,这些数据也要不断进行更新、综合。传统的关系数据库系统一般处理格式化的数据,它比较适合这一方面,并能够很好的达到商业商务处理的需求,它在商业领域取得了巨大的成功。
3) 面向主题
数据仓库面向主题的特点与传统数据库面向应用进行数据组织的特点相对应,数据仓库中的数据是面向主题进行组织的,而数据库是面向事务处理应用进行数据组织的。在较高层次上对分析对象的数据的一个完整、一致的描述,能完整、统一地刻画各个分析对象所涉及的各项数据及数据间的联系,就是面向主题的数据组织方式。主题是指一个分析领域,是在一个较高层次上对数据进行组织、归类的标准。从而使得面向主题的数据组织可以独立于数据的处理逻辑,方便了在多种环境上开发新的分析型应用。同时,这种独立性也是建设企业全局数据库所要求的,故面向主题不仅适用于分析型数据环境的数据组织形式,也适用于建设企业级数据库的数据组织方式。当然,根据其时间、访问频率等可把同一主题的数据存放在不同的设备上,以使数据仓库的整体性能得到优化。