企业的信息资源管理完整版

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

企业的信息资源管理

Document serial number【NL89WT-NY98YT-NC8CB-NNUUT-NUT108】

企业的信息资源管理

共享数据库的概念

教授:这是一个需要讨论清楚的认识问题。让我们从共享数据库的概念讲起吧。先看一个例子:有个公司最先开发了工资系统,按职工工资单建立了数据存储。后来开发了人事系统,按人事档案建立了人事数据存储。在管理工作中,工资系统要用人事数据,人事系统要用工资数据,这就需要编制数据抽取和格式转换的接口软件,如图1。

图1两个应用的接口随着公司的发展和职工人数的增加,又开发了职务历史跟踪系统,购买了劳动分布软件包。这样,四个应用相互使用数据,就需要12个接口,如图2。我们假定每个应用项目有一个数据存储(实际情况是每个应用都使用了多个冗余的数据存储),逐渐增加的应用项目要做到信息互用,额外的接口的数目如下表:应用项目数数据存储数接口数1 1 02 2 2 (2×1) 3 3 6 (3×2) 4 4 12 (4×3)5 5 20 (5×4)6 6 30 (6×5)7 7 42 (7×6)这些接口的数目和复杂性,随着新的应用增加按几何级数增加。最终,增加新应用的花费和现有系统的集成,靠增加接口的方法,变得可望而不可及了。

图2四个应用的接口数据管理的一项任务,就是提倡对相互有关的应用项目的信息资源做好规划和协调。通过这项工作,可以最大程度地提高数据的共享,而使数据冗余度最低。上例中四个应用的有关职工的信息

如果组织成共享数据库,四个应用都直接存取共享数据库,而不是通过接口互用数据,就简单、可靠、高效率地实现了四个应用的集成,如图3。

图3共享数据库不需要接口

上述工资单和人事登记表等等,是管理人员使用的数据格式,我们把它叫作“用户视图”。一般来说,不能按用户视图的原样子来建立数据库。

学生:我在学校里学过数据结构规范化的理论,可是不会用,实际工作中差不多都是这样“建库”的。

教授:所以我们在例中把它们叫作“数据存储”,而不叫“数据库”。要把多个应用所涉及的用户视图,按新系统的信息需求重新改造制作一番,才能成为共享的“职工数据库”。

学生:这么说,共享数据库的概念并不神秘;而且,从例中可以看出,共享数据库确实是集成化的信息系统的基础与核心。可是,如此简单的道理,为什么得不到普遍的认识呢

教授:原因是复杂的,既有技术历史上的原因,又有教育培训上的原因。现在大家普遍应用的关系型数据库管理系统(RDBMS),•从dBASE、FoxPro 到 Oracle 和 Sybase等等,•都提供了非常简单的物理数据库的建立、修改或删除的手段,比起过去用三代程序语言来“建库”不知简化了多少倍。70年代后期,有的数据库专家就提出了“数据库风险”的警告,意思是说,由于使用数据库管理系统,不同的开发人员,在不同的时间,为不同的应用,很容易地建一些“数据库”,很可能产生大量冗余且不一致的数

据,给信息处理和使用造成很大的困难。许多数据库产品供应商,只讲某一数据库管理系统的完善功能,好像不用规划和协调就可以解决信息资源管理的问题;一些受过专业教育的人,学了数据规范化的理论但没经过从用户视图到数据库设计的训练;现在多媒体和超文本等信息技术开始普及应用,但是最基本的事务数据的结构化分析与组织技术却受到冷遇,似乎不值一提,等等。这些正是不少企业应验了“数据库风险”的原因。

集成化的数据环境

学生:实在说,我不论在校期间还是工作中,都没有系统学习过数据集成的理论和方法,请老师给补补课。教授:在这么短的时间里,只能概要地说说,补课还得靠你回去结合工作进行学习。

詹姆斯·马丁(James Martin)15年前就提出了企业的计算机信息系统是以数据为中心的原理,写出了数据集成的理论和方法专着。“数据中心原理”是说,只要企业的性质和目标不变,它的数据类就是稳定的,任何的瞬间,都是对这些数据类的数据输入(记录的增加、修改或删除)和数据输出(记录的检索或使用),信息系统的开发应该面向数据,而不应该面向处理过程,因为处理过程是多变的(图4)。

图4数据位于现代数据处理系统的中心

他明确提出“数据环境”(Data Environment)的概念,认为企业的计算机应用有四类数据环境,反应了由低级到高级的发展过程。

第一类数据环境是数据文件(Data-Files)环境。是指早期用程序语言(多数是COBOL)建立的数据存储结构,•缺乏数据分析工作,一般是与应用程序密切相联。优点是应用开发见效快,缺点像上面的例子所反映出的问题,随着应用的增多,冗余的、不一致的数据也会越来越多,从而形成了混乱的数据环境,系统维护、集成十分困难。

第二类数据环境是应用数据库(Application Data Bases)环境。当数据库管理系统出现以后,数据存储结构的建立大大简化了,但是数据分析工作没跟上,用DBMS按用户视图“建库”,方便性带来了随意性,于是应验了“数据库风险”,可能更快地形成混乱的数据环境,系统维护、集成同样十分困难。

第三类数据环境是主题数据库(Subject Data Bases)环境。经过科学的规划和设计,用DBMS建立具有共享性和一致性的、本来意义上的数据库,即“主题数据库”。以主题数据库为主的数据环境才是集成化的数据环境,在这种数据环境中才能开发和运行集成化的信息系统。

第四类数据环境是信息检索系统(Information Retrieval Systems)。是指对一些主题数据库进行萃取和深加工,为高层查询和辅助决策准备的数据环境。

学生:这样说来,不仅我们单位这几年基本上是在应用数据库的环境中转来转去,可能许多单位也是如此。再说,好多人并不晓得、大家也不讲“数据环境”这个概念。

教授:这正是有些单位的MIS搞不上去的一个重要原因。我们说,企业信息系统集成的基础与核心任务是数据集成,就是要改造以数据文件和应用数据库为主的、混乱的、低档次的数据环境。企业集成化MIS建设成功的重要标志,是达到高档次的数据环境──主题数据库和信息检索系统。

诺兰模型把集成和数据管理分为前后两个阶段,似乎可以先搞集成后搞数据管理,但后来的实践表明这是行不通的。米歇模型对此作了修正,揭示了信息系统集成与数据管理不可分,集成阶段的重要特征就是搞好数据组织,或者说信息系统集成的实质是数据集成。我们近些年来搞的集成化MIS研究和开发工作的一个重要体会,是要特别强调数据环境的建设,更确切地说,是以主题数据库为主的集成化的数据环境的建设。

学生:主题数据库与通常所说的数据库主要区别在哪里

教授:主题数据库最主要的特征是面向业务主题,而不是面向应用程序,因而数据独立于程序。上面例子中的“职工数据库”面向职工管理的业务主题,包括对职工的自然情况、工资、职业历史和工班任务等管理内容,是主题数据库;而面向应用程序建立的“工资表”、“人事档案表”等等,是通常所说的数据库,或应用数据库。采用主题数据库的一整套技术方法,随着应用系统的增加数据库的数目有特定的增加趋势,到一定的时候就趋于平稳,不再增加,这样逐步建成的是稳定的、可控制的和有序的数据环境。否则,按应用数据库的做法,“数据库”将随应用系统的增加而迅猛增加,势必造成不稳定、不可控制和无序的数据环境。

相关文档
最新文档