企业的信息资源管理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
企业的信息资源管理
共享数据库的概念
教授:这是一个需要讨论清楚的认识问题。让我们从共享数据库的概念讲起吧。
先看一个例子:有个公司最先开发了工资系统,按职工工资单建立了数据存储。后来开发了人事系统,按人事档案建立了人事数据存储。在管理工作中,工资系统要用人事数据,人事系统要用工资数据,这就需要编制数据抽取和格式转换的接口软件,如图1。
图1两个应用的接口
随着公司的发展和职工人数的增加,又开发了职务历史跟踪系统,购买了劳动分布软件包。这样,四个应用相互使用数据,就需要12个接口,如图2。我们假定每个应用项目有一个数据存储(实际情况是每个应用都使用了多个冗余的数据存储),逐渐增加的应用项目要做到信息互用,额外的接口的数目如下表:
应用项目数数据存储数接口数
1 1 0
2 2 2 (2×1)
3 3 6 (3×2)
4 4 12 (4×3)
5 5 20 (5×4)
6 6 30 (6×5)
7 7 42 (7×6)
这些接口的数目和复杂性,随着新的应用增加按几何级数增加。最终,增加新应用的花费和现有系统的集成,靠增加接口的方法,变得可望而不可及了。
图2四个应用的接口
数据管理的一项任务,就是提倡对相互有关的应用项目的信息资源做好规划和协调。通过这项工作,可以最大程度地提高数据的共享,而使数据冗余度最低。上例中四个应用的有关职工的信息如果组织成共享数据库,四个应用都直接存取共享数据库,而不是通过接口互用数据,就简单、可靠、高效率地实现了四个应用的集成,如图3。
图3共享数据库不需要接口
上述工资单和人事登记表等等,是管理人员使用的数据格式,我们把它叫作“用户视图”。一般来说,不能按用户视图的原样子来建立数据库。
学生:我在学校里学过数据结构规范化的理论,可是不会用,实际工作中差不多都是这样“建库”的。
教授:所以我们在例中把它们叫作“数据存储”,而不叫“数据库”。要把多个应用所涉及的用户视图,按新系统的信息需求重新改造制作一番,才能成为共享的“职工数据库”。
学生:这么说,共享数据库的概念并不神秘;而且,从例中可以看出,共享数据库确实是集成化的信息系统的基础与核心。可是,如此简单的道理,为什么得不到普遍的认识呢?
教授:原因是复杂的,既有技术历史上的原因,又有教育培训上的原因。现在大家普遍应用的关系型数据库管理系统(RDBMS),•从dBASE、FoxPro 到Oracle 和Sybase等等,•都提供了非常简单的物理数据库的建立、修改或删除的手段,比起过去用三代程序语言来“建库”不知简化了多少倍。70年代后期,有的数据库专家就提出了“数据库风险”的警告,意思是说,由于使用数据库管理系统,不同的开发人员,在不同的时间,为不同的应用,很容易地建一些“数据库”,很可能产生大量冗余且不一致的数据,给信息处理和使用造成很大的困难。许多数据库产品供应商,只讲某一数据库管理系统的完善功能,好像不用规划和协调就可以解决信息资源管理的问题;一些受过专业教育的人,学了数据规范化的理论但没经过从用户视图到数据库设计的训练;现在多媒体和超文本等信息技术开始普及应用,但是企业管理最基本的事务数据的结构化分析与组织技术却受到冷遇,似乎不值一提,等等。这些正是不少企业应验了“数据库风险”的原因。
集成化的数据环境
学生:实在说,我不论在校期间还是工作中,都没有系统学习过数据集成的理论和方法,请老师给补补课。
教授:在这么短的时间里,只能概要地说说,补课还得靠你回去结合工作进行学习。
詹姆斯·马丁(James Martin)15年前就提出了企业的计算机信息系统是以数据为中心的原理,写出了数据集成的理论和方法专著。“数据中心原理”是说,只要企业的性质和目标不变,它的数据类就是稳定的,任何经营管理的瞬间,都是对这些数据类的数据输入(记录的增加、修改或删除)和数据输出(记录的检索或使用),信息系统的开发应该面向数据,而不应该面向处理过程,因为处理过程是多变的(图4)。
图4数据位于现代数据处理系统的中心
他明确提出“数据环境”(Data Environment)的概念,认为企业的计算机应用有四类数据环境,反应了由低级到高级的发展过程。
第一类数据环境是数据文件(Data-Files)环境。是指早期用程序语言(多数是COBOL)建立的数据存储结构,•缺乏数据分析工作,一般是与应用程序密切相联。优点是应用开发见效快,缺点像上面的例子所反映出的问题,随着应用的增多,冗余的、不一致的数据也会越来越多,从而形成了混乱的数据环境,系统维护、集成十分困难。
第二类数据环境是应用数据库(Application Data Bases)环境。当数据库管理系统出现以后,数据存储结构的建立大大简化了,但是数据分析工作没跟上,用DBMS按用户视图“建库”,方便性带来了随意性,于是应验了“数据库风险”,可能更快地形成混乱的数据环境,系统维护、集成同样十分困难。
第三类数据环境是主题数据库(Subject Data Bases)环境。经过科学的规划和设计,用DBMS建立具有共享性和一致性的、本来意义上的数据库,即“主题数据库”。以主题数据库为主的数据环境才是集成化的数据环境,在这种数据环境中才能开发和运行集成化的信息系统。
第四类数据环境是信息检索系统(Information Retrieval Systems)。是指对一些主题数据库进行萃取和深加工,为高层查询和辅助决策准备的数据环境。
学生:这样说来,不仅我们单位这几年基本上是在应用数据库的环境中转来转去,可能许多单位也是如此。再说,好多人并不晓得、大家也不讲“数据环境”这个概念。
教授:这正是有些单位的MIS搞不上去的一个重要原因。我们说,企业信息系统集成的基础与核心任务是数据集成,就是要改造以数据文件和应用数据库为主的、混乱的、低档次的数据环境。企业集成化MIS建设成功的重要标志,是达到高档次的数据环境──主题数据库和信息检索系统。
诺兰模型把集成和数据管理分为前后两个阶段,似乎可以先搞集成后搞数据管理,但后来的实践表明这是行不通的。米歇模型对此作了修正,揭示了信息系统集成与数据管理不可分,集成阶段的重要特征就是搞好数据组织,或者说信息系统集成的实质是数据集成。我们近些年来搞的集成化MIS研究和开发工作的一个重要体会,是要特别强调数据环境的建设,更确切地说,是以主题数据库为主的集成化的数据环境的建设。