关于总体数据规划与主题数据库的讨论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
A S R C Ds so i tites Wh t ip m n Sr eiD t Pan g w a i BT A r iu i n s s : y m l et a g a -l i , t c s n h h i o e t t c a n n h s Srt iD t Pan ghw ip m n Sr eiD tPan g ad t ds n - t e c a l i , t m l et t c a l i , hw eg Sb a g a - n n o o e t g a - n n n o o i u a j t aa e iet , t aa z ad s ut a l et bs hw p pr e D t s fcnl hw nl e cnt c dt e m ns e o t r e y c a b e i y o o y n o r a -e f a , o l o a ie a -i io ao c eoz g c i , ad sa nc s p c e dm iwd n r tn gri ad n e , t e e s r s s h v o n e m i a in n o g t n h r e a t f t d c e e y e
4 设计好主题数据库是关键
在数据管理上, 从面向 应用到面向主题是M S I发展的结果。 进入应用数据库的是日 常事务产 生的 最新和专用的应用数据; 进入主题数据库的则是经过加工和集成、 且不再修改的不同时空的历 史 数据。主题是一个分析领域、 是在较高层面对数据归 类的标准。主题数据库使MI 能为管理层 S 提供综合查询服务, 它不能替代应用数据库的作用。现简介两个实例: 41 二维形式的主肠我据库( 工资裹” . 以” 为例〕
工资管理主题数据库一级表 }主关健字: 年月, 工号: 字段: 年月, 工号, 姓名. 应发工资, 应扣工资. 实发工资. 签收栏;
三 K1 藏荟 * W -硒 f 一 t司
二级表-2应扣复合数据项 I :
外健 : , : : . . 项称 发金 ; 关 宇 为工 字 年 工 应 名 . 项。 年 号段月号发 应
计。
13 坚持“ 先集成, . 后开发. ‘ 的策略和时机 诺兰模型指出: I建设过程存在起始、 MS 蔓延、 控制、 集成、 数据管理和成熟六个阶段。“ 先开 发, 后集成” 方式: 先工业化、 后信息化的西方国家的M S I 建设, 经历过传统的“ 先开发, 后集成” 的 开发过程. 这是一种不成功的、 无法集成的方法。原因 系统硬软件平台的差异; 是: 应用系统的不断 变化和缺乏全域信息的 分类编码( 标准) 或编码不统一。 “ 先集成, 后开发” 方式: 高举邓小平理论伟大旗帜, 建设有中国 特色的 社会主义, 要批判地接受 外国M S I经验。强调“ 先做好面向数据的总体数据规划, 再进行面向对象的应用开发”是具有中 . 国特色的MI开发策略, S 能有效地实现在“ 集成” 指导下的分步开发, 简称为“ 先集成, 后开发” 。电 力企业 MI 搞了 1 年多. S 5 现正在由 诺兰模型的“ 控制” 阶段向“ 集成” 阶段过渡, 是进行总体数据规
3 一 17 9
关于总体数据规划与主题数据库的讨论
曹林 贵
( 河北省电力公司 石家庄 002) 501
摘 要 本文讨论MI为什么要做总体数据规划, S 什么是总体数据规划, 怎么做总体数据规划, 以及如 何设计好主题数据库、 如何分析建立数据元家库和搞好全域信息分类编码等企业信息化不可回遵的问
题。
关.词
划的最佳时机。 14 电力企业 MI 趁设导则的签本要求 . S
摘自 电 《 力企业计算机管理信息系统建设导则( 试行) 中国电力信息中心〔982 号) ( } 19]4 文: “ 力企业M S 电 I建设, 必须遵循‘ 统一领导、 统一规划、 统一标准’ 的原则, 以信息工程理论为指导, 在完成面向数据的总体教据规划后. 再进行面向对象的应用开发,用群件技术解决非结构化信息 (
i bi i e t pi ifr i ss m n l n ne re oma n t u d g r s n o ye
K Y R S ngm n i om t n E WO D Maae et r ao n f i D t e m ns omai cdn aa e t ifr t n ig l e n o o
外关镇字: 年月, 工号: 字段: 年月. 工号. 应扣项名称. 应扣项金倾。
本例特点: 对存储类用户视图( 工资表) 进行消除复合数据项的规范化( 一范式) 处理. 设计出它
3 一 20 0
的主题数据库为 1 个一级表和2 个二级表的数据结构, 把原来在应用数据库中作为字段的复合数 据项目 放在二级表中作为记录来处理。得到了无论“ 应发项目 和“ ” 应扣项目 怎么变化都不需要改 ” 变数据库结构的稳定效果。它与关系数据库二维表的形式相同, 较容易设 比 计。但在数据结构变 化( 变发工资与银行联网、 如当 需在一级表中加牡丹卡号) 还有可能需要修改它的数据库结构。 时, 42 一维形式的主肠救据库( 何时、 . 以汗 何地、 何种发电f. 为例) 这种数据结构只 有数据项名称和数据项数值两列内容, 呈一字长蛇阵向下延伸. 故称一维形式 的主题数据库。其数据项名称则由 组成该数据项的数据元素名及其分类属性( 何时、 如: 何地、 何种 等) 组合而成。下面主文件中的记录表示“98 19 年度马头发电厂火电 发电 量= ,0, 0瓦时)” 3800 ( 0 。
所以, 展开对“ 总体数据规划与主题数据库” 的讨论是急切而重要的。
1 为什么要总体数据规划
11 从橄据处理危机说起 . 数据处理危机的表现: 已开发及运行中的 MI 系统的难以维护和无法集成。 S 数据处理危机的原因: 分散开发, 低水平重复劳动; 面向应用, 用的数据库多. 自 共享的少; “ 接 口 泛滥, 个应用数据库之间 ” 在n 互相调用时, n ( 一 ) 接口 , 可建 x 1个“ ”致使系统难以维护; n 数据 环境落后、 开发应用系 已 统的数据结构太不稳定; 条条管理, 上下企业的不同部门之间各自为政, MI建设体制上瘴碍重重; S 信息资源底数不清, 无法统一信息标准, 使系统无法集成, 等等。 数据处理危机的根源: M S 在于 I建设缺乏正确的理论指导、 开发策略和复合型队伍。 改造数据环境的必要性:数据处理危机” “ 反映了信息化进程中对于数据组织技术研究的播求。
等, 年代则用第四代编程语言4 LO A L 9 0 G , R C E等大型关系数据库和 W b e 技术等。值得注意的 是: 在忽视数据结构的情况下, 编程手段越先进, S MI建设乱得越快! 数据和程序方面: 从两者不分到互相分开; 从数据被组织在程序( 数据文件) 到被置入数据 之中 库中( 数据与程序互相独立)从用数据库文件管理数据到用数据库文件存放各种编码以 ; 管理程序。 在技术上为产生下述“ 一维形式的主题数据库” 提供了手段。 理论方面: 6 年代采用指导计算机软件( 5. 0 0 程序及其文档) 开发和维护的软件工程理论; 7 0 -0 8 年代采用指导大型复杂计算机( 含硬、 软件) 系统开发建设的系统工程理论: 0 9 年代则 到8- 0 需要采用信息工程理论来指导企业/ 行业MI的开发建设. 标是创建MI 的集成化、 S 其目 S 网络化; 核心是总体数据规划; 基础是主题数据库; 范围为含有社会属性和技术属性的多技术、 多学科的综 合人机系统, 主要手段是管理好数据元素并做好全域信息编码。信息工程理论有三条基本原理:, 1 数据位于现代管理的中心; 应用多变, 2 , 但数据相对稳定; 最终用户必须自 3 , 始至终真正参加开发, MI建设才能成功。 S 方法方面: 过程方法: 面向 针对处理过程( 业务+ 数据流) 建立应用数据库, 经接口 共享. 便于开 发, 但应用多变时不易 维护, 集成困难. 适用于中小型系统。面向数据方法: 据数据中心说和稳定 论, 藉辅助工具软件, 分析用户视图, 模清数据家底, 建立稳定而共享的数据结构, 重构M S I 的稳定 数据环境, 适应多变的处理过程。但需在分析数据和规划数据结构上下大功夫. 以 优点是集成度 高, 系统稳定, 维护方便, 适用于大型复杂的企业MI的开发建设。面向对象方法: S 通过对象将数 据和操作封装在一起, 对外仅提供少数必要的接口, 对象之间通过消息相互通信和服务, 其稳定的 对象结构减少了系统波动效应, 开发的 所以 软件易于修改、 维护、 扩充和移植。但在系统规划阶段 使用面向 对象方法不如面向数据方法的效果好。 数据结构方面: 从人机约定的文件方式到数据库( 主要是关系数据库) 方式; 从应用数据库方式 到主题数据库方式; 从主题数据库方式向 数据库仓库发展。当前重点是要研究主题数据库如何设
码的目录和内容。
33 信息编码阶段 . 讨论并提出全域信息分类编码体系表; 根据体系表和编码目 结合主题数据库设计的要求, 录, 从数据元素库中提取全部可供信息编码的数据元素, 填入各类信息编码的码表, 逐一进行编码, 并 编写其编码原则和编码说明。属于程序标记类的编码可在应用开发时再做; 码表内容非常庞大的 一些信息编码( 材料编码, 如: 设备编码等)可另组队伍专门 , 开发。完成后应组织专家评审。
Srt idt p n i Sb c dt ae t e c a l n g uj t a bs a g a -a n e- a
管理信息系 M S的建设和发展, 统( I) 除了要有正确的方针策略之外, 还应研究其方法论、 工具 和环境。目 前我国对信息工程的研究尚处初始阶段, 而电力M S I 的建设却萦重艰巨, 任重道远。
机管理走向集成化、 网络化打下坚实的基础。
3 怎么做总体数据规划
31 系统分析阶段 .
对原系统作需求调研, 重点在业务情况和用户视图; 建立三层结构的业务模型并写出说明短 语; 填写数据流表, 1F 绘制 D D和2F D D数据流图; 视图 用户 登录并规范化, 分析其数据组成及主关 键字; 同时做好数据元素命名、 分类和定义; 生成数据元素库及数据元素在用户视图中的 分布分析; 萃取基本词、 类别词和编码属性; 初步归 纳出全域信息分类编码的目 录。
3 一 19 9
的开发) 。在建设过程中, 坚持以数据为中心, 动态控制与静态管理相结合, M S 确保 I 的实用化和
高效益。 ”
2 什么是总体数据规划
总体数据规划是以 信息工程理论为指导, 采用面向数据的方法, 在计算机捕助工具软件支持 下. 分析、 组织和规划企业M S I所需称定的数据结构、 各种主 题数据库的分布策略和实施步蕊。以 便改造现存的数据环境, 满足信息共享需求, 使系统易于开发、 易于维护, 稳定运行。为企业的计算
3 一 18 9
以往人们 仅做到对数据的采集、 传输、 加工、 存储和应用( 屏幕, 打印)而忽略了对信息的“ , 组织”为 , 使MI能有稳定、 S 合理的数据环境, 必须研究总体数据规划。
12 从软件开发的经历讲 . 编程方面: 5 年代用机器语言,0 0 6 年代用汇编语言,0 7 年代用 B SC等,0 AI 8 年代用 dA E BS
32 系统碗棋阶段 .
据企业体制改革和推向 市场的高层目 设计新系统的 标, 功能模型; 在系统分析基础上规划数据 组织, 设计好主 题数据库的库结构, ( 它能容纳不同时段的同类数据和不同空间的异类数据)求出 ; 数据元素在数据库中的分布分析; 描述功能模型和数据库模型间的实体关系; 确定全域信息分类编
管理信息系统( S 总休教据规划 主厄教据库 数据元素 信息组码 MI)
wenku.baidu.com
Srt i D t-l nn t e c aPa ig& S bet tbs ag a n ujc D a ae a
C o nu a L gi i
Hb Ewr P wr pr i Si san 002 ) et ltc e Cro tn h ih ag 501 i i o o ao j a