数据整合的设计与实现

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3 基于 XML/RDF 的数据交换技术
XML 是 由 W3C (Word Wide Web Consortium) 在 1998 年 9 月设计的一个 SGML (Standard Gener- alized Markup Language 标准通用标记语言) 的简化 版本。XML 是一 套定义语 义标记的规 则, 这 些 标 记将文档分成许多部件并对这些部件加以标识。 它也是元标记语言, 即定义了用于定义其他与特 定领域有关的、语义的、结构化的标记语言的句 法语言。这些语言定义了一套固定的标记, 用来 描 述 一 定 数 目 的 元 素 。XML 定 义 了 一 套 元 句 法 , 与特定领域有关的标记语言都必须遵守。如果一 个应用程序可以理解这一元句法, 那么它也就自 动地能够理解所有的由此元语言建立起来的语言。 各种应用不必事先了解多种不同的标记语言使用 的每 个标记。XML 对 于大型和复 杂的文档是 理 想 的, 因为数据是结构化的。这不仅使用户可以指 定一个定义了文档中的元素的词汇表, 而且还可 以指定元素之间的关系。作为标准交换语言, 担 负描述交换数据是 XML 重要作用之一[2]。
……
数据整合平台
编码 映射 工具
数据 导出 服务
数据 导入 服务
COBRA服务和基于 XML/RDF 的数据交换技术
图 2 数据整合平台设计模型
决策支持信息 发
布 管理支持信息 工
具 业务支持信息
Βιβλιοθήκη Baidu



中心数据库

5.2 各模块的功能设计 编码映射模块是整合平台重要组成部分。系统
数据整合的前提是对企业数据进行分析, 通过详 细的分析, 首先找到不同系统数据库中关键数据 之间的业务联系, 对这些紧密关联的库表进行编 码映射。依据电力信息编码规范, 编码映射工具会 自动对关键数据表进行处理, 生成信息编码的前 五位分类码, 后 6 位属性码则指定到具体的数据 元。依据这些信息编码, 业务关联的数据在数据表 现上也有了交换的“桥梁”, 这样就可以方便地进行 数据分析和提取, 生成企业有价值的信息。
2007 年第 2 期
河南电力

数据整合的设计与实现
张宏林, 张占营 ( 安阳供电公司, 河南 安阳 455000)
摘 要: 介绍了供电企业信息化发展的现状、基于 CORBA 的企业数据整合方法和基于 XML/RDF 的数据交换技术, 提出了供电企业数据整合平台的设计方案, 并对该方案的应用进行了探讨。 关键词: 数据整合 CORBA XML/RDF 中图分类号: TP 311 文献标识码: B 文章编号: X( 2007) 02- 009- 04
由 于 本 系 统 作 用 是 针 对 来 自 设 计 、构 建 和 数 据 表示各异的企业数据源, 基于 CORBA 中间件技术 和 XML/RDF 的数据交换技术, 因此平台的使用必 须兼备两种数据耦合方式, 具备企业数据发掘和 数据二次开发使用两种功能。
系统模型见图 2。
电能量管理系统 营销现代化系统 负荷监控系统 客户服务系统
10
张宏林等: 数据整合的设计与实现
2007 年第 2 期
全 服 务 、命 名 服 务 和 永 久 对 象 服 务 等 ) 的 接 口[1]; 支 持制造业的垂直领域通用设施向终端用户应用提 供工作流、对象管理和安全管理等的服务接口; 水 平领域通用设施是针对某个应用领域 ( 如金融、电 信 、电 力 等 ) 提 供 服 务 接 口 , 并 为 特 定 的 高 层 应 用 ( 如 SCADA/EMS 等) 提供对外接口。
针对上述问题, 经过对应用需求的整理, 我
们发现想打破系统间的数据交流的壁垒, 必须以 系统数据整合为基础, 逐步丰富应用, 建立企业 决策系统的实施策略。制订电力企业数据整合平 台 的 设 计 方 案 , 它 采 用 先 进 的 基 于 CORBA 的 客 户/服务器构件进行系统的集成, 提供 RPC 方式的 数据获取, 满足紧密耦合的集成需求; 同时提供 XML/RDF 文 件 导 入 器 /导 出 器 构 件 , 系 统 间 交 换 XML 编码的 消息, 满足松 耦合的集成 需求 。 这 两 个构件组成能够适应各种需求的接口适配器, 使 企业数据整合的实现成为可能。
The Layout and Actualization of Data Integration
Zhang Hong-Lin, Zhang Zhan-Ying (Anyang Power Supply Company, Anyang 455000, China) Abstract: This article introduces the status of information of the power supply enterprise .Then give the technique of the data integration base on CORBA and the transfer of date that base on XML/RDF technology. And bring forward the layout of data integration flat of the power supply enterprise. At last discuss the application of the layout . Key words: data integration; CORBA; XML/RDF
基于 CORBA 的企业应用集成的基本方法是以 产品为对象, 以产品开发过程为核心,采用面向对象 和分布 式 对 象 计 算 技 术 , 以 企 业 模 型 、信 息 共 享 模 型为基础, 利用软总线和软构件技术, 开发不同应 用软件的接口适配器。实现应用软件的即插即用以 及各应用软件之间的信息交换与共享。
电力信息编码规范和按此规范编制的编码, 就是不同数据库之间数据交互的“桥梁”。规范的制 订必须依据国家和省级电力行业的标准, 又能很好 地对本企业的设备和工组流中产生的数据进行唯 一性对应。例如安阳市供电公司编码的组成分为七 层: 省份代码、单位代码、变 电站/输电线 路代码、电 压 等 级 代 码 、设 备 所 属 单 元 代 码 、设 备 类 别 代 码 、设 备顺序号, 共 17 位, 如图 1。
数据导入/导出器模块提供数据导出/导入的服 务。由于 XML 能够创建不依赖于平台、语言和限制 性约束的开放性数据, 因此它适用于数据交换的 松散耦合数据集成方式。整合平台的数据导入/导出 器使得电力企业内部各个业务模块有机结合, 数据 交换畅通无阻, 从而在整体上理顺业务操作的目 的。数据导入/导出器将系统的专用格式数据表示成 不 依 赖 于 平 台 的 、语 言 的 开 放 性 数 据 。 数 据 提 供 者 接受其他系统的订阅请求, 在数据变化时或者经 过指定的时间间隔, 将其他系统所订阅的数据通 过导出器, 生成 XML 编码的消息, 发布给相应的 订阅者。订阅者接收到消息后, 使用导入器, 按照 相应的模式文件, 将数据导入自己的系统。在数据 导入的过程中, 由于涉及各业务数据系统的安全 性, 数据导入的方向多数是中心数据库, 只在极 少的、数据要求准确的、经过分析后没有任何风 险的情况下, 才可以导入应用系统。
1 前言
到目前为止, 供电企业的信息化建设已经历 了一个漫长的历史积累过程, 在这个发展过程中, 各业务部门根据特定的需要, 安装和开发实现不 同功能的应用系统。由于各个系统的建设时期不 同, 阶段性信息化技术的冲击使得这些系统所使 用硬件平台、操作系统、通讯协议、开发技术等 存在很大的差异, 导致企业的 IT 环境具有显著的 分布性和异构性特点。此外, 这些应用系统关系 电力对象的不同方面、对电力对象有专门的建模 方法, 在设计上很少考虑与其他系统进行自由的 数据交换; 而且应用需求也会在系统安装后不断 变化和增加。这些问题的存在导致企业数据冗余、 重复输入, 部门之间难以进行数据共享, 各应用 系 统 在 信 息 上 呈 现 “孤 岛 ” 态 势 。 “信 息 孤 岛 ” 的存在将无法实现实时的信息存取和对业务流程 的透视, 使企业运营成本提高和效益下降, 并使 企业 IT 系统的维护所需的费用和时间增长 , 企业 决策层也难以统揽全局。因此, 电力企业越来越 迫切地需要对电力运营各个方面的数据进行整合, 以提高业务处理的整体效率, 从根本上优化经营。
设备顺序号
设备类别码 所属单元代码 电压等级码 变电站/输电 线路辨别码
单位代码 省份代码
图 1 安阳供电公司编码组成
2007 年第 2 期
河南电力
11
5 电力企业数据整合平台设计方案
本部分首先给出数据整合平台的详细系统模 型, 然后对系统模型中的主要模块进行功能描述, 并简要说明了系统的特点。 5.1 系统模型
在 国 际 标 准 IEC61970 中 明 确 指 明 了 开 放 的 、 可 “即插即用”的 EMS 应用即是基于构件实现了, EMS 集成框架是一个基于构件的集成体系结构。在 OMG UTF 专 门 针 对 电 力 领 域 规 范 了 基 于 CORBA 的数据访问设施( DAF) 、工业系统数据采集( DAIS) 等领域服务。
2 基于 CORBA 的企业数据整合方法及其实 现技术
CORBA( Common Object Request Broker Archi- tecture) 标准是对象 管理组织( OMG) 制 定 的 一 种 在 异构系统之间进行通信的协议, 它也可以作为一种 软件总线, 进行数据交换的各个部分只要遵循这个 总线规范即可。参照 OMG 规范, 企业应用系统数 据整合可采用基于 CORBA 的企业应用集成体系结 构。CORBA 对象请求代理支持公共对象服务、通用 设 施 、领 域 接 口 和 应 用 接 口 之 间 的 互 操 作 性 和 交 互 通信。公共对象服务独立于应用领域, 为各种分布 式对象软件提供的一组基本服务 ( 如事务服务、安
数据整合的关键在于数据的描述方式, 或者 说是 表达方式。XML 作 为文本自 描述方式, 使 得 它成为在不同的应用间交换数据的理想格式。XML 使用的是非专有的格式, 不受版权、专利、商业 秘密或是其他种类的知识产权的限制。XML 的功能 是非常强大的, 同时对于人类或是计算机程序来
说, 都容易阅读和编写。使用 XML 而不是专有格式, 人们就可以利用任何理解 XML 的工具来处理数据。 还可以为不同的目的使用不同的工具。一个程序用 来查看而另一程序用来编辑。XML 使用户不必因为 数据已经用专有格式编写好了或是接受数据的人 只接受专有格式而限制在一个特定的程序上。
4 电力信息编码规范
从企业数据整合的角度, 去分析建设在不同时 期的信息系统, 其数据库的采用和设计是各不相同 的。对这些数据的整合, 从技术上不存在太大的问 题, 但是由于不同数据库的设计采用不同的编码, 导致的结果是很多在业务层联系密切的数据, 在数 据表现上却找不到任何的关联, 因此必须在这些数 据表之间搭建“桥梁”。
以下为 XML 文件的一个范例: <cim:event rdf:ID=“12345”> <ActivatyRecord.createdOn>AbsoluteDateTime 类型的 数据, 由年、月、日、时、分、秒、毫秒生成( 转换成 date 字符串) </ActivatyRecord.createdOn> <Document.type>事件分类号</Document.type> <Document.subType>事件类型</Document.subType> <Document.title>事件对象组名</Document.title> <Naming.name>事件对象名 0</Naming.name> <Naming.descripition>事 件 文 字 描 述</Naming.descripi - tion> </cim:event>
相关文档
最新文档