基于XML的异构数据交换技术研究
基于XML的异构数据源间数据交换的实现研究
有无 缝集成 功 能 , 都是 基于 他们 自身 产 品量身 定做 的 , 外 , 但 此 在使 用 中还存 在着 不尽 人意 的地 方 , 数据 如
企 事 业 单 位 不 断 发 展 的 信 息 化 需 要 . 细 介 绍 了 数据 集 成 中 间件 的结 构 和 实 现 功 能 , 在 基 于 关 系 型 数 据 库 的 详 并
档 案 和 办 公 系 统 的数 据 集 成 中应 用 了 该 方 案 , 用 户 提 供 可 配 置 的 使 用 方 式 . 为
行 交换 的 出人 口 , 实现 了业务 系 统 间的 同步或 异步 的数 据交互 [ . 3 介绍 所实 现 的 中间件 的主要 功能设 计 . ]
1 数 据 集 成 实 现 方 案
基 于 XML 和 We b服 务 的数 据集 成 需要 建 立 一个 数 据 交 换 中心 Ⅲ , 一服 务 的提 供 和管 理 , 统 以保 证
V014 N_ .0 o 3
20 0 7年 6月
J n 2 0 u .07
文 章 编 号 :0 6— 92 2 0 )30 0— 6 4 57 4 ( 0 7 0—0 90
基 于 XML 的异 构 数 据 源 间数 据 交 换 的 实现 研 究
邵秀丽, 韩建彬, 阎 仲蹼
查询 , 还实 现 了异构 系 统 间的信 息互 动 , 异构 系统 的数据 能无 缝 地迁 移 和交 换 , 现 了信 息 的高 效流 转 使 实
基于XML的异构数据交换的研究
为 了对 XML文 档 的结构 与 允许 值 进 行 定 义 和检
查, 有两 种 办法 : 是 使用 D D文档 类 型定义 ; 一 T 二是 使 用 XML S h m 。 这 两 者 均 为 X ce a ML规 范 的一 部 分 。 D D 的用 途 很 多 , T 可用 来 定 义 内容 的模 式 、 限制 数 据
pr v d s n w a of ti k n T hs pa r r snt a o i e a e w y h n i g. i pe p e e s hee o e o da e c n XM L—b s d,t ie p cfc t r g ne us t x ha ge a ae i gv s s e i pr c s i o es ofa pl a on p i t . ci
2 .Deat n fCo ue nier g fnn ct n T cn lg ol eJnn ,hn o g 7 10 C n ) pr meto mp trE gnei , ig Voa o eh oo y C lg , ig S a d n 2 2 O , ha n i i e i i
Re e r h o t r g ne u t s a c f He e o e o s Da a Exc n e y t m s d o XM L ha g S s e Ba e n ZHENG i i, L—l IHu S u j n i, HI Xi - u
Ke r s h tr g n o s d tb e ; t e c a g ; y wo d : ee o e e u a a s d a x h n e XM L S h ma; a s a ce XM L
基于XML的异构数据交换模型的研究
源之 间 的互操 作 [ 。 1 异构 性 主要体 现在 3 方面 : ] 个 计算 机 体 系 结 构 的 异 构 、 作 系统 的异 构 和 D MS 的异 操 B 构 。随 着信 息 技术 的迅猛 发展 , 业 问 的联 系 日趋 紧 企
密 , 同系统 问 的信 息交 流 日益 增多 , 实 际应用 中经 不 在
i t g i .Fi a l ,t e e p rme tp o e h e sb l y a d a c r c ft e c n e so t o . n e rt y n l y h x e i n r v d t e fa i i t n c u a y o h o v r i n me h d i KEYW ORD d t x h n e i t g i o s r i t a a e c a g , n e rt c n t a n s,r l t n ls h ma y ea i a c e o
异构 数据 交换 是指异 构数据 处理 环境 下不 同数据
很 差 。而基 于 X ML 的交 换 方式 的扩 展性 非常 好 。 利 用 XML文 档作 为 中 间文件 进 行异 构 数据 源 间 的 信 息交 换 必 须实 现 以下两 点 : 数 据 源 中的记 录 提 将
取 出来转 变 为 XML文 档 ; 已有 的 X 将 ML文档解 析 后 导 入 到数 据 源 中 。为 了在数 据源 和 X ML文 档之 间传 递数据 , 须将数据源结构和 X 必 ML文 档 结 构 相 互 转 化 。本 文将 对 数据 源 中的关 系数 据库 结 构 和 XML文 档 结构 之间 的转 化进 行研 究 。 以往 的数 据交 换模 型 在
常
浩
安 建成
XML在异构数据交换中的研究
中图分类 号 :T 311 P1 2
文献标 识码 :A
文 章编 号 :10— 59 ( 00 1— 01 ( 0 7 9 9 2 1 ) 0 0 9一) 1
XM L s a c n c ng fH e e 0 e 0 t Re e r h o Ex ha eo t r g ne usDa a
摘 要 :本 文对基 于 XML技 术 的数据 交换 方式进 行 了研 究 ,探 讨 了异构 系统 间的数 据 交换 问题 ,提 出一种基 于 X ML 技 术 的异构 系统 数据 交换技 术 ,构 建 了以 X ML为数 据 交换 标 准的异 构数 据 交换平 台。 关键词 :异构数 据 ;XML ;数据 交换
s se sp o lm ,r p e ee o e e uss tm t xc ng e h oo y s d o y tm r b e p o os d ah tr g n o yse d a e ha etc a n lg ba e n XM L tc olg ,r ae t ee o e e us e h o c e td h tr g n o n y he
d t x h n epaf r b aae c a g lt m y XML d t x h n es n ad . o a e c a g t d r s a a
Ke ywo dsHee o e e u aaXM L; t x h n r : tr g n o sd t ; Daae c a ge
一
ቤተ መጻሕፍቲ ባይዱ
配 ,此 时 以 C为根节 点 的二叉 树 的左右 子树 就不对 称 了 ,则需要 增加 相应 的结 束置 标和 元素 A配成 一对 ,然 后就 可 以删 除 A 。这 样 以 c为根 的二叉 树 的左右 子树 保持 对称 了,接着 可 以则在 L中 删 除节 点 B 。如 此递 推 ,直到 L中只剩 下头 节 点元素 。 ( )在读 完 H M 五 TL文档 后 , 果 L中还 剩下 头节 点元 素 , 如 则 在这 个元 素 内容 的前面 加上 “ / < ”后 面加 上 “ ” > ,使之 成 为一对 符合 XL的严 格语 法的 匹配 置标 , 后写 入 HM 文 档 ,即表 示转 M 然 TL
基于XML的异构数据交换系统的研究与实现
企业 A XML
format_A ML
(data)
数据交换平台 XML
format (data) ML
企业 B format_B
(data)
图 1 XML 数据交换整体示意
假设企业 A 有数据 data,采用格式 format_A 封装,构成
数据集 format_A (data),而企业 B 只能识别采用格式 format_B
到数据交换服务器上。其实服务器端和客户端都将采用 SOAP 和
HTTP 相结合来传递消息,所以 XML 封装/发送器在服务器端和客
户端都是必不可少的。
客户端的结构如图 2 所示。
数据
XML 生 成 器
XML
XML 封装/ 发送器
XML 文档 注册
数据交 换服务
器
XML 文档 应用接口
图 2 XML 数据交换客户端
Research and Realization of Heterogeneous Data Exchange System Based on XML
YANG Jian1, TANG Huijia1, SUN Linfu2, WANG Shengyin1
(1. School of Computer & Communication Engineering, Southwest Jiaotong University, Chengdu 610031; 2. CAD Engineering Center, Southwest Jiaotong University, Chengdu 610031)
封装的数据,同时,为保持最大的兼容性,平台将采用一个
有最大兼容性的数据结构 format,我们的数据交换平台就是
基于XML的异构数据库集成研究
2 . 3核 心模 块 描 述
毋庸置疑 ,在基于 X ML的中间件 集成系 统中,最 关键的是 中间层 ,也就是说 中间层是
核心层 ,因为中间层封装 了异构数据库的业务
数据缓存 中。另外 ,基于各个包装器和数 据层
的数据库是一一对应的关系 ,当数据库 里面数
以不同形 式存 储的 、依赖 于不 同 的 DB MS的 数据 。当然 ,想要更大程度上利用这些数据资
本文针 对异 构数据 库 系统 间
信 息 共 享 与 信 息 交 换 难 题 , 深 入
l
2 . 2体 系结 构
的讨论 了异构数据 库的集成 方法, 『 并采 用 x M L 的 异构 数据 库 中 间件 1
技 术 实现异 构数 据库 之 间的信 息 交换 ,在 实际应 用 中有 着较 广 阔 的应 用前景
3 总 结
异构 数据库 之 间进 行数 据的 传输 日益成
下面详细说明上述三个主要模块的功能。 据访 问接 口,让用户感觉到就像操作一个数据 模块。 2 . 3 . 1配置 文件模块 库一 一 样方便快 捷。X ML的出现为 异构数据 库 的集成带来 了新的挑战和契机。
XML是一种基于 S G ML简 单灵活的元语 合 以往异构数据库集成方法的基础上 ,采用基 言,具有 高可扩展性 、高度结构化和 自定义性 据信。在这 个配 置文件模块 中,会生成三类文 件 ,包括全局虚拟视图文件 、数 据库 连接配置 于 XML的异构数据库 中间件技术实现异构数 等特性 ,方便表示不 同类型 的数据信息 ,同时 据库之间信息交换 .首先提 出了一个异构数据 也 方 便 了 不 同 数 据 库 之 间 进 行 数 据 共 享 和 交 信息文件 以及安全控制文件。生成的这三类配 库集 成 中间件 的三层 框架结构 , 并通过 XM L 置文件可 以使管理员对集成的个数据 库的元数 换 ,进而 X ML在 异构数据库 的集成方面有很 技术在客户端与数据库服务器 问构建 了一个 中 据信息进行重新定义 ,也可以配置需要查询数 火优势 。本文 主要研 究基于 XML异构数据库 间件 系统 。在该集成 中间件系统中通过对配置 据库的连接信息和安全控 制信息 。 的集成。 改 全局 虚拟 视 图文件 :对 数据 层 的异构数 文件模块 、查询模块 、包 装器模 块的封装 ,
基于XML的异构数据交换系统的研究与设计
( ) MI具 有 自描 述 性 , 以不 预 先规 定 数 据 结 构 , 1X 可 非 常适 用 于 不 同 应 用 间 的 数 据 库 交 换 , 数 据 交 换 中 使 用 在
的 深化 及 数 据 的使 用 。如 何 实 现 异 构 数 据 库 系 统 之 间 的
数 据 共 享 和数 据 互 访 , 信息 化 发 展 迫 切 需 要 解 决 的 问 题 是
作 者简 介 : 惠敏 ( 9 8 , , 汉 商 业服 务 学 院讲 师 , 究 方 向 为 计 算 机 软 件 开 发 ; 攀 ( 9 1 , , 汉 商 业服 务 学 院 助 教 , 陈 1 7 一) 女 武 研 姜 1 8 一) 男 武 研
究方 向为 计 算 机 软 件 开 发 。
第 1 期 0
此, RAI 数 据 恢 复 就 至 少 成 功 了 一 半 。 D
参考文献 :
图 6 创 建虚 拟 R D AI 5
[ ] 何 欢 , 倩 . 据 备 份 与 恢 复 [ . 京 : 械 工 业 出版 社 ,0 2 1 何 数 M] 北 机 21. [] 蔡 平. 盘 阵列 的 数 据 安 全 隐 患 与 数 据 修 复 I ] 第 二 十 一 次 全 国 2 磁 t.
X ML, 开发人 员 可以方 便地 使用 自定 义 的标记 来描述 数据 。
基于XML的异构数据交换的研究
基于XML的异构数据交换的研究摘要:本文对目前较常用的异构数据交换的技术进行了分析,总结了各种方法的优缺点。
借鉴虚拟法的数据集成的实现思想,结合实际应用中数据集成的需求,提出基于XML技术实现异构数据交换集成的解决方案。
该方案简单易行,各系统仍然按照原来的方式运行,共同部分只是XML文档,当需要进行信息交流时,通过中间件把本地数据库数据转换成XML数据文件即可。
关键词:信息孤岛数据转换方法数据仓库法虚拟法XML 随着Internet技术的迅速发展,许多单位或部门都逐步实现了信息化管理。
由于各部门的业务和功能归属不同,形成许多相互隔离的、由不同核心技术设计的信息服务和管理系统。
由于系统中数据的表示不同,系统间交换数据很困难,形成“信息孤岛”[1],从而使得各个系统无法保证数据的一致性。
1 常用的解决办法企业应用集成EAI(Enterprise ApplicationIntegration)是解决这一问题的方法之一。
EAI的定义是:“通过硬件、软件、标准和业务过程的结合,实现两个或多个应用系统的无缝集成,使它们能够统一运作”[2]。
按照不同的实现技术,集成方法可以分为三类:数据转换方法、数据仓库法和虚拟法。
(1)数据转换方法:通过转换工具在不同数据库之间进行模式映射,将一个数据库中的数据复制、转换为另一个数据库中的数据,从而实现数据库之间的转换。
此种方法技术简单,容易实现。
(2)数据仓库法:在客户端与数据源之间增加一个数据仓库层,用于存储来自各数据源要交换的数据,系统提供对这个数据仓库的查询机制。
好处是既可用于数据集成,又可用于决策支持查询。
但当数据源的数据发生变化时,数据仓库中的数据也要作相应的更新。
因此,这种体系结构还需要一些数据加载和增量更新等操作。
(3)虚拟法:该方法中数据仍保存在各数据源上,集成系统仅提供一个虚拟的集成视图和对该集成模式的查询请求转化成对各异构数据源的查询。
在这种体系结构中,中间层根本不存储数据,当客户端发出查询请求时,只需将查询发送到相应的数据源上。
基于XML异构数据库数据转换技术的研究
【 ew r htoeeu t aedtecag cnl yX L Ky od s】 e r nos a bs;a hneeho g ;M eg da a x t o
1 x ML与 L N 的开发架构 IQ
YVL 和 数 据 库 之 间 是 互 补 的 关 系 XML更 适 合 于 J -[ 动 态 的 数 据 交 换 和 集 成 , 平 台 无 关 。X L 的 自定 义 性 与 M
s c r. h l o MLi u e e c b e h trg n o ss u tr ed tb s fr t n a dte ac l eh tr e e u e re o o et sT ef f o i e X s dt d s r e t e o e e u t cu o t a a ei omai , n nc l a eeo n o sd ge t s o i h e r ef h a n o h ut g fw d t a e yu i ef z ac i f r k g u etb t c r w i ewt t re d tb s . i l, c od gt tes u tr uc a b s s s g h z ym t n a e i th l s te h h nl i et g t a a e Fn l a c ri t c e o s r a b nt u hg t t no t a e r u cii a u n hh a a ay n oh r u f o e d t a ew i na s fl aa i o l b o e etr t a b s . a b s h h o ti u e t, u ei r dt t g t a e a cc n ud t d mp t o h a e d a c
XML在异构数据交换系统中的研究与实现
信息如文本 、表格 ,甚至图形等以原始 数据 的方式储存 [ 2 1 。在
异构数 据交换方面 , M 显示 了它强大的力量,这得益于它具 X L
/删
J M DO
J 0M D
解析器
解析器
及 X 文件 ML
图 3 异构数据交换 系统框架 331 ..转换规则字典设计
根据数 据库转移 和数据库合 并两种 转换方式 ,设计 了两
种格式的交换规则字典。数据库转移所 需 r e m 文件格式如 u .l lx
下:
图 2 异构数据交换 系统模块
t n r st ov wi hn ue h rbe xsig i h x h n e po e s An y uig J E tn ad e vrn n i a e o sle s t igrlstep o lmse i n n te e c a g rc s . d b sn 2 E sa d r n io me t o i c t a dJ n DOM, Iitr c n eJ C d v r iih d temirt no eeo e e u aa n n l c iv h eeo AP nef ea dt DB r e ns e gai fh trg n o sd t,a d f al a he ete h tr— a h i f h o i y
和X ML文件等 。
< l i=“ Ru e d 序号” n me “ a = 字典名称” tp = “ y e 转移数据 库 ”> <一 ! 数据库说明 < r DbnIe “ Sc an= 数据库名称” tp =“ y e 数据库类型”, > < 一 ! 表说 明一 > < Db t l t _ d nme “ a e b o a = 源表名” t_e _ a = “ b .l b n w n me 修改 后表名”> < 一 U 明一 ! 歹说 >
基于XML的异构PDM平台数据交换技术
北京航天长征飞行器研究所 赵振杰 闫月辉 王浩 王锦程一、引言航天产品的研制涉及预研、设计、制造、测试和发射等众多环节,具有研制周期短、产品质量要求高的特点,单纯依靠某一单位很难在短时间内完成需求分析、结构设计、产品制造、产品测试和产品交付等整个研制过程,需要基于网络环境下的多专业、多领域协作完成。
由于航天产品研、制分离的独特模式使得各专业群体往往分布在不同的部门、不同的地区,因此必须采用研究所与企业联合研制的模式,充分发挥各自的专业特长,异地设计、制造、管理与协同工作模式是未来我国航天产品研制发展的必然趋势。
要实现航天产品协同研制,首要的就是要解决设计数据共享与管理问题。
产品数据管理(PDM)以产品为核心,以软件技术为基础,在企业范围内为产品的设计与制造创建一个并行化的协同工作环境,它提供了产品全生命周期的信息化管理,实现了对产品相关的数据、过程和资源一体化的集成管理。
随着型号产品三维研制模式的逐步推广,越来越多的企业使用PDM平台对产品全生命周期进行管理,以实现缩短产品开发周期、提高质量、降低成本的目标。
但由于不同的企业往往选用不同的PDM系统,造成设计数据在协同研制过程中流转不畅,技术状态难以控制等问题。
一直以来,采用异构PDM平台的厂所间的数据交换往往依靠手工来完成,这种手工传送的方式常常带来数据传送不及时、数据安全性和一致性不能充分保证、数据交换无法完整记录等问题,一旦数据源出现问题,轻者产品重修,重者产品报废,给航天产品研制带来无法挽回的损失。
本文在结合目前厂所间选用不同PDM平台的应用现状,采用XML、PDM平台二次开发等技术实现设计数据在厂所不同PDM平台间的可控发放和接收,为航天产品实现多厂所协同研制过程中数据源有效控制提供解决方案。
二、关键技术1.XML技术XML(eXtensible Markup Language,可扩展标记语言)是W3C(互联网联合组织)发布的一种标准,该标准允许信息提供者提供根据需要自行定义标记及属性名,亦可包含描述法。
基于XML的异构数据交换系统的研究与设计
基于XML的异构数据交换系统的研究与设计摘要:实现异构数据库系统之间的数据共享和数据互访,是信息化发展迫切需要解决的问题之一。
探讨了利用XML技术实现异构数据库之间的数据交换,提出了异构数据交换系统的模型。
关键词:异构数据;数据交换;XML0引言目前,信息化建设渗透到各个领域,已经成为政府机构和企事业单位发展的重要手段和战略选择。
由于初期阶段,信息化未得到统一规划和统筹安排,各个职能领域的管理平台或系统相对独立,系统间的数据流通困难,相当数量的政府机构和企事业单位都积累了大量的基于不同平台和数据库管理系统的数据以及众多的非结构化数据,造成了多数据库并存的异构问题,严重阻碍了信息化的深化及数据的使用。
如何实现异构数据库系统之间的数据共享和数据互访,是信息化发展迫切需要解决的问题之一。
1XML与异构数据1.1XML简介可标记扩展语言XML(ExtensibleMarkupLanguage)是由W3C 的XML工作组制订的,它是一种通用的标记语言,是特别设计的一组定义语义标记的规则。
XML适用于异构数据的交换,它具有如下特点:(1)XML具有自描述性,可以不预先规定数据结构,非常适用于不同应用间的数据库交换,在数据交换中使用XML,开发人员可以方便地使用自定义的标记来描述数据。
(2)XML具有可扩展性,用户在遵守标记命名规则的前提下,可以在XML文档中增加有意义并且能供用户使用的标记。
(3)XML具有跨平台性,XML文件无论是在Windows平台、Unix平台或是其他平台上,含意都是一样的。
(4)XML文件不仅包含数据,还包含了数据的数据结构。
XML 文档不需要结构描述部分,它自身的层次关系就可以体现数据结构,能非常清晰地表达数据间的依赖关系。
(5)互联网是XML的最大的载体,与传统的电子数据交换的V AN联网方式相比,互联网具有成本较低、连接广泛、扩展性好的特点。
XML的扩展性允许它描述不同种类的数据,又由于基于XML 的数据是自我描述的,数据不需要有内部描述就能被交换和处理,所以XML能够使不同来源的结构化数据很容易在不同操作系统、数据库和应用软件之间进行数据交换和集成,以做进一步处理。
基于XML的异构数据库数据交换研究
半结构 有结构 关系 半结构化( 图或树状结构 ) XML c e 、 S h ma Xml Da - m 数据 目录( 系统数 据字典 中) DTD、 丰 富可 由 C sXS s 、 L等定义 简单 SL Q XQ 、 pt LX a h 完备 完备 通过代理软件支持 完全支持 支持 尚不支持 面 向应用 、 面向人 面向应 用
摘要 : M X L以其 良好的结构和灵活性迅速成为互联网上数据表示和交换的栽体。笔者利 用 X L 实现异构关 系数据库 间的数据 交换 , M
并提 出了以纯 XML数据库( t e Nav XMLDa bs) i t ae 为中心 交换数据库的 原型交换 平台。 a 关键词 : ML 异构数据库 ; X ; 数据交换 ; XML教据库 纯
信息系统。 同一单位 内各部 门不 同的管理信息 系统 间又有着 但 不 同的数据库系统。 如何实现不同数据库系统 间数据资源的共 享, 提高现有数据 的复用率 以提高管理 系统的效率 , 已经成为 个亟待解决 的问题。
一
命令 , 数据传输诸如 中间件等实体 软件进行处理 。基于模板 用 驱动 的映射是浅 层次映射 ,以 X L文 档内嵌的 Bl M q 执行 的数 据结果集合为依据 , 不涉及数据库赖 以存在 的关系模式或对象 模式 , 当前诸如 Mi oo Q re 0 c sfS LS vr 0 0等大多数产品都属于 r t e 2 模板映射 ,只能应用于在关 系数据库和 X ML文档之间传递数 据, 并不 支持 面向对象数据库之间或关 系数据库与对象数据库
基于XML的异构数据库间数据交互技术研究
使得可以在异构数据库之间进行无 障碍数据交换。
个 中间数据 库 , 并根 据 关 系 和 字 段 的定 义 在 每 个
数据 库 和 中间数据 库 之 间 建立 一 个 中 间件 , 两 供
者之间的数据交换使用。这种方法所需 要 的中间
模块 少 , 其可 扩展 性 强 , 点 是 实 现难 度 大 , 缺 转换 时 间长 。( ) 向 中间 件 方法 : 基 本 思 想 是 在 每 2双 其 两 种异 构数 据库 之 间 建立 一个 中 间件 ; 是 这 种 方 但
与数据库技术。E—m i: i nye alh i.n all g gu @m .nu c 。 ea i
(B ) / ) 表示粗体 , X L用标记( m s g) / 而 M ( es e …( a
m s g) 表示 信息 内容 。X es e ) a ML实 际上 是 一 种 定 义
维普资讯
法开销大 , 代价高。文 献 [ ] 5 对这 两种方法 的优缺 点进行 了具 体 的分析 。基于这 些原 因, 目前 , 关于
20 0 6年 8月 1 1日收 到
义, 而不是它如何显示。例如 , T L用标记 ( B HM ()
…
作者简介 : 雷刚跃( 9 1 男 , 17 一) 硕士 , 讲师。研究方向 : 系统 信息
通过数据库模式之 间的模板 映射 , 较好地实现异构数据 库之 间的透 明互操 作 , 实现数据 交换 的跨 平 台操 作, 实现异构 数据库 之 间进行无 障碍数据交换 。
关 键词
异构数据 库
数据交换
平 台无关
X ML
中图分类号
T34 P 1;
文献标 识码
A
基于XML的异构数据交换技术及应用
关 键 词 :数 据 集成 ; 异 构数 据 ; 数 据 交换 ; X ML语 言
The Te c hno l o g y a nd A pp l i c a t i o n 0 f He t e r 0 g e n e 0 us Da t a
Ex c ha ng e Ba s e d o n XM L
ቤተ መጻሕፍቲ ባይዱ
集 成 的数 据 .企业 存储 再 多 的 数 据 其 商业 价 值 也 为 零 。 因 此 , 企 业 必 须拥 有 一 个 单 一 、完 整 、可 信 的 数 据 视 图 ,数 据集 成 的 需 求 应 运 而 生 。X ML是 一 种 平 台 无 关 、 可 扩 展 的 标 记 语 言 , 非 常适合 不 同应用 系统 间的数 据集 成l l _ 2 1 。主 要 讨 论 如何 利 用
起 来 .构 成 企 业 管 理 决 策 的 统一 化 信 息平 台 。
随着 企 业 数 据 爆 炸 式 增 长 以及 I T应 用 的发 展 ,企 业 必 然 产 生 大量 的结 构 各 异 、散 落 在 不 同的 业 务 系 统 中 的 数 据 。 这些 数 据 以 不 同 的 状 态 存 储 ,有 的是 结 构 化 的 ,有 的 是 非 结 构 化 的 .这些 大量 的分 散 的异 构 数 据 由于 其 问 缺 乏 数 据 关 联性 很难 直 接 为 企业 的综 合 发 展 和 企 业 决 策 提 供 准 确 的 信 息 支 持 ,没有
ZHo U Ya ng
( He i b e i N e u s o l f C o . , L t d , He b e i Q i n h u a n g d a o 0 6 6 0 0 4, C h i n a )
基于XML在异构数据之间转换的研究
网格环境的任务一般都 比较大 ,一个 资源提供 者有可能满足不 了消费者的请求,就采用协 同分配 器,实现 在多个管理域协同分配 资源。资源分辨器 / 同分配器工作是分辨资源 , 目的是 是实现 协 协
同分配。
矩 阵 10 × 1 0 00 00 矩 阵 10 × 1 0 50 50
20. 0 4
[1丁箐 . 2 网格环境下 资源管理 的研 究 [ 1 国科学技 术大学, 20 . D. 02 [1 冠英 . 3 网格理论模型及其应用 [ 】 国科学院计算技术研究所 ,2 0 . D. 02 [1 4 赵东 . 网格计算环境中若干关键技术的研究 [ . D】 中国科技大学,2 0 . 03 作者 简介:郭绍翠 (I8 , 9 )女, 山东烟 台人 ,助教 ,研 究方向 :网格计算 : 宋正强 ( 9 9) 男, 山东烟台人 ,助工.研 究方向 :网络管理:李杰 (9 9 17 - , 17
4 结 束 语
本文在总结当代各种 网格系统研 究与发展经验的基础上 ,对网 格资源管理系统 体系结构模型进行了归类,提出 了一种比较通用的 网格资源管理系统抽象模型,并构建 了该模型 的原型系统,然后在 网格环境 中进行 了实验,实验结果表 明该模型 的有效性,为以后进 行进一步 的网格资源管理 与调度 ,进行 网格 计算做好 了准备。@
S HEN S imi , N ha - ng h - ngYI S o ho
为这方面 的标准。在这种数据格式下建立 一个 中间标准,实现不 同 的数据 与 XML文档之间的双 向数据转换 与传输 ,就可 以解决各种 数据 之间 的交换 问题 , 并可 方 便地 进 行 We b应用 应该指 出 , XML 本 质 上 是 一 种 描 述 性 的标 记 语 言 , 是 一 种 更 好地 表 示 信 息 的 手段。同时,这也意味着 XML可 以是用于信息存储和管理的一种 方式,正如同传统的数据 库技术二 样。 一 XML 不仅是一 种描述 文档的文本格式 ,还是一种描述结构化 和半结构化数据 的机 制,提供 了处理此 类数据所需 的一系 列技术。 如今微 软推 出的 XA LX S X M P ( ML文件规格 书)等基于 X ’ ML的 技术使我们 向实现通用的数据访 问又迈进 了一步 。
基于XML的校园异构系统的数据交换安全研究
算机软件在不同的输入条件下产生的不同类型的反映。其检测方
法 一般 来 说是 指对 计算 机 软件接 口处语 言 的识 别 、语法 的 定义 并
计 算 机 软 件 安 全检 测 是信 息 安 全 体 系 中 必 不 可 少 的组 成 部 分 。在信 息 化 高速 发展 的今 天 ,计算 机 的各 类软 件 以及计 算机 网 络 的应用 已经渗 透 到各 行各 业 中 ,成 为人 们 工作 和生 活最 重 要 的 组成 之 一 ,而软 件 安全 检测 确保 了计 算机 软 件应 用 的 良性 发 展 , 因此 我们 必 须在 今后 的工作 学 习 中进 一步 加 强对 计算 机安 全检 测
计 算机 光 盘软件 与应用
2 1 年第 1 期 02 3
C m u e DS f w r n p l c to s o p trC o t a ea dA p ia in
部分 。
工 程 技 术
测试模型,机器对这个模型具备可读性。常用的检测方法是有限
状态机 和 马尔 可夫链 。这种软件 安全检 测方法 与第一种 安全检测 方 法相 比,此种 以模型 为基础 的测 试方法 比较系 统化 ,它不致力 于让
这种安全机制通过证书和公钥对数据进行严格加密,这样就防止 了他人通过旁注等方法非法入侵数据库, 造成数据的丢失和损坏 , 保 持 了数据 的完 整 性 。借助 X ML 文件 进 行异 构数 据 的交 换 ,完
整 的数 据交 换流 程 如下 : ( )系统 B 向系 统 A提 出交换 请求 ,rqet ) 1 eus B ,并 在库 中 (
[ 王清 . 漏 洞分析 技 术 [ . : 工业 出版社 , 1, 1 】 软件 M] 北京 电子 2 1 0 6
基于XML的异构船体结构数据交换技术
第34卷第6期2020年12月 江苏科技大学学报(自然科学版)JournalofJiangsuUniversityofScienceandTechnology(NaturalScienceEdition) Vol 34No 6Dec.2020 DOI:10.11917/j.issn.1673-4807.2020.06.002基于XML的异构船体结构数据交换技术王 岳1,何 磊1,郑斌华2,潘建辉2(1.江苏科技大学船舶与海洋工程学院,镇江212100)(2.上海东欣软件工程有限公司,上海201203)摘 要:为了实现SPD系统的船体结构模型向吊装分析软件TSV-BLS的数据传输,分析了船舶XML的构造格式,在此基础上开发了一套从国产船舶CAD系统SPD中导出包含船体数据的XML接口.通过该接口导出的XML文件实现了船体模型在吊装分析软件TSV-BLS中的完整重现,验证了不同的船舶CAD/CAE系统通过XML文件进行数据交换的可行性.关键词:XML;数据交换;SPD;TSV-BLS;CAD/CAE中图分类号:U671 99 文献标志码:A 文章编号:1673-4807(2020)06-008-05收稿日期:2019-09-09 修回日期:2019-12-04基金项目:江苏省科技成果转化专项基金资助项目(615010905)作者简介:王岳(1979—),男,副教授,研究方向为船舶数字化设计制造技术.E mail:ainiuchina@163.com引文格式:王岳,何磊,郑斌华,等.基于XML的异构船体结构数据交换技术[J].江苏科技大学学报(自然科学版),2020,34(6):8-12.DOI:10.11917/j.issn.1673-4807.2020.06.002.DataexchangetechnologyofshiphullstructurebasedonXMLWANGYue1,HELei1,ZHENGBinhua2,PANJianhui2(1.SchoolofNavalArchitectureandOceanEngineering,JiangsuUniversityofScienceandTechnology,Zhenjiang212100,China)(2.ShanghaiDongxinSoftwareEngineeringCo.Ltd.,Shanghai201203,China)Abstract:TorealizedatatransmissionofshiphullmodelsfromSPDtohoistinganalysissoftwareTSV-BLS,theXMLformatforshipstructuresisanalyzed.Onthisbasis,interface,whichoutputsXMLfilesthatcontainhulldatafromdomesticshipmanufacturingCADsoftwareSPDisdeveloped.DataiscompletelyremodeledinhoistinganalysissoftwareTSV BLSthroughtheXMLfileoutputbythisinterface.ThisprovesthepossibilitythatdifferentCAD/CAEsystemsforshipproductioncanexchangedatathroughXMLfilesKeywords:XML,dataexchange,SPD,TSV BLS,CAD/CAE 船舶分段吊装作业是影响造船周期的关键要素之一.在对复杂分段结构进行吊装前,往往需要使用通用有限元分析软件进行结构安全性校核.然而,由于CAD(计算机辅助设计)/CAE(计算机辅助分析)系统与通用有限元分析软件之间缺乏有效接口,导致重复建模工作量大,且无法计及起吊过程中对缆绳、姿态等影响因素,导致分析计算效率低,校核准确性有待提高[1].为此,文中以国产三维CAD系统SPD和动态吊装模拟分析软件TSV-BLS为对象,研究模型数据结构,开发CAD/CAE异构船体数据结构相关接口方案,摆脱对国外软件系统的依赖[2].1 船体数据结构的XML格式1 1 XML语言与船体结构的关联为避免数据的重复输入,实现各CAD系统之间的数据交换,先后出现了以igs文件为中间文件的IGES标准和以stp/step文件为中间文件的STEP标准[3-5].但这些数据交换标准在运用于船舶生产设计时往往解析速度过慢[6],而且由于以相对封闭的专有格式作为中间文件进行数据交换,使得对各CAD系统接口的开发变得较为困难.尤其对于类似TSV-BLS这种专用CAE软件来说,开发这类标准接口是极为不方便的.船舶CAD生产系统中与CAE有限元分析软件密切相关的船体设计系统包含了组成复杂船体模型的各种部件和零件.这些零件、部件或者构件在船体数据库中一般以各种板架、型材、孔、面板、肘板、补板等结构模型进行分类存放.船体结构如图1,可划分为不同的总段和分段,分段可以划分为平面板架、曲面板架,这样逐级划分下去,直到点、线元素的表达为止.这种分层逐级划分的逻辑关系符合XML表达数据的方式.图1 船体结构树Fig.1 Hullstructuretree开发XML接口是实现异构船体结构数据交换的一种合理解决方案.TSV-BLS具有直接读取TRIBONSchemaXMLHullSteel后置接口的功能,它能直接读取TRIBON导出的XML格式.因此在开发前置接口时,可以主要参照TRIBONSchemaXMLHullSteel进行XML船体模型数据导出接口的设计[8].1 2 船体XML的根节点船体XML根节点的元素名为Ship.它的二级节点包括Material、BarSection、HoleDef、NotchDef、Block[9]. 其中:Matrial代表船体材料的相关属性;Bar Section代表组成各类型材属性;HoleDef代表各类开孔属性;NotchDef代表各类边界孔属性;Block节点代表分段,是船体XML格式中最为重要的一个节点,包含了船体结构全部数据,几乎所有下级节点均是在Block节点之下展开的.Block节点主要由代表坐标范围的节点Extent、平面板架PlanePan el节点以及曲面板架CurvedPanel节点组成.1 2 1 平面板模型构建的关键节点SimpleContour和DetailedContour两个XML节点包含了表达平面板结构信息的主要数据.在XML表达上相同,但在含义上却并不相同.De tailedContour是包含了内孔、边界孔及切口的板轮廓,SimpleContour则仅是板轮廓.这两个节点结构类似,都包含一个StartPoint节点和若干个Segment节点.Segment节点下又包含Amplitude节点和Node节点.在平面板中其名称分别为StartPoint2d、Segment2d、Amplitude2d和Node2d;在曲面板中其名称分别为StartPoin3d、Segment3d、Amplitude3d和Node3d.以平面板为例,SimpleContour或Detailedcon tour中的StartPoint2d是起点,这里假设为Node1,则之后的Node2d依次假设为Node2、Node3、…、Node(n).Amplitude2d的作用是在nodei、node(i+1)中间插入一个点(Node insert),三点确定一段圆弧.方法是以nodei至node(i+1)直线的中点作为坐标原点,然后通过中点垂直到圆弧的向量确定Node-insert的位置.在程序设计时,按照这种的样条构造方式进行数据转换.在XML中表现的层级关系及对应图例如图2.图2 SimpleContour和DetailContour的XML格式及对应图例Fig.2 SimpleContourandDetailContourinXMLformatanditscorrespondingdrawing1 2 2 曲面板模型构建的关键节点曲面板中的节点StripRow代表一块曲面板的曲面点阵,TSV-BLS系统读取该节点后通过点阵拟合形成曲面.对四边形、三边形和五边形曲面板的程序设计思路分为3种:①四边形曲面板,点阵FacetSurface中的StripRow从原点开始可以按U轴或者V轴正方向依次排列开来,StripRow按V轴正方向排列,每个StripRow在V轴方向数值相同.如图3,该四边形曲面板Plate为17×17的曲面板,即由17个StripRow组成,每个StripRow包含17个9第6期 王岳,等:基于XML的异构船体结构数据交换技术Point点阵.StripRow按排列的先后顺序设为StripRow1、StripRow2、…、StripRow17,Point的U/V轴坐标以递增或递减排列均可.②三边形曲面板,由于Nurbs是由U、V两个参数方向定义的边界曲线,有四条边界.对于三条边界的曲面只能将剩余的一边退化为一点进行处理.将三边形曲面板也设为N×N的点阵,理论上三边形或四边形曲面板可以是任意N×N的点阵,但N的取值建议为16的倍数加1.如图4,三边形曲面为17×17的点阵,所有StripRow中的最后一个Point的坐标相同且重合于一角点.③五边形曲面板,将其分解为2个四边形板,即2个N×N的点阵合并在一起,在XML格式中就显示为[2(N-1)+1]×N的点阵.如图5,五边形曲面板为33×17的点阵.在最后一组StripRow角点处,实际按折边处理,U轴数值在大幅下降后开始平缓于5450左右,该组StripRow即为折边所在的点阵.图3 典型四边形曲面点阵及其XML格式Fig.3 TypicalquadrilateralcurvedsurfacedotmatrixanditsXMLformat图4 典型三边形曲面点阵及其XML格式Fig.4 TypicaltrilateralcurvedsurfacedotmatrixanditsXMLformat图5 典型五边形曲面点阵及其XML格式Fig.5 TypicalpentagoncurvedsurfacedotmatrixanditsXMLformat2 接口开发过程中典型问题及解决方案2 1 平面板架一侧型材或肘板丢失问题在SPD的数据结构中板架节点是包含型材、肘板部分对称或者部分镜像信息的,而目前版本的TSV-BLS643 2在读取XML文件时,其数据构造在同一个板架下不支持型材和肘板部分对称或者部分镜像,这会导致生成的模型部分出现型材、肘板不能正确显示的问题.因此在程序设计时需要根据型材和肘板的对称性决定是否单独拆分并重建成不同对称性的板架节点,以曲面板架为例,如图6,导出XML文件后AG11分段曲面板上的曲面型材由于存在部分对称的情况,因此由“AG11-SHELL-CStf”这个曲面板架节点拆分为了“AG11-SHELL-CStf-AsDefined”和“AG11-SHELL-CStf-Reflected”两个曲面板架节点.程序修改后再导入TSV-BLS模型得以正常显示,问题解决前后情况对比如图7.图6 根据对称性重新构造的XML板架节点Fig.6 RegroupedXMLPanelnodesbasedonsymmetry图7 AG11分段型材丢失与问题解决Fig.7 BlockAG11profileslossandproblemsolving01江苏科技大学学报(自然科学版)2020年2 2 圆管支柱丢失问题SPD中圆管支柱的数据是属于型材即节点StiffenerGroup之下的.而吊装软件中所有的圆管支柱,即PillarGroup节点只有属于平面板架PlanePanel节点下级时才能在吊装软件中正常显示,如果按照SPD的数据结构直接导出XML节点就会出现丢失圆管支柱的情况.在程序设计时应分为三步处理.第一步,把各分段所有圆管支柱筛选出来;第二步,构造PillarGroup节点,并将筛选出来的圆管支柱添加其中;第三步,构造新的PlanePan el节点并将PillarGroup节点添加其中.其程序实现的部分代码及其导出的部分XML格式如图8.问题解决前后情况对比如图9.图8 部分添加PillarGroup节点的代码及其导出的XML格式Fig.8 Partofcodesforaddingnode‘PillarGroup’anditsXMLformatoutcomes图9 AG11分段支柱丢失与问题解决Fig.9 BlockAG11pillarslossandproblemsolving2 3 边界孔丢失问题边界孔是板与板之间共同拼接成的孔,在SPD中边界孔归类于孔,即相应的XML节点HoleGroup.而TSV-BLS在读取XML数据时会把边界孔归类为板本身的样条曲线,无法真实识别.程序设计时,首先要判断哪些板包含边界孔,然后筛选出所有含边界孔的板,最后重划其板样条曲线.重划方法是将板的边界孔裁剪后与剩余的板样条曲线拼接形成新的板边界曲线.以分段CB05为例,如果按照普通板处理就会出现只能显示部分孔的问题,问题解决前后情况对比如图10.图中曲线不光滑为TSV-BLS显示的问题,不影响软件实际使用.图10 CB05分段丢失与问题解决Fig.10 BlockCB05borderlineholelossandproblemsolving11第6期 王岳,等:基于XML的异构船体结构数据交换技术3 XML接口应用实例以SPD船体数据库作为数据源,开发了一套船体XML数据抽取接口程序,主要分三步来实现:第一步,从SPD船体数据库按分段、总段提取船体模型数据及材料属性等相关信息,将内孔、边界孔、型材等数据表达形式做映射,转换为TRIBON的数据表达形式供吊装软件读取;第二步,将所提取数据按照前文方案生成XML文件作为中间文件;第三步,向动态吊装分析软件TSV-BLS导入XML文件,生成模型.文中以号船1542A的HB01分段为例进行验证,该分段在SPDV4 0三维浏览器中的模型以及导出XML文件后通过TSV-BLS643 2导入生成的模型,对比情况如图11.图11 分段HB01的SPD模型与TSV-BLS模型对比Fig.11 SPDmodelcomparedwithTSV-BLSmodelofblockHB01 通过接口生成的XML文件能够使模型及属性信息完整的在TSV-BLS中再现.在船舶CAD与CAE系统软件之间,实现了船体结构数据的快速完整交换.4 结论(1)以XML文件为基础,开发数据交换接口程序,实现了船体数据模型在TSV-BLS中的完整再现.(2)接口开发过程中,针对平面板架一侧型材或肘板丢失、圆管支柱丢失、边界孔丢失等问题进行方案设计,使相关问题得以解决.(3)所开发的接口方案为CAE系统直接利用国产船舶CAD系统模型数据提供了便利,对避免不必要的重复建模,提高生产效率及降低设计分析成本有着重要意义.参考文献(References)[1] 吴忠.基于TSV-BLS的虚拟上建整吊分析[C]∥中国造船工程学会(CSNAME),2016年MIS/S&A学术交流会议论文集.大连:[s.n.],2016.[2] 陈辉.SPD船舶设计软件介绍[C]∥中国造船工程学会(CSNAME),2015年CAD/CAM学术交流会议论文集.南京:[s.n.],2015.[3] 刘一良,刘弘,王吉华.面向STEP标准三维实例的结构化查询方法研究[J].计算机科学与探索,2016,10(6):867-874.DOI:10.3778/j.issn.1673-9418.1506069.LIUYiliang,LIUHong,WANGJihua.ResearchonSTEP3Dinstanceorientedstructuredquerymethod[J].JournalofFrontiersofComputerScienceandTechnology,2016,10(6):867-874.DOI:10.3778/j.issn.1673-9418.1506069.(inChinese)[4] 杨君,窦万峰.基于宏语义的异构CAD同步协作关键技术[J].江苏科技大学学报(自然科学版),2011,25(3):253-257.YANGJun,DOUWanfeng.KeytechnologiesofmacrosemanticsynchronizedcollaborationwithheterogeneousCADsystems[J].JournalofJiangsuUnversityofSci enceandTechnology(NaturalScienceEdition),2011,25(3):253-257.DOI:10.3969/j.issn.1673-4807.2011.03.011.(inChinese)[5] 查乐,朱仁传.基于IGES的船体NURBS曲面网格划分[J].《水动力学研究与进展》编委会,第二十九届全国水动力学研讨会论文集.镇江:[s.n.],2018.[6] 杨连生,李爱平,李佳威,等.基于XML的船舶生产设计数据交换接口技术研究与实现[J].中国造船,2016,57(4):164-174.DOI:10.3969/j.issn.1000-4882.2016.04.019.YANGLiansheng,LIAiping,LIJiawei,etal.Re searchondatainterfacetechnologyfordesignofshipproductionbasedonXML[J].ShipbuildingofChina,(下转第22页)-82.DOI:10.3901/JME.2013.04.075.(inChinese)[8] 赵耀邦,雷正龙,李俐群,等.铝合金激光-电弧双面焊接激光稳定、压缩电弧的机制分析[J].机械工程学报,2013,49(4):51-57.DOI:10.3901/JME.2013.04.051.ZHAOYaobang,LEIZhenglong,LILiqun,etal.Mechanismoflaserinducedstabilizationandcompressionofarcduringlaser arcdouble sidedweldingforaluminiumalloy[J].JournalofMechanicalEngineering,2013,49(4):51-57.DOI:10.3901/JME.2013.04.051.(inChinese)[9] 武传松,秦国梁.轻金属材料激光+GMAW复合热源焊接机理的研究进展[J].焊接,2009(7):11-17.DOI:10.3969/j.issn.1001-1382.2009.07.003.WUChuansong,QINGuoliang.Researchprogressoflaser+GMAWhybridweldingmechanismoflightmetals[J].Welding&Joining,2009(7):11-17.DOI:10.3969/j.issn.1001-1382.2009.07.003.(inChinese)[10] 高明.CO激光-电弧复合焊接工艺、机理及质量控制规律研究[D].武汉:华中科技大学,2007.[11] 崔丽,贺定勇,李晓延,等.激光-电弧复合焊接工艺参量的研究进展[J].激光技术,2011,35(1):65-69.DOI:10.3969/j.issn.1001-3806.2011.01.019.CUILi,HEDingyong,LIXiaoyan,etal.Researchprogressoflaser archybridweldingprocessingparameters[J].LaserTechnology,2011,35(1):65-69.DOI:10.3969/j.issn.1001-3806.2011.01.019.(inChinese)[12] 牛宽,刘双宇,刘凤德,等.激光-电弧复合焊接工艺参数对焊缝形貌及焊接稳定性的影响[J].应用激光,2014,34(1):51-56.DOI:10.3788/AL20143401.0051.NIUKuan,LIUShuangyu,LIUFengde,etal.Theeffectofweldingparametersonweldappearanceandstabilityinlaser arcwelding[J].AppliedLaser,2014,34(1):51-56.DOI:10.3788/AL20143401.0051.(inChinese)(责任编辑:顾琳檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶)(上接第12页) 2016,57(4):164-174.DOI:10.3969/j.issn.1000-4882.2016.04.019.(inChinese)[7] 倪天文,季刚.基于XML和Spring框架的参数化建模[J].中国造船,2018,59(3):171-177.DOI:10.3969/j.issn.1000-4882.2018.03.018.NITianwen,JIGang.ParametermodelingbasedonsoftwareXMLandSpring[J].ShipbuildingofChina,2018,59(3):171-177.DOI:10.3969/j.issn.1000-4882.2018.03.018.(inChinese)[8] 朱胤逵.基于TRIBON多平台数据交换技术研究[D].大连:大连理工大学,2015.[9] TribonSolutionsAB.TribonM3Documentation:XMLbasedformat[G].Sweden:TribonSolutionsAB,2004.(责任编辑:贡洪殿)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于XML 的异构数据交换技术研究张丽华(嘉兴学院数学与信息工程学院,浙江嘉兴314001)摘要:介绍了一个基于XML 的异构数据交换系统模型。
通过该系统可实现异构数据源之间的数据交换和共享,给出了数据交换的实现方法。
关键词:XML ;异构数据;数据交换;关系数据库中图分类号:TP311文献标识码:A 文章编号:1672-0679(2010)02-0077-04随着现代企业组织机构的日益庞大,各项业务操作日益复杂,各相关部门、单位之间的相互协作、相互交叉也日益紧密。
为满足某种业务的特定要求,企业相继开发了相关的管理信息系统(Manage Information System ,MIS ),这些系统和数据已成为企业日常运转及发展不可缺少的组成部分,但是这些数据大多是被独立创建和管理的,无论是在它们所依赖的系统平台上,还是在语义上,都有所不同。
因此很难互用,这就产生了“信息孤岛”问题。
如何把这些异构数据源进行集成和一致化处理,是当今企业信息处理所面临的最大难题。
在信息一体化进程中,如果重新架构平台,统一规划各部门的现有信息系统,就需要投入大量人力、物力和财力。
因此将现有信息系统废置不用不是科学地解决问题的办法。
目前迫切需要解决的是如何对“信息孤岛”加以有效整合,实现不同系统之间的数据传递,为数据的进一步加工、处理做准备,为数据挖掘奠定基础。
传统的关系数据库之间的数据交换大多采用文本文件作为中间媒介,但是,文本文件只能实现单表间的简单信息的交互。
Excel 电子表格以二进制格式存储,其优于传统纯文本文件的一个好处是可以对数据分类(数值型、文本型等),所以电子表格也为关系数据库之间进行信息交换提供了方便,但随着计算机网络的不断发展,电子表格在数据交换中的应用远不如XML [1]。
1XML 在异构数据交换中的应用XML 具有在描述(标记、置标)信息时的可扩展性、跨平台性和自描述性等特点,已经成为web 上异构数据交换的通用数据交换格式[2]。
1.1异构数据转换原理利用XML 文档作为中间形式,对异构数据格式进行转换,从而能被其它的系统接收,实现异构数据源之间的数据交换[3]。
这种基于复制技术的异构数据转换方法既保持了各数据库相对独立性和自治性,又使各异构数据源实现了信息集成。
基于XML 的异构数据转换模型如图1所示。
1.2异构数据交换的实现基于复制技术的异构数据转换过程如图2所示。
包括如下几个主要程序模块。
(1)连接数据库。
无论是将数据库数据保存到XML 文件,还是将XML 数据保存到数据库中,首先需要远程连接用户数据库。
在系统中允许用户选择不同的数据库连接验证方式。
(2)从数据库读出源数据,填充到Dataset 缓存表中。
因为一个数据库中有多个关系表,在操作时需要将所有的表数据填充到一张Dataset 缓存表中,从XML 转化成数据库时,再分离成多表。
(3)数据库数据保存到XML 文件。
根据读取的表名将数据库数据依次填充到Dataset 缓存表中,并把缓存表中的数据加载到XML 文档中,实现数据库文件到XML 文件的转化。
———————————————————[收稿日期]2009-12-15[基金项目]嘉兴学院一般科研基金项目(70107028)[作者简介]张丽华(1972-),女,浙江嘉兴人,副教授,硕士。
第23卷第2期苏州科技学院学报(工程技术版)Vol.23No.22010年6月Journal of Suzhou University of Science and Technology (Engineering and Technology )Jun .2010苏州科技学院学报(工程技术版)2010 78(4)XML数据保存到数据库。
在连接到用户数据库的前提条件下,首先加载XML数据填充到DataSet,然后解析源表的各字段名及其类型。
根据解析的结果,用SQL命令创建数据库和数据库表。
最后再逐字段解析各字段的值,并用SQL命令将这些值插入到新建的数据表,保存到相应的数据库中。
以下是SQL Server数据库数据转化成XML文件及架构,以及XML数据保存到Oracle数据库的部分主要程序代码[4,5]。
//读取表名,填充到Dataset ds中name=(Session["name"]).ToString();DataSet myDataSet=new DataSet();DataSet ds=new DataSet();SqlConnection myConnection=new SqlConnection(ConnectionString+name);string SQL="select name from sysobjects where type='U'";SqlDataAdapter myComm=new SqlDataAdapter(SQL,myConnection);myComm.Fill(ds,"mydata");//解析多表for(int i=0;i<ds.Tables[0].Rows.Count;i++){myConnection.Open();string strSQL="select*from"+ds.Tables[0].Rows[i][0].ToString();SqlDataAdapter myCommand=new SqlDataAdapter(strSQL,myConnection);myCommand.Fill(myDataSet,ds.Tables[0].Rows[i][0].ToString());}//将DataSet中的数据保存为XML数据,并保存到指定的文件夹myDataSet.WriteXmlSchema(Server.MapPath("dataDB//")+name+".xsd");myDataSet.WriteXml(Server.MapPath("dataDB//")+name+".xml",XmlWriteMode.IgnoreSchema);XmlDataDocument datadoc=new XmlDataDocument(myDataSet);datadoc.Save(Server.MapPath("dataDB//")+name+"1.xml");myConnection.Close();第2期张丽华:基于XML的异构数据交换技术研究79 //读取XML数据填充到DataSet ds中DataSet ds=new DataSet();ds.ReadXml(Server.MapPath("dataDB//")+(Session["name"]).ToString()+".xml");dbName=(Session["name"]).ToString();//用SQL新建数据库string strCommand="create database"+"_"+dbName;OleDbCommand myCommand=new OleDbCommand(strCommand,myConnection);myConnection.Open();myCommand.ExecuteNonQuery();myConnection.Close();//在新建数据库中根据从DataSet中解析得到的字段名及其类型创建数据表//将记录写入新建的数据表中DataTable myTable=ds.Tables[n];dtName=myTable.TableName;string colName,colName1,colT;……myOleDbDataAdapter.InsertCommand=new SqlCommand("Insert into"+"_"+dtName+"VALUES"+"("+colName1+")",myConnection);……string col=colName.Substring(0,colName.Length-colName.Substring(colName.IndexOf(",")).Length);colName=colName.Substring(colName.IndexOf(",")+1);string col1="@"+col;string ct=colT.Substring(0,colT.Length-colT.Substring(colT.IndexOf(",")).Length);colT=colT.Substring(colT.IndexOf(",")+1);ct="SqlDbType."+ct;workParam=myOleDbDataAdapter.InsertCommand.Parameters.AddWithValue(col1,colT);workParam.SourceColumn=col;workParam.SourceVersion=DataRowVersion.Current;……myOleDbDataAdapter.Update(ds,dtName);……采用类似的方法,可以实现XML文件与其它关系数据库之间的相互转换,以及XML文件与Excel电子表格之间的相互转换。
2结语文章给出了一个基于XML的异构数据交换系统的实现方案。
该系统在保证各成员数据库独立性和自治性的前提下,实现异构数据的共享与集成,具有较好的通用性与开放性,适合企业内部不同平台、数据源、应用之间的数据交换,为企业信息集成提供参考。
参考文献:[1]王仲,陈晓鸥.基于XML的数据交换与存取技术研究[J].计算机工程与应用,2001(24):108-111.[2]席景科,闫大顺.Web数据挖掘中数据集成问题的研究[J].计算机工程与设计,2006,27(8):1366-1368.[3]刘源,姚淑珍.XML的关系化存储及与关系数据库的数据转换[J].计算机工程与设计,2004,25(11):2039-2043.苏州科技学院学报(工程技术版)2010[4]Dinar Dalvi,Joe XML 高级编程[M].北京:清华大学出版社,2002.[5]Rebecca M 程序设计[M].李高健,译.北京:清华大学出版社,2002.A Study on Heterogeneous Data Exchange Based on XMLZHANG Li-hua(College of Mathematics and Information Engineering,Jiaxing University,Jiaxing 314001,China )Abstract :This paper introduces a model for heterogeneous data exchange based on XML.The system can exchange and share the data among the different sources.The method used to realize the heterogeneous data exchange is given in this paper.Key words:XML;heterogeneous data;data exchange;relation database(责任编辑:卢文君)(上接第76页)5结语统一身份认证及组织结构管理系统的目标主要包括:(1)企业平台系统的安全模型,提供统一的、完善的、易用的用户认证和组织结构管理平台[4];(2)为各应用系统提供一个跨平台的授权信息管理接口,解决目前组织结构混乱、用户使用不便、安全性差等问题[5];(3)完善用户管理功能的同时,提高统一企业平台的安全性,抵御潜在的安全风险。