一种基于XML的异构数据库集成方法
基于XML的异构数据库集成技术的研究
本 目 任 辑: 翔 栏责编 闻军
数据 库 及 信息 管 理
基于 X ML的异构数据库集成技术的研究
孙海 军 . 岩 高 ( 津 商业 大 学 信 息 工 程 学 院 , 津 30 3 ) 天 天 0 14
摘 要 : 实现 异 构 数 据 库 间信 息 的 共 享 和 集 成 , 数 据 集成 的 原 理 以 及 主 要 技 术 进 行 了研 究 。 重 点 分 析 了 XML与 关 系数 据 库之 间 为 对 的 映 射 , 出 了一 种 以 X L作 为 中 间件 的 异 构 数 据 库 集 成 方 案 , 对 其 中的 主 要 环 节给 出 了具 体 实 现 。 该 方 案 实现 了异 构 数 据 库 的 透 提 M 并
1引言
长 期 以 来 , 企 业 或 部 门 的 数 据 库 系 统 相 对 独 立 建 设 , 于 各 由 操 作 系 统 不 同 、 据 库 类 型 不 同 、 据 结 构 不 同 以及 D MS不 同 数 数 B 等 原 因 , 步 形 成 了各 个 独 立 的 异 构 数 据 库 . 互 之 间 不 能 进 行 逐 相 有 效 的交 互 。 为企 业 内部 以及 企 业 之 间 业 务 逻 辑 的 整 合 和 数 据 这 信 息 的共 享 提 出 了巨 大 的 挑 战 。 本 文 提 出 了一 种 利用 XM L作 为 中 间 件 技 术 ,进 行 异 构 数 据
e eprs n o m a on s tm ntg a o ntr i ei f r t yse i e t n. i r i
K y WO d : e r S XM L; tr g n o sDaa a e Da aI t g a o ; i de r Hee o e e u tb s ; t n e t n M d lwae r i
基于XML的异构数据库集成的研究
基于X ML的异构数据库集成的研究
Res ear n egr i t ogene ch on i t atng he er ous d a at bas b ed on X M L e as
王雅轩,顼
聪
W ANG 、 — u n XU Co g r xa . n a
一
中囝分类号 :T 3 2 P 9
文献标识码 :B
文章编号 :1 0 - 1 4 2 1 ) ( - 1 2 0 9 0 ( 0 1 1下) 0 - 2 0 3 2
D i 1 . 9 9 J is . 0 9 1 4 2 1 .( ) 4 o : 3 6} . n 1 0 -0 3 . 0 1 1 下 . 1 0 / s
互转 换 ,将 数据 存储 到 X ML数据 空 间中 ,并 维持
XML数据 空间 与各异构数 据源之 间的映射关 系 。
技术 将这个 模型映 射到 关系数 据库 。
收 稿 日 期 :2 1-1-1 00 2 7 作者简介:王雅轩 (99 16 一) ,女 ,黑龙江哈尔滨人 ,副教授 ,研究生 ,研究方向为软件理论与应用。
的映 射模式 的原理 就 是利 用 XML文 档 中的数据模
图 1 异 构 数 据 库 数 据 集 成 的构 架 图
1 数 据 服 务 器 层 :系统 数 据 的提 供 者 ,它 包 ) 括 各种 类 型 的数 据 库 。 每个 数 据 源 与 企业 内部 各
部 门的 MI S系统 相连 , 成 自己的 本地应 用 。 构
板驱 动和模 型驱 动 。在 基于模 板驱 动的映 射 中 , 并
出一
分 散 异 构 数 据 源 层
不 预先 定 义 文 档结 构 和 数 据库 结构 之 间 的映 射 关 系,而是 在数据 转换软 件 的处理模 板 中嵌 入说 明命 令 ,让数据 传输 中间件 来执 行该模板 。以模型 驱动
一种基于XML的异构数据集成系统结构的研究
同 . 据 的统 一 性 没 有 保证 , 业 各部 门之 间无 法 进 行 信 息 共 享 , 成 成 , 成 以 XML结 构 的结 果 文 件 返 回给 用 户 。 数 企 形 生 在此 过程 可 分 成 建 立 集 了 “ 息 孤 岛 ” 严 重 影 响 了 信 息化 对 企业 的 服务 能 力 l 如 何 通 过 网络 成 模 式 和 数 据 集 成 查 询 两 个 阶 段 。 信 , l 】 。 . 有 效 地 对 这 些 不 同来 源 、不 同 格 式 的数 据 进 行 有 效 的 集 成 访 问 和 利 21 建 立 集 成 模 式 阶 段
随着 信 息 化 建 设 的 深 入 . 当数 量 的企 业 积 累 了 大 量 建 立 于 不 同 相 该 系 统 的 工 作 过 程 是 , 户 输 入 全 局 数 据 查 询 信 息 , 据 公 共 模 用 根 的时 间 、 储 在 不 同 平 台 、 存 依赖 于 不 同数 据 库 管 理 系统 的数 据 ( 关 系 型 将 全 局 查 询 分 解 为 针 对 各 异 构 数据 源 的 子 查 询 , 各 子 查 询 传 递 给 如 将 型数 据 库 数 据 、 ML文 档 、 本 文 件 等) 由 于数 据 格 式 、 码 标 准 不 各 数 据 源 执 行 .各 数 据 执 行 的 子 查 询 结 果 根 据 公 共 模 型进 行 结 果 合 X 文 。 编
基于XML的异构生物信息数据库整合技术研究
作 者 简介 : 李 美 满( 1 9 7 1 - ) , 男, 硕士 , 副教 授 , 研 究 方 向 为 生物 信 息 学
⑨ 现 代 计 算 机 2 0 1 3 . 0 1 中
该系统 的体 系结 构由下载中心数据库 、数据库 管 理、 用户端组成 下 载中心数据库模块给 出数据源地址
和 具 体 的 下 载方 式 .指 导 数 据 库 管 理 员 下 载 到 本 地 指 定 的文件夹 中: 数 据 库 管 理 模 块 采 用 可 视化 的 界 面 , 方 便 维 护 系 统 .其 主 要 功 能 是 按 照 生 物 公 共 数 据 模 型 建 立 异 构 数 据 库 之 间 的语 义 链 接 .在 概 念 和联 系 层 次 上
对 数 据 进 行 建 模 而 引 起 的数 据结 构 和 数 据 语 义 表 达 的
成, 这些注释对序列数据功 能 、 来源、 特性 进行描述 , 数 据 的无 结构化 就是指生物数 据通 常以文档 形式描 述 数据 的异构包括语 义的异 构和语 法的异构 .数据描述
模 式 和描 述 标 识 不 同 导致 语 义 的 异 构 .语 法 的 异 构 是
0 引
言
1 生 物 公 共 数 据模 型
生物数据库 的整合存在数据 的异构 和数据 的无结
构 化 两 个 主 要 的难 题 生 物 数 据 库 中对 生 物 数 据 的描 述 主 要 由原 始 序 列 数 据 以及 对 生 物 信 息 描 述 的 注 释 组
生 物信 息学是在生命科学 的研究 中以计算机 为工 具对生 物信息进行储 存 、 检索和分析 的科学 . 其根 本任 务 是从 海量的生物数据 中提取有效信 息 .并从 中揭示
李美满 , 许 中华 , 刘 柯
基于XML的异构数据库集成中间件
[ 作者简介 ] 吴启 明(9 3一) 男, 17 , 湖南 浏阳人 , 河池 学院计信 系讲师 , 武汉 大学在职硕 士研 究生 , 主要研究
方向为数据挖掘与个性搜索; 易云飞(9 1一) 男, 18 , 广西资源人 , 河池 学院计信 系助教 , 中南民族 大学在 读硕士研究
生, 主要研究方向为数据挖掘 , 工智 能和信息安全 。 人
1 X ML简 介
X L即可扩展标记语言(Xes l M r pLnug) M 是定义标记的规则 , M e t ie ak agae 。X L nb u 这些标记将文档分成 许 多部件 并对这 些部件 加 以标 识 。标记语 言 是一种对 文档 的规 范 化 的描 述 , 它用 于指 出文档 中哪些 是 内容 , 哪些是标记 , 以及这些标记的用处。由于 X L描述数据的内容 , M 适合于机器处理和数据库应用和查询 , M XL 已成为互 联 网上 数据表 示和交 换 的标 准 。X ML文 档包括 三部 分 :ML声 明、 X 处理 指示 ( 可选 )X 、 ML元 素 。
例如 :
<?x eso mlv rin= “1 0” sa dao e=“y s” e c d n =“g 2 2”? > . tn l n e n o ig b 31
<?x —s l h e y e = “ e t x l ml t e s e t p y t tx/ s ”h e =“ sy e x l ? > r f my t l. s ”
改变成为一个亟待解决的难题。纵观国内外 , 对它的研究起步较晚, 且很不完善。一般可采用以下两种方式 之一来解 决 。一种方 式是将 原有 的数据 移植 到新 的数据 库 系统 中 , 以达 到两 种数 据库 之间 的数据 溶合 ; 另一
基于XML的异构数据库集成的研究
S u y o n e r to fh tr g n o s d t b s a e n XM L t d n i tg a i n o e e o e e u aa a e b s d o
W ANG — 0 g, Z Nih n HANG a g li Gu n -e
太 适用 。
() 2 中间件技术 中间件是位于 CS之间的中介 接 口软件 , 异 / 是
() 2模式异构 , 即数据源在存储模式上的不 同。
存储模式主要包括关系模式 、 对象模式 、 对象关系模 构系统集成所需的粘接剂 , 是保证操作系统 、 通讯协 式和文档嵌套模式等几种 , 其中关系模式 ( 关系数据 议 、 数据库 间进行对话 、 互相操作的软件系统。现有 库) 为主流存储模式。同时 , 即便是 同一类 存储模 的数据 库 中间件 允许 C et ln 在异构数据库 上调用 i 式, 它们的模式结构可能也存在着差异。例如不同
同时 , 每个数据库系统仍保有 自己的应 用特性 、 完
整 性控 制 和安全性 控 制 。用 户可 以通过本平 台对 这
置上的多个业务数据管理系统中的数据 , 如图 l 所 示。异构数据源的整合 、 集成是企业 信息化建设 过 程经常遇到的一个现实 问题 , 也是制约企业各种应
些数据库里的数据进行各种操作 , 同操作一个单 如
一
X (x n b a u agae技术作为异构 ML Et s lM r pL ug) e ie k n 数据集成与异构数据交换解决方 案有其先天优势。
XL M 包含了大量 “ 自描述” 性标记来精确 的表示信 息的各种含 义, 它提供 了丰富的数据构造和解析方 法, 能够适应多样并且不断变化的网络应用环境 , 被
基于XML的异构数据库集成技术研究
£7 { | / 嵌务 入 服 《模 淼 j V l } I 式
lI 局 , ‘ ●
l
q
’ .
L
一 一 ,
记语言 ,x 能够根据具体应用灵 活 地表现异构数据源 中的各种信息 ,包
括应用程序之间的数据交换 、结构化 和半结构化文档 以及数据库 中数据 的 输出.随着 X L技术 的兴起 ,异构数 M 据源 的集 成问题 成为数据库领域研究
刘淑 梅
( 水学院 衡 现 代 教育 技 术 管 理 中心 ,河 北 衡 水 0 3 0 ) 5 0 0
摘 要 :异构数据库 系 统的集成是 当 前数据处理领域的研究热点,它能有效地利用信息资源,实现数据共享.提出了一
种基于 X L的异构数据库集成的方法,X L中间件层是异构数据 源集成的关键和核心 ,它能够 实现 X L数据模型与数据 源 M M M 各数据模型之 间的映射和数据源文档与 X L文档 的相互转换. M 利用这种方 法可有效地集成各种数据格 式的异构数据库 系统
集成应 用系统 除了要集 成传统 的异构
信发 彳 息 布 ll
, , r — 、
.
◆
用 查 户询
腑 器
/
用屡 户
数据库 ,还 要集成 W b上这些新 的数 e 据源 ,如何实现异构数据源 集成应 用 在 W b上 的实现 ,其中一个关键技术 e 是如何 以一种统一 的数据模 式描述 各
关键 词 :XL M;中间件;数据集成;数据模型 中图分类 号 :T3 11 P1.3 文献 标识码 :A 文章编 号 :17—0520) 102—3 6326 (08O—0 70
随着计算机 网络技术 的迅速发展,出现 了许多新的数据形式,如 电子邮件、H M T L文档等信息,与这些数据 相 比,传统数据库 中的数据具有严格的存储格式 ,数据的各种操 作具有严格 的规范 ,因此 ,传统数据库中的数 据称为结构化数据 .而互联网上的大量 数据缺乏统一 固定的模式,数据往往是不规则的并且是经常变动的,这 些数据 是先有 数据后 有模式 ,即半结 构化数据.在 W b上实现异构数据源 e
基于XML的异构数据库集成研究
2 . 3核 心模 块 描 述
毋庸置疑 ,在基于 X ML的中间件 集成系 统中,最 关键的是 中间层 ,也就是说 中间层是
核心层 ,因为中间层封装 了异构数据库的业务
数据缓存 中。另外 ,基于各个包装器和数 据层
的数据库是一一对应的关系 ,当数据库 里面数
以不同形 式存 储的 、依赖 于不 同 的 DB MS的 数据 。当然 ,想要更大程度上利用这些数据资
本文针 对异 构数据 库 系统 间
信 息 共 享 与 信 息 交 换 难 题 , 深 入
l
2 . 2体 系结 构
的讨论 了异构数据 库的集成 方法, 『 并采 用 x M L 的 异构 数据 库 中 间件 1
技 术 实现异 构数 据库 之 间的信 息 交换 ,在 实际应 用 中有 着较 广 阔 的应 用前景
3 总 结
异构 数据库 之 间进 行数 据的 传输 日益成
下面详细说明上述三个主要模块的功能。 据访 问接 口,让用户感觉到就像操作一个数据 模块。 2 . 3 . 1配置 文件模块 库一 一 样方便快 捷。X ML的出现为 异构数据 库 的集成带来 了新的挑战和契机。
XML是一种基于 S G ML简 单灵活的元语 合 以往异构数据库集成方法的基础上 ,采用基 言,具有 高可扩展性 、高度结构化和 自定义性 据信。在这 个配 置文件模块 中,会生成三类文 件 ,包括全局虚拟视图文件 、数 据库 连接配置 于 XML的异构数据库 中间件技术实现异构数 等特性 ,方便表示不 同类型 的数据信息 ,同时 据库之间信息交换 .首先提 出了一个异构数据 也 方 便 了 不 同 数 据 库 之 间 进 行 数 据 共 享 和 交 信息文件 以及安全控制文件。生成的这三类配 库集 成 中间件 的三层 框架结构 , 并通过 XM L 置文件可 以使管理员对集成的个数据 库的元数 换 ,进而 X ML在 异构数据库 的集成方面有很 技术在客户端与数据库服务器 问构建 了一个 中 据信息进行重新定义 ,也可以配置需要查询数 火优势 。本文 主要研 究基于 XML异构数据库 间件 系统 。在该集成 中间件系统中通过对配置 据库的连接信息和安全控 制信息 。 的集成。 改 全局 虚拟 视 图文件 :对 数据 层 的异构数 文件模块 、查询模块 、包 装器模 块的封装 ,
一种基于XML的WebGIS多源异构数据集成方案
点.
X ML是 国际组 织 W3 C为适 应 www 的应 用将 S ML Sadr e e le ru a g ae 标 准 G ( t adG n r i dMak pL n ug ) n az
进 行简 化形成 的标记语 言 , 是为 了用来对 信息进行 描述 而设计 的一种 语言 , 它作 为一种 可用来 制定具 体
G S数据库 服务器 上 的地 理空 间 数据 , 用 G S应 用 服 务器 上 的 We ev e 其 进 行 数 据抽 取 , 将 I 调 I b S ri 对 c 并
其 转换 为 X ML格式 ; 于经 过模 式映射 和转 换而存 储 为 X 对 ML数 据库 的地 理空 间数据 , 则直 接通 过封 装 了X ML查 询 的 We e i bS r c v e进行 数据 抽 取 ; 着对 以上 两 种情 况 下 得 到 的 X 接 ML进行 X L e tnil S T( Xe s e b Sy set a gaeTa s r a o , 扩 展 样 式 表 语 言 转 换 ) 换 , X tl he L nu g rnf m t n 可 e o i 转 将 ML格 式 的 数 据 转 换 为 S G V ( clbeV c r rp i , S a l et a hc 可伸缩 矢量 图形 ) 式 , a oG s 格 最后 将 S G嵌 入 We V b页 面发 送 到 客 户端 浏 览 器 , 浏 览器 中的 S G插件 对 页面 中的 S G进行 显示 , 而在 实现 地理 空 间数据 的矢 量传输 和显示 的 同时 , V V 从 使 得不 同格式 和来 源 的地 理空 间数 据集成 于 X ML这一 格式 , 同时 , 还可 通过对 已定 义 的 We e i bS r c v e进行
基于XML的异构数据库集成方法研究与实现
一 一 —
X ML异构数据库集成 与查 询系统构建 在数据库系统之上 . 目的是集 成异构数据源 的信息 . 为数据共享 、 发布和应用提供支 持, 并负责异构数据源的数据访问 、 查询和协调数据源之间的信
息。
图 1系统 框 架
本 系 统 采 用 客 户/ 务 器 三 层 架 构 . 图 1 示 。 各 个 异 构 服 如 所 数据库资源构成了系统数据层 ; 本系统完成的主要 任务 . 即异构 数据集成 和查询的功能被封装构成业务层 ;用户 的应用构成系
Sh ma 准 作 为异 构 数 据 源 的全 局 模 式描 速 , 助 X ce ce 标 借 MLS hma强 大 的数 据 描 速 能 力 。 过 实现 关 系模 式 的 提 取 、 系模 式 通 关
到 X hma的 转 化 和 附加 语 义约 束 。 MLS e c 实现 了异 构 资 源 数 据 库 数 据 的 整 合 。
期 06
基于 X ML的异构数据库集成 方法研 究与实现
王彦新 .杨奎河
( 北 科 技 大 学信 息 科 学 与 工程 学 院 , 北 石 家 庄 0 0 5 ) 河 河 5 0 4
【 摘 要 】异构数据库 的集成 问题是 当前数据 处理领域 内研 究的 一个热点 。 : 它能更有效地利用信 息资源、 实现数据共享。 文章提 出并 实现 了基 于 X ML的异构数据库集成与查询 系统 . 并重点讨 论 了异构数据库的集成方法。 系统采用 W3 C的 X ML
统 的 表 示 层
基于 X ML的异构数据 库集成与查询 系统的核心 是数据转 化和集成 , 为了更好 的实现数据 的集成 . 系统 采用 X hma 1 表 2所 示 。 MLS e 和 c 模式作为系统的全局模式 ,并分 为两步完成异构数据模式到全 名称 宇段名 类型 长 度 局模式的转化和集成 。包装器负责异构数据源模式 ( 系模式) 关 IB编码 IB S N S N nac r 2 vr a O  ̄ 到X ML模式 的初步转化 , 仲裁机构 负责对转化结果进行进一步 分类 码 Ct oy Iac r 2 ae r Y rh g / a 的模 式集 成 , 终 宴 现 系 统 全 局 模式 映射 最 书名 Bo ae lac r 1 ok m N w rM 0 0
基于 XML 的异构数据源集成系统研究
2 0 1 3年第 1 1 期
王红军 : 基于 X ML的异构数据源集成系统研究
协议 和格式进行数据封装 、 传输 。同时 , 数据交换 并不 是一 个 简单 的数 据传 送 的过 程 , 数 据 中心需 要 对数 据进 行 管理 和 维 护 , 例 如 数 据 的加 密 , 防止 数 据重 发 、 自动转发 、 数 据 的断点 续 传等 , 以保证 数据 传输的安全 、 完整 、 准确和高效 。最后 , 数据中心将 数据 发送 给 数据 的接 收方 。
数据 中心 首先 是数 据 的集 中存 储器 , 通 过整合 各业 务部 门的数据 资源 , 建立 综合 和全 域 的数据模
量同步交换。要完成数据传输 , 首先接收要传输 的 数据 , 并 支持 网络 方 式或 文件 导入 方式 。其 次要 确 定传输协议和数据传输格式 , 在数据进行传输过程 中, 数据中心要通过加密等多种方式来保证数据传 输 的安全 。最后 , 数 据 以多种 方式 安全 准 确地送 达
基于XML的异构数据库集成研究
基于XML的异构数据库信息集成模型研究
科技资讯S I N &T NOLOGY I NFORM TI O N随着网络的发展,特别是在信息化时代和全球经济竞争的新环境下,数据资源的共享己经成为一个热门并且需要解决的问题。
基于XML 的数据集成中间件就是解决信息孤岛问题的一种很好的方法。
本文利用X ML 和中间件技术,提出一种基于X M L 和中间件的数据集成方案。
通过该中间件,可将各种异构数据库集成在一起,并为高层提供一个统一的访问服务接口。
1数据集成框架模型在进行集成分析和设计时可以把各个应用系统作为一个单独的应用模块加以考虑。
本文在对XM L 技术进行分析探讨的基础上,设计了以下模型,如图1所示。
图1该模型由以下四层组成:1.1客户端层用户交互界面,接受用户的信息请求并返回请求结果。
1.2W e b 层为企业提供We b 服务,包括信息的发布、交互和处理的功能。
只存在于基于We b 的分布式企业信息系统中。
1.3业务层数据集成中间件封装了系统的业务逻辑,提供集成的业务服务,构成系统的业务层。
接收客户端的查询请求,接收来自数据库的源数据格式的查询结果,并将其转化为X ML 文档。
合成的XML 文档经语法分析、处理,协同XS L ,依据客户端要求的文件格式返回。
1.4数据库层处于最底层,是系统的数据提供者,分布于各个需要集成的异构数据库。
2模型分析本集成模型与包装器/调节器模型的类似之处在于:l )翻译器类似于包装器,两者实现对底层数据库的包装,为用户提供透明访问;2)对应于调节器,本模型提供了转换器和集成器,都实现对包装翻译过的信息的进一步集成。
不同之处在于:l )包装器/调节器模型中包装器与数据库需要一一对应,而本共享模型只需要实现一个统一的翻译器;2)包装器需与调节器一一对应,因此不利于系统扩展。
而本共享模型,增加一个数据源。
不必重新实现翻译器、转换器和集成器,只需提供数据源的连接信息和翻译、转换、集成的必要信息;3)对于用户查询,调节器将查询请求分解为包装器可以执行的小查询,派发给包装器,并组合查询结果。
基于XML的异构数据库集成研究
兰州 工业 高 等 专 科 学 校 学 报
J u n lo a z o oy e h i C l g o r a fL n h u P lt c n c o l e e
Vo . 8 No 5 11 . Oc . 01 t2 1
文章编 号 :0 9— 29 2 1 ) 5— 0 4— 4 10 2 6 ( 0 1 0 0 2 0
基 于 X 异 构 数 据 库 集 成 研 究 ML的
胡 晓玫
( 成都市工业 职业 技术学校 , 四川 成都 604 ) 10 1
摘 要 : 讨 了异 构数据 库 集成 方 法 , 采 用 X 探 并 ML的异 构数 据库 中间件技 术 实现 异 构数 据库 之 间信
的 内容上 , 不是 得 到 数据 的方 法 上 , 而 实 现 不 而 从
中 问件 能 够 屏 蔽 各 种 数 据 库 之 间 的 差 异 , 为
应 用程 序 提 供 统 一 的访 问 接 口 , 以满 足 不 同 环 境 下 应用 的需 要 , 而完 成 异 构 数 据 库 的集 成. 从 中问
集成 , 是信 息 化发 展 迫 切 需要 解 决 的 问题 之一 _ . 1 ]
XML的 出现 无疑 为异 构数 据 源 的集 成 带来 了新 的 希望 . 以 一 种 全 新 的 自我 描 述 方 式 定 义 数 据 结 它
构, 这种结 构 不仅 能 描 述数 据 内容 , 能 突 出结 构 还 特征 的描 述 , 从而 体 现 出数 据 之 间 的关 系 . 文 将 本 研 究 基 于 X L的异构 数据 库 的集成 . M
・2 5・
2 基 于 XML的 异构 数 据 集成 方 法
基于XML技术的异构关系数据库集成模型
t e s e i c c n e so r c s ewe n t e i i e . Ba e i t i tg ai n m i d e r , a s f r fi f r t n ma a e n h p c f o v r i n p o e sb t e m sg v n i h s d O l h si e r t d lwa e n o o t e o o ma i n g me t wa n o
文 章 编 号 :0 07 2 2 1) 45 8 —4 10 —04(0 0 2 —2 50
Hee o e o eai n ld tba ei tg ai nm o e a e n XM L tr g ne usr lto a aa s n e r to d l s d o b
计 算 机 工 程 与 设 计 C m u r n i en d ei o pt E g er g n D s) 00 1( 3 4
58 25
・软件与算 法 ・
基于 XML技术 的异构 关 系数据库集成模型
郝少华, 韩 燮
( 中北 大学 电子 与 计 算机 科 学技 术 学 院 ,山 西 太原 0 0 5 ) 30 1
Ab t a t T f c i ey s l et ep o lm f ee o e e u aa a ei t g a i n t e sau fh tr g n o sd t b s n e r to s s r c : o e e t l o v h r b e o tr g n o sd t b s n e r to , h t t so ee o e e u a a a e it g a i n i v h a a y e , a d aXM L b s d h t r g n o sr lt n l aa a e mo e sp o o e . Th smo e sdv d d i t ee o e e u a a a e n lz d n — a e ee o e e u e ai a t b s d l r p s d o d i i d l i i e o h tr g n o sd t b s i n ly r i t g a i nmi d e r y r n p l a i n ly r h e a t . Th n t n f h e a t emo e r e it d a dt e a e, n e r t d lwa el e da p i to e r ep rs o a a c a t ef ci s t e h e rs nt d l ed p c e , n u o o t r p i h a h i lme t t n f h tg a e d lwa el y ra ed s u s d T ema p n u e ewe nt ed t b s n mp e n a i s t ei e r t dmi d e r e r ic s e . h p i g r l s t e a a a ea dXM L a e d t i d a d o o n a b h r e al , n e
异构数据集成思路总结
基于XML的异构数据集成方案一、设计任务设计出基于XML的异构数据集成方案,具体要求:i. 数据源包括:结构化数据、非结构化数据和半结构化数据ii. 实现功能包括:能够用统一的方式实现查询等处理iii. 应用的技术为XML技术,实现异构数据集成二、设计应用的具体集成方法2.1异构数据集成方法简介:异构数据集成方法包括:模式集成和数据复制方法。
1、模式集成方法中的数据仍保存在各数据源上,由集成系统提供一个虚拟的集成视图(即全局模式)以及全局模式查询的处理机制。
用户直接在全局模式的基础上提交请求,由数据集成系统处理这些请求,转换成各个数据源在本地数据视图基础上能够执行的请求。
2、数据复制方法将各个数据源的数据复制到与其相关的其它数据源上,并维护数据源整体上的数据一致性、提高信息共享利用的效率。
3、模式集成包括:联邦数据库和中间件集成方法是现有的两种典型的模式集成方法。
4、数据复制方法:数据仓库方法。
2.2异构数据集成方案分析1.联邦数据库数据集成联邦数据库是数据库集成的最简单结构,将所有组件数据库进行一对一的连接为了实现各个数据库和其它数据库数据之间的互操作,需要解决各个数据库之间的格式冲突问题,就要为每一个数据库向其它数据库的数据类型转换提供转换规则。
这就是说这样的异构数据库系统需要建立NX(N一1)/2个转换规则,或者说要编写N X (N一1)/2段代码来支持两两之间的查询访问。
在联邦数据库数据集成方式中,如果要向系统中加入新的节点,就需要再建立很多转换规则,并且为系统之间只有通过编写软件来实现互相的信息正确地传递,这样做既费时又费工。
如果各个子系统需要修改,那么会带来更多的问题,大大影响了系统的可扩展性、移植性和稳定性。
其模型示意图如下图所示:图1 联邦数据库集成方法示意图2中间件集成方法中间件数据集成基于一个“公共数据模型”,实质上数据仍旧保存在各个参加集成的数据源中,通过各数据源的“包装器’将数据虚拟成公共数据模式,用户的查询是基于公共数据模式基础上的,即建立基于公共数据模式的虚拟数据库集成系统。
基于XML的异构数据库集成中间件的研究
配置模块 面 向管理 接 口, 主要 向集 成 中间件 管 理 员提供 异构数 据库 的元 数据信 息 。通过 配置模块
主要生成 三类文 件 : 全局 视 图文件 , 数据库 连接池配
供统 一 的查 询接 口, 如图 1 示 。 所
XML d t ,ti d l w r h ed l df rn e s e t o a as u c cu i gt e p afr ,s s m a a h smi d e a es il s l i e e c si a p c f t o r e i l dn lt m a f n s d n h o yt e
数据访 问接 口。
要 实现数 据 的集 成 , 主 要 的是 找 到一 种 解 决 最 异构性 的交互媒 介 。X ML具有 平 台性无 关 、 扩 展 可
基金项目:重庆市 自然科学基金项 目( S C 0 7 B 18 CT20 B27 ) 作者 简 介 :张 建 江 ( 9 1 , , 士 研 究 生 , 要 研 究 方 向 为计 算 1 8 一) 男 硕 主 机网络及数据库 。
图1 X ML集 成 中 I 模 型 司件
连接池 配置文件 : 通过 J D 将 生成的连 接池信 NI
息写入 配 置 文件 ( e e.m sr rx l和 ap poet s , v p . rp re ) 记 i 录相应 的配置信 息并保存 为 X L文件 。 M
X ML集 成 中间件 将 各 个异 构 数据 库 的元 数 据
存储( 异构 数据库 系统 ) 和基 于数据 的查询应 用 ( 应
用 程序 ) 间 , 方 面 汇 集 了分在 各 个 异 构 数 据 库 之 一
基于XML的异构数据库集成中间件系统研究
收 稿 日期 : 0 -83 2 60-1 0
求, 于是作为先进 的应用集成工具 , 集成平 台与集成 框架技术就应运而生。 目 前企业应用集成有几种不 同的技术规范 , 大都采用面向对象和分布式技术 , 如
ss m .A tgainfa sdi mp tr n fetrr ewt e i b i yt e n i ert meue c n o r no uei go nepi i t m uh.T eitga o i e mehd fmpe n dk y i f s hh s h ert nt n i m . toso i lme t e n a
化的面向异构 系 统数据 集成 的框架结构 , 实现框架结构所涉厦 的关键技术和 实现方法进行 了 究 , 此框架结构 的 并对 研 在
基础 上建立 了基 于 we b的面向异构应 用系统 的集成适配嚣工具, 作为一个主要 的支撑 工具模块 , 在基 于 P M[技 术的项 D 1 ] 目管理 系统 中和 电子政务 中得到 了应 用。 关键词 : M ; X L 异构信 息 系统 ; 集成框 架结构 中图分类号 :P9 .3 T 3 30 文献标识码 : A
Ab l ̄ : t n 删 d doige trr e 8d t o ueie teeaea u t f aaa difr t nw ihmut e8ae n sr Wi c hi v a pn nepi ’ aacmp tr d, r r mo n d t n noma o hc s z h o i s b h tdad
Ree r h o m tg ain F a fHee o e e u n o m ain sa c n Da I e r t r meo tr g n o sI f r t n o o S se ae n XM L Teh oo is y tm B sd o c n lge
基于XML的异构数据库集成设计与实现
基于XML的异构数据库集成设计与实现摘要作为上海市科委专项基金资助项目之一,同济大学和上海体育学院联合承担了中国乒乓球队知识交互平台的研发,该项目中需要将前期开发的技战术分析系统中得到的宝贵的数据集成到平台中并加以应用。
本文依托于该项目,主要探讨已知数据库结构的异构数据集成,结合xml技术,讨论该技术在不同数据库信息交换中的积极作用,并给出理论原型加以论证,提出基于xml的综合异构数据集成解决方案。
关键词 xml;异构数据;数据集成;信息交换中图分类号tp311 文献标识码a 文章编号 1674-6708(2013)86-0176-020 引言在信息技术发展日新月异的今天,随着互联网技术的不断更新,给人们的生活和工作带来了极大方便,但也正是由于技术的更新换代以及技术研发人员和平台的更迭,数据库系统的局限性也随之产生,基于不同数据库开发的系统则在资源的互操作性上存在问题形成数据孤岛,因此在不影响已有系统的情况下,整合各个数据库就成为迫切的需要。
与此同时,这些数据库在许多情况下为完成一项数据查询任务,均需要同步来共享数据。
以利用中间数据源来管理各个分散的数据库,从而实现异构数据库的集成,是一个行之有效的方法。
在实际项目当中,往往会遇到以上问题,本文研究内容基于“中国乒乓球队知识交互平台”,它是以乒乓球项目为例,综合运用现代信息技术、管理科学以及运动训练理论开发而成的知识交互平台系统。
在具体操作当中,遇到异构数据库集成问题,因此需要建立一个基于“中国乒乓球队知识交互平台”的异构数据集成方案,以实现知识平台中心数据库整合其他异构数据库中的资源,以及对异构数据库变化的捕捉与更新,对这些分布、异构、自治的数据源实现跨平台访问。
1 关键技术研究1.1 异构数据库异构数据库系统是相关的多个数据库系统的集合,可以实现数据的共享和透明访问,每个数据库系统在加入异构数据库系统之前本身就已经存在,拥有自己的dmbs。
异构数据库的各个组成部分具有自身的自治性,实现数据共享的同时,每个数据库系统仍保有自己的应用特性、完整性控制和安全性控制。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
据和半结构化数据 )使数据交换保持了平台独立性 , 原则 , 降低耦合性 , 提高 了重用的可能性 , 这样 就使 异构数据源集成中问件能更好地适应开放 、 发展环
中间件层
器
数据源层
图 1 异构数据库 集成方案框 架
收稿 日期 :0 8—1 —2 修 回 日期 ;09—1 20 1 5; 20 2—1 6
该方案具有扩展性 , 如要添加新的数据源访问需要 , 只需向中间件系统进行注册相关 信息即可实现 , 即该 中间件系统具有弹性环境 , 有利于 日后系统 的维护。采用该异构数据库集成方案可解决企业异构数据库
第2卷 o
第1 期
茂名 学 院学报
J R I OF MAO OU NA M G U 、 R nY NI S
V0 . 0 N . 12 o 1 F b.0 9 e 20
21 00年 2月
一
种基 于 X ML的异 构 数 据 库 集 成 方 法
乔 玮
( 西安文理学 院, 陕西 西安 70 6 ) 105
中图分类号 :P 1 .3 T 3 11 文献标识码 : A 文章编号 :6 1 502 1)1 0 9 3 17 —69 (0 00 —0 4 —0
现代企业普遍应用数据库技术来管理各种数据 , 多数企业在发展过程中积累了大量的数据 , 这些数据 可为企业的业务发展和经营规划提供参考。但由于数据库应用系统是在不同时期 、 根据不同的需求建立 的, 开发标准、 数据库平 台、 数据格式等不 同, 因此在企业数据共享中形成 了“ 信息孤岛” 。数据库 中间件技 术通过提供一个全局模式和对应各数据源的局部模式 , 集成来 自不同数据源的数据, 不需考虑数据库的模 型和运行平 台…。X L e t s l M r pLnu e是 S M (t dr G nr a u agae的子集。作 M (Xe ie a u aga ) G LS na ee l r pLnug) n b k g a d aM k 为一种可扩展标记语言 , 自描述性使得 X L 其 M 本身非常适用 于异构数据应用 间的数据交换 。由于 X L M 能够描述不规则数据 , 能够从不同的来源集成数据 , 因此将 X L M 作为数据 的描述工具和转换工具来构造 数据集成 的中间件 , 是实现异构数据集成的较理想 的解决方式[。 2 】
作者 简介 : 乔玮(97一)男 , 17 , 河南洛 阳人 , 助理工程师 , 硕士 , 从事网络集成与数据库技术研究。
5 0
茂名 学 院学 报 ຫໍສະໝຸດ 21 00年 境中的数据集成 。本方案中的中间件层主要 由注册器 、 查询处理器 、 结果处理器和包装器四个模块组成。 注册器主要负责异构数据库的注册服务, 并生成公共模型; 查询处理器需要根据用户提交的查询请求 , 将基 于总体视图的查询分解为针对各个数据源的子查询 , 并提交给包装器执行 ; 结果处理器把包装器的结果汇总
处理 , X L 以 M 的方式返回; 包装器负责与底层数据源交互 , 包装异构数据源, 实现数据位置和访问的透明性。 该构架的工作流程及所实现的功能为: 应用程序服务器接收客户端发送的查询请求 , 该查询请求为全 局查询请求 , 可能需要访问数据源层中不同数据库中的信息。中间件层接收全局查询 , 根据各异构数据源 注册的共享信息进行分析 , 查询处理器将全局查询分解为针对具体数据库子查询 , 并将子查询发送到对应
应 ●—— . ——— . 二二 )
信息 , 为数据的共享和应用提供访问支持 , 负责异构 户
端
数据源的数据访问和查询 , 同时协调各数据源之间 客 的信息集成。该方案 将 X 技术 与全局数据模式 户 ML 相结合 , 在中间件 中以 X L M 文档进行数据 的交互 ,
用
l 异 构 数 据 库 集成 方 案
本文 中的异构数据库是指相关 的多个数据库系统的集合 , 异构数据库的各个组成部分具有 自身的 自 治性 , 每个局部数据库拥有 自己的 D M ( B S 可以是同为关系型数据库系统的 Oal S LSr r 也可以是 r e Q v 等, c、 ee 不同数据模型的数据库 , 如关系 、 模式 、 层次 、 面向对象数据库等)在实现数据 的共享 和透明访 问的同时 , , 每个数据库管理系统仍然保有 自身的完整性控制和安全性控制。
的数据源。数据层 中的各数据库管理系统接收到查询后 , 从数据库中查询相关信息 , 把查询结果返还给结 果处理器, 结果处理器将其合并成同一笔数据记录 , 并将得到的全局查询结果返还给应用程序服务器, 应 用程序服务器再将用户请求的结果返回给用户 。以上过程均以 X L M 文档为数据转换的中介格式。同时,
程
务
( 注册器 )
包 I二=≥ <
端
端
服 - ( 询 理 —+器 一 + 序 4 查 处 器) — 装 ● {堡 三 ’ ●— _墼
器
应用层
户 它能够转换来 自 同数据源的数据 ( 不 包括结构化数 客
(结果处理器)●—.包 一 F ——. ● = —— = 二二
基于 X L M 的异构数据库集成方案的基本框架如图 l 所示 , 它分为三层结构 : 分别为应用层 、 中间件层
和数据源层 , 中间件层构建在各数据库 系统之上 , 数据应用程序服务器之下 , 在不改变异构数据源原始数 据存储和管理方式的情况下 , 集成各个异构数据源 客
I 公共模型 I
摘要 : 异构数据库 的集成 是当前数据库研究领域 内的一个热点 , 它能更有效地利用信 息资源及实现 数据共享 。论 述了一种 基于 X L中间件 的异 构数据库集成方法 。首先介绍 了异 构数据库 集成 系统整 体框架 结构 的层次模 型和每 一层 的服务功 M
能, 然后对 其中的关键 问题 , 如关系数据模式到 X ce a MLShm 模式转换及查询分解方法进 行 了讨论 , 最后 阐述 了该 异构数据 库集成方法 的优点 。 关键词 : M ; X L 中间件 ; 据集成 ; 数 异构 数据库