对关系数据库与XML数据库的比较研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
<? xm 1 v e s o n = r i 1.0 e c d n = b 3 2 ? n o i g g 2 1 > < n e a e> Si g r T b1
的关 系通过 嵌套方 式表达 ,有 明显 的层次 结 构 , 而 且表 示 形 式 非 常 灵 活 。 而 关 系 数 据 是 结构 固定的平 面化 的信 息,数 据存储 在二 维 表中 ,数据 之间 的关系 是通过 表与 表的关 联 关系来表达 的。在 X L M 向关 系数据库 的转换 过 程 中 ,无论何 种转 换方 案,在 转换 结果 中,
蠢
对 系数据库 与 关
摘 要 : 作 为 当 今 比 较 流 行 的 二 大 数 据 库 ,本文主要 分析 了X L M 数据 库与 关系数 据库 之 间的 关 系, 结合 实例论 述 了X L丈档 的特 M 点,并对 X L M 文档 内容到 关 系数据库 的转换提 出 了一 种 可 行 的 解 决 思 路 。 关键 词 :X L 关 系数 据 库 ;转 换 M; 1 、前言 关系数据 库系 统采用 二维 表格 作为 存储 数据 的模 型,关 系数据 是结 构固定 的信 息, 通 过 表 与 表 的 关 联 关 系 来 表 达 数 据 之 间 的 关 系 ,由于其具 有数 据结构 化 、冗余度 低 、程 序 与数据独 立性 强, 易于 扩充 等特 点 ,已成 为 目前发展 的一 大主流 ,很 多大 型信息 系统 都是建立在结构化数据设计之上 。 而 随着I t r e 的飞速 发展 ,网络信 息 n e nt 量 急剧膨胀 ,为 了更好地 进行 信息 管理和 信 息 交换 ,可扩展 标记 语言 X L ( X e s b e M e t n i l M r u L n u g a k p a g a e)技 术 应 运 而 生 。 X L M 是 S M 的一个 简化版 本 ,它将 S M 的丰 富功 能 GL GL 与H M 的 易用 性结 合到w b TL e 的应 用中 。X L M 较 传统关系数据库 具有其 自身 的优势 ,如X L M 数 据 是半结构化 的信 息 ,与传统 的关系 数据 库 中的关系数据 相 比,元素 之 间的关 系通过 嵌 套 方 式 表 达 , 表 现 形 式 非 常 灵 活 : 另 外 其 数 据存 储不需要 使用 数据库 系统 ,在任 何应用 程序 中都可 以读写数 据 ,使 用起 来非 常简单 方便 ,且数据 格式统 一 ,因其可 以高 效地操 作 和 维 护 W b 以 指 数 增 长 的数 据 , 目前 已成 e上 为网上传输数据 的重要手段 。
<sn > / o g <Sne a l > I ig r T b e
s g 1 al i e n le n ’ l
. dl on e e
nt n l " ai ai o b
b ) 1 e
王 菲
Байду номын сангаас女
中国
表 l Sne iz l
Pp o
tte i l
s g ll l e n i e’l l al
3 M 数据库与关系数据库的 比较 、X L x ML数 据 库 与 关 系 数 据 库 系 统 相 比 [ — ], 有 如 F几 方 面 的 差 异 : 1 存 储 形 23 . 式 :X L M 数据存储在 层次化结构化 的文档中, 而关 系数据库将数据存 储在多个表 中。2 .存 储数据 :X L 点具有 元素和属性 二种值,而 M结 关系数据库 中记录 单元只有 单一 的值 。3 .存 储顺 序:X L 素是有顺序的 ,而 关系数据库 M元 中记录 元是 无序 的 。4 .存 储 数据 特 点 : XL M 中元素是可 以嵌 套的,而关系数 据库中记 录 单元是 原子 的。5 .递 归 性 : X L 素 是 可 M元 递 归的,而关系数据库 [ 几乎不支持递 归。6 『 l 数据检 索:XL M 中可 以直 接 检 索 一 个 文 件 中 的数 据 ,而 关系 数据库 往往 需要关 联检 索多 个表的数据 。7 .数据查询 :X L M 标准查 M 用X L 询语言X a h q e y p t 或X u r 查询 ,而关 系数据库用 标准查询语言SL 数据进行查询 。 Q对 4 M 向关系数据库 的转换 方案 、X L
2 0 . 1 ) -1 . 0 8 1 :1 8( 6 2 4
[] 2 邓华梅 , 肖锋 , 海 平. 关 于x L 李 袁 M 数据 的存储 研究 【] 科技 情报 开发 与经济, J.
20 8 8( 4 :1 -1 5 0 ,1 2 ) 3 . 5 5
由 上 可 知 X L 关 系 数 据 库 进 行 数 据 转 M 与
< i l > 年 < t te t te 流 / il>
<o p sr 陈 晓娟 <c m o e > cmoe > / o p sr
< e g h 3:0 / e g h ln t > 3 < ln t>
< e r 2 O1 / e r ya>0 <ya>
③对 于有 多值属 性需要 创建 一个单 独的 表 来 存 储 这 些 值 ,包 含 外 键 和 其 父 元 素 所 在 表 的主键形成 的链接 。 利用上 述规 则 ,可 以很 方便地 将 以上 的 XL M 示例文档转换为如 下二维表 :
应 用X L 为W b M作 e 数据 交换 的平台 ,能更好地 进 行信 息管理和 信息 交换 ,随着I t r e 的 n en t 不断发展 ,X L M 数据库 的应 用也必将越来越广
泛。
参考文献:
【 】翁 畅 平 . 基 于 xM l 数 字 图 书 L的 馆 信 息 组 织 [ ]. 科 技 情 报 开发 与 经 济 , J
换 的 最 大 困 难 是 由 非 层 次 和 层 次 的 差 别 而 导 致 的 。X [ 据 是 半 结 构 化 的 信 息 ,元 素 之 间 M 数
[】 其 华 . 网 络 环 境 下基 于 X L 异 构 3彭 M的 数据 交换 的研 究 [] 西南民族大学学报 : 自 J.
标记 ,具 有十分 强的 可扩展 性 。下面 是一个 XL M 文档的实例 ,描述 了一 个歌手 的姓名 、性 ・ 别、所唱 曲目等信息 。
.
C ip s l Ol o e l
ll el h
V a er
传奇 流年
王 菲 王 菲
李健 陈晓娟
表 2
42 0 33 : 0
2 l 0O 2 0 01
首先X L M 文档可扩 展能力 强 [ ] 1 ,允许用 户 自定义 标签 以及这 些标签 相关 参数 的属性 和 值 ;其 次 其 具 有 良 好 的 数 据 可 重 用 性 : 另 外 使 用 X L 档 具 有 较 强 的 平 台 独 立 性 。X L M文 M 可运行在 任何平 台和操 作系 统上 ,具有 结构 化 和标准 化的文 件模式 ;最 后 ,由于数 据可 被X L M 唯一标识 ,搜索 软件 无需 了解类 似传统 数 据库 的构建情 况 ,因此搜 索起来 会变 得 f 分容易 。但 X L M 也有其 自身 的不足 , ̄ D D H T 没 有 采 用X L M 的语 法规 则而 是基 于 正 则表 达式 的 , 描 述 能 力 有 限 : 约 束 定 义 能 力 不 足 ; 没 有 数据类 型的支 持; 不够结 构化 ,重用 的代
2 M 的 特 点 、X L
< i g r S n e >
! !!! 曼 = !
数据库 的比较研 究
文 ◎ 董 婧 ( 曲靖 师 范 学 院 计 算 机 科 学 与 工程 学 院 云 南 曲靖 )
薹圜
< i g r nm > 菲 < s n e a e s n e a e  ̄ /igrnm> <edr> <gne > gne 女 /edr < a i n l t > 国< n t o a iy ntoaiy中 / a i n lt >
② 由 复 杂 元 素 构 成 的 表 ,对 其 内 容 分 类 处 理 : 单 值 属 性 和 简 单 子 元 素 映 射 利 用 上 面 第 一 个 规 则 ; 对 于 复 杂 子 元 素 , 形 成 对 复 杂 子 元 素 对 象 的 引 用 , 关 系 数 据 库 中 , 实 体 间 的关系通过外键 引用来实现 ,而在X L M 数据库
2 3 2
.
5 、结 束 语 通 过 以 上 对 关 系 数 据 库 ̄ X L 据 库 的 比 HM 数 较 ,可 发现X B L D 具有更 强的灵 活性和可 D R B k 扩展 性 ,但X L M 还需解决数据 存储、索引 、冗 余 和查 询优化 等 问题 。它和关 系数据库 之 间 存 在着 大量 的数据 转换 ,实例 证明本文 所提 出的X L M 向关系数据库 的转换 方案是可行 的,
< on > s g
中,实体 间 的关 系通过 I R F M 元素 嵌套 D E 或X L
来 实 现 , 因 此 当 元 素 形 成 表 后 , 把 该 引 用 改 成 主 键 — — 外键 (r m r k y — — F r i n P iay e s o e g ky) e s 的表 示 形 式 。
< y e P p / y e tp>o<tp>
都既 要保持 数据源 内容的完整 性 ,又要保证 数据源 结构 的可恢 复性 。因此 可采用 如下转 换 规 则 [] 4: ① 单 值 属 性 和 简 单 元 素 直 接 映射 表 的
列。
<sne > /igr
< on > s g
然科学版, 0 32 ( : 5— . 2 0 , 96 7 6 78 ) 5 [ 4】董 东 ,马 丽 .x 据 库 和 关 系 L数 M 数 据 库 之 比 较 [ 计 算 机 工 程 与 设 J].
计 , 0 5 2 8 : 9— 0 9 2 0 , 6() 2 2 2 9 0
(r c s i g n tu to ) [ D T 段 。 其 中 p o e s n i sr c i n  ̄ C A A I
标 记 是 用 一 对 尖 括 号 来 表 示 ,元 素 内 容 可 以 是 文 本 数 据 , 也 可 以 是 X L 素 , 甚 至 是 该 M 元 元素 本身 。其语 法和 H M 类似 ,但是 X L TL M 的 优 势 在 于 其 允 许 用 户 可 以根 据 需 要 自 行 定 义
< i l > 奇 < t t e tte传 Ii1> <o p sr 李 健 < cm o e > cmo e> /o p s r
< e g h 4:0 I e g h ln t > 2 < ln t >
<e r 2 1 < ya > y a >O 0 / e r
< sn > / o g
价相对较高 。
S 蟮 Ol
XL M 文档 主要 由X L 素构 成 。每个 X L M元 M 元 素 包 括 3 分 : 开 始 标 记 、 元 素 内容 和 结 束 部 标 记 。标 记 包 括 六 个 内 容 : 元 素 (1 m n ) eee t, 属 性 ( t te at bu ), 实 体 引 用 ( nt ri e tY i r f r n e ) 注 释 ( o m n ) 处 理 指 令 ee ec s , Cmet ,
的关 系通过 嵌套方 式表达 ,有 明显 的层次 结 构 , 而 且表 示 形 式 非 常 灵 活 。 而 关 系 数 据 是 结构 固定的平 面化 的信 息,数 据存储 在二 维 表中 ,数据 之间 的关系 是通过 表与 表的关 联 关系来表达 的。在 X L M 向关 系数据库 的转换 过 程 中 ,无论何 种转 换方 案,在 转换 结果 中,
蠢
对 系数据库 与 关
摘 要 : 作 为 当 今 比 较 流 行 的 二 大 数 据 库 ,本文主要 分析 了X L M 数据 库与 关系数 据库 之 间的 关 系, 结合 实例论 述 了X L丈档 的特 M 点,并对 X L M 文档 内容到 关 系数据库 的转换提 出 了一 种 可 行 的 解 决 思 路 。 关键 词 :X L 关 系数 据 库 ;转 换 M; 1 、前言 关系数据 库系 统采用 二维 表格 作为 存储 数据 的模 型,关 系数据 是结 构固定 的信 息, 通 过 表 与 表 的 关 联 关 系 来 表 达 数 据 之 间 的 关 系 ,由于其具 有数 据结构 化 、冗余度 低 、程 序 与数据独 立性 强, 易于 扩充 等特 点 ,已成 为 目前发展 的一 大主流 ,很 多大 型信息 系统 都是建立在结构化数据设计之上 。 而 随着I t r e 的飞速 发展 ,网络信 息 n e nt 量 急剧膨胀 ,为 了更好地 进行 信息 管理和 信 息 交换 ,可扩展 标记 语言 X L ( X e s b e M e t n i l M r u L n u g a k p a g a e)技 术 应 运 而 生 。 X L M 是 S M 的一个 简化版 本 ,它将 S M 的丰 富功 能 GL GL 与H M 的 易用 性结 合到w b TL e 的应 用中 。X L M 较 传统关系数据库 具有其 自身 的优势 ,如X L M 数 据 是半结构化 的信 息 ,与传统 的关系 数据 库 中的关系数据 相 比,元素 之 间的关 系通过 嵌 套 方 式 表 达 , 表 现 形 式 非 常 灵 活 : 另 外 其 数 据存 储不需要 使用 数据库 系统 ,在任 何应用 程序 中都可 以读写数 据 ,使 用起 来非 常简单 方便 ,且数据 格式统 一 ,因其可 以高 效地操 作 和 维 护 W b 以 指 数 增 长 的数 据 , 目前 已成 e上 为网上传输数据 的重要手段 。
<sn > / o g <Sne a l > I ig r T b e
s g 1 al i e n le n ’ l
. dl on e e
nt n l " ai ai o b
b ) 1 e
王 菲
Байду номын сангаас女
中国
表 l Sne iz l
Pp o
tte i l
s g ll l e n i e’l l al
3 M 数据库与关系数据库的 比较 、X L x ML数 据 库 与 关 系 数 据 库 系 统 相 比 [ — ], 有 如 F几 方 面 的 差 异 : 1 存 储 形 23 . 式 :X L M 数据存储在 层次化结构化 的文档中, 而关 系数据库将数据存 储在多个表 中。2 .存 储数据 :X L 点具有 元素和属性 二种值,而 M结 关系数据库 中记录 单元只有 单一 的值 。3 .存 储顺 序:X L 素是有顺序的 ,而 关系数据库 M元 中记录 元是 无序 的 。4 .存 储 数据 特 点 : XL M 中元素是可 以嵌 套的,而关系数 据库中记 录 单元是 原子 的。5 .递 归 性 : X L 素 是 可 M元 递 归的,而关系数据库 [ 几乎不支持递 归。6 『 l 数据检 索:XL M 中可 以直 接 检 索 一 个 文 件 中 的数 据 ,而 关系 数据库 往往 需要关 联检 索多 个表的数据 。7 .数据查询 :X L M 标准查 M 用X L 询语言X a h q e y p t 或X u r 查询 ,而关 系数据库用 标准查询语言SL 数据进行查询 。 Q对 4 M 向关系数据库 的转换 方案 、X L
2 0 . 1 ) -1 . 0 8 1 :1 8( 6 2 4
[] 2 邓华梅 , 肖锋 , 海 平. 关 于x L 李 袁 M 数据 的存储 研究 【] 科技 情报 开发 与经济, J.
20 8 8( 4 :1 -1 5 0 ,1 2 ) 3 . 5 5
由 上 可 知 X L 关 系 数 据 库 进 行 数 据 转 M 与
< i l > 年 < t te t te 流 / il>
<o p sr 陈 晓娟 <c m o e > cmoe > / o p sr
< e g h 3:0 / e g h ln t > 3 < ln t>
< e r 2 O1 / e r ya>0 <ya>
③对 于有 多值属 性需要 创建 一个单 独的 表 来 存 储 这 些 值 ,包 含 外 键 和 其 父 元 素 所 在 表 的主键形成 的链接 。 利用上 述规 则 ,可 以很 方便地 将 以上 的 XL M 示例文档转换为如 下二维表 :
应 用X L 为W b M作 e 数据 交换 的平台 ,能更好地 进 行信 息管理和 信息 交换 ,随着I t r e 的 n en t 不断发展 ,X L M 数据库 的应 用也必将越来越广
泛。
参考文献:
【 】翁 畅 平 . 基 于 xM l 数 字 图 书 L的 馆 信 息 组 织 [ ]. 科 技 情 报 开发 与 经 济 , J
换 的 最 大 困 难 是 由 非 层 次 和 层 次 的 差 别 而 导 致 的 。X [ 据 是 半 结 构 化 的 信 息 ,元 素 之 间 M 数
[】 其 华 . 网 络 环 境 下基 于 X L 异 构 3彭 M的 数据 交换 的研 究 [] 西南民族大学学报 : 自 J.
标记 ,具 有十分 强的 可扩展 性 。下面 是一个 XL M 文档的实例 ,描述 了一 个歌手 的姓名 、性 ・ 别、所唱 曲目等信息 。
.
C ip s l Ol o e l
ll el h
V a er
传奇 流年
王 菲 王 菲
李健 陈晓娟
表 2
42 0 33 : 0
2 l 0O 2 0 01
首先X L M 文档可扩 展能力 强 [ ] 1 ,允许用 户 自定义 标签 以及这 些标签 相关 参数 的属性 和 值 ;其 次 其 具 有 良 好 的 数 据 可 重 用 性 : 另 外 使 用 X L 档 具 有 较 强 的 平 台 独 立 性 。X L M文 M 可运行在 任何平 台和操 作系 统上 ,具有 结构 化 和标准 化的文 件模式 ;最 后 ,由于数 据可 被X L M 唯一标识 ,搜索 软件 无需 了解类 似传统 数 据库 的构建情 况 ,因此搜 索起来 会变 得 f 分容易 。但 X L M 也有其 自身 的不足 , ̄ D D H T 没 有 采 用X L M 的语 法规 则而 是基 于 正 则表 达式 的 , 描 述 能 力 有 限 : 约 束 定 义 能 力 不 足 ; 没 有 数据类 型的支 持; 不够结 构化 ,重用 的代
2 M 的 特 点 、X L
< i g r S n e >
! !!! 曼 = !
数据库 的比较研 究
文 ◎ 董 婧 ( 曲靖 师 范 学 院 计 算 机 科 学 与 工程 学 院 云 南 曲靖 )
薹圜
< i g r nm > 菲 < s n e a e s n e a e  ̄ /igrnm> <edr> <gne > gne 女 /edr < a i n l t > 国< n t o a iy ntoaiy中 / a i n lt >
② 由 复 杂 元 素 构 成 的 表 ,对 其 内 容 分 类 处 理 : 单 值 属 性 和 简 单 子 元 素 映 射 利 用 上 面 第 一 个 规 则 ; 对 于 复 杂 子 元 素 , 形 成 对 复 杂 子 元 素 对 象 的 引 用 , 关 系 数 据 库 中 , 实 体 间 的关系通过外键 引用来实现 ,而在X L M 数据库
2 3 2
.
5 、结 束 语 通 过 以 上 对 关 系 数 据 库 ̄ X L 据 库 的 比 HM 数 较 ,可 发现X B L D 具有更 强的灵 活性和可 D R B k 扩展 性 ,但X L M 还需解决数据 存储、索引 、冗 余 和查 询优化 等 问题 。它和关 系数据库 之 间 存 在着 大量 的数据 转换 ,实例 证明本文 所提 出的X L M 向关系数据库 的转换 方案是可行 的,
< on > s g
中,实体 间 的关 系通过 I R F M 元素 嵌套 D E 或X L
来 实 现 , 因 此 当 元 素 形 成 表 后 , 把 该 引 用 改 成 主 键 — — 外键 (r m r k y — — F r i n P iay e s o e g ky) e s 的表 示 形 式 。
< y e P p / y e tp>o<tp>
都既 要保持 数据源 内容的完整 性 ,又要保证 数据源 结构 的可恢 复性 。因此 可采用 如下转 换 规 则 [] 4: ① 单 值 属 性 和 简 单 元 素 直 接 映射 表 的
列。
<sne > /igr
< on > s g
然科学版, 0 32 ( : 5— . 2 0 , 96 7 6 78 ) 5 [ 4】董 东 ,马 丽 .x 据 库 和 关 系 L数 M 数 据 库 之 比 较 [ 计 算 机 工 程 与 设 J].
计 , 0 5 2 8 : 9— 0 9 2 0 , 6() 2 2 2 9 0
(r c s i g n tu to ) [ D T 段 。 其 中 p o e s n i sr c i n  ̄ C A A I
标 记 是 用 一 对 尖 括 号 来 表 示 ,元 素 内 容 可 以 是 文 本 数 据 , 也 可 以 是 X L 素 , 甚 至 是 该 M 元 元素 本身 。其语 法和 H M 类似 ,但是 X L TL M 的 优 势 在 于 其 允 许 用 户 可 以根 据 需 要 自 行 定 义
< i l > 奇 < t t e tte传 Ii1> <o p sr 李 健 < cm o e > cmo e> /o p s r
< e g h 4:0 I e g h ln t > 2 < ln t >
<e r 2 1 < ya > y a >O 0 / e r
< sn > / o g
价相对较高 。
S 蟮 Ol
XL M 文档 主要 由X L 素构 成 。每个 X L M元 M 元 素 包 括 3 分 : 开 始 标 记 、 元 素 内容 和 结 束 部 标 记 。标 记 包 括 六 个 内 容 : 元 素 (1 m n ) eee t, 属 性 ( t te at bu ), 实 体 引 用 ( nt ri e tY i r f r n e ) 注 释 ( o m n ) 处 理 指 令 ee ec s , Cmet ,