XML文档在关系数据库中存储与查询的实现
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
( n d s) ) o e(。 和
①将 XML文 档作为一个整体存 储在
数据库的某一列 中,它的基本存储单 元是
XML文 档 。 ⑦将XMI 文档看成一种 图结构 , 进行
一
4 ̄ ML数据 的查 询
5 结束 语
XML 已经逐渐 成为Itme上数据 现 ne t 现 已 提 出 多 种 查 询 语 言 , 如 XP t a h、 定的分解 ,然后将其元素和值存 储在关 f XQ ey u r 、XML QL等 ,这 些语 言均是通 i 表示 和交换的新的标准 ,而关 系数据库 则 2
引 言
XMLe e s l Mak pL n u g ) ( ni e Xt b ru a g a e 即可扩 展标记 语言 ,是 由 w 3 WO i C( r d wie we o s rim) 19 年2月发 d b C n ot u 于 98
向的超 链接 等等方面的一些不足之处。
32 . 基于关 系数据 库系统的存储 方法
目前提 出 的 XML RD — B存 储 方 法 主
要3 : 类
XML 据的存储和查询 , 面向对象数据 数 而 库在查询 优化上 存在的 问题 制约 了 XM L 数据的查询分解 和优化。
档 。XML数据 类型提 供 了四个检索 XML 值或 实例的方法 : u r (、 au (、 x s q ey ) v le) e i t
2 ML与关 系数据 库 X
XML 文档属于半结构化的数据 , 而关 系数据库管理 系统(RDB ) 用二 维表 MS采 作 为存 储数 据 的模 型 ,表格 由行和 列组
成 ,列 用 于 表 示 组 成 数 据 有 效 信 息 的 属 性 ,行 则是 用于 指示 一 条完整 的数 据 记 录。 XML 档 与 结 构 化 的关 系数 据 库 进 行 文 转 换 时 , 键 问题 是 如 何 将 X L 档 的结 关 M 文
系数据库中。 ③ 采 用 一 定 的 映 射 规 则 , 直 接 将 XML 文档模 式( 或从X 文档 中抽取 出模 ML
.
随 ML日益 过路径表达式 实现 对XML 文档的查询 。 按 是非 常成熟的数据库技 术 , 着X 照查询处理方式 , 这些优化 方法基本上可 f 广泛 的应用 , 将进一步推动XML 数据 库技
3 ML的一般 存储模 式 x
31 . 以文本文件保存 XML数据 可 以 将 一 个 XML文 档 存 储 成 一 个文 本文件 ,并且实现一个查询引擎 ,当查询
被执行的时候 , XML 文件被解析成驻 留在 内存的一棵树 。只要查询计算还需要树 中
的结点 ,这棵树 就必须驻 留在内存里。
布的一种标准 。 ML X 描述 的 数据本身的 意义和数据实体之 间的复杂嵌 套关 系 , 这
使 得 XMI 能 表 示 结 构 化 的 数 据 , 关 系 既 如
和对 象数据 ,又能 够表 示半 结构 化的 数 据 ,如 We b数据 。XML现 已经逐渐成为 Itr e 上数 据表 示和交换的新的标准 。 nen t
D :1 .9 9 ji n 10 — 9 2 2 1 9 0 7 OI 0 3 6 / . s .0 1 8 7 .0 0 1 .3 s
XML文档在关系数据库 中
存储 与查询 的实现
张艳华
1 东营 职 业 学 院 计算 机 系 2 7 9 . 50 1
2 中国石 油大学 ( 东)计算 机与通信工程 学院 2 7 6 . 华 5O1
子节点有相应的原子数据值 ( XML子元素 系列简单路径 ,通过节点 问的 包含 /拥 f 内容 /属性值) 。如果 X ML文档 实例 中有 J有关系连接来求满足所求关系的节点集 且考 虑元素 间的 引用 ,则 它是 一个 图模 型 ,否则是一个树模型 ;如果 考虑 X ML 元素次序 ,则成为一种有序模 型。 3 3对象管理 器方法 . 合, 然后将 多条简单路径的查询结果 连接 起来 。 这种 方法虽然不需要对整 个搜 索空 间进行遍历 ,但对于长度 为 n的路径 ,需
:
②路 径连接方法 。 针对 图的遍历方法
搜索空间较大的问题 ,为了减小搜索空 f
根据 编码 判 断节 点之 间 的父子 关 系和 祖 : 先 /后 代 关 系 。查 询 时 将 查 询 路 径 分 解 成
一
对象( XML元素) 并赋予一个唯一标识 , 节 ;间 , 通过对 XML文档 中的节点进行编码 ,
构与关 系数据库数据的结构即关 系表对应 起来 ,也就是需要建立不 同结构 层次之 间 的映射关 系。
1什 么 是 XML
XML既是可扩展 的 (Xtn il)一 e es e b 种元标记语言 ,又是一种 可定义 自己的新 的标 记语言 ,标记是核心 ,功 能更加的强 大 , 同时 还规 定 了它 特有 的 一 套标 签 。 X 在很 多方面更具 有优势 , ML 比如开发灵 活的 We b应用软件 , 更有意 义的搜 索 , 当 然 XM 有一 点缺 陷就是 能 充分支 持 L也 X ML的应 用处理程 序不多。 XML 的出现有它的必然性 , 可以弥补 HT L 言语 义性 差 、格 式 固定 、 以 扩 M 语 难 展、交互性差 、内部结构的条理性差 、单
以 分 四类 :
术的新发展。
式信息)映射到相应的关 系模式 ,然后再 ①图的遍历方法 。把 X ML文档看成 根据映射模式存储相应 的XML 文档 。 这种 J图, 对给定的查询, 通过对X 文档图进 j ML 方法能够利用关 系数据库 的特性 ,如查询 』行遍历来实现查找过程。 按照遍历方式不 优化和并发性控制等 。 同分为 自顶 向下遍 历、自底 向上遍历和混 } XM L 系 存 储 的 核 心 是 XML文 档 到 合遍 历三种 。该类方法搜索空 间较大 , 关 查 1 RD B的模式映射方法 , 包括模 型映射 和结 构映射 。 一个XML 文档实例可 用类似 对象 交换模型的变种来表示 。每个节 点表示个 点的每一条边 表示 相应对象 的一个属性并 用属性名( xML子元素 /属性 名) 注 ,叶 标 询的时 间开销 和空间开销均较大 。
①将 XML文 档作为一个整体存 储在
数据库的某一列 中,它的基本存储单 元是
XML文 档 。 ⑦将XMI 文档看成一种 图结构 , 进行
一
4 ̄ ML数据 的查 询
5 结束 语
XML 已经逐渐 成为Itme上数据 现 ne t 现 已 提 出 多 种 查 询 语 言 , 如 XP t a h、 定的分解 ,然后将其元素和值存 储在关 f XQ ey u r 、XML QL等 ,这 些语 言均是通 i 表示 和交换的新的标准 ,而关 系数据库 则 2
引 言
XMLe e s l Mak pL n u g ) ( ni e Xt b ru a g a e 即可扩 展标记 语言 ,是 由 w 3 WO i C( r d wie we o s rim) 19 年2月发 d b C n ot u 于 98
向的超 链接 等等方面的一些不足之处。
32 . 基于关 系数据 库系统的存储 方法
目前提 出 的 XML RD — B存 储 方 法 主
要3 : 类
XML 据的存储和查询 , 面向对象数据 数 而 库在查询 优化上 存在的 问题 制约 了 XM L 数据的查询分解 和优化。
档 。XML数据 类型提 供 了四个检索 XML 值或 实例的方法 : u r (、 au (、 x s q ey ) v le) e i t
2 ML与关 系数据 库 X
XML 文档属于半结构化的数据 , 而关 系数据库管理 系统(RDB ) 用二 维表 MS采 作 为存 储数 据 的模 型 ,表格 由行和 列组
成 ,列 用 于 表 示 组 成 数 据 有 效 信 息 的 属 性 ,行 则是 用于 指示 一 条完整 的数 据 记 录。 XML 档 与 结 构 化 的关 系数 据 库 进 行 文 转 换 时 , 键 问题 是 如 何 将 X L 档 的结 关 M 文
系数据库中。 ③ 采 用 一 定 的 映 射 规 则 , 直 接 将 XML 文档模 式( 或从X 文档 中抽取 出模 ML
.
随 ML日益 过路径表达式 实现 对XML 文档的查询 。 按 是非 常成熟的数据库技 术 , 着X 照查询处理方式 , 这些优化 方法基本上可 f 广泛 的应用 , 将进一步推动XML 数据 库技
3 ML的一般 存储模 式 x
31 . 以文本文件保存 XML数据 可 以 将 一 个 XML文 档 存 储 成 一 个文 本文件 ,并且实现一个查询引擎 ,当查询
被执行的时候 , XML 文件被解析成驻 留在 内存的一棵树 。只要查询计算还需要树 中
的结点 ,这棵树 就必须驻 留在内存里。
布的一种标准 。 ML X 描述 的 数据本身的 意义和数据实体之 间的复杂嵌 套关 系 , 这
使 得 XMI 能 表 示 结 构 化 的 数 据 , 关 系 既 如
和对 象数据 ,又能 够表 示半 结构 化的 数 据 ,如 We b数据 。XML现 已经逐渐成为 Itr e 上数 据表 示和交换的新的标准 。 nen t
D :1 .9 9 ji n 10 — 9 2 2 1 9 0 7 OI 0 3 6 / . s .0 1 8 7 .0 0 1 .3 s
XML文档在关系数据库 中
存储 与查询 的实现
张艳华
1 东营 职 业 学 院 计算 机 系 2 7 9 . 50 1
2 中国石 油大学 ( 东)计算 机与通信工程 学院 2 7 6 . 华 5O1
子节点有相应的原子数据值 ( XML子元素 系列简单路径 ,通过节点 问的 包含 /拥 f 内容 /属性值) 。如果 X ML文档 实例 中有 J有关系连接来求满足所求关系的节点集 且考 虑元素 间的 引用 ,则 它是 一个 图模 型 ,否则是一个树模型 ;如果 考虑 X ML 元素次序 ,则成为一种有序模 型。 3 3对象管理 器方法 . 合, 然后将 多条简单路径的查询结果 连接 起来 。 这种 方法虽然不需要对整 个搜 索空 间进行遍历 ,但对于长度 为 n的路径 ,需
:
②路 径连接方法 。 针对 图的遍历方法
搜索空间较大的问题 ,为了减小搜索空 f
根据 编码 判 断节 点之 间 的父子 关 系和 祖 : 先 /后 代 关 系 。查 询 时 将 查 询 路 径 分 解 成
一
对象( XML元素) 并赋予一个唯一标识 , 节 ;间 , 通过对 XML文档 中的节点进行编码 ,
构与关 系数据库数据的结构即关 系表对应 起来 ,也就是需要建立不 同结构 层次之 间 的映射关 系。
1什 么 是 XML
XML既是可扩展 的 (Xtn il)一 e es e b 种元标记语言 ,又是一种 可定义 自己的新 的标 记语言 ,标记是核心 ,功 能更加的强 大 , 同时 还规 定 了它 特有 的 一 套标 签 。 X 在很 多方面更具 有优势 , ML 比如开发灵 活的 We b应用软件 , 更有意 义的搜 索 , 当 然 XM 有一 点缺 陷就是 能 充分支 持 L也 X ML的应 用处理程 序不多。 XML 的出现有它的必然性 , 可以弥补 HT L 言语 义性 差 、格 式 固定 、 以 扩 M 语 难 展、交互性差 、内部结构的条理性差 、单
以 分 四类 :
术的新发展。
式信息)映射到相应的关 系模式 ,然后再 ①图的遍历方法 。把 X ML文档看成 根据映射模式存储相应 的XML 文档 。 这种 J图, 对给定的查询, 通过对X 文档图进 j ML 方法能够利用关 系数据库 的特性 ,如查询 』行遍历来实现查找过程。 按照遍历方式不 优化和并发性控制等 。 同分为 自顶 向下遍 历、自底 向上遍历和混 } XM L 系 存 储 的 核 心 是 XML文 档 到 合遍 历三种 。该类方法搜索空 间较大 , 关 查 1 RD B的模式映射方法 , 包括模 型映射 和结 构映射 。 一个XML 文档实例可 用类似 对象 交换模型的变种来表示 。每个节 点表示个 点的每一条边 表示 相应对象 的一个属性并 用属性名( xML子元素 /属性 名) 注 ,叶 标 询的时 间开销 和空间开销均较大 。