基于全文检索的XML存储查询系统
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Ab t a t s r c XML d tb s a e n a mp ra tp r f h ed o aa a e , u sb s e sp o u t r u n o efc i l a e n a a a e h s b e n i o tn a t e f l f tb s b t t u i s r d c sa ep tit f t ot i d s i n e man yb s d o
连 接 查 询 算 法 的 问题 , 时借 助全 文 检 索 技 术 达 到 X 同 ML查询 加 速 的 效 果 。该 方 案 应 用 于 实 际软 件 开 发 项 目中 , 很好 地 解 决 了 X ML 文档 的关 系数 据 库 存 储 管理 工 作 , 并且 具 有 很 高 的查 询 效 率。 关 键 词 关 系数 据 库 X ML索 引编 码 结 构连 接 查 询 全 文 检 索
( eatetfC m ue Si c a dE gnei S ag a i tn nvrt,hn h i 0 2 0.hn ) Dp r n o p tr c ne n n i r g,h nh i a og U i sy S aga 0 4 C ia m o e e n Jo ei 2
S OR N A D T I G N QUE YI R NG Y T M OR XML B E ON F L T X E R E AL S SE F AS D UL E T R T I V
Qa h n za La hn i C a gh o i C a g o o
q ey n f ce c . u r ig ef in y i
Ke w r s y o d
R l i a d t ae X d xe c dn S u tr i u r F l t t e e a e t n l a s ML i e n o i ao a b n g t c a j nq e u x r r vl r u lo y le t i
d t b s s i r s le a d XML q e yn a e e p dt d w t h e p o u lt x e r v 1 h o u in i s d i n a t a ot r aa a e s e ov d, n u r i g c n b x e i i t e h l ff l e t r t e a.T e h i o wae
第2 8卷 第 3期
2 1 年 3月 01
计 算机 应 用与软 件
Co p tr App iai n n o wa e m ue l t sa d S f r c o t
V0. 8 N0 3 12 .
M a . 01l r2
基 于全文检索 的 X ML存 储 查 询 系统
但是半结构化 的 XM I文档和纯文本文档毫无二致 ; 此外结构连 接查询算法执行 时, 就相 当于作用 在原始 的 X ML文 档上 , 根本 不 能体现关 系数 据库存储 的优势 。 本文针对关 系数据库 管理 X ML数据 的问题 , 设计 了 ie e D wy 征, X 但 ML本质上只是一种 数据 格式 , 核心并 不在 于 如何 管 其 理数据 , 这就要借助于数据库系统 。投入商业应用的纯 X L数 M
i e o ei poi d wt w ihtepolm o tg t gfl tx rtea t h o g n ML su t a ji q e igi rlinl n xcd r d , i hc rbe i er i ul et er vl e nl yad X t c rl on ur n e t a d s ve h h f n an i c o r u y n ao
些 问题 。例 如, SS L Sre 将 X L文 档看 作一种 单独 的数 M Q evr M
0 引 言
Xa Pt X ur h和 Q e y的发 展 成 熟 , 得 X L具 有 了 数 据 库 的 特 使 M
据类型 , 整个 文 档 存储 在 一 个 字 段 中 。虽 然 可 以构 建 倒 排 索 引 ,
te r lt n ld tb s s wh c e n tl rn n s me t u ls F c n e sta in o o i g XML d t n r lt n l aa a e , e h ea i a aa a e , ih d f i y b i g i o r be . a i g t i t fs r o i e o h u o t n aa i e ai a d tb s s a n w XML o
d v l pn r g a e eo i g p o m wh c h s r i h a wel e l i t e l d a t t h ma a e n o e ain l aa a e tr o XM[ o me t a d h w a o d w h n g me t f r lt a d tb s s e f o o d ( u n S n s o s g o
乔长昭 廖 畅
( 海 交 通 大 学 计 算 机科 学 与 工 程 系 上 上 海 204 020
摘 要
XML数据库 已经成为数据库领域 的重要成 员, 但是在 商业数据库 产 品中它主要构建 在甍 系数播 霹基础之 上, 自然 引 这
入很 多难题。针对 X ML的关 系数据 库存绪 , 出一种新 的 X 提 ML索引编码 , 解决 了在 关 系数据 库 中集 成全 支检 索技术 和 X ML结构
连 接 查 询 算 法 的 问题 , 时借 助全 文 检 索 技 术 达 到 X 同 ML查询 加 速 的 效 果 。该 方 案 应 用 于 实 际软 件 开 发 项 目中 , 很好 地 解 决 了 X ML 文档 的关 系数 据 库 存 储 管理 工 作 , 并且 具 有 很 高 的查 询 效 率。 关 键 词 关 系数 据 库 X ML索 引编 码 结 构连 接 查 询 全 文 检 索
( eatetfC m ue Si c a dE gnei S ag a i tn nvrt,hn h i 0 2 0.hn ) Dp r n o p tr c ne n n i r g,h nh i a og U i sy S aga 0 4 C ia m o e e n Jo ei 2
S OR N A D T I G N QUE YI R NG Y T M OR XML B E ON F L T X E R E AL S SE F AS D UL E T R T I V
Qa h n za La hn i C a gh o i C a g o o
q ey n f ce c . u r ig ef in y i
Ke w r s y o d
R l i a d t ae X d xe c dn S u tr i u r F l t t e e a e t n l a s ML i e n o i ao a b n g t c a j nq e u x r r vl r u lo y le t i
d t b s s i r s le a d XML q e yn a e e p dt d w t h e p o u lt x e r v 1 h o u in i s d i n a t a ot r aa a e s e ov d, n u r i g c n b x e i i t e h l ff l e t r t e a.T e h i o wae
第2 8卷 第 3期
2 1 年 3月 01
计 算机 应 用与软 件
Co p tr App iai n n o wa e m ue l t sa d S f r c o t
V0. 8 N0 3 12 .
M a . 01l r2
基 于全文检索 的 X ML存 储 查 询 系统
但是半结构化 的 XM I文档和纯文本文档毫无二致 ; 此外结构连 接查询算法执行 时, 就相 当于作用 在原始 的 X ML文 档上 , 根本 不 能体现关 系数 据库存储 的优势 。 本文针对关 系数据库 管理 X ML数据 的问题 , 设计 了 ie e D wy 征, X 但 ML本质上只是一种 数据 格式 , 核心并 不在 于 如何 管 其 理数据 , 这就要借助于数据库系统 。投入商业应用的纯 X L数 M
i e o ei poi d wt w ihtepolm o tg t gfl tx rtea t h o g n ML su t a ji q e igi rlinl n xcd r d , i hc rbe i er i ul et er vl e nl yad X t c rl on ur n e t a d s ve h h f n an i c o r u y n ao
些 问题 。例 如, SS L Sre 将 X L文 档看 作一种 单独 的数 M Q evr M
0 引 言
Xa Pt X ur h和 Q e y的发 展 成 熟 , 得 X L具 有 了 数 据 库 的 特 使 M
据类型 , 整个 文 档 存储 在 一 个 字 段 中 。虽 然 可 以构 建 倒 排 索 引 ,
te r lt n ld tb s s wh c e n tl rn n s me t u ls F c n e sta in o o i g XML d t n r lt n l aa a e , e h ea i a aa a e , ih d f i y b i g i o r be . a i g t i t fs r o i e o h u o t n aa i e ai a d tb s s a n w XML o
d v l pn r g a e eo i g p o m wh c h s r i h a wel e l i t e l d a t t h ma a e n o e ain l aa a e tr o XM[ o me t a d h w a o d w h n g me t f r lt a d tb s s e f o o d ( u n S n s o s g o
乔长昭 廖 畅
( 海 交 通 大 学 计 算 机科 学 与 工 程 系 上 上 海 204 020
摘 要
XML数据库 已经成为数据库领域 的重要成 员, 但是在 商业数据库 产 品中它主要构建 在甍 系数播 霹基础之 上, 自然 引 这
入很 多难题。针对 X ML的关 系数据 库存绪 , 出一种新 的 X 提 ML索引编码 , 解决 了在 关 系数据 库 中集 成全 支检 索技术 和 X ML结构