Rtop-k基于结构松弛的XML关键字近似查询方法
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 2 ( ) ) 辽宁工业大学电子与信息工程学院 锦州 1 辽宁工业大学计算中心 锦州 1 2 1 0 0 1 2 1 0 0 1 ( 3 ( ) 辽宁工程技术大学电子与信息工程学院 葫芦岛 1 2 5 1 0 5
摘 要 目前 , 现有的大多数关键字查 询 方 法 都 是 计 算 XML 包 含 关 键 字 元 素 的 最 紧 致 片 段 , 这类方法大都忽略了 而 XML 结构化查询 能 够 准 确 捕 捉 用 户 查 询 的 信 息 , 具 有 较 高 的 准 确 率。将 结 构 化 查 XML 文档中嵌入的结构关系 , 询方法与关键字信息检索相结合 , 通过分析关键字与 XML 文档的结构关系判断 用 户 查 询 的 需 求 , 将面向对象的思想 ) 。实验结果表明, 和松弛查询的方法引入到关键字查询方法中 , 提出一个新的 XML 关 键 字 近 似 查 询 框 架 ( 所 R t o k - p 具有较高的查全率和查准率 。 提近似查询方法能够较为准确地捕捉用户的查询意图 , 关键词 XML, 关键字 , 松弛查询 , 对象 中图法分类号 Байду номын сангаасT P 3 1 1. 1 3 文献标识码 A
, A b s t r a c t e c e n t l m o s t o f e x i s t i n a l o r i t h m s f o r k e w o r d s s e a r c h a l w a s c o m u t e t h e m o s t c o m a c t f r a m e n t s R y g g y y p p g , c o n t a i n k e w o r d s . H o w e v e r m a n o f t h e s e m e t h o d s d o n o t t a k e t h e s t r u c t u r e r e l a t i o n s h i e m b e d d e d i n t h e XML w h i c h - y y p , i n t o c o n s i d e r a t i o n . F o r t h e s t r u c t u r a l o f XML d o c u m e n t s i t a l w a s h a s a h i h e r a c c u r a c a s i t c a n c a d o c u m e n t u e r - y g y p q y , t u r e t h e i n f o r m a t i o n s e a r c h e d b u s e r s a c c u r a t e l . I n t h i s w e c o m b i n e t h e m e t h o d s o f s t r u c t u r a l t o e t h e r a e r u e r y y g p p q y , ’ w i t h t h e k e w o r d i n f o r m a t i o n r e t r i e v a l a n d i n f e r t h e n e e d s o f u s e r s t h r o u h a n a l z i n t h e r e l a t i o n s h i b e t w e e n u e r y g y g p q y u e r k e w o r d s a n d t h e s t r u c t u r e o f t h e XML d o c u m e n t . W e i n t r o d u c e t h e t h i n k i n o f o b e c t o r i e n t e d a n d t h e o f r e l a x a - - q y y g j , u e r r o o s e r o x i m i t u e r t i o n i n t o k e w o r d m e t h o d s a n d a n e w a r c h i t e c t u r e o f k e w o r d R t o k) . E x e r i m e n t a l - q y p p p y q y( y y p p s h o w t h a t o u r m e t h o d c a n c a t u r e t h e s e a r c h i n t e n t i o n o f u s e r s a c c u r a t e l w i t h h i h r e c a l l a n d r e c i s i o n . r e s u l t s - p y g p , , u e r K e w o r d R e l a x a t i o n O b e c t K e w o r d s XML, q y y j y 匹配结果在结构化查询中比较容易实现 。
第3 9卷 第1 1 A期 2 0 1 2年1 1月
计 算 机 科 学 C o m u t e r c i e n c e S p
V o l . 3 9N o . 1 1 A N o v 2 0 1 2
: 基于结构松弛的 XML 关键字近似查询方法 R t o k - p
李 婷1 李 昕2 孟祥福3
: R t o k A K e w o r d P r o x i m i t S e a r c h M e t h o d B a s e d o n S t r u c t u r e R e l a x a t i o n - p y y
1 2 3 L I T i n I X i n NG X i a n f u ME - g L g 1 ( , , ) C o l l e e E l e c t r o n i c s &I n f o r m a t i c s E n i n e e r i n L i a o n i n U n i v e r s i t o f T e c h n o l o J i n z h o u 1 2 1 0 0 1, C h i n a g g g g y g y 2 ( , , ) C o m u t i n C e n t e r L i a o n i n U n i v e r s i t o f T e c h n o l o J i n z h o u 1 2 1 0 0 1, C h i n a p g g y g y 3 ( , , ) C o l l e e o f E l e c t r o n i c s a n d I n f o r m a t i o n E n i n e e r i n L i a o n i n T e c h n i c a l U n i v e r s i t H u l u d a o 1 2 5 1 0 5, C h i n a g g g g y
摘 要 目前 , 现有的大多数关键字查 询 方 法 都 是 计 算 XML 包 含 关 键 字 元 素 的 最 紧 致 片 段 , 这类方法大都忽略了 而 XML 结构化查询 能 够 准 确 捕 捉 用 户 查 询 的 信 息 , 具 有 较 高 的 准 确 率。将 结 构 化 查 XML 文档中嵌入的结构关系 , 询方法与关键字信息检索相结合 , 通过分析关键字与 XML 文档的结构关系判断 用 户 查 询 的 需 求 , 将面向对象的思想 ) 。实验结果表明, 和松弛查询的方法引入到关键字查询方法中 , 提出一个新的 XML 关 键 字 近 似 查 询 框 架 ( 所 R t o k - p 具有较高的查全率和查准率 。 提近似查询方法能够较为准确地捕捉用户的查询意图 , 关键词 XML, 关键字 , 松弛查询 , 对象 中图法分类号 Байду номын сангаасT P 3 1 1. 1 3 文献标识码 A
, A b s t r a c t e c e n t l m o s t o f e x i s t i n a l o r i t h m s f o r k e w o r d s s e a r c h a l w a s c o m u t e t h e m o s t c o m a c t f r a m e n t s R y g g y y p p g , c o n t a i n k e w o r d s . H o w e v e r m a n o f t h e s e m e t h o d s d o n o t t a k e t h e s t r u c t u r e r e l a t i o n s h i e m b e d d e d i n t h e XML w h i c h - y y p , i n t o c o n s i d e r a t i o n . F o r t h e s t r u c t u r a l o f XML d o c u m e n t s i t a l w a s h a s a h i h e r a c c u r a c a s i t c a n c a d o c u m e n t u e r - y g y p q y , t u r e t h e i n f o r m a t i o n s e a r c h e d b u s e r s a c c u r a t e l . I n t h i s w e c o m b i n e t h e m e t h o d s o f s t r u c t u r a l t o e t h e r a e r u e r y y g p p q y , ’ w i t h t h e k e w o r d i n f o r m a t i o n r e t r i e v a l a n d i n f e r t h e n e e d s o f u s e r s t h r o u h a n a l z i n t h e r e l a t i o n s h i b e t w e e n u e r y g y g p q y u e r k e w o r d s a n d t h e s t r u c t u r e o f t h e XML d o c u m e n t . W e i n t r o d u c e t h e t h i n k i n o f o b e c t o r i e n t e d a n d t h e o f r e l a x a - - q y y g j , u e r r o o s e r o x i m i t u e r t i o n i n t o k e w o r d m e t h o d s a n d a n e w a r c h i t e c t u r e o f k e w o r d R t o k) . E x e r i m e n t a l - q y p p p y q y( y y p p s h o w t h a t o u r m e t h o d c a n c a t u r e t h e s e a r c h i n t e n t i o n o f u s e r s a c c u r a t e l w i t h h i h r e c a l l a n d r e c i s i o n . r e s u l t s - p y g p , , u e r K e w o r d R e l a x a t i o n O b e c t K e w o r d s XML, q y y j y 匹配结果在结构化查询中比较容易实现 。
第3 9卷 第1 1 A期 2 0 1 2年1 1月
计 算 机 科 学 C o m u t e r c i e n c e S p
V o l . 3 9N o . 1 1 A N o v 2 0 1 2
: 基于结构松弛的 XML 关键字近似查询方法 R t o k - p
李 婷1 李 昕2 孟祥福3
: R t o k A K e w o r d P r o x i m i t S e a r c h M e t h o d B a s e d o n S t r u c t u r e R e l a x a t i o n - p y y
1 2 3 L I T i n I X i n NG X i a n f u ME - g L g 1 ( , , ) C o l l e e E l e c t r o n i c s &I n f o r m a t i c s E n i n e e r i n L i a o n i n U n i v e r s i t o f T e c h n o l o J i n z h o u 1 2 1 0 0 1, C h i n a g g g g y g y 2 ( , , ) C o m u t i n C e n t e r L i a o n i n U n i v e r s i t o f T e c h n o l o J i n z h o u 1 2 1 0 0 1, C h i n a p g g y g y 3 ( , , ) C o l l e e o f E l e c t r o n i c s a n d I n f o r m a t i o n E n i n e e r i n L i a o n i n T e c h n i c a l U n i v e r s i t H u l u d a o 1 2 5 1 0 5, C h i n a g g g g y