一种融合词语位置特征的Lucene相似度评分算法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一种融合词语位置特征的Lucene相似度评分算法
白培发;王成良;徐玲
【期刊名称】《计算机工程与应用》
【年(卷),期】2014(000)002
【摘要】相似度评分算法是Lucene引擎中的核心部分之一。

对Lucene内部的相似度评分算法进行研究分析后,针对Lucene只关心查询词出现的频率,而不关心它们所在的位置这一缺陷提出了一种改进的算法。

改进的算法将词语位置关系特征融合到Lucene原始相似度评分算法中。

在TREC数据集上的实验结果表明:改进后的算法与Lucene原始算法相比,在MAP和P@n指标上都有一定程度的提高。

%The scoring algorithm of similarity is one of the core parts in Lucene. After the analysing and researching on the default scoring algorithm of Lucene similarity, this paper proposes an improved algorithm aimed at the deficiency of the Lucene’s default algorithm which only considers the frequencies rather than the position of query terms occurrence. The improved algorithm combines the feature of the terms’position relationship with Lucene’s default scoring algorithm of similarity. The experiment on the TREC dataset shows that, the improved algorithm increases the value of evaluation metric MAP and P@n to a certain extent.【总页数】5页(P129-132,161)
【作者】白培发;王成良;徐玲
【作者单位】重庆大学计算机学院,重庆 400030;重庆大学计算机学院,重庆400030; 重庆大学软件学院,重庆 400030;重庆大学软件学院,重庆 400030【正文语种】中文
【中图分类】TP311
【相关文献】
1.融合用户相似度与评分信息的协同过滤算法 [J], 乔雨;李玲娟
2.融合位置相关和概率排序的Lucene排序算法改进 [J], 胡博;蒋宗礼
3.一种改进的Lucene语义相似度检索算法 [J], 黄承慧;印鉴;陆寄远
4.融合词性与位置信息改进的Lucene排序算法 [J], 苏琴;谢卫华
5.融合用户评分与显隐兴趣相似度的协同过滤推荐算法 [J], 武建新;张志鸿
因版权原因,仅展示原文概要,查看原文内容请购买。

相关文档
最新文档