一种结合LDA主题分析的地理信息检索方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一种结合LDA主题分析的地理信息检索方法
盖森;刘建忠;熊伟;孙晨;张心悦
【期刊名称】《测绘科学技术学报》
【年(卷),期】2015(000)003
【摘要】地理信息检索可以根据用户查询请求在文档集中检索出与其空间相关的信息,是信息检索领域一个重要的研究方向。

传统的地理信息检索模型,将地理信息与主题信息分开考虑,忽略了两者之间的关系。

针对该问题,提出一种结合LDA主题分析的地理信息检索改进方法。

首先,通过LDA主题分析对检索文档集进行噪音剔除,然后挖掘查询请求和检索文档中地理信息和主题信息之间的关系,相似度计算采用夹角余弦和KL距离两种计算方法,并附加到查询请求和检索文档之间的相似度计算当中。

此处对搜狗文本分类语料库精简版和复旦文本分类测试语料库进行了LDA主题分析,并进行了检索测试。

实验表明改进模型能够较好地衡量地理信息与主题信息之间的关系,提高了检索的查准率。

%Geographical information retrieval can be used to retrieve spatial related information from the document collection according to the user query, which is an important research area of information retrieval. Conventional geographical information retrieval model deals with the geographical information and topic information separately, which ignores their relationship. Aiming at this problem, an improved settlement was put forward. At first, LDA topic analysis was used to remove noise of words and then exploit the relationship between geographical information and topic information in the query request and documents. Similarity was
calculated through cosine and KL dis-tance, which was attached to the comprehensive similarity. To terrify this method, the lite version of Sogou text categorization corpus and the Fudan text categorization testing corpus were applied with LDA topic analysis. The experimental results reveal that the improved model can measure the relationship between geographical information and topic information acceptably and improve the precision ratio.
【总页数】6页(P315-320)
【作者】盖森;刘建忠;熊伟;孙晨;张心悦
【作者单位】信息工程大学,河南郑州 450001;信息工程大学,河南郑州450001;信息工程大学,河南郑州 450001;信息工程大学,河南郑州 450001;信息工程大学,河南郑州 450001
【正文语种】中文
【中图分类】P208
【相关文献】
1.一种基于LDA的高分辨率遥感影像检索方法 [J], 沈盛彧;刘哲;张平仓;张彤;吴华意;陈小平
2.一种模块化2DPCA和CSLDA相结合的人脸验证算法 [J], 袁宁;吴小俊;王士同;杨静宇;Josef Kittler
3.一种基于主题爬行模式的地理信息分布式检索方法 [J], 王小康;邓硕;吴博;李景文
4.结合语义相似度改进LDA的文本主题分析 [J], 赵林静
5.一种结合改进Z-S 细化算法的书法字双层检索方法 [J], 邵荣堂; 李婕; 巩朋成; 张正文
因版权原因,仅展示原文概要,查看原文内容请购买。

相关文档
最新文档