一种改进的TFIDF网页关键词提取方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一种改进的TFIDF网页关键词提取方法
李静月;李培峰;朱巧明
【期刊名称】《计算机应用与软件》
【年(卷),期】2011(028)005
【摘要】Although the classical TFIDF-based keywords extraction method is easy to implement and has low time cost,its results are not good enough to acquire features which play key roles in the text content. This paper proposes such a method,it uses the improved TFIDF formula to extract keywords by means of extended synonym dictionary and based on the considerations of the structure feature of Chinese texts and the lexical category feature of Chinese words and phrases. Experimental results show that our method outperforms the classical method evidently, and is able to extract satisfied results.%传统TFIDF用的特征.提出了一种在考虑中文文本结构特征和中文词语词性特征的基础上,借助扩展的同义词词林,利用改进的TFIDF公式来提取的方法.实验结果表明:该方法明显优于传统方法,能够抽取到令人满意的结果.【总页数】3页(P25-27)
【作者】李静月;李培峰;朱巧明
【作者单位】苏州大学计算机科学与技术学院,江苏,苏州,215006;苏州大学计算机科学与技术学院,江苏,苏州,215006;苏州大学计算机科学与技术学院,江苏,苏
州,215006
【正文语种】中文
【相关文献】
1.一种基于TFIDF方法的中文关键词抽取算法 [J], 徐文海;温有奎
2.基于TFIDF算法的关键词提取方法 [J], 章志华;陆海良;郁钢
3.基于网页特征的TFIDF改进算法 [J], 宋斌;方小璐
4.一种改进混合文本密度的网页信息提取方法 [J], 陈壮;葛斌
5.基于Scopus检索和TFIDF的论文关键词自动提取方法 [J], 陈列蕾;方晖
因版权原因,仅展示原文概要,查看原文内容请购买。

相关文档
最新文档