基于LDA特征选择的文本聚类

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于LDA特征选择的文本聚类
张梦笑;王素格;王智强
【期刊名称】《电脑开发与应用》
【年(卷),期】2012(25)1
【摘要】特征选择在文本聚类中起着至关重要的作用,将产生式模型Latent Dirichlet Allocation(LDA)引入基于K-means算法的文本聚类中,通过提取特征与隐含主题的关系进行特征选择.在第2届中文倾向性分析评测的语料上的实验结果表明,当选择2%的特征时,相对于单词贡献度(TC,Term Contribution)方法的纯度和F值分别提高了0.15和0.16,相对于LDA直接得到文本与主题的关系的实验结果的纯度和F值分别提高了0.14和0.13.
【总页数】5页(P1-5)
【作者】张梦笑;王素格;王智强
【作者单位】山西大学数学科学学院,太原030006;山西大学计算机与信息技术学院,太原030006;山西大学计算智能与中文信息处理教育部重点实验室,太原030006;山西大学计算机与信息技术学院,太原030006
【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于VSM和LDA混合模型的文本聚类研究 [J], 刘晓蒙;熊海涛
2.基于LDA模型的文本聚类检索 [J], 李霄野;李春生;李龙;张可佳
3.基于LDA改进的K-means算法在短文本聚类中的研究 [J], 冯靖;莫秀良;王春东
4.基于LDA的英汉维文本聚类系统的设计与实现 [J], TIAN Liang;Tuergen Yibulayin;Hasan Wumaier;Kahaerjiang Abiderexiti
5.基于LDA模型和文本聚类的水族文献主题挖掘研究 [J], 杨秀璋
因版权原因,仅展示原文概要,查看原文内容请购买。

相关文档
最新文档