一种短文本主题特征的改进方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一种短文本主题特征的改进方法
郑诚;代宁
【期刊名称】《工业控制计算机》
【年(卷),期】2015(000)008
【摘要】This paper presents an improved method for short text based on LDA.ln this case,acquiring couple word co-occurrence to model instead of the traditional word co-occurrence way.The method can al eviate the data sparseness problem and improve the performance of the model.The experimental results on real data sets show that the performance of this method has better promotion compared to the traditional topic model.%
主题模型被用来进行文本主题挖掘已经被证明是一个非常有效的手段,随着即时通讯的发展,挖掘短文本的主题特征也变得越来越重要。
由于短文本的稀疏性,把传统的主题模型(如LDA)直接用在短文本上,生成的主题特征效果并不好。
在研
究LDA主题模型的基础上,提出一种改进的短文本主题特征提取方法。
在此方法中,通过对每篇短文本获取“词对”共现的方式来对文本建模,代替传统的“词”共现的方式,这种方式一定程度上能缓解数据稀疏的问题,提高了主题特征的效果。
在真实数据集上的实验表明,方法相比于传统主题模型,在短文本特征提取方面有较好的提升。
【总页数】3页(P110-112)
【作者】郑诚;代宁
【作者单位】安徽大学计算智能与信号处理教育部重点实验室,安徽合肥230601; 安徽大学计算机科学与技术学院,安徽合肥230601;安徽大学计算智能与信号处理教育部重点实验室,安徽合肥 230601; 安徽大学计算机科学与技术学院,安徽合肥230601
【正文语种】中文
【相关文献】
1.融合BTM主题特征的短文本分类方法 [J], 郑诚;吴文岫;代宁
2.一种针对短文本的主题情感混合模型 [J], 谢珺;郝洁;苏婧琼;邹雪君;李思宇
3.一种改进的短文本流主题演化模型 [J], 林特;赵晓东;柳先辉
4.一种结合主题模型与段落向量的短文本聚类方法 [J], 饶毓和;凌志浩
5.一种融合Wikipedia类图和主题特征的短文本检索方法 [J], 李璞;肖宝;孙玉胜;张志锋;邓璐娟
因版权原因,仅展示原文概要,查看原文内容请购买。