基于LDA模型的论坛热点话题识别和追踪
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于LDA模型的论坛热点话题识别和追踪
徐佳俊;杨飏;姚天昉;付中阳
【期刊名称】《中文信息学报》
【年(卷),期】2016(0)1
【摘要】在当今处于信息数量爆炸式增长的互联网时代,如何分析海量文本中的信息并从而提取出所蕴含的有利用价值的部分,是一个值得关注的问题.然而论坛语料作为网络语料,其结构和内容较一般语料相比更为复杂,文本也更加短小.该文提出的方法利用LDA模型对语料集进行建模,将话题从中抽取出来,根据生成的话题空间找到相应的话题支持文档,计算文档支持率作为话题强度;将话题强度反映在时间轴上,得到话题的强度趋势;通过在不同时间段上对语料重新建模,并结合全局话题,得到话题的内容演化路径.实验结果说明,上述方法是合理和有效的.
【总页数】7页(P43-49)
【作者】徐佳俊;杨飏;姚天昉;付中阳
【作者单位】萨尔州大学-上海交通大学语言技术联合实验室,上海交通大学计算机系,上海200240;萨尔州大学-上海交通大学语言技术联合实验室,上海交通大学计算机系,上海200240;萨尔州大学-上海交通大学语言技术联合实验室,上海交通大学计算机系,上海200240;萨尔州大学-上海交通大学语言技术联合实验室,上海交通大学计算机系,上海200240
【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于改进的ccLDA多数据源热点话题检测模型 [J], 陈兴蜀;马晨曦;王文贤;高悦;王海舟
2.基于改进的ccLDA多数据源热点话题检测模型 [J], 陈兴蜀;马晨曦;王文贤;高悦;王海舟;;
3.基于OLDA的热点话题演化跟踪模型 [J], 陈兴蜀;高悦;江浩;杜敏;王海舟;何建云
4.基于LDA模型的微信图书馆热点话题检测 [J], 荀静;
5.基于LDA模型的电力投诉文本热点话题识别 [J], 许睿;龙丹;刘佳;刘畅
因版权原因,仅展示原文概要,查看原文内容请购买。