基于集成的扩展主题模型的情感分析研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于集成的扩展主题模型的情感分析研究

随着互联网技术的高速发展,和各类应用软件在人们日常生活中的渗透,越来越多的用户习惯在互联网上发表对新闻、事件或产品的观点意见。对这些主观性非结构化文本进行情感分析,提取和分析文本中的情感倾向,对舆情监控、电子商务和信息预测等领域都有着重要作用。因此,对文本进行情感分析在理论和实践中都有重要的意义。本文主要进行了以下两个部分的工作:第一,使用TF-IDF加权的

n-gram语言模型特征对LDA主题模型进行扩展。在基于词袋模型的LDA主题模型中,对文本中词序、上下文等语义信息有所忽略。使用TF-IDF加权的n-gram语言模型特征对主题模型进行扩展,在主题模型中增加部分语义信息,从而提高情感分析的效果。第二,在对LDA主题模型进行扩展的基础上,基于扩展模型的文本-主题概率分布划分

子样本集,进行集成学习。考虑集成学习在提高模型效果和稳定性中的优势,结合扩展主题模型中各文本具有不同主题的特性,基于主题

进行子训练集的采样,为集成学习中的各基分类器提供差异性。采用简单投票法进行决策融合,得到最终的情感分析结果。通过理论推导和实验结果分析表明,使用本文提出的基于集成的扩展主题模型方法进行情感分析,能够有效地提高情感分析的效果和稳定性,且在复杂

度方面没有明显的增加。

相关文档
最新文档