基于集成的扩展主题模型的情感分析研究
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于集成的扩展主题模型的情感分析研究
随着互联网技术的高速发展,和各类应用软件在人们日常生活中的渗透,越来越多的用户习惯在互联网上发表对新闻、事件或产品的观点意见。对这些主观性非结构化文本进行情感分析,提取和分析文本中的情感倾向,对舆情监控、电子商务和信息预测等领域都有着重要作用。因此,对文本进行情感分析在理论和实践中都有重要的意义。本文主要进行了以下两个部分的工作:第一,使用TF-IDF加权的
n-gram语言模型特征对LDA主题模型进行扩展。在基于词袋模型的LDA主题模型中,对文本中词序、上下文等语义信息有所忽略。使用TF-IDF加权的n-gram语言模型特征对主题模型进行扩展,在主题模型中增加部分语义信息,从而提高情感分析的效果。第二,在对LDA主题模型进行扩展的基础上,基于扩展模型的文本-主题概率分布划分
子样本集,进行集成学习。考虑集成学习在提高模型效果和稳定性中的优势,结合扩展主题模型中各文本具有不同主题的特性,基于主题
进行子训练集的采样,为集成学习中的各基分类器提供差异性。采用简单投票法进行决策融合,得到最终的情感分析结果。通过理论推导和实验结果分析表明,使用本文提出的基于集成的扩展主题模型方法进行情感分析,能够有效地提高情感分析的效果和稳定性,且在复杂
度方面没有明显的增加。