基于深度学习的中文短文本情感分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于深度学习的中文短文本情感分析

随着互联网不断发展,网络评论平台不断增加,用户评论数量也

爆发式增长。利用情感分析技术能够有效的挖掘文本包含的情感信息,目前已成为社会舆情监督和厂家获取反馈信息的重要途径,具有很高的研究价值。本文的研究目的是探究中文短文本中所包含的情感信息,主要解决文本情感极性褒贬义分类问题。传统的情感分析方法主要有两种:基于情感词典的方法和基于机器学习的方法。但由于文本语料简短,含有大量未登录词使得上述方法存在数据稀疏问题,且过分依

赖领域专家的标注。近年来出现的深度学习技术能够很好的解决上述问题。因此,本文采用深度学习的方法对中文短文本进行情感分析。主要研究内容如下:首先,在文本数据预处理过程,针对目前网络上存在的大量未登录词,设计了一种新词发现方法,主要是利用词语的内

部凝固度、边界自由度及语言规则对候选新词进行过滤。将识别的新词加入词库,提高分词的准确率。其次,传统的词向量仅考虑了文本中的语义语法信息,会将语义相近,情感极性却相反的词语映射到相邻

的位置,导致最终分类结果错误。为了解决此问题,本文在传统词向量的基础上融合了情感信息,提出一种情感词向量的生成方法。最后,

针对循环神经网络在处理时序信息发生的梯度消失问题,本文提出基于GRU(Gated Recurrent Unit)的情感分析模型,将循环神经网络的隐层节点替换为GRU单元,用于情感分析。本文利用Python中的Keras 深度学习库构建提出的GRU情感分析模型,通过实验,找到模型最佳

参数,并在最佳参数下进行情感分析,其分类的准确率达到92.01%。

将其与机器学习模型SVM及深度学习模型LSTM,CNN进行对比实验,结果表明,在所有指标下,本文提出的以情感词向量作为输入的情感分析模型明显优于其他模型。

相关文档
最新文档