跨语言情感分析方法研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

跨语言情感分析方法研究
近些年来,随着自然语言处理技术和机器学习技术的发展,单语
文本的情感分析已得到深入的研究和发展,各种关于词级、超词级、句子级、篇章级的情感分析研究已逐渐趋于成熟。

然而,作为情感分析领域的特殊研究任务之一,跨语言情感分析的效果仍未达到人们的预期。

其主要原因是不同语言的特征空间之间的不相交性使得关联跨语言间的情感表达存在障碍,进而导致了在跨语言间有效共享跨语言间情感知识面临极大的挑战。

为了解决跨语言间情感知识的有效共享问题,因而设计可靠的情感知识共享通道和策略以及构建有效的跨语言间情感表达关联成为了当前跨语言情感分析研究的核心问题。

目前跨语言情感分析研究得到了极大的关注也取得了重要的研究进展,但是仍存在一些未完全解决的问题。

因此,针对目前跨语言情感分析研究所存在的问题,本文首先从跨语言情感分析研究的一般性策略出发,有针对性地研究了在跨语言间情感知识的的迁移和适应性问题;然后,由跨语言情感分析研究的核心问题出发,研究了一般跨语言情感分析任务的核心问题---跨语言间情感表达关联研究,最后针对具体的跨
语言情感分类任务的核心问题---跨语言间情感极性表达的固有差异展开深入地研究。

具体研究内容如下:1.协同学习框架中对源语言未标注数据的利用以及情感表征性研究基于协同学习,本文提出一种基于交叉采样与结构情感信息的跨语言情感分析交互学习模型。

首先,通过启发式识别方法抽取文本中的情感表达作为结构情感特征,将其融合到传统的n-gram特征空间中,形成情感表征性更强的特征空间;
其次,在传统协同学习的框架基础上,我们提出一种交叉采样策略对两种语言视图中的非标注数据的情感知识交互迁移,从而实现将源语言与目标语言进行高效融合学习;最终获得具有更高性能的目标语言情感分类器。

实验结果表明:相较于传统跨语言情感分析模型,基于交叉采样和结构情感融合的半监督学习框架可以高效地利用少量源语言标注数据挖掘出大量的未标注数据中的情感知识,从而帮助目标语言学习出更优质的情感分类器。

2.跨语言间情感知识的可靠迁移研究跨语言情感分析的主要任务是通过利用源语言情感知识来识别目标语言情感极性。

然而,绝大部分的现有方法是基于迁移学习的,由于知识迁移过程可能存在的迁移错误使得它们并未取得理想的效果。

本文针对该问题提出在迁移学习模型的迁移过程中引入知识验证模型,从而通过识别出高质量的可靠的知识来减少由错误知识给系统带来的性能影响。

实验结果说明本文提出在迁移学习过程中引入知识验证模型的必要性和有效性。

3.跨语言间情感表达关联的研究构建跨语言间的情感表达联系是跨语言情感分析方法的基础。

现有的绝大部分工作主要集中在一般语义关系的构建上,由于情感语义是一般语义的一个部分,因此,非情感语义可能会对情感知识的学习造成干扰。

本文将平行文本共享的极性表达之间的差异看成一种情感关系,提出了利用一个双视图的联合卷积神经网络来捕获跨语言文档之间的情感关系,通过对跨语言情感联系的识别对平行文本的情感极性进行分类。

受实体关系学习的启发,我们首先学习了单语的情感表达,然后将单语情感表达分别映射到一个双语的情感关系空间中,利用向量的加权减法来
捕获跨语言情感关系。

在公开数据集上的测试结果说明了该方法的有效性。

4.跨语言间情感极性表达固有差异的学习方法研究由于不同语言表达情感的方式不同,因此发现跨语言间情感极性表达的固有差异是解决跨语言情感关系的一条重要途径。

本文将跨语言间情感极性表达的固有差异看成连接跨语言平行文本的情感极性表达的重要关联。

通过研究跨语言间情感极性表达的固有关联来分析跨语言平行文本
的情感极性。

基于此,本文提出了两个基于“迁移”假设的关联学习模型。

实验表明了跨语言间情感极性表达关联学习对于解决跨语言情感分析问题的有效性和重要性。

相关文档
最新文档