基于多任务学习与注意力机制的多层次音频特征情感识别研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于多任务学习与注意力机制的多层次音频特征情感识别研究李磊;朱永同;杨琦;赵金葳;马柯
【期刊名称】《智能计算机与应用》
【年(卷),期】2024(14)1
【摘要】传统音频分类任务仅仅是从单层次音频提取特征向量进行分类,即便使用过大的模型,其过多的参数也会造成特征之间的耦合,不符合特征提取“高聚类,低耦合”的原则。

由于注意到一些与情绪相关的协变量并没有得到充分利用,本文在模型中加入性别先验知识;将多层次音频特征分类问题转化为多任务问题进行处理,从而对多层次特征进行解耦再进行分类;针对特征分布的再优化方面设计了一个中心损失模块。

通过在IEMOCAP数据集上的实验结果表明,本文提出模型的加权精度(WA)和未加权精度(UA)分别达到了71.94%和73.37%,与原本的多层次模型相比,WA和UA分别提升了1.38%和2.35%。

此外,还根据Nlinear和Dlinear算法设计了两个单层次音频特征提取器,在单层次音频特征分类实验中取得了较好的结果。

【总页数】11页(P85-94)
【作者】李磊;朱永同;杨琦;赵金葳;马柯
【作者单位】上海理工大学健康科学与工程学院;上海理工大学机器智能研究院;上海理工大学机械工程学院;商丘学院机械与电气信息学院
【正文语种】中文
【中图分类】TP241
【相关文献】
1.基于注意力的多层次混合融合的多任务多模态情感分析
2.基于注意力机制的多任务3D CNN-BLSTM情感语音识别
3.基于注意力机制的语音情感识别非线性特征融合方法的研究
4.融合级联注意力和多任务学习的语音情感识别
5.基于多层次注意力网络的多模态情感识别研究
因版权原因,仅展示原文概要,查看原文内容请购买。

相关文档
最新文档