【CN109817246A】情感识别模型的训练方法、情感识别方法、装置、设备及存储介质【专利】
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 201910145605.2
(22)申请日 2019.02.27
(71)申请人 平安科技(深圳)有限公司
地址 518000 广东省深圳市福田区福田街
道福安社区益田路5033号平安金融中
心23楼
(72)发明人 刘博卿 贾雪丽 王健宗
(74)专利代理机构 深圳市力道知识产权代理事
务所(普通合伙) 44507
代理人 何姣
(51)Int.Cl.
G10L 25/63(2013.01)
G10L 25/30(2013.01)
G10L 15/06(2013.01)
G10L 25/45(2013.01)
G10L 25/24(2013.01)
(54)发明名称情感识别模型的训练方法、情感识别方法、装置、设备及存储介质(57)摘要本申请涉及智能决策领域,基于深度学习训练情感识别模型。具体公开了一种情感识别模型的训练方法、情感识别方法、装置、计算机设备及存储介质,该方法包括:获取用户的语音信息以及对应的数据标签;根据语音信息以及对应的数据标签构建样本数据;根据预设处理规则对样本数据中的语音信息进行预处理以得到对应的频谱向量;提取预设的循环神经网络,循环神经网络包括注意力机制,注意力机制用于加强语音信息中的部分区域;基于循环神经网络,根据语音信息对应的频谱向量和数据标签进行模型训练以得到情感识别模型。该方法可以提高情感识别模型的可泛化性,
提高模型识别的准确率。权利要求书2页 说明书12页 附图5页CN 109817246 A 2019.05.28
C N 109817246
A
1.一种情感识别模型的训练方法,其特征在于,包括:
获取用户的语音信息以及所述语音信息对应的数据标签;
根据所述语音信息以及对应的数据标签构建样本数据;
根据预设处理规则对所述样本数据中的语音信息进行预处理以得到对应的频谱向量;提取预设的循环神经网络,所述循环神经网络包括注意力机制,所述注意力机制用于加强所述语音信息中的部分区域;
基于所述循环神经网络,根据所述语音信息对应的频谱向量和数据标签进行模型训练以得到情感识别模型。
2.根据权利要求1所述的训练方法,其特征在于,所述根据预设处理规则对所述样本数据中的语音信息进行预处理以得到对应的频谱向量,包括:
对所述样本数据中的语音信息进行分帧加窗处理以得到处理后的语音信息;
对处理后的语音信息进行频域变换以得到对应的幅度谱;
通过梅尔滤波器组对所述幅度谱进行滤波处理,并对滤波处理后的幅度谱进行离散余弦变换以得到梅尔频率倒谱系数;
对所述梅尔频率倒谱系数进行归一化处理以得到所述语音信息对应的频谱向量。
3.根据权利要求2所述的训练方法,其特征在于,所述通过梅尔滤波器组对所述幅度谱进行滤波处理,包括:
获取所述语音信息对应的最大频率,利用梅尔频率计算公式计算所述最大频率对应的梅尔频率;
根据计算的梅尔频率以及所述梅尔滤波器组中三角滤波器的数量计算两个相邻三角滤波器的中心频率的梅尔间距;
根据所述梅尔间距完成对多个三角滤波器的线性分布;
根据完成线性分布的多个三角滤波器对所述幅度谱进行滤波处理。
4.根据权利要求3所述的训练方法,其特征在于,
所述梅尔频率计算公式为:
其中,f mel 为所述梅尔频率,f为所述语音信息对应的最大频率,A为系数;
所述对所述梅尔频率倒谱系数进行归一化处理以得到所述语音信息对应的频谱向量,包括:
采用零均值归一化对所述梅尔频率倒谱系数进行归一化处理以得到所述语音信息对应的频谱向量,
所述零均值归一化对应的转化公式为:其中,为梅尔频率倒谱系数的均值;σ为梅尔频率倒谱系数的标准差;x为每个梅尔频率倒谱系数;x *为归一化后的梅尔频率倒谱系数。
5.根据权利要求1所述的训练方法,其特征在于,所述循环神经网络的结构包括输入层、循环层、注意力机制、全连层和输出层;所述注意力机制用于根据注意力方程建立所述循环层的输出量与权重向量之间的映射关系以实现加强所述语音信息中的部分区域;所述注意力方程为:
权 利 要 求 书1/2页2CN 109817246 A