老年人语音情感识别系统设计与实现-第4章上
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第4章 老年人语音情感识别系统详细设计与实现
第二章、第三章以系统研究背景为基础,对系统进行需求分析,设计系统整
建立情感语料库
语音增强特征提取模型训练
采集的老年人
语音语音增强特征提取识别阶段
输入分类器
对重点步骤进行介绍:
1. 建立情感语料库。选择中科院语音库CASIA 和老人语音情感库EESDB 作为情感语料库。系统选取两种库中四种公共的情感状态进行训练:生气(angry ),喜悦(happy ),中性(neutral )和悲伤(sad )。这四种情感易于区分,对应于老年人在日常生活中的精神状态,为子女关怀老人提供参考。
2. 语音增强。实际环境中,噪声的来源多种多样。针对老年人带噪语音,使用语音增强技术尽可能地消除信号中的噪声,使处理后的语音接近纯净语音,从而提高系统性能及语音情感识别的结果。
3. 特征提取。在特征提取前,需要预先开展语音信号的预处理工作。对语音信号进行短时分析,将语音信号交叠分帧,使用窗函数截取其中一段,进行FFT,为特征提取做准备。对预处理完成的语音信号进行情感特征提取,对特征进行尺寸和格式调整,使其满足训练学习要求。
4. 训练识别。利用提取的特征,选择合适的语音情感识别训练模型,调整网络结构及训练参数,对语音样本进行训练和学习,得到训练模型。语音样本从训练模型输出后,使用分类器进行分类,最终得出情感分类的结果。
在上述流程中,语音采集属于系统数据采集层,语音增强、特征提取、训练识别属于系统数据处理层。
4.2 软件功能模块概述
老年人语音情感识别系统由老年人客户端、子女客户端及后台服务端组成。
系统设计