老年人语音情感识别系统设计与实现-第4章上

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第4章老年人语音情感识别系统详细设计与实现

第二章、第三章以系统研究背景为基础，对系统进行需求分析，设计系统整

建立情感语料库

语音增强特征提取模型训练

采集的老年人

语音语音增强特征提取识别阶段

输入分类器

对重点步骤进行介绍：

1. 建立情感语料库。选择中科院语音库CASIA 和老人语音情感库EESDB 作为情感语料库。系统选取两种库中四种公共的情感状态进行训练：生气（angry ），喜悦（happy ），中性（neutral ）和悲伤（sad ）。这四种情感易于区分，对应于老年人在日常生活中的精神状态，为子女关怀老人提供参考。

2. 语音增强。实际环境中，噪声的来源多种多样。针对老年人带噪语音，使用语音增强技术尽可能地消除信号中的噪声，使处理后的语音接近纯净语音，从而提高系统性能及语音情感识别的结果。

3. 特征提取。在特征提取前，需要预先开展语音信号的预处理工作。对语音信号进行短时分析，将语音信号交叠分帧，使用窗函数截取其中一段，进行FFT，为特征提取做准备。对预处理完成的语音信号进行情感特征提取，对特征进行尺寸和格式调整，使其满足训练学习要求。

4. 训练识别。利用提取的特征，选择合适的语音情感识别训练模型，调整网络结构及训练参数，对语音样本进行训练和学习，得到训练模型。语音样本从训练模型输出后，使用分类器进行分类，最终得出情感分类的结果。

在上述流程中，语音采集属于系统数据采集层，语音增强、特征提取、训练识别属于系统数据处理层。

4.2 软件功能模块概述

老年人语音情感识别系统由老年人客户端、子女客户端及后台服务端组成。

系统设计