(完整版)情感语音信号中共振峰参数的提取方法毕业设计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

太原理工大学

毕业设计(论文)任务书毕业设计(论文)题目:

情感语音信号中共振峰参数的提取方法毕业设计(论文)要求及原始数据(资料):

要求:

1:大量查阅关于共振峰提取技术的资料(通过Internet或图书馆)。

2:分析总结各种共振峰的提取方法。

3:用一种共振峰提取方法实现情感语音中共振峰的提取。

4:写一篇论文并给出共振峰提取结果。

原始数据:

1:共振峰研究意义

随着多模态人机交互技术的发展,新型人机交互模式的应用前景更加广阔。语音作

为一种自然有效的人机交互方式,成为当前的研究热点。语音信号不仅包含语音信息,

还包含着说话人的情感信息。语音情感信息处理技术的研究对于提高计算机的智能化具

有重要的现实意义。

语音情感信息处理技术作为一个重要的研究领域已经有很长时间的研究历史了,然

而在传统语音信号处理中往往忽略了在语音信号中的情感因素。共振峰是反映声道谐振

第1页

特性的重要特征,它代表了发音信息的最直接的来源,而且人在语音感知中利用了共振峰信息。所以共振峰是语音信号处理中非常重要的特征参数,已经广泛地用作语音识别的主要特征和语音编码传输的基本信息。人在语音感知中也利用了共振峰信息。所以共

振峰已经广泛地用作语音识别的主要特征和语音编码的基本信息。

语音的频率特性主要是由共振峰决定的,当声音沿声管传播时,其频谱形状就会随声管而改变。如果讲话者的发音中包含喜、怒、哀、乐等情感信息,那么讲话者的声道形状就会发生不同的变化。共振峰作为情感特征信息的非韵律特征参数,我们研究提取它的方法对包含在语音信号中的情感信息分析和处理时及其有意义的。

2:共振峰的几种提取方法

(1)谱包络提取法:共振峰信息包含在语音频谱包络中,因此共振峰参数提取的关键是

估计自然语音频谱包络,并认为谱包络中的最大值就是共振峰。

(2)倒谱法提取共振峰:因为倒谱运用对数运算和二次变换将基音谐波和声道的频谱包

络分离开来。去除了激励引起的谐波波动,所以可以更精确地得到共振峰参数。(3)LPC法提取共振峰:从线性预测导出的声道滤波器是频谱包络估计器的最新形式,线

性预测提供了一个优良的声道模型(条件是语音不含噪声)。

(4)求根法提取共振峰:找出多项式复根的过程通常采用牛顿—拉夫逊(Newton-Raphson)

算法。

(5)LPC倒谱法提取共振峰:语音信号的倒谱可以通过对信号做傅里叶变换,取模的对

数,再求反傅里叶变换得到。

第2页

毕业设计(论文)主要内容:

1:介绍情感语音信号共振峰提取的背景及研究意义,分析语音合成技术的国内外研究现

状、应用领域。

2.探索提取情感语音信号中共振峰参数所所遇到的问题困扰。

(1)虚假峰值(2)共振峰合并(3)高音调语音

3.分析掌握共振峰的多种提取方法,对多种共振峰提取方法进行比较和分析。

(1)谱包络提取法

(2)倒谱法提取共振峰

(3)LPC法提取共振峰

(4)求根法提取共振峰

(5)LPC倒谱法提取共振峰

4.重点研究分析倒谱法提取语音信号共振峰,分析其优缺点并利用这种方法提取情感语

音中的共振峰。

学生应交出的设计文件(论文):1:开题报告

2:中期检查

3:毕业论文

第3页

主要参考文献(资料):

[2] 张刚, 张雪英, 马建芬. 语音处理与编码[M]. 北京, 兵器工业出版社, 2000.

[4] Cowie R and Cornelius R. Describing the emotional stares that are expressed

in Speech[J], Human-Computer Studies, 2003, 40:5-3.

[5] D Ververidis and C Kotropoulos, Emotional speech recognition:Resources,

features and [6] Cowie, R.Douglas-Cowie, E.Savvidou, MeMahon, E.Sawey, M.Sehroder, M.FEELTRACE’:An Instrument for Recording Perceived

Emotion in Real Time. In ISCA Workshop on Speech and Emotion, Belfast 2000.

[7] Cowie, R.Douglas-Cowie, E.Speakers and hearers are people:Reflections on

Speech deterioration as a consequence of acquired deafness in Profound

Deafness and Speech Communication. London, 1995.

[8] R.Cowie,E.Douglas-Cowie, E.Automatic statistical analysis of the signal and

prosodic signs of emotion in speech.In Proc. 4th Int. Conf. Spoken Language Processing.PhiladelPhia, PA,

[9] 赵力, 蒋春辉, 邹采荣. 语音信号中的情感特征分析和识别的研究[N]. 电子学

报, 2004,

[10] 付丽琴, 王玉宝, 王长江. 基于多特征向量的语音情感识别[J]. 计算机科学,

2009,

专业班级通信0902班学生赵智越

相关文档
最新文档