语音信号处理复习

合集下载

语音信号处理知识点总结

语音信号处理知识点总结

语音信号处理(电技重点)第二章1、语音产生的机制、清音浊音(p7倒数第三段);2、语音的特点:浊音,准周期信号,短时能量大,过零率小;清音,随即自噪声,………….小,………大;声道,谐振腔,谐振频率,共振峰频率;音调,音强,音长,音质;频谱特征:清音谐波不明显;浊音谐波结构(精细频谱)谱包络(共振峰机构);3、统计分布,幅度分布(伽马分布修正);4、数字模型:激励模型(清音随即自噪声,浊音周期脉冲序列)声道模型(级联型、并联型、混合型)5、响度、音调、音色;6、语音感知:16hz---16Khz频谱分析,色彩感知,屏蔽效应;第三章1、取样率8khz(数字域)2、预处理(放大及增益控制,反混叠,预加重)3、短时能量分析短时能量随时间变化规律,区分清/浊音、声/韵母;4、短时过零率表现短时频谱特征,预测清/浊音、有/无声;5、短时相关求浊音周期及缺点6、短时平均幅度差:极小值——>求基音周期第四章1、语音时变谱2种解释;2、取样率(时间分辨率、频率分辨率);第五章1、同态分析了解;2、复倒谱倒谱意义准周期信号倒谱仍是准周期,T不变,幅度随f下降,page60,提取T依据;声道冲击响应倒谱——最小相位序列的为因果序列,衰减快page61能量集中在低频;——最大…………….为反因果序列…;3、最小相位法递推法掌握;4、给段语音倒谱求声门激励序列声道冲击序列;第六章1、线性预测基本原理:建立在全极点模型下用过去式测值预测现在以及将来时;2、预测滤波器F(z),线性预测误差滤波器A(z),语音合成全极点滤波器H(z)——三者关系;3、优化原则:均方误差最小,求偏导求A(z), H(z)系数;4、自相关法、均方差法,格型法优缺点;5、LPC谱估计:6~10阶,逼近谱包络6、LPC复倒谱了解7、线谱对:定义特点(掌握);第九章1、基音检测——自相关法,简化逆滤波法;2、相关处理法——表9-1,掌握SIFT,AMDF;3、共振峰估计:LPC第十一章1->声码器的基本结构图;2->LPC声码器与APC编码器区别与联系;3->LPC参数种类及量化特征page162;4->5种预测系数,线谱对,哪些适合在信道传输(编码)及原因,自己总结;5->混合编码与LPC声码器和APC的区别和联系;。

语音信号的考试部分知识点

语音信号的考试部分知识点

语音信号处理复习资料一、名词解释:1、基音周期:声带开合一次的时间为基音周期(pitch period)。

它的倒数称为基频。

2 、音色:也叫音质;由混入基音中的倍音决定。

3 、音高:声音的高低;主要用基频反映。

基频值越大,反映出的音高越高。

4、音强:发音的轻重;可以用声压或声强来表示声音的强度,一般用相对声压或相对声强表示。

5、音长:声音的长短,取决于发音持续时间的长短。

6、响度:是一种主观心理量,主观感觉到的声音强弱的一种衡量标准,它与频率有关。

一样的音强,不一样的频率,则响度也会有所不同。

7、听觉掩蔽效应:一个更响的音调可以将其频率附近的较低的音调掩蔽。

可以分为同时掩蔽和异外时掩蔽。

8、临界频带:一个纯音可以被以它为中心频率,且具有一定带宽的连续噪声所掩蔽,如果在这一频带内噪声功率等于该纯音的功率,这时该纯音处于刚好能被听到的临界状态,即称这一带宽为临界带宽。

临界带宽有许多近似表示,一般在低于500 Hz的频带内,临界带宽约为100Hz,在高于500Hz 时,临界带宽约为中心频率的20% 。

人耳的基底膜具有与频谱分析仪相似的作用。

频率群的划分相应地将基底膜分成许多小的部分,每一部分对应一个频率群。

掩蔽效应就是在这些频率群内发生,这是因为对应的那一频率群的基底膜部分的声音,在大脑中似乎是叠加在一起来评价的,如果这时同时发声,可以互相掩蔽。

9、采样的基础知识:对于一个有限带宽的模拟信号,其频谱的最高频率为F0,在对其进行采样时,其采样频率在Fs>2F0时,采样后的信号才能保证信息不丢失。

语音信号中人耳可以感知的最大频率在3.4KHz左右采样频率在8KHz~16KHz之间短时分析:内平稳语音信号是一种随时间而变化的信号,可能是浊音激励也可能是清音激励,浊音的基音周期以及信号幅度等语音特性也都随时间变化,但这种变化是缓慢的,在一小段短时间内10~30ms,语音信号近似不变。

于是,我们把变化的语音信号分成一些相继的短时间段来处理。

语音信号处理复习题

语音信号处理复习题

1 研究语音信号处理的目的是什么?人类的通信有哪三种方式,从而说明语音信号处理有哪三个学科分支?它的目的一是要通过处理得到一些反映语音信号重要特征的语音参数以便高效的传输或储存语音信号信息;二是要通过处理的某种运算以达到某种用途的要求。

1.什么叫做语言学?什么叫做语音学?言语过程可分为哪五个阶段?语音中各个音的排列由一些规则所控制,对这些规则及其含义的研究学问称为语言学;另一个是对语音中各个音的物理特征和分类的研究称为语音学。

人的说话过程如图2-1所示,可以分为五个阶段:(1)想说阶段:(2)说出阶段:(3)传送阶段:(4)接收阶段:(5)理解阶段:3、有哪几种描述声道特性的数学模型?请说明声管模型流图是如何得出的?有几种共振峰模型?各有什么特点和适用情况?声道的数学模型有两种观点:1)声管模型将声道看为由多个不同截面积的管子串联而成的系统。

在“短时”期间,声道可表示为形状稳定的管道。

另一种观点是把声道视为一个谐振腔,按此推导出的叫“共振峰模型”。

共振峰模型,把声道视为一个谐振腔。

共振峰就是这个腔体的谐振频率。

由于人耳听觉的柯替氏器官的纤毛细胞就是按频率感受而排列其位置的,所以这种共振峰的声道模型方法是非常有效的。

一般来说,一个元音用前三个共振峰来表示就足够了;而对于较复杂的辅音或鼻音,大概要用到前五个以上的共振峰才行。

基于物理声学的共振峰理论,可以建立起三种实用的共振峰模型:级联型、并联型和混合型。

(1)级联型声道模型这时认为声道是一组串联的二阶谐振器。

从共振峰理论来看,整个声道具有多个谐振频率和多个反谐振频率,所以它可被模拟为一个零极点的数学模型;但对于一般元音,则用全极点模型就可以了。

它的传输函数可分解表示为多个二阶极点的网络的串联:N=10,M=5时的声道模型如下图所示:(2)并联型声道模型对于非一般元音以及大部分辅音,必须考虑采用零极点模型。

此时,模型的传输函数如下:通常,N>R ,且设分子与分母无公因子及分母无重根,则上式可分解为如下部分分式之和的形式:这就是并联型的共振峰模型。

东南大学语音信号处理期末考试复习总结(全面)

东南大学语音信号处理期末考试复习总结(全面)

语音信号处理是研究数字信号处理技术对语音信号进行处理的一门科学语音:是声音和语言的结合体,是一连串的音组成的语言的声音。

人的说话过程:想说,说出,传送,接收,理解。

句法的最小单位是单词,词法的最小单位是音节。

语音特征:音色,音调,音强,音长。

语音音素:元音和辅音。

辅音包括浊音(声带振动)和清音共振峰:元音激励进入声道时引起共振特性,产生一组共振频率。

基音频率:浊音的声带振动的基本频率。

汉语是一种声调语言,声调具有辩义作用。

声调的变化就是浊音基音周期的变化。

汉语音节的一般结构:声带,韵母,声调对发音影响最大的是声带。

基音周期:声带每开启和闭合一次的时间,倒数就是基音频率。

语音听觉系统:耳:内耳(将机械信号转化为神经信号),中耳(声阻抗变换),外耳(声源定位和声音放大)。

掩蔽效应:在一个强信号附近,弱信号将变得不可闻。

被掩蔽掉的不可闻信号的最大声压级称为掩蔽门限或掩蔽阈值。

掩蔽效应:同时掩蔽和短时掩蔽。

同时掩蔽:存在一个弱信号和一个强信号频率接近,强信号会提高弱信号的听阀,当弱信号的听阀被升高到一定程度就会导致这个弱信号弱不可闻。

短时掩蔽:当A声和B声不同时存在时也存在掩蔽作用,称为短时掩蔽。

语音信号生成的数学模型:激励模型(一般分为浊音激励和清音激励),声道模型(一般分为声管模型和共振峰模型,共振峰模型又分为三种:级联,并联,混合型),辐射模型。

浊音激励模拟成是一个以基音周期为周期的斜三角脉冲串。

可以把清音模拟成随机白噪声。

完整的语音信号的数学模型的传输函数H(z) = AU(z)V(z)R(z).一阶高通形式的R(z)=R0(1-z^(-1)) 把和时序相关的傅里叶分析的显示图形称为语谱图。

语谱图是一种三维频谱,它是表示语音频谱随时间变化的图形。

第三章:语音信号分析1.参数性质不同:时域,频域,倒频域。

分析方法:模型分析法(根据语音信号产生的数学模型来分析和提取表征这些模型的特征参数)和非模型分析法(时域,频域,倒频域)。

语音信号处理期末考试复习题

语音信号处理期末考试复习题

《语音信号处理》期末考试复习资料(涉及考点的教材课后复习题)授课教师:薛雅娟老师整理人:通信161班梁雨(第2-5章)通信161班左自睿(第6-10章)根据成都信息工程大学通信工程学院选修课《语音信号处理》期末考试范围,整理成期末考试的复习资料以供学弟学妹们参考。

所有权归属成都信息工程大学。

在此衷心感谢薛老师平时悉心地教育指导。

整理人均系在读本科学生,水平有限,错误与不足之处在所难免,敬请大家见谅,欢迎批评、斧正。

第二章:语音信号处理的基础知识人耳听觉的掩蔽效应分为哪几种?掩蔽效应的存在对我们研究语音信号处理系统有什么启示?答:分为同时掩蔽和短时掩蔽。

同时掩蔽是指同时存在的一个弱信号和一个强信号频率接近时,强信号会提高弱信号的听阈,当弱信号的听阈被升高到一定程度时就会导致这个弱信号变得不可闻。

当A声和B声不同时出现时也存在掩蔽作用,称为短时掩蔽。

短时掩蔽分为前向掩蔽和后向掩蔽。

语音信号的数学模型包括哪些子模型?激励模型是怎样推导出来的?辐射模型又是怎样推导出来的?它们各属于什么性质的滤波器?答:①激励模型②声道模型③辐射模型④完整的语音信号的数学模型激励模型一般分成浊音激励和清音激励。

浊音激励:发浊音时,声激励是一个准周期的单位脉冲串,Av为增益参数;为了使浊音的激励信号具有声门振动气流脉冲的实际波形,需将冲激序列通过一个声门脉冲模型滤波器(实际上是一个斜三角波形)G(z)。

最后形成一个以基音周期为周期的斜三角波形。

清音激励模拟为随机噪声,实际中一般使用均值为0、方差为1的白噪声。

辐射模型:从声道模型射出的是速度波ul(n),而语音信号是声压波pl(n),二者之倒比称为辐射阻抗Zl。

在语音信号参数分析前为什么要进行预处理,有哪些预处理过程?答:预滤波的目的有两个:一是抑制输入信号各频域分量中频率超出fs/2的所有分量(fs为采样频率),以防止混叠干扰;二是抑制50Hz的电源工频干扰。

预处理过程:预加重、加窗和分帧。

语音信号处理复习

语音信号处理复习

34 初始码书的生成方法?
7
复习
35 短时能量和短时过零率的的用途。
36 对语音信号进行处理时为什么要进行分帧。
37 为什么端点检测有重要意义?
38 什么叫LBG算法,怎样设计初始码本,并用来训练 码本。
39 为什么说语音信号可以看成隐马尔科夫过程,隐马尔 科夫过程有哪些模型参数。 HMM包含两个随机过程,三个概率矩阵,一个输出概率
复习
1 由下面的WAV文件读出语音的编码信息: 52 49 46 46 A4 9A 7B 01 57 41 56 45 66 6D 74 20 10 00 00 00 01 00 02 00 44 AC 00 00 10 B1 02 00 04 00 10 00 64 61 74 61 80 9A 7B 01 42 FF 35 FC E2 FE 07 00 E7 FE AF 03 5F FF 65 01.....................
2 画出语音信号的产生模型,简述语音的产生过程。 3 为生么语音信号要进行“短时”分析。 4 语音信号的时域分析方法有那些? 5 语音信号频率范围是多少?
1
复习
6 什么是浊音的基音频率(F0)?男性、女性和儿童 的F0大致分布在什么范围。
7 可以认为多长的时间范围内,语音信号是平稳信号。 8 电话语音的采样率为8kHz;纯语音在进行计算机录 入时,一般采样率在15kHz~20kHz左右;音乐的采 样率可以高达44kHz。
9
复习
46 为什么语音识别时需要做时间规整? 47 说话人识别的目的及分类。 48 什么叫加性噪声和乘性噪声。为什么加性噪声的处 理是语音增强的基础。 49 减谱法的实现框图及工作过程。 50 自适应消噪的基本原理 51 A律压扩编码实例, LBG算法实例,隐HMM模型求 输出概率实例,动态时间规正法(DTW)的计算实例

语音信号处理复习

语音信号处理复习

自相关法
基音检测
倒谱法
简化逆滤波法(SIFT)
共振峰估值
1. 带通滤波器法 2. DFT法
3. 倒谱法
4. LPC法
第9章思考题
1.基音检测的自相关法中的中心削波处理的思路 及实现过程? 2.用倒谱法实现基音检测和共振峰检测的原理及 实现框图?
•语音编码的概念、应用和分类等 •语音信号的压缩编码原理 • 语音通信中的语音质量 •脉冲编码调制(PCM)及其自适应
时变线性 系统
语音取样值
时变参数
第2章思考题:
1. 什么叫语言?什么叫语音? 2. 人类的发音器官包括哪些?在发音时各起了什
么作用? 3. 解释以下概念:基音频率、共振峰、浊音、清
音。 4. 语音信号模型包括哪些子模型?激励模型和辐
射模型各属于什么性质的滤波器?
第3章语音信号的时域分析
•语音处理的目的 •语音信号分析方法
1.什么叫做隐马尔可夫过程?为什么说语 音信号可以看成隐马尔可夫过程?
2. HMM模型的结构主要有哪两种?它们 的特点是什么?
3.隐马尔可夫模型有哪些模型参数?请 叙述这些参数的含义和定义式。
根据某状态HMM模型,每一种路 径输出某某符号的概率计算。
语音检测分析——语音特征参数的提取和分析。
主要包括:基音检测和共振峰参数的估值。
NT
•短时傅里叶变换的取样率 •语音信号的短时综合 滤波器组求和法
•语谱图
可同时在时间和频率上显示语音频谱随 时间的变化。
第4章思考题:
1. 短时傅里叶变换的定义式是什么?短时傅 里叶变换的两种解释是什么? 如何提高短 时谱的频率分辨率?
2. 在求语音信号的短时谱时,对窗函数有什 么要求? 对语音信号频谱分析采用海明窗 和矩形窗各有什么特点?

第二章语音信号的基础知识

第二章语音信号的基础知识
第二章 语音信号处理的基础知识
语音信号的基本概念 语音:人们讲话时发出的话语叫语音。是一种人
们进行信息交流的声音,是组成语言的声音/带有 语言信息的声音。
语音(Speech)=声音(Acoustic)+语言 (Language)
语音是由一连串的音素组成语言的声音。
第二章 语音信号处理的基础知识
对语音的研究包括两个方面
➢声道
人在说话时,空气由肺部压入,由嘴唇呼出,声门由此开 启和闭合,构成声带振动,然后通过声道(喉腔、咽腔和口腔) 响应(引起共振特性)变成语音,气流从喉向上经过口腔或鼻 腔后从嘴或鼻孔向外辐射,期间的传输通道称为声道。气流流 过声道时犹如通过了一个具有某种谐振特性的腔体,放大某些 频率,在频谱上形成相应位置的峰起,称为共振峰。
✓(元音一定是浊音。辅音包括浊音和清音。 ✓英语中:由元音和辅音(这些都是音素)构成音节, 由几个音节构成一个词。 ✓汉语中:汉语中由元音和辅音构成声母和韵母,结 合声调构成一个音节,一个音节就是一个字。
一 语音信号的产生
4)汉语音节的一般结构
声母、韵母和声调是汉语语音的三要素。 汉语语音的1个不同于其他语言的是它具有声调 (音调)。声调是1个音节在念法上的高低升降 的变化,汉语中有4个声调,即阴平(-)、阳 平( ′)、上声( )、和去声(‵)。
一 语音信号的产生
声调的变化就是浊音基音周期的变化,为了将
调值描写地具体一些,一般采用“五度标记法”,
用一条竖线表示声音的高低,从下而上用1、2、3、
4、5依次表示低、半低、中、半高、高。
阴平
5高
阳平 上声
去声
4 半高 3中 2 半低 1低
调类 阴平 阳平 上声 去声

东南大学语音信号处理期末考试复习总结(全面)

东南大学语音信号处理期末考试复习总结(全面)

语音信号处理是研究数字信号处理技术对语音信号进行处理的一门科学语音:是声音和语言的结合体,是一连串的音组成的语言的声音。

人的说话过程:想说,说出,传送,接收,理解。

句法的最小单位是单词,词法的最小单位是音节。

语音特征:音色,音调,音强,音长。

语音音素:元音和辅音。

辅音包括浊音(声带振动)和清音共振xx:元音激励进入声道时引起共振特性,产生一组共振频率。

基音频率:浊音的声带振动的基本频率。

汉语是一种声调语言,声调具有辩义作用。

声调的变化就是浊音基音周期的变化。

汉语音节的一般结构:声带,韵母,声调对发音影响最大的是声带。

基音周期:声带每开启和闭合一次的时间,倒数就是基音频率。

语音听觉系统:耳:内耳(将机械信号转化为神经信号),中耳(声阻抗变换),外耳(声源定位和声音放大)。

掩蔽效应:在一个强信号附近,弱信号将变得不可闻。

被掩蔽掉的不可闻信号的最大声压级称为掩蔽门限或掩蔽阈值。

掩蔽效应:同时掩蔽和短时掩蔽。

同时掩蔽:存在一个弱信号和一个强信号频率接近,强信号会提高弱信号的听阀,当弱信号的听阀被升高到一定程度就会导致这个弱信号弱不可闻。

短时掩蔽:当A声和B声不同时存在时也存在掩蔽作用,称为短时掩蔽。

语音信号生成的数学模型:激励模型(一般分为浊音激励和清音激励),声道模型(一般分为声管模型和共振峰模型,共振峰模型又分为三种:级联,xx,混合型),辐射模型。

浊音激励模拟成是一个以基音周期为周期的斜三角脉冲串。

可以把清音模拟成随机白噪声。

完整的语音信号的数学模型的传输函数H(z) = AU(z)V(z)R(z).一阶高通形式的R(z)=R0(1-z^(-1))把和时序相关的傅里叶分析的显示图形称为语谱图。

语谱图是一种三维频谱,它是表示语音频谱随时间变化的图形。

第三章:语音信号分析1.参数性质不同:时域,频域,倒频域。

分析方法:模型分析法(根据语音信号产生的数学模型来分析和提取表征这些模型的特征参数)和非模型分析法(时域,频域,倒频域)。

语音信号处理期末复习题

语音信号处理期末复习题

语音信号处理期末复习题语音信号处理期末复习题语音信号处理是一门研究语音信号的产生、传输、处理和识别的学科。

它广泛应用于语音识别、语音合成、语音增强等领域。

在本文中,我们将回顾一些与语音信号处理相关的重要概念和技术。

一、语音信号的产生和特征提取语音信号是由人的声带振动引起的空气压力变化所产生的。

在语音信号处理中,我们通常使用基频、共振峰和声强等特征来描述语音信号。

1. 基频是指声音中最低频率的周期性振动。

它与人的声带振动频率相关,可以用来区分不同的语音音调。

2. 共振峰是指声音中频率响应最大的频率。

它与声道的共振特性相关,可以用来区分不同的语音音色。

3. 声强是指声音的能量大小。

它与声音的响度相关,可以用来区分不同的语音强度。

为了提取语音信号的特征,我们可以使用时域分析和频域分析等方法。

时域分析可以通过计算语音信号的短时能量和过零率等参数来描述语音信号的时域特征。

频域分析可以通过计算语音信号的功率谱和倒谱等参数来描述语音信号的频域特征。

二、语音信号的传输和编码在语音信号处理中,为了实现语音信号的传输和存储,我们需要对语音信号进行编码。

编码可以将连续的语音信号转换为离散的数字信号,以便于传输和处理。

1. 量化是指将连续的语音信号转换为离散的数字信号。

在量化过程中,我们需要选择合适的量化步长和量化级数,以平衡信号的保真度和数据的压缩率。

2. 编码是指将离散的数字信号表示为二进制码。

在编码过程中,我们可以使用不同的编码算法,如脉冲编码调制(PCM)和自适应差分脉冲编码调制(ADPCM)等。

为了提高语音信号的传输效率,我们还可以使用压缩算法对语音信号进行压缩。

压缩算法可以分为有损压缩和无损压缩两种。

有损压缩可以通过去除语音信号中的冗余信息来减少数据量,但会引入一定的失真。

无损压缩可以通过使用编码算法来减少数据量,但不会引入失真。

三、语音信号的处理和识别在语音信号处理中,我们可以使用滤波器、时域变换和频域变换等技术来对语音信号进行处理和分析。

语音信号处理期末复习讲解

语音信号处理期末复习讲解

3.3短时能量分析
短时能量定义
• 短时:通过加窗来实现 • 能量:通过求信号幅度的平方来实现
En
m
[ x(m)w(n m)]

2

m n N 1

n
[ x(m)w(n m)]
2
• 窗的位置随n变化
窗的类型
• 直角窗(矩形窗)
Time domain 40 1 30 0.8 20 10 0 -10 -20
人体发声的部位
声带——震动的来源
Tp
典型声门脉冲波形
• Tp为基音周期,倒数为基音频率,用fp表示, 取决于声带的尺寸和特性 • 男性说话者的fp大致分布在60-200Hz范围内 • 女性说话者和小孩的fp值在200-450Hz范围内 • 同一个人所发出的声音有高低变化,是靠控 制声带的松紧来调节的。
MOS得分 5 4 3 2 1 质量等级 优 良 可 差 坏 失真级别 不觉察 刚有觉察 有觉察且稍有可厌 明显觉察且可厌但可忍受 不可忍受
第三章 语音信号的 时域分析
语音信号的稳态——帧的概念
• 语音自身从长时间看是非稳态过程,从短时 间看是相对稳定的,既“短时性”。 • 将语音分为一段一段的,每一段称为“一 帧”,大概时间为10-30ms • 短时时域分析是语音处理的基本方法,也是 最直观、最易理解的方法
窗的类型
• 海明窗(Hamming,也称汉明窗,升余弦)
Time domain 40 1 20 0.8 0
Frequency domain
Magnitude (dB)
10 20 30 40 Samples 50 60
Amplitude
0.6
-20 -40 -60

语音信号处理复习华南理工

语音信号处理复习华南理工

语音信号处理复习第二章语音信号处理基础知识1,定义:(1)语音是指人们讲话时发出的话语,它是一种声音,具有声学特征的物理特性。

而它又是一种特殊的声音,是人们进行信息交流的声音,是组成语言的声音。

因此语音是语言和声音的组合体。

(2)语音是由人的发声器官发出的一种声波,它具有音色、音调、音强和音长。

①音色:是一种声音区别于另一种声音的基本特征②音调:指声音的高低,取决于声波的频率③音强:指声音的强弱,取决于声波的振幅④音长:指声音的长短,取决于发音时间的长短(3)任何语言都有语言的元音和辅音两种音素:元音:当声带振动发出的声音气流从喉腔、咽腔进入口腔从唇腔出去时,这些声腔完全开放,气流顺利通过。

一个重要的声学特性是共振峰。

辅音:由于通路的某一部分封闭起来或者受到阻碍,气流被阻不能畅通。

包括清音和浊音。

①浊音:声带振动②清音:声带不振动(4)人的听觉系统有两个重要的特性:①时频分析特性:人的耳蜗就像一个频谱分析仪,将复杂的信号分解成各种频率分量。

②听觉掩蔽效应:心理声学中的听觉掩蔽效应指在一个强信号附近,弱信号将变得不可闻,被掩蔽掉了。

掩蔽效应分为同时掩蔽和短时掩蔽。

2,语言信号生成的数学模型:①激励模型:在声门(声带)以下,称为“声门子系统”,它负责产生激励振动,是激励系统②声道模型:从声门到嘴唇的呼气通道是声道,是声道系统③辐射模型:语音从嘴唇辐射出去,则嘴唇以外是辐射系统3,语音信号的特性分析:(1)语音信号的时域波形和频谱特性:①时域波形:周期性,周期对应声带振动的频率,即基音频率。

②频谱特性:共振峰特性。

元音频谱有明显的几个凸起点,它们出现的频率就是共振峰频率。

清辅音频谱峰点之间的间隔是随机的,没有周期分量。

(2)语谱图:语谱图是一种三维图谱,它是表示语音频谱随时间变化的图形,其纵轴为频率,横轴为时间,任一给定频率成分在给定时刻的强弱用相应点的灰度或色调的浓淡来表示。

语谱图中显示了大量的与语音的语句特性相关的信息,它综合了频谱图和时域波形的特点,明显地显示出语音频谱随时间的变化情况,或者说是一种动态的频谱。

语音信号处理考试试题

语音信号处理考试试题

语音信号处理考试试题一、简答题1. 请解释什么是语音信号处理?语音信号处理指的是对语音信号进行数字信号处理的过程。

它涉及到声音的采集、编码、分析、合成和识别等一系列处理技术,旨在提高语音通信和语音识别系统的性能。

2. 请列举一些常见的语音信号处理应用。

常见的语音信号处理应用包括语音通信、语音识别、语音合成、语音增强、语音压缩等。

3. 请简要描述语音信号处理系统的基本框架。

语音信号处理系统的基本框架包括声音的采集、预处理、特征提取、模型训练和解码等步骤。

首先,声音信号通过麦克风采集,并进行预处理,如去除噪声、归一化等。

然后,从预处理的信号中提取出特征,如音频频谱、共振峰等信息。

接下来,使用这些特征进行模型的训练,以建立语音信号的模型。

最后,通过解码器将输入的语音信号与训练好的模型进行匹配,从而实现语音的识别或合成。

4. 请列举一些常用的语音信号处理算法或技术。

常用的语音信号处理算法或技术包括数字滤波、时域和频域特征提取、自动语音识别(ASR)、线性预测编码(LPC)、傅里叶变换(FFT)、Mel频谱倒谱系数(MFCC)、隐藏马尔可夫模型(HMM)等。

5. 请解释什么是Mel频谱倒谱系数(MFCC)算法。

Mel频谱倒谱系数(MFCC)算法是一种常用的语音信号处理算法,主要用于语音特征提取。

它模拟了人类听觉系统的工作原理,通过对语音信号进行分帧、加窗、傅里叶变换等处理,提取出与人耳感知的频率特征相关的Mel频率倒谱系数。

MFCC算法具有较好的语音信号特征提取效果,广泛应用于语音识别等领域。

二、计算题1. 对下述数字信号进行离散傅里叶变换(DFT):x(n) = [1, 2, 3, 4]首先,对x(n)进行零填充,得到长度为N的信号x'(n) = [1, 2, 3, 4, 0, 0, 0, 0]。

然后,对x'(n)进行DFT计算,得到频谱X(k)。

X(k) = [10, -2+2j, -2, -2-2j, 0, 0, 0, 0]2. 对下述频谱进行逆离散傅里叶变换(IDFT):X(k) = [10, -2+2j, -2, -2-2j]首先,对X(k)进行逆DFT计算,得到时域信号x(n)。

南理工-语音信号处理期末考试重点整理

南理工-语音信号处理期末考试重点整理

2、语音信号产生过程
2.语音产生过程
浊音(Voiced sounds) :声带绷紧,气流通过时会使得 开口变成一开一闭的周期性动作,这时候就造成周期 性的激发气流,如a,o;
清音(Unvoiced or Fricative sounds) :声带完全舒展 ,声道某部位收缩形成一个狭窄的通道,产生空气湍 流,如t,d;
3、语音信号产生的数字模型
第02章基础知识—12
由图可见,它是一个低通滤波器。频率分析表明,其幅度谱按12 dB/倍 频程的速率衰减。如果将其表示为Z变换的全极模型的形式,有 G(z)=1/ (1-g1z-1)(1-g2z-1)
如果g1和g2的值都接近于1,则由此形成的激励信号频谱很接近于声门 脉冲的频谱。显然,上式表明斜三角波可描述为一个二阶极点的模型。需 要指出,不同人、不同语音,其声门脉冲的形状不一定相同,但在语音合 成中对其形状要求不很苛刻,只要其傅里叶变换有近似的特性就可以了。
第02章基础知识—9
3、语音信号产生的数字模型
3. 语音信号产生的数字模型
下图是一 个完整的语音信号产生的数字模型:
第02章基础知识—10
3、语音信号产生的数字模型
由此模型框图,我们可将语音信号看成 准周期序列或随机噪声序列作为激励的 线性非移变系统的输出,此模型可分为 三个部分:激励模型、声道模型、辐射 模型 激励模型 根据发浊音和发清音的机理 又分为:(a)浊音激励 (b)清音激励
出。 基于各种音素发音的不同谐振特点可建立起三
种实用的共振峰模型: (a)级联型 (b)并联型 (c)混合型
第02章基础知识—16
3、语音信号产生的数字模型
(2) 声道模型
(a)级联型: 适用于一般单元音,认为声道是一组串联的二阶谐振器:

语音信号处理中期复习要点

语音信号处理中期复习要点

《语音信号处理》中期复习要点[0].什么是语音?解释音质、音量、音调[1].解释元音、辅音[2].解释音素、音节[3].语音信号的最大特点是什么?[4].解释基音、共振峰的概念[5].列于几种语音预处理的方法[6].语音预处理中的预加重,加重的是哪部份?[7].相同条件下,时间分辨率、频率分辨率、时宽、带宽相互之间成什么关系?[8].讨论窗口大小对短时能量分析的影响。

[9].讨论窗口大小对短时幅度分析的影响。

[10].已知某音频信号的采样率为10kHz,量化精度为16位,均匀量化,则该信号的编码率为?(单位bps)[11].短时能量分析和短时平均幅度分析的本质是相同的,都是以对语音信号的什么为研究对象的。

[12].短时相关分析和短时平均幅度差分析出发点相同,以语音的什么为考察对象的?[13].过零率和什么密切相关?[14].三条曲线分别代表三种音素:浊音V、清音U、无声S(能量较小的背景噪声)的短时过零概率分布,在图中标注对应位置。

[15].三条曲线分别代表三种音素:浊音V、清音U、无声S(能量较小的背景噪声)短时幅度概率分布,在图中标注对应位置。

[16].E n、Mn的作用是什么?[17].解释短时自相关分析为什么能够提取基音。

[18].估计该图语音的基音周期[19].经过修正和没有经过修正的短时自相关分析有何区别?为什么要进行修正?[20].经过修正和没有经过修正的短时平均幅度差分析有何区别?为什么要进行修正?[21].人耳对语音的高频还是低频部分更加敏感?[22].利用语音信号(浊音)的准周期性,来提取基音信息或区分清浊音的时域方法有哪些?[23].E n(k)=21)]()([1∑-=++-+NmkmnxmnxN可以用来提取什么?两个窗口的大小关系是?[24].什么是短时自相关分析的“谱平整”[25].比较短时自相关和AMDF的算法优缺点[26].语音信号的STFT,是一个关于和的二元函数,分别固定它们时,可以得到两种解释,一种是,一种是。

通信中的语音信号处理复习大纲

通信中的语音信号处理复习大纲

《通信中的语音信号处理》复习大纲1、了解语音信号处理的目的、实质和发展历史;实质:是研究用数字信号处理技术对语音信号进行处理的一门学科目的:通过处理得到一些反映语音信号重要特征的语音参数以便高效地传输或储存语音信号所包含的信息。

通过对语音信号进行某种运算以达到某种要求。

发展历史:1876年电话的发明,贝尔(Bell);1939年声码器的研制成功—声源+声道;1947年贝尔实验室发明语谱图仪—语音识别研究的开始;50年代第一台口授打字机和英语单词语音识别器;60年代出现了第一台以数字计算机为基础的孤立词语音识别器和有限连续语音识别器;70年代动态规划技术、隐马尔可夫模型、线性预测技术和矢量量化码书生成方法用于语音编码和识别;80、90年代语音处理技术产品化—IBM Tangora-5和Tangora-20英语听写机,Dragon Dictate 词汇翻译系统(70000),汉语听写机。

CMU语音组研制成功SPHINX系统(997,95.8%);国内,清华大学、中科院声学所和中科院自动化所在汉语听写机研究方面有一定成果。

(除了属于这种LPC[线性预测分析法]的方法外,还开发了各种数字语音处理方法。

到目前为止,相继实现了语音编码、语音分析、语音合成、语音修正、语音识别、说话者识别等各种具体应用系统。

)2、理解和掌握语音信号的表示和处理方法,常用的语音编码的采样率和相应的数字语音信号的速率;1.语音表示方法的选择:要保存语音信号中的消息内容;表示形式要便于传输和存储、变换和处理,不至于严重损害消息的内容,有用信息更易于被提取;2. 语音信号数字表示的优点:数字技术能完成许多很复杂的信号处理工作;语音可以看成是音素的组合,具有离散的性质,特别适合于数字处理;数字系统具有高可靠性、价廉、紧凑、快速等特点,很容易完成实时处理任务;数字语音适于在强干扰信道中传输,易于和数据一起在通信网中传输,也易于进行加密传输。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

s(n)
A(z)
逆滤波器
e(n)
A(z)
1
F(z)
1
p i 1
ai zi

1 H(z)
第6章思考题:
1.如何将信号模型化为模型参数?最常用的是什 么模型?什么叫线性预测?什么叫逆滤波器?
2.自相关法求预测误差滤波器的预测系数、预测 误差功率 的过程。 3. 什么叫LPC参数?PARCOR参数?LSP参数?
3. 短时自相关函数和短时平均幅度差函数定 义和用途,它们间有什么差异?
第4章 语音信号的短时傅里叶分析
• 短时傅里叶变换的定义

表达式 X n (e j ) x(m)w(n m)e jm m
标准傅里叶变换的解释
滤波器的解释
频率分辨率、时间分辨率与窗口长度的关系: f 1
u(n)
H(z)
s(n)
图6-1 信号s(n)的模型化
H(z)
G
p

1 ai zi
i 1
ai为实数
线性预测分析就是根据已知信号s(n)对各参数 aˆ i
和增益G进行估计。在这里

为线性预测系数。
i
s(n)
F(z)
图6-3 线性预测器
sˆ(n)
p
F (z) ai zi i 1
1.什么叫做隐马尔可夫过程?为什么说语 音信号可以看成隐马尔可夫过程?
NT
•短时傅里叶变换的取样率 •语音信号的短时综合 滤波器组求和法
•语谱图
可同时在时间和频率上显示语音频谱随 时间的变化。
第4章思考题:
1. 短时傅里叶变换的定义式是什么?短时傅 里叶变换的两种解释是什么? 如何提高短 时谱的频率分辨率?
2. 在求语音信号的短时谱时,对窗函数有什 么要求? 对语音信号频谱分析采用海明窗 和矩形窗各有什么特点?
卷积同态系统模型 特征系统 D*[ ] 和D*-1[ ]
的三步数学运算
语音信号两个卷积分量的复倒谱
避免相位卷绕的算法 最小相位信号序列:
信号的零极点全部在z 平面单位圆内。
第5章思考题:
1. 什么叫解卷?解卷算法有几种?什么叫同态滤波?其 作用是什么? 2. 卷积同态系统的组成及意义?特征系统D*[ ]和逆特征 系统D*-1[ ]运算的三个步骤是什么? 3. 什么是复倒谱?什么是倒谱?分别写出其数学表达式。 清、浊音的复倒谱或倒谱各有什么特点? 4. 什么是相位卷绕?它是如何产生的?有什么方法克服?
• 语音信号 的产生模型
激励模型 声道模型 辐射模型
声管模型
级联型
共振峰模型 并联型
混合型
基音周期 冲激序列 发生器 随机噪声 发生器
基音周期
单个声门 脉冲模型
幅度
浊/清音 开关
声道 模型
幅度
语音信号的产生模型
辐射 语音信号 效应
ቤተ መጻሕፍቲ ባይዱ
准周期脉冲 序列发生器
浊音
随机噪声 发生器

清音
增益控制
语音产生的数字模型
与第9章结合复习
主要内容 6.1概述 6.2线性预测分析的基本原理 6.3线性预测分析的解法——自相关法 6.4格型法 6.5线性预测分析应用 ---LPC谱估计和LPC复倒谱
线性预测(简写为LPC)分析的基本原理是将被 分析的信号用一个模型来表示,即将信号看作是 一个模型(即系统)的输出。用模型参数来描述 信号。
时变线性 系统
语音取样值
时变参数
第2章思考题:
1. 什么叫语言?什么叫语音? 2. 人类的发音器官包括哪些?在发音时各起了什
么作用? 3. 解释以下概念:基音频率、共振峰、浊音、清
音。 4. 语音信号模型包括哪些子模型?激励模型和辐
射模型各属于什么性质的滤波器?
第3章语音信号的时域分析
•语音处理的目的 •语音信号分析方法
•短时分析技术:对语音信号采用分段或叫分帧 处理
称为短时分析
•短时能量分析 •短时平均幅度
短时平均能量的定义 窗口形状的选择 窗口的长度 主要用途:区分清音段和浊音段
•短时过零分析:定义、主要用途
•短时相关分析
第3章思考题:
1. 在语音信号参数分析前为什么要进行预处 理,有哪些预处理过程?
2. 短时平均能量(平均幅度)和短时平均过 零率的定义。这两种时域参数的用途。窗口 函数的长度和形状对它们有什么影响?
8.1 概述 8.2 隐马尔可夫模型的引入 8.3 隐马尔可夫模型的定义 8.4 隐马尔可夫模型三项问题的求解
HMM模型的结构主要有两种: •各态历经:主要用于说话人识别、语种辨识等
(即只能用于不要求时间顺序的语音信号处理)
•从左至右: 主要用于语音识别
(因语音识别特征参数是一个时间序列)
第8章思考题
第三篇 语音信号处理技术与应用
第10章 语音编码(一) ——波形编码
第11章 语音编码(二) ——声码器技术与混合编码
第12章 语音合成
第13章 语音识别
第14章 说话人识别
第15章 语音增强
第1章 绪论
•语音信号处理 :概念、应用领域 •语音、语言:
第2章 语音信号处理的基础知识
•语音的产生 •语音的分类: 浊音、清音 •语音的基本特性 •语音的时间波形和频谱特性 •语音信号的统计特性
Speech Signal Processing
全书三篇,16章(讲15章) 第一篇 语音信号处理基础
第1章 绪论 第2章 语音信号处理的基础知识
第二篇 语音信号分析
第3章 语音信号的时域分析 第4章 语音信号的短时傅里叶分析 第5章 语音信号的同态滤波及倒谱分析 第6章 语音信号的线性预测分析 第7章 语音信号的矢量量化 第8章 隐马尔可夫模型(HMM) 第9章 语音检测分析
4. 什么是LPC谱?LPC谱估计的特点。
7.1概述 7.2矢量量化的基本原理 7.3失真测度 7.4最佳矢量量化器和码本设计 7.5降低复杂度的矢量量化系统 7.6语音参数的矢量量化
第7章思考题:
1. 什么叫矢量量化?什么叫码书?码字? 2. 矢量量化器的工作原理是什么? 3. 什么叫失真测度?常用的有哪几种? 4.矢量量化器最佳设计的两个条件?如何理解? 5.LBG算法原理?
3. 短时傅里叶变换滤波器解释的两种形式的 物理意义是什么?
4. 什么是语谱图?窄带语谱图和宽带语谱图 各有什么特性?
第5章 语音信号的同态滤波及倒谱分析
由卷积结果求得参与卷积的各个信号称为“解卷”, 也称为反卷积。同态信号处理也叫同态滤波,它实现了 将卷积关系变换为求和关系的分离处理。
同态信号处理的基本原理 复倒谱和倒谱
相关文档
最新文档