贵大语音信号处理试卷2012-2013
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、填空
1、物理声学认为声波具有音调、音强、音长和音色四种要素。P7
2、频率低于20Hz的信号称为次声。
3、元音频谱有明确的共振峰结构。P28
4、宽带语谱图的带宽约为300 Hz。P29
5、语谱图中冲直条代表基音或赛擦音。P29
6、语音信号的频率越低,相应的能量越高。
7、矩形窗的主瓣宽度最小,旁瓣高度最大,会导致泄漏现象。P45
8、语谱图中垂直条纹的基音条纹间隔是基音的周期。P29
9、清音时能量集中于较高频率段内,具有高的过零率。P38
10、对数功率谱的逆傅里叶变换是一个空间域。
二、选择题:
1、窄带语谱图具有良好的(a)分辨率。P29
A、频率
B、时间
C、视觉
D、感觉
2、窄带语谱图的带宽约为(a)Hz。P29
A、45
B、90
C、180
D、300
3、标准量化是将取样后的信号值( b )地进行量化。P86
A、全部
B、逐个
C、局部
D、同时
4、人工神经网络由( d )三者构成。P117
A、神经元
B、网络拓扑
C、学习算法
D、神经元,网络拓扑,学习算法
5、短时自相关函数可以很明显的反映(d )信号的周期性。P40
A、清音
B、摩擦音
C、爆破音
D、浊音
6、一个脉冲序列信号可以用(d )表示。
A、ejω
B、sinωi
C、u(t)
D、δ(t)
7、周期信号在频域里有(b)结构特点。
A、连续
B、谐波
C、周期
D、单值
8、语音信号是一种典型的( b )信号。P286
A、确定
B、随机
C、模糊性
D、混沌性
9、脉冲编码制PCM编码速率(c)。P144
A、16kbit/s
B、32kbit/s
C、64kbit/s
D、126kbit/s
10、语音信号预滤波的目的是(c)。P33
A、防止混叠干扰
B、抑制50Hz的电源干扰
C、防止混叠干扰和抑制50Hz的电源干扰
D、防止清音干扰
三、判断题
1、辅音发声时的阻碍的位置叫调音点(r)。P9
2、窄带语谱具有良好的时间(频率)分辨率,但频率(时间)分辨率较差(x )。P29
3、不能直接对语音信号进行傅里叶变换(r )。P65
4、语音信号预加重的目的是为了提升高频,使信号的频谱平坦(r)。P34
5、语音信号处理窗口的长度一般为126点(X )。P37
6、矩形窗频率分辨率最低(高),频率泄漏最小(x )。P45
7、过零率就是每秒内信号值通过最大值的(信号波形穿过横轴)次数(x)。p38
8、浊音时能量集中于较高频率段内,具有较高(较低)的过零率(x)。P38
9、矢量量化是一种信号(信号压缩和编码的)处理方法(x)。貌似对的p86
10、HMM是一种随机过程(r)。P100
1、论述发音器官产生元音的条件。P7
a、声道受到声带振动的激励引起共振;
b、在语音流的持续过程中,声道不发生极端的狭窄并维持较稳定的形状;
c、和鼻腔不发生耦合,声音只从口腔辐射出去。这三个条件需同时满足,否则该语言就是辅音。
2、简述幅度分析的依据。
3、简述LPC的基本思想。(线性预测)p53
由于语音信号样点之间存在相关性,所以可以用过去的样点值来预测现在或未来的样点值,即一个语音的抽样能够用过去若干个语音抽样的线性组合来逼近,通过使实际语音信号抽样值和线性预测抽样值之间的误差在均方准则下达到最小值来求解预测系数,而这预测系数就反映了语音信号的特征,故可以用这组语音特征参数进行语音识别或语音合成等。
1、简述基音同步叠加psola算法的主要特点。
在语音波形片断拼接之前,首先根据语义,用PSOLA算法对拼接单元的韵律特征进行调整,使合成波形既保持了原始语音基元的主要音段特征,又使拼接单元的韵律特征符合语义,从而获得很高的可懂度和自然度。(来自网络)p185
2.语音增强的目的。P285
其一,语音增强的一个主要目标是从带噪语音信号中提取尽可能纯净的原始语音。然而,由于干扰通常都是随机的,从带噪语音中提取完全纯净的语音几乎不可能。在这种情况下,语音增强的目的主要有两个:一是改进语音质量,消除背景噪音,使听者乐于接受,不感觉疲劳,这是一种主观度量;二是提高语音可懂度,这是一种客观度量。这两个目的往往不能兼得。目前有一些对低信噪比带噪语音进行语音增强的方法,可以显著地降低背景噪声,改进语音质量,但并不能提高语音的可懂度,甚至略有下降。
其二,解决噪声污染,在接收端尽可能在带噪声语音中提取纯净的语音信号,改善其质量,提高语音识别系统前端与处理的抗噪声能力,提高输入信号的信噪比。
3.说话人识别的特征主要包括哪些内容?P219
语音短时能量、基音周期(现已证实基音调周期及其派生参数携带有较多的个人信息) 、语音短时谱或BPFG 特征(包括14 -16 个BPF) .线性预测系数LPC、共振峰频率及带宽、LPC 倒谱等,以及反映这些特征动态变化的线性回归系数等,其他的特征参数还包括鼻音联合特征、谱相关特征、相对发音速率特征、基音轮廓特征等.另外.也可以对这些特征进行变换加工,如K-L 变换等,而得到加工后的二次特征。其中,倒谱特征和基音特征是较常用的特征,并获得了较好的识别。