语音信号处理_考试参考题(修订版)(1)

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

一、填空题：（每空1 分，共60分）

1、语音（speech）300－3400kHz，采样率为（8kHz ）宽带语音（wide-band speech），带宽7kHz （50-7k），采样率为（14k Hz ）带宽20kHz（20-20k），采样率一般为（40k Hz ）

2、语音由肺中的通过（稳定）的气流或声道中的气流激励（喉头至嘴唇的器官的各种作用）而产生。当肺中的气流通过声门时，声门由于其间气体压力的变化而开闭，使得气流时而通过，时而被阻断，从而形成一串周期性脉冲送入声道，由此产生的语音是（浊音）。如果声带不振动，声门完全封闭，而声道在某处收缩，迫使气流高速通过这一收缩部位而发音，由此产生的语音是（清音）。

3、语音信号从总体上是非平稳信号。但是，在短时段（10~30）ms中语音信号又可以认为是平稳的，或缓变的。

4、语音的四要素是音长，音强，音高和音质，它们可从时域波形上反映出来。其中音长特性：音长（长），说话速度必然慢；音长（短），说话速度必然快。音强的大小是由于声源的（震动幅度）大小来决定。

5、声音的响度是一个和（振幅）有密切联系的物理量，但并不就是音强。

6、人类发音过程有三类不同的激励方式，因而能产生三类不同的声音，即（浊音）、（清音）和（爆破音）。

7、当气流通过声门时声带的张力刚好使声带发生较低频率的张弛振荡，形成准周期性的空气脉冲，这些空气脉冲激励声道便产生浊音如果声道中某处面积很小，气流高速冲过此处时而产生湍流，当气流速度与横截面积之比大于某个门限时（临界速度）便产生摩擦音，即（清音）。

8、如果声道某处完全闭合建立起气压，然后突然释放而产生的声音就是（爆破音）。

9、在大多数语音处理方案中，基本的假定为语音信号特性随时间的变化是（平稳随机）的。这个假定导出各种（线性时不变）处理方法，在这里语音信号被分隔为一些短段再加以处理。

10、一个频率为F。的正弦形信号以Fs速率抽样，正弦波的一周内就有（Fs/F0）个抽样。每一周内有两次过零，所以过零的长时间平均率是（2 Fs/F0）过零率／抽样。因此，平均过零率就是一个估计正弦波频率的适当方法。

11、如果过零率（高），语音信号就是清音。如果过零率（低），语音信号就是浊音。语音流由（音位）结合而成的最小单位，同时也是（音节）的最小单位,其英语对应词是phoneme，一个音节由（元音）和（辅音）构成，其英语对应词是Vowel和Consonant。

12、语音信号的最重要持征表现在它的“短时频谱”上。如果从语音流中利用加窗的方法取出其中的一个短段，再对其进行（傅立叶）变换，就可以得到该段语音的（短时）谱。

13、人类听觉系统具有（掩蔽效应），大致是一个单音的声级越（高），对其周围频率声音的掩蔽作用越强。人耳对不同频段声音的敏感程度（不同）。人耳对语音信号的（低频率和高频率）变化不敏感。

14、响度较（大）的频率成分的存在会影响响度较（小）的频率成分的感受，使其变得不容易察觉。

15、浊音的声带振动基频称为（基音频率）。

16、分析综合技术就是通过对信源分析，提取其中具有本质意义的参数，编码仅对这些参数进行。接受端借助一定的规则和模型，结合一定的算法将这些参数再综合成逼近（原语音）。

17、高、低子带信号能量相互混叠的现象也称为（频谱混叠）。

18、声音的掩蔽效应，说明一个声音的存在会影响人耳对另一个声音的听觉能力。掩蔽效应与两个声音的（频率和相对音量）有关。利用掩蔽效应可以用有用声音信号去掩蔽无用声音信号，即将不需要的声音在主观感觉上降低或消除。

19、语音可以用一个（语音生成）系统的输出来表示，该系统具有随时间（变化）的性质。这把我们引向语音分析的一项基本原理，该原理指出，如果我们研究语音信号的每一短段，则以准周期脉冲串或随机噪声信号激励一个（）系统所产生的输出信号作为每一段的模型是有效的。

20、语音分析的问题在于估计语音模型的参数并且测量它们随时间的变化。因为一个线性时不变系统的激励信号及其冲激响应是按（级联）方式结合起来的，语音分析问题可以看作是将（）的问题。这个问题通常称为（）。

21、语音增强的一个主要目标是从带噪语音信号中提取尽可能纯净的原始语音。对于非加性噪声，有些可

以通过变换而转变为（）。

22、语音的发声过程可以模型化为激励源作用于一个线性时变滤波器，激励源可以分（浊音激励）和（清音激励）两类，浊音由气流通过声带产生。时变滤波器则是（）的模型。通常认为声道模型是一个（全极点）滤波器，滤波器参数可以通过线性预测分析得到，但若考虑到鼻腔的共鸣作用，采用（）模型更为合适。

23、CELP 体制用保存在激励码本中的码矢量或自适应产生的矢量作为激励，以语音（）作为声道模型，产生语音信号。

24、将（综合器）引入编码器，和语音分析器结合，在编码端产生与解码端一样的合成语音，与原始语音在感知加权域内相比较，选择适当的语音编码参数值，使得比较的误差最小。

25、按发音方式，可分为（单个特定讲话人）、（多讲话人）发音识别系统及（与讲话人无关）三种识别系统。

26、按识别对象，可分为（孤立词、连接词、连续语音识别系统）及（语音理解和会话系统）识别系统；

27、按词汇表的大小，可分为小词汇表（1~20词）、中等词汇表（20 —1000词）、大词汇表（1000词）以上和无限词汇表识别系统，理想的语音识别系统应该是非特定人无限词汇的连续语音识别系统。

二、问答题（每题5分，共20 分）

1、语音信号处理主要研究哪几方面的内容？

语音信号处理是研究用数字信号处理技术对语言信号进行处理的一门学科，语音信号处理的理论和研究包括紧密结合的两个方面：一方面，从语言的产生和感知来对其进行研究，这一研究与语言、语言学、认知科学、心理、生理等学科密不可分；另一方面，是将语音作为一种信号来进行处理，包括传统的数字信号处理技术以及一些新的应用于语音信号的处理方法和技术。

2、语音识别的研究目标和计算机自动语音识别的任务是什么？

语音识别技术，也被称为自动语音识别Automatic Speech Recognition，(ASR)，其目标是将人类的语音中的词汇内容转换为计算机可读的输入，例如按键、二进制编码或者字符序列。

计算机自动语音识别的任务就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。

3、语音合成模型关键技术有哪些？

语音合成是实现人机语音通信，建立一个有听和讲能力的口语系统所需的两项关键技术，该系统主要由三部分组成：文本分析模块、韵律生成模块和声学模块。1.如何取样以精确地抽取人类发信的主要特征，2.寻求什么样的网络特征以综合声道的频率响应，3.输出合成声音的质量如何保证。

4、语音压缩技术有哪些国际标准？

三、列举工农业生产、人民生活中的 5 种语音信号处理应用技术或产品。简述其工作原理？（共20 分）语音压缩, 语音合成语音识别语音增强语音理解

语音识别的应用领域非常广泛，常见的应用系统有：语音输入系统，相对于键盘输入方法，它更符合