语音信号 习题
语音信号处理考试题(综合)
语音信号处理重点、考点、考试题一、填空题:(共7小题,每空2分,共20分)A卷1、矢量量化系统主要由编码器和组成,其中编码器主要是由搜索算法和构成。
2、基于物理声学的共振峰理论,可以建立起三种实用的共振峰模型:级联型、并联型和。
3、语音编码按传统的分类方法可以分为、和混合编码。
4、对语音信号进行压缩编码的基本依据是语音信号的和人的听觉感知机理。
5、汉语音节一般由声母、韵母和三部分组成。
6、人的听觉系统有两个重要特性,一个是耳蜗对于声信号的时频分析特性;另一个是人耳听觉的效应。
7、句法的最小单位是,词法的最小单位是音节,音节可以由构成。
二、判断题:(共3小题,每小题2分,共6分)1、预测编码就是利用对误差信号进行编码来降低量化所需的比特数,从而使编码速率大幅降低。
()2、以线性预测分析-合成技术为基础的参数编码,一般都是根据语音信号的基音周期和清/浊音标志信息来决定要采用的激励信号源。
()3、自适应量化PCM就是一种量化器的特性,能自适应地随着输入信号的短时能量的变化而调整的编码方法。
()三、单项选择题:(共3小题,每小题3分,共9分)1、下列不属于衡量语音编码性能的主要指标是()。
(A)编码质量(B)矢量编码(C)编码速率(D)坚韧性2、下列不属于编码器的质量评价的是()(A)MOS (B)DAM(C)DRT(D)ATC3、限词汇的语音合成技术已经比较成熟了,一般我们是采用()作为合成基元。
(A)词语(B)句子(C)音节(D)因素四、简答题:(共2小题,每小题12分,共24分)1、画出矢量量化器的基本结构,并说明其各部分的作用。
2、试画出语音信号产生的离散时域模型的原理框图,并说明各部分的作用。
五、简答题:(共5小题,前三小题,每题5分,后两小题,每题10分,共35分)1、线性预测分析的基本思想是什么?2、隐马尔可夫模型的特点是什么?3、矢量量化器的所谓最佳码本设计是指什么?4、针对短时傅里叶变换Ⅹn(ejw)的定义式,请从两个角度对其进行物理意义的分析。
语音信号处理 华工 2015
一、分析题
1、语谱图的定义以及对其进行解读,答出横杠、竖直条、乱纹的物理意义(7分)
2、隐马尔科夫模型的三个基本问题,其中哪一个最难解决,并说出主要原因(7分)
二、简答题
1、同态信号处理的基本原理,以语音信号为例。
(5分)
2、MFCC特征提取的流程。
(5分)
3、波形编码与参数编码的区别。
(5分)
4、DTW算法的目的以及其基本思想(5分)
5、矢量编码的基本原理(4分)
6、HMM的两个随机过程(4分)
三、填空题(每空2分)
1、预处理一般包括预加重、加窗、分帧。
2、说话人识别系统包括预处理、特征提取、模式匹配、判决。
3、语音是人的发声器官发出的一种声波,它具有一定的音色,音调,音强和音长。
4、一个语音的抽样能够用过去若干个语音抽样或它们的线性组合来逼近。
5、。
(实在是记不起啦)
四、选择题
五.判断题
(后面的选择、判断题自求多福吧)。
语音信号处理 试题
语音信号处理试题共20道1. 什么是语音信号处理?语音信号处理是关于对语音信号进行分析、合成、增强和识别等处理的技术领域。
2. 解释什么是时域和频域。
时域是指信号在时间上的变化,频域是指信号在频率上的变化。
3. 什么是数字信号处理(DSP)?数字信号处理是指在数字计算机或数字信号处理器上对信号进行处理和分析的技术。
4. 描述语音信号的采样和量化过程。
采样是将连续的语音信号转换为离散的信号,通过在时间上等间隔地采集样本。
量化是将采样后的信号的幅度近似为离散的数值。
5. 什么是谱分析?谱分析是通过将信号转换到频域来分析信号的频谱特性,通常使用傅里叶变换来实现。
6. 请解释语音增强的目的和方法。
语音增强旨在改善语音信号的质量,减少噪声和其他干扰的影响。
常见的方法包括滤波、降噪和增益控制等。
7. 什么是语音编码?语音编码是将语音信号转换为数字数据的过程,以便在通信和存储中进行传输和处理。
常见的语音编码方法包括PCM、ADPCM、MP3等。
8. 解释语音识别的基本原理。
语音识别是将语音信号转换为文本或命令的过程。
它涉及特征提取、模型训练和模式匹配等步骤。
9. 描述语音合成的过程。
语音合成是将文本转换为语音信号的过程。
它包括文本处理、声学模型生成和波形合成等步骤。
10. 什么是语音活动检测?语音活动检测是识别语音信号中的活动部分(有声音的部分)和非活动部分(无声音的部分)的过程。
11. 解释MFCC特征在语音信号处理中的作用。
MFCC(Mel频率倒谱系数)是一种常用的语音特征提取方法,它可以将语音信号转换为具有更好鲁棒性和可区分性的特征表示。
12. 什么是语音端点检测?语音端点检测是识别语音信号中的开始和结束点的过程,常用于语音识别和语音分割任务中。
13. 解释自适应滤波在语音信号处理中的作用。
自适应滤波是一种根据输入信号的特性自动调整滤波器参数的方法,可以用于降噪和回声抵消等任务。
14. 描述基于隐马尔可夫模型(HMM)的语音识别流程。
《语音信号处理》课程试验练习
《语音信号处理》课程试验练习
本课程专题试验练习的目的是循序渐进,通过组合若干次专题练习,最终实现一个能够识别10个数字的孤立字语音识别系统。
练习1.
使用能量特征、过零率特征设计一个语音检测算法。
要求能在普通的实验室噪声环境下,准确地检测出语音信号的起终点位置。
练习2.
编写计算LPC 预测器系数的Durbin 算法程序,在此基础上计算全极点模型的倒谱。
编写FFT程序,由此计算语音信号的倒谱。
练习3.
编写语音识别的DTW 模板匹配算法程序。
练习4
用DTW算法和语音的倒谱特征实现一个能够识别10个不同数字发音的孤立字语音识别系统。
语音信号处理作业homework
Homework6
1、为何矩形窗不适合用于频谱成分动态范围很宽 的语音分析中? 2、用矩形窗和海明窗对浊音语音信号进行谱分析 时,效果有何不同? 3、波形乘以窗函数,相当于对信号谱与窗函数的 傅里叶变换进行卷积,窗函数应具有什么特性? 4、推导短时傅里叶变换的卷积积分形式。 5、写出短时傅里叶变换滤波器解释的第一种形式 定义式实数运算的表达式。 6、对直角窗而言,短时傅里叶变换的时间取样率 是多少?
Homework4
1、矩形窗和海明窗对短时平均能量的影响。 2、窗口的长度对短时平均能量的结果有什么影响? 3、短时平均能量函数和短时平均幅度函数的差别 是什么? 4、浊音和清音的短时平均过零数有何不同? 5、平均过零数的用途。在背景噪声大或小时,各 选用什么函数?
Homework5
1、求证短时自相关函数为偶函数、周期函数。 2、区分五种时域分析方法的表示式和实现框图。 3、浊音和清音的自相关函数各有什么特点? 4、根据书中P36页下图估算浊音的基因周期,其中 窗口长度N=401,采样频率为10kHz。 5、浊音语音和清音语音的短时平均幅度差函数各有 什么特点?。 6、写出短时傅里叶变换的定义式,短时傅里叶变换 与标准傅里叶变换之间的关系是什么? 7、写出短时傅里叶变换或离散的短时傅里叶变换的 两种解释 。
Homework7
1、语谱图和声纹定义。 2、同态滤波和倒谱分析的定义。 3、写出特征系统D*[ ]将卷积性信号转 化为加性信号的过程。 4、写出经过逆特征系统D*-1[ ]将加性 信号转换为卷积性信号的过程。
Homework8
1、用傅里叶变换写出复倒谱和倒谱定义式,二者有 何联系? 2、在倒谱情况下一个序列经过正、逆两个特征系统 变换后,不能还原成自身,原因何在? 3、推导声门激励信号和声道冲激响应序列的复倒谱。 4、声门激励信号和声道冲激响应序列复倒谱性质。 5、微分法避免相位卷绕原理。 6、求证最小相位信号复倒谱的偶对称分量和奇对称 分量的傅里叶变换别为的傅里叶变换的实部和虚部。 7、根据书P64图5-6写出最小相位信号法求复倒谱的 过程。
语音信号考试重点
人耳能听到的声音,频率范围在16Hz-16kHz ___-之间,年轻人的上限可以延伸至_20kHz__,老年人则衰退到_10kHz___。
短时分析技术的基本概念:语音信号的频率越低,相应的能量越高。
1、频域编码的两个基本原则(1)通过合适的滤波或变换,在频域上得到数目较少、相关性较小的分量,从而提高编码效率;(2)接受者所感知的失真信息是用来提高语音编码的性能。
2、语音识别的两个步骤:第一步是学习或训练;第二步是识别。
3、汉语的特点是:(1)汉语的特点为自然单位是音节、每一个字都是单音节字,即汉语的一个音节就是一个字的音,字是独立的发音单位;再由音节字构成词,最后由词构成句子。
每一个音节字由声母和韵母拼音而成;在音节中,声母较简单,而韵母比较复杂。
(2)汉语语音的另一个特点是它具有声调。
(3)汉语的特点还有音素少、音节少的特点。
4、矢量量化器最佳设计的两个条件是:最佳划分和最佳码书。
5、编码器的质量评价方法,包括主观评价法和客观评价法。
6、语音合成的三种基本方法:波形合成法、参数合成法和规则合成法。
1、海明窗与直角窗(矩形窗)对浊音语音的频谱分析比较它们在基音谐波、共振峰结构以及频谱具有相似性,但其频谱间也具有差别。
(1)是基音谐波尖锐度增加,这是因为矩形窗频率分辨率较高;(2)矩形窗较高的旁瓣产生了一个类似于噪声的频谱。
因此,在语音频谱分析中极少采用矩形窗。
2、简述如何利用听觉掩蔽效应。
(1)听觉掩蔽:人类听觉中存在一种现象,即两个音同时存在时,一个声音有可能受到另一个声音的干扰或压制,即一个音被另一音掩盖,这称为听觉掩蔽。
(2)应用:听觉掩蔽现象在语音处理中得到了广泛的应用。
在语音编码中,利用听觉掩蔽效应改善输出语音质量已取得很大效益。
3、简述语音信号的频谱和功率谱的作用。
频谱是对动态信号在频率域内进行分析对动态信号在频率域内进行分析对动态信号在频率域内进行分析对动态信号在频率域内进行分析,分析的结果是以频率为横坐标的各种物理量的谱线和曲线,即各种幅值以频率为变量的频谱函数F(ω)。
语音信号处理_考试参考题(修订版)(1)
一、填空题:(每空1 分,共60分)1、语音(speech)300-3400kHz,采样率为(8kHz )宽带语音(wide-band speech),带宽7kHz (50-7k),采样率为(14k Hz )带宽20kHz(20-20k),采样率一般为(40k Hz )2、语音由肺中的通过(稳定)的气流或声道中的气流激励(喉头至嘴唇的器官的各种作用)而产生。
当肺中的气流通过声门时,声门由于其间气体压力的变化而开闭,使得气流时而通过,时而被阻断,从而形成一串周期性脉冲送入声道,由此产生的语音是(浊音)。
如果声带不振动,声门完全封闭,而声道在某处收缩,迫使气流高速通过这一收缩部位而发音,由此产生的语音是(清音)。
3、语音信号从总体上是非平稳信号。
但是,在短时段(10~30)ms中语音信号又可以认为是平稳的,或缓变的。
4、语音的四要素是音长,音强,音高和音质,它们可从时域波形上反映出来。
其中音长特性:音长(长),说话速度必然慢;音长(短),说话速度必然快。
音强的大小是由于声源的(震动幅度)大小来决定。
5、声音的响度是一个和(振幅)有密切联系的物理量,但并不就是音强。
6、人类发音过程有三类不同的激励方式,因而能产生三类不同的声音,即(浊音)、(清音)和(爆破音)。
7、当气流通过声门时声带的张力刚好使声带发生较低频率的张弛振荡,形成准周期性的空气脉冲,这些空气脉冲激励声道便产生浊音如果声道中某处面积很小,气流高速冲过此处时而产生湍流,当气流速度与横截面积之比大于某个门限时(临界速度)便产生摩擦音,即(清音)。
8、如果声道某处完全闭合建立起气压,然后突然释放而产生的声音就是(爆破音)。
9、在大多数语音处理方案中,基本的假定为语音信号特性随时间的变化是(平稳随机)的。
这个假定导出各种(线性时不变)处理方法,在这里语音信号被分隔为一些短段再加以处理。
10、一个频率为F。
的正弦形信号以Fs速率抽样,正弦波的一周内就有(Fs/F0)个抽样。
语音信号处理答案
二、问答题(每题5分,共20 分)1、语音信号处理主要研究哪几方面的内容?语音信号处理是研究用数字信号处理技术对语言信号进行处理的一门学科,语音信号处理的理论和研究包括紧密结合的两个方面:一方面,从语言的产生和感知来对其进行研究,这一研究与语言、语言学、认知科学、心理、生理等学科密不可分;另一方面,是将语音作为一种信号来进行处理,包括传统的数字信号处理技术以及一些新的应用于语音信号的处理方法和技术。
2、语音识别的研究目标和计算机自动语音识别的任务是什么?语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。
计算机自动语音识别的任务就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。
3、语音合成模型关键技术有哪些?语音合成是实现人机语音通信,建立一个有听和讲能力的口语系统所需的两项关键技术,该系统主要由三部分组成:文本分析模块、韵律生成模块和声学模块。
1.如何取样以精确地抽取人类发信的主要特征,2.寻求什么样的网络特征以综合声道的频率响应,3.输出合成声音的质量如何保证。
4、语音压缩技术有哪些国际标准?二、名词解释(每题3分,共15分)端点检测:就从包含语音的一段信号中,准确的确定语音的起始点和终止点,区分语音信号和非语音信号。
共振峰:当准周期脉冲激励进入声道时会引起共振特性,产生一组共振频率,称为共振峰频率或简称共振峰。
语谱图:是一种三维频谱,它是表示语音频谱随时间变化的图形,其纵轴为频率,横轴为时间,任一给定的频率成分在给定时刻的强弱用相应点的灰度或色调的浓淡来表示。
码本设计:就是从大量信号样本中训练出好的码本,从实际效果出发寻找好的失真测度定义公示,用最少的搜素和计算失真的运算量。
语音增强:语音质量的改善和提高,目的去掉语音信号中的噪声和干扰,改善它的质量三、简答题(每题6分,共30分)1、简述如何利用听觉掩蔽效应。
音频信号分析考核试卷
B. MIDI控制器
C.数字音频接口
D.音序器
4.以下哪些格式属于有损音频压缩格式?( )
A. MP3
B. AAC
C. FLAC
D. OGG
5.在音频信号分析中,以下哪些参数用于描述信号的时域特性?( )
A.振幅
B.频率
C.波形
D.包络
6.以下哪些技术可以用于立体声声像定位?( )
A.声道延迟
18.在音频信号处理中,以下哪种方法可以减少噪声?( )
A.提高采样率
B.降低比特率
C.增加滤波器
D.减小振幅
19.以下哪种音频效果器用于调整声音的音色?( )
A.延时器
B.混响器
C.均衡器
D.压缩器
20.以下哪个参数与音频信号的音质密切相关?( )
A.采样率
B.比特率
C.声道数
D.音频效果器
(以下为答题纸)
6.在多声道录音中,5.1声道系统包含______个主声道和______个低频效果声道。
7.声音的音色主要由声音的______成分决定。
8.在FFT分析中,频率轴的分辨率与______成反比。
9.音频信号的动态范围是指从最小声到最大声的______范围。
10.在数字音频工作站中,______是用于控制虚拟乐器和音频处理器的软件界面。
1.在数字音频中,采样频率是指每秒钟对模拟信号进行______次采样。
2.音频信号的振幅表示声音的______。
3.常用的音频文件格式中,______格式是一种无损压缩格式。
4.在音频信号处理中,______是一种用来减少背景噪声的技术。
5.人类能听到的声音频率范围大约在______Hz到20000Hz之间。
语音信号处理复习题
1 研究语音信号处理的目的是什么?人类的通信有哪三种方式,从而说明语音信号处理有哪三个学科分支?它的目的一是要通过处理得到一些反映语音信号重要特征的语音参数以便高效的传输或储存语音信号信息;二是要通过处理的某种运算以达到某种用途的要求。
1.什么叫做语言学?什么叫做语音学?言语过程可分为哪五个阶段?语音中各个音的排列由一些规则所控制,对这些规则及其含义的研究学问称为语言学;另一个是对语音中各个音的物理特征和分类的研究称为语音学。
人的说话过程如图2-1所示,可以分为五个阶段:(1)想说阶段:(2)说出阶段:(3)传送阶段:(4)接收阶段:(5)理解阶段:3、有哪几种描述声道特性的数学模型?请说明声管模型流图是如何得出的?有几种共振峰模型?各有什么特点和适用情况?声道的数学模型有两种观点:1)声管模型将声道看为由多个不同截面积的管子串联而成的系统。
在“短时”期间,声道可表示为形状稳定的管道。
另一种观点是把声道视为一个谐振腔,按此推导出的叫“共振峰模型”。
共振峰模型,把声道视为一个谐振腔。
共振峰就是这个腔体的谐振频率。
由于人耳听觉的柯替氏器官的纤毛细胞就是按频率感受而排列其位置的,所以这种共振峰的声道模型方法是非常有效的。
一般来说,一个元音用前三个共振峰来表示就足够了;而对于较复杂的辅音或鼻音,大概要用到前五个以上的共振峰才行。
基于物理声学的共振峰理论,可以建立起三种实用的共振峰模型:级联型、并联型和混合型。
(1)级联型声道模型这时认为声道是一组串联的二阶谐振器。
从共振峰理论来看,整个声道具有多个谐振频率和多个反谐振频率,所以它可被模拟为一个零极点的数学模型;但对于一般元音,则用全极点模型就可以了。
它的传输函数可分解表示为多个二阶极点的网络的串联:N=10,M=5时的声道模型如下图所示:(2)并联型声道模型对于非一般元音以及大部分辅音,必须考虑采用零极点模型。
此时,模型的传输函数如下:通常,N>R ,且设分子与分母无公因子及分母无重根,则上式可分解为如下部分分式之和的形式:这就是并联型的共振峰模型。
语音信号处理期末考试复习题
《语音信号处理》期末考试复习资料(涉及考点的教材课后复习题)授课教师:薛雅娟老师整理人:通信161班梁雨(第2-5章)通信161班左自睿(第6-10章)根据成都信息工程大学通信工程学院选修课《语音信号处理》期末考试范围,整理成期末考试的复习资料以供学弟学妹们参考。
所有权归属成都信息工程大学。
在此衷心感谢薛老师平时悉心地教育指导。
整理人均系在读本科学生,水平有限,错误与不足之处在所难免,敬请大家见谅,欢迎批评、斧正。
第二章:语音信号处理的基础知识人耳听觉的掩蔽效应分为哪几种?掩蔽效应的存在对我们研究语音信号处理系统有什么启示?答:分为同时掩蔽和短时掩蔽。
同时掩蔽是指同时存在的一个弱信号和一个强信号频率接近时,强信号会提高弱信号的听阈,当弱信号的听阈被升高到一定程度时就会导致这个弱信号变得不可闻。
当A声和B声不同时出现时也存在掩蔽作用,称为短时掩蔽。
短时掩蔽分为前向掩蔽和后向掩蔽。
语音信号的数学模型包括哪些子模型?激励模型是怎样推导出来的?辐射模型又是怎样推导出来的?它们各属于什么性质的滤波器?答:①激励模型②声道模型③辐射模型④完整的语音信号的数学模型激励模型一般分成浊音激励和清音激励。
浊音激励:发浊音时,声激励是一个准周期的单位脉冲串,Av为增益参数;为了使浊音的激励信号具有声门振动气流脉冲的实际波形,需将冲激序列通过一个声门脉冲模型滤波器(实际上是一个斜三角波形)G(z)。
最后形成一个以基音周期为周期的斜三角波形。
清音激励模拟为随机噪声,实际中一般使用均值为0、方差为1的白噪声。
辐射模型:从声道模型射出的是速度波ul(n),而语音信号是声压波pl(n),二者之倒比称为辐射阻抗Zl。
在语音信号参数分析前为什么要进行预处理,有哪些预处理过程?答:预滤波的目的有两个:一是抑制输入信号各频域分量中频率超出fs/2的所有分量(fs为采样频率),以防止混叠干扰;二是抑制50Hz的电源工频干扰。
预处理过程:预加重、加窗和分帧。
语音信号处理期末复习题
语音信号处理期末复习题语音信号处理期末复习题语音信号处理是一门研究语音信号的产生、传输、处理和识别的学科。
它广泛应用于语音识别、语音合成、语音增强等领域。
在本文中,我们将回顾一些与语音信号处理相关的重要概念和技术。
一、语音信号的产生和特征提取语音信号是由人的声带振动引起的空气压力变化所产生的。
在语音信号处理中,我们通常使用基频、共振峰和声强等特征来描述语音信号。
1. 基频是指声音中最低频率的周期性振动。
它与人的声带振动频率相关,可以用来区分不同的语音音调。
2. 共振峰是指声音中频率响应最大的频率。
它与声道的共振特性相关,可以用来区分不同的语音音色。
3. 声强是指声音的能量大小。
它与声音的响度相关,可以用来区分不同的语音强度。
为了提取语音信号的特征,我们可以使用时域分析和频域分析等方法。
时域分析可以通过计算语音信号的短时能量和过零率等参数来描述语音信号的时域特征。
频域分析可以通过计算语音信号的功率谱和倒谱等参数来描述语音信号的频域特征。
二、语音信号的传输和编码在语音信号处理中,为了实现语音信号的传输和存储,我们需要对语音信号进行编码。
编码可以将连续的语音信号转换为离散的数字信号,以便于传输和处理。
1. 量化是指将连续的语音信号转换为离散的数字信号。
在量化过程中,我们需要选择合适的量化步长和量化级数,以平衡信号的保真度和数据的压缩率。
2. 编码是指将离散的数字信号表示为二进制码。
在编码过程中,我们可以使用不同的编码算法,如脉冲编码调制(PCM)和自适应差分脉冲编码调制(ADPCM)等。
为了提高语音信号的传输效率,我们还可以使用压缩算法对语音信号进行压缩。
压缩算法可以分为有损压缩和无损压缩两种。
有损压缩可以通过去除语音信号中的冗余信息来减少数据量,但会引入一定的失真。
无损压缩可以通过使用编码算法来减少数据量,但不会引入失真。
三、语音信号的处理和识别在语音信号处理中,我们可以使用滤波器、时域变换和频域变换等技术来对语音信号进行处理和分析。
数字语音处理复习题
第一章绪论1.语音信号处理是以语音语言学和数字信号处理为基础而形成的一门涉及面很广的综合性的学科。
p1d32.语音信号处理的应用技术列举:语音编码、语音识别、语音合成、说话人识别和语种辨识、语音转换和语音隐藏(语音信息伪装、语音数字水印技术)、语音增强等p4d33.当前语音信号处理应用的3个主流技术:矢量量化技术、隐马尔可夫模型技术、人工神经网络技术。
p4d3第二章语音信号处理基础知识1.语音是组成语言的声音,是声音(Acoustic)和语言(Language)的组合体。
p5d22.语音的基本声学特性包括音色,音调,音强、音长。
p7d2➢音色:也叫音质,是一种声音区别于另一种声音的基本特征。
➢音调:是指声音的高低,它取决于声波的频率。
➢音强:声音的强弱,它由声波的振动幅度决定。
➢音长:声音的长短,它取决于发音时间的长短。
3. 说话时一次发出的,具有一个响亮的中心,并被明显感觉到的语音片段叫音节(Syllable)。
一个音节可以由一个音素(Phoneme)构成,也可以由几个音素构成。
音素是语音发音的最小单位。
p7d34.任何语言都有语音的元音(V owel)和辅音(Consonant)两种音素。
p7d38.当声带振动发出的声音气流从喉腔、咽腔进入口腔从唇腔出去时,这些声腔完全开放,气流顺利通过,这种音称为元音。
p7d39.呼出的声流,由于通路的某一部分封闭起来或受到阻碍,气流被阻不能畅通,而克服发音器官的这种阻碍而产生的音素称为辅音。
p7d37.发辅音时由声带是否振动引起浊音和清音的区别,声带振动的是浊音,声带不振动的是清音。
p7d38.元音构成音节的主干(因为无论从长度还是能量看,元音在音节中都占主要部分。
)p7d39.元音的一个重要声学特性是共振峰(Formant)。
共振峰参数是区别不同元音的重要参数,它一般包括共振峰频率(Formant Frequency)的位置和频带宽度(Formant Bandwidth)。
语音信号处理考试试题
语音信号处理考试试题一、简答题1. 请解释什么是语音信号处理?语音信号处理指的是对语音信号进行数字信号处理的过程。
它涉及到声音的采集、编码、分析、合成和识别等一系列处理技术,旨在提高语音通信和语音识别系统的性能。
2. 请列举一些常见的语音信号处理应用。
常见的语音信号处理应用包括语音通信、语音识别、语音合成、语音增强、语音压缩等。
3. 请简要描述语音信号处理系统的基本框架。
语音信号处理系统的基本框架包括声音的采集、预处理、特征提取、模型训练和解码等步骤。
首先,声音信号通过麦克风采集,并进行预处理,如去除噪声、归一化等。
然后,从预处理的信号中提取出特征,如音频频谱、共振峰等信息。
接下来,使用这些特征进行模型的训练,以建立语音信号的模型。
最后,通过解码器将输入的语音信号与训练好的模型进行匹配,从而实现语音的识别或合成。
4. 请列举一些常用的语音信号处理算法或技术。
常用的语音信号处理算法或技术包括数字滤波、时域和频域特征提取、自动语音识别(ASR)、线性预测编码(LPC)、傅里叶变换(FFT)、Mel频谱倒谱系数(MFCC)、隐藏马尔可夫模型(HMM)等。
5. 请解释什么是Mel频谱倒谱系数(MFCC)算法。
Mel频谱倒谱系数(MFCC)算法是一种常用的语音信号处理算法,主要用于语音特征提取。
它模拟了人类听觉系统的工作原理,通过对语音信号进行分帧、加窗、傅里叶变换等处理,提取出与人耳感知的频率特征相关的Mel频率倒谱系数。
MFCC算法具有较好的语音信号特征提取效果,广泛应用于语音识别等领域。
二、计算题1. 对下述数字信号进行离散傅里叶变换(DFT):x(n) = [1, 2, 3, 4]首先,对x(n)进行零填充,得到长度为N的信号x'(n) = [1, 2, 3, 4, 0, 0, 0, 0]。
然后,对x'(n)进行DFT计算,得到频谱X(k)。
X(k) = [10, -2+2j, -2, -2-2j, 0, 0, 0, 0]2. 对下述频谱进行逆离散傅里叶变换(IDFT):X(k) = [10, -2+2j, -2, -2-2j]首先,对X(k)进行逆DFT计算,得到时域信号x(n)。
语音信号处理试卷
第 1 页 共 1 页 内蒙古科技大学2012/2013学年第一学期 《语音信号处理》B 卷 考试试题 课程号:67118305 考试方式:闭卷 使用专业、年级:信息2009 任课教师:杨立东 考试时间:120分钟 备 注: 一、填空题(共10空,每空2分,共20分) 1. 人类听觉系统具有 效应。
2. 利用参数编码实现语音通信的设备通常称为 。
3. Mel 频率尺度的值大体上对应于实际频率的 分布关系 4. 语音信号具有 特性,所以可以将其看作是一个准稳态过程。
5. 语音识别方法一般有模板匹配法、 和 三种。
6. VQ 中采用的距离测度必须具备对称性、 、 和有高效算法等性质。
7. 不能通过一个信号的倒谱还原原始信号,因为在计算倒谱过程中丢失了 信息。
8. 50Hz 交流电源哼声属于 噪声。
二、判断题(共5题,每题2分,共10分) 1. 在DM 编码中造成的颗粒噪声,可以通过减小量化阶距来去除。
( ) 2. 语音合成系统是一个单向系统,由机器到人。
( ) 3. FSVQ 是一种无记忆的矢量量化。
( ) 4. 人在说话的时候由于呼吸所引入的噪声称之为周期噪声 ( ) 5. 预加重的目的是提升低频部分,使信号的频谱变得平坦。
( )三、简答题(共5题,每题8分,共40分) 1. 简述LPC 的基本思想。
2. 简述端点检测过程中遇到的实际困难。
3. 简述HMM 的三个基本问题。
4. 简述语音信号分析过程中进行预滤波的目的。
5. 简述共振峰估计的过程中存在的困难。
四、计算题(共3题,每题10分,共30分) 1. 已知序列[][][][][][]0.110.4110.2820.0334h k k k k k k δδδδδ=+-+-+-+-,求()H z 及其倒序多项式4()R H z 。
2. 已知一个HMM 如下图所示,从S 1开始,S 4结束,每个状态有三个输出符号a,b ,c ,求利用该模型输出abcb 的概率。
语音习题
1什么叫语音?什么叫语言?人们说话的过程可分为哪五个阶段?每个阶段的主要内容是什么?2.人类的发音器官包括哪些部分?在发音时各部分都起什么作用?音调频率有什么因素决定的?3.人类的听觉器官包括哪些部分?在听音时他们是如何起作用的?基底膜是如何起关键作用的?4.人耳听觉的掩蔽效应分为哪几种?掩蔽效应的存在对我们研究语音信号处理系统有什么启示?5语音信号的数学模型包括哪些子模型?激励模型是怎样推导出来的?辐射模型又是怎样推导器?1.在语音信号参数分析前为什么要进行预处理,有哪些预处理过程?2.对语音信号进行处理时为什么要进行分帧?分帧的常用方法是什么?3.短时能量(短时平均幅度)和短时过零率的定义。
这两种时域参数的用途。
窗口的长度和形状对它们有什么影响?常用的有哪几种窗口?4.请叙述同态信号处理的基本原理(分解和特征系统)。
倒谱的求法及语音信号两个分量的倒谱性质。
有哪几种避开相位卷绕方法,请叙述它们的工作原理。
5.什么是复倒谱?什么是倒谱?已知复倒谱怎样求倒谱?已知倒谱怎样求复倒谱,有什么条件限制?6.什么叫基音和声调,它们对汉语语音处理有何重要意义?常用的基因周期检测方法有哪些?叙述它们的工作原理和框图。
7.为什么共振峰检测有重要意义?常用的共振峰检测方法有哪些?叙述它们的工作原理。
1.什么叫矢量量化,它在语音信号处理中有什么用途?什么叫做码本、码本尺寸和码矢(或码字)?如何分配矢量量化的各项技术指标?2.什么叫做失真测度,理想的失真测度应具有什么特性?常用的有哪几种失真测度,它们都是如何定义的?各有什么用途?3.什么是最佳矢量量化器码本设计的原则?什么是最近邻准则?4.如何设计最佳矢量量化器?什么叫做LBG算法?如何用程序加以实现?怎样设计初始码本,并用来训练码本?1.什么叫做马尔可夫链?什么叫隐过程?什么叫做隐马尔可夫过程?为什么说语音信号可以看成隐马尔可夫过程?隐马尔可夫模型有哪些模型参数?请叙述这些参数的含义和定义式。
复习试题
1.为什么语音信号要进行短时分析?2.语音信号的时域分析方法有哪些(写出三种)?3.同态信号处理又称同态滤波,画出同态滤波中特征系统框图?4.画出线性预测分析用于语音编码和语音合成的原理框图,并简述其原理?5.画出语音生成的数学模型?人的发音系统包括哪些部分?简述数学模型与人的发音系统之间的对应关系?6.在语音信号的时域分析方法中,清、浊音判断的方法有哪些(写出三种)?它们的基本原理是什么?7.常用的基音周期检测的方法有哪些(写出三种)?它们的基本原理是什么?8.对语音信号进行分析时,可以提取到哪些特征参数(写出三个或三个以上)9.语音信号时域分析中,短时能量分析的用途?10.画出矢量量化应用于语音识别的原理框图,并简述其原理?12.画出增量调制编码(DM)发送端原理框图并简述其原理及其增量调制编码的缺点?13.简述矢量量化的过程?14.画出矢量量化应用于语音通信的原理框图,并简述其原理?15.简述分裂法选取初始码本的基本思路?16.简述LBG 算法设计最佳码本的基本思路?17.画出增量调制编码(DM)发送端原理框图并简述其原理及其增量调制编码的缺点?18.画出自适应差分脉冲编码(ADPCM)发送端原理框图并简述其原理以及为什么自适应差分脉冲编码(ADPCM)可以提高系统的信噪比?19若采集的语音信号的动态范围为(-5v,+5v ), 采用A 律压扩编码。
当输入信号为1.05v ,且采用中平型量化器时,编码为多少?(写出具体的编码过程)20.设声门激励序列)1()()(-+=n a n n u δδ 求 (1))(n u 的复倒谱?(2))(n u 的倒谱?21.已知:线性预测相关性关系式:∑=-='p k k k n x a n x 1)()( 其中k a 为预测系数,预测误差∑=--='-=p k k k n x a n x n x n x n e 1)()()()()( ,根据均方误差最小准则(min 2)]([n e E ),证明:⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡----=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡p n n n n n n n n n n n n a a a R p R p R p R R R p R R R p R R R 21)0()2()1()2()0()1()1()1()0()()2()1( (Yule-Walker 方程), 其中:∑-==-=1,.....1),()()(N j n n p j j n x n x j R 为自相关函数22. 证明: []22333)(1n n E a E -=。
语音信号作业一
语⾳信号作业⼀语⾳信号处理作业⼀⼀、简答题1、语⾳信号的基本特性有哪些?答:(1)⾳质。
它是⼀种声⾳区别于其他声⾳的基本特征。
(2)⾳调。
就是声⾳的⾼低。
⾳调取决于声波的频率:频率快则⾳调⾼,频率慢则⾳调地低。
(3)声⾳的强弱。
⾳强即⾳量,⼜称响度。
它是由声波振动幅度决定的。
(4)声⾳的长短。
也称为⾳长,它取决于发⾳持续时间的长短。
2、试说明描述声⾳的三个物理量以及声⾳的三要素?答:(1)物理量:幅度、频率、相位。
(2)三要素:响度、⾳调、⾳⾊。
3、关于声道部分的数字模型,⽬前有哪两种观点?答:关于声道的数学建模有两种观点:1)将其视为多个不同的管⼦串联,由此导出声管模型;2)视为谐振腔,由此导出共振蜂模型。
4、贯穿于语⾳分析全过程的是什么技术?简述它的概念。
答:贯穿于语⾳分析全过程的是“短时分析技术”语⾳信号从整体来看其特征及表征其本质特征的参数均是随时间⽽变化的,所以它是⼀个⾮平衡态过程,不能⽤处理平衡信号的数字信号处理技术对其进⾏分析处理。
但是在⼀个短时间范围内(⼀般认为在10-30ms的短时间内),其特性基本保持不变即相对稳定,因⽽可以将其看作是⼀个准稳态过程,即语⾳信号具有短时平稳性。
5、画出语⾳信号处理的系统框图。
答:6、列举出⼏种常⽤的语⾳信号时域分析⽅法。
答:短时能量分析短时过零分析短时相关分析7、写出短时平均能量的定义式,并画出其实现框图。
答:8、试说明短时傅⾥叶分析的两种解释。
答:这两个公式都有两种解释:①当n固定不变时,它们是序列w(n-m)x(m)(-∞<m<∞)的标准傅⾥叶变换或标准的离散傅⾥叶变换。
此时与标准傅⾥叶变换具有相同的性质,⽽Xn(k)与标准的离散傅⾥叶变换具有相同的特性。
②当ω或k固定时,和Xn(k)看做是时间n的函数。
它们是信号序列和窗⼝函数序列的卷积,此时窗⼝的作⽤相当于⼀个滤波器。
9、短时傅⾥叶分析的取样率有哪⼏种?它们之间的关系如何?答:时间取样率、频域取样率、总取样率。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
CL=0.75A, y(n)自相关
CL=A, y(n)自相关
也可以用 matlab 进行画图: 先写单个周期的自相关函数如下:
function r=zixiangguan(y,p); m=size(y); r=zeros(1,p); m=length(y); for k=1:p temp=0; for i=0:2*p ind1=rem(i,p)+1; ind2=rem(i+k,p)+1; temp=temp+y(ind1)*y(ind2); end r(k)=1/(2*p+1)*temp; end
P34 1. 设序列 x(n)短时能量定义为: En = 其中窗函数表示为: w( m) = ⎨
m = −∞
∑[ x(m)w(n − m)]
∞
2
⎧a , ⎩0 ,
m
n
m≥0 m<0
试求En的一个递推公式,用En-1和输入x(n)表示En。
En = = =
m = −∞
∑[ x(m)w(n − m)]
n −1 n −1
function y=xiaobo(x,level) m=size(x); if length(m)>2 || ~(m(1)==1||m(2)==1) error('x must one-dimension!'); end if m(2)==1 x=x'; end m=size(x); y=zeros(m); temp=find(x>level); y(temp)=1; temp=find(abs(x)<=level); y(temp)=0; temp=find(x<-level); y(temp)=-1; return
然后分别画图
t=0:0.001:3.559; x=cos(10*t); y=xiaobo(x,0.5); %改变为 0.75,1 分别画图 r=zixiangguan(y,629); % r=r'; plot(r)
也可以用 Matlab 中的互相关函数 xcorr()作图 7. 常用的时域基音检测算法有哪些?他们的基本原理是什么? 要点:参见书本中(1)基于短时自相关函数的基音周期估计 a. 短时自相关函数在基音周期的整数倍位置存在较大的峰值 b. 找到第一最大峰值的位置就可以估计出基音周期 (2)基于短时平均幅度差函数的基音周期估计 a. 标准周期的信号在不同周期段对应的信号之差为零 b. 浊音是一个准周期信号,在一帧语音内不同基音周期段对应信号之 差应该很小。
N
N
m′ = 0
∑ aw(m′) x (n − 1 − m′) + x (n) − a
m′ = 0
x 2 (n − N ), (其中w(m′ + 1) = a
m ′ +1
)
= a ∑ w(m′) x 2 (n − 1 − m′) + x 2 (n) − a N x 2 (n − N ) = aEn −1 + x 2 (n) − a N x 2 (n − N )
再分别进行画图:
t=0:0.005:2; x=cos(10*t); c=0.5; %改变为 0.75,1 分别画图 y=xiaobo(x,c); hold on;plot([0,2.5],[0 0]); plot(t,y,'y') axis([0 2 -1.5 1.5]);
CL=0.5A, y(n)自相关
2
∞
⎧a ,
| m|
m≤ N 其他
⎩ 0,
En =
m = −∞ N −1 m =1 N
∑ w(m) x (n − m) = ∑ w(m) x (n − m)
2 2 m =0 m =0
ห้องสมุดไป่ตู้
∞
N −1
= ∑ w(m) x 2 (n − m) + w(m) x 2 (n − m)
± w(m) x 2 (n − m)
4. 证明短时平均过零率的定义式(3-15)可以表示为:
zn = zn −1 +
1 {| sgn[ x(n)] − sgn[ x(n − 1)] | − | sgn[ x(n − N )] − sgn[ x(n − N − 1)] |} 2N
1 2N
短时平均过零率的定义式(3-15)即为 zn =
m = n − N +1
m = n −1− N +1 n
∑ | sgn[ x(m)] − sgn[ x(m − 1)] |
n −1
将zn-1移到等式右边即可。 6. 将信号x(n)=Acos(ω0n)输入三电平削波器,输出为:
⎧ 1, ⎪ y (n) = ⎨ 0, ⎪− 1, ⎩
x (n) > C L x ( n) ≤ C L x(n) < −CL
(1) 当CL=0.5A,CL=0.75A,CL=A时,画出函数y(n)的波形。 (2) 当CL为以上三种取值时,画出y(n)的自相关函数。 (1) y(n)的波形
0.5A 0 -0.5A -0.75A -A CL=0.75A CL=A 0.75A A CL=0.5A
可以用 matlab 进行画图: 先写一个 function 函数如下:
∞
2
=
2
m = n − N +1
∑[ x(m)w(n − m)]
2
m = n − N +1
∑[ x(m)w(n − m)]
+ [ x(m) w(n − m)]2
2
m=n
± [ x(m) w(n − m]2
m = n −1− N +1
m = n −1− N +1
∑[ x(m)w(n − m)]
+ [ x(n) w(0)]2 − [ x(n − N ) w( N )]2
∑ | sgn[ x(m)] − sgn[ x(m − 1)] |
n
zn −1 =
1 2N
zn − zn −1 =
n −1 1 1 − − − | sgn[ ( )] sgn[ ( 1 )] | x m x m ∑ ∑ | sgn[ x(m)] − sgn[ x(m − 1)] | 2 N m = n − N +1 2 N m = n −1− N +1 1 {| sgn[ x(m)] − sgn[ x(m − 1)] |m = n − | sgn[ x(m)] − sgn[ x(m − 1)] |m = n −1− N +1} = 2N 1 {| sgn[ x(n)] − sgn[ x(n − 1)]− | sgn[ x(n − N )] − sgn[ x(n − N − 1)]} = 2N
m= N
= ∑ w(m) x 2 (n − m) + [ w(0)]x 2 (n) − w( N ) x 2 (n − N )
m =1
= =
m′ = 0 N −1
∑ w(m′ + 1) x (n − 1 − m′) + a
2 2 2 N −1
N −1
0
x 2 ( n) − a x 2 ( n − N )
= En −1 + [ x(n)a 0 ]2 − [ x(n − N )a N ]2 = En −1 + x 2 (n) − a 2 N x(n − N )
2. 设序列 x(n)短时能量定义为: En = 其中窗函数表示为: w(m) = ⎨ 试求En的一个递推公式。
m = −∞
∑ w(m) x (n − m)