大学本科语音信号处理实验讲义8学时汇总

合集下载

语音信号处理实验报告.docx

语音信号处理实验报告.docx
在浊音清音对比中,可以发现,对呈现谐波特征的浊音语音谱来说这个特点很明显,就是在谐波成分处LPC谱匹配信号谱的效果要远比谐波之间好得多。
在实验中,当P值增加到一定程度,预测平方误差的改善就不很明显了,而且会增加计算量,一般取为8~14,这里P取为10。
5.基音周期估计
①自互相关函数法
②短时平均幅度差法
二.实验过程
1. 系统结构
2.仿真结果
(1)时域分析
男声及女声(蓝色为时域信号,红色为每一帧的能量,绿色为每一帧的过零率)
某一帧的自相关函数
3.频域分析
①一帧信号的倒谱分析和FFT及LPC分析
②男声和女声的倒谱分析
③浊音和清音的倒谱分析
④浊音和清音的FFT分析和LPC分析(红色为FFT图像,绿色为LPC图像)
从男声女声的时域信号对比图中可以看出,女音信号在高频率分布得更多,女声信号在高频段的能量分布更多,并且女声有较高的过零率,这是因为语音信号中的高频段有较高的过零率。
2.频域分析
这里对信号进行快速傅里叶变换(FFT),可以发现,当窗口函数不同,傅里叶变换的结果也不相同。根据信号的时宽带宽之积为一常数这一性质,可以知道窗口宽度与主瓣宽度成反比,N越大,主瓣越窄。汉明窗在频谱范围中的分辨率较高,而且旁瓣的衰减大,具有频谱泄露少的有点,所以在实验中采用的是具有较小上下冲的汉明窗。
三.实验结果分析
1.时域分析
实验中采用的是汉明窗,窗的长度对能否由短时能量反应语音信号的变化起着决定性影响。这里窗长合适,En能够反应语音信号幅度变化。同时,从图像可以看出,En可以作为区分浊音和清音的特征参数。
短时过零率表示一帧语音中语音信号波形穿过横轴(零电平)的次数。从图中可以看出,短时能量和过零率可以近似为互补的情况,短时能量大的地方过零率小,短时能量小的地方过零率较大。从浊音和清音的时域分析可以看出,清音过零率高,浊音过零率低。

语音信号处理实验大纲

语音信号处理实验大纲

语音信号处理
一、实验课程名称:语音信号处理
二、实验课程英文名称: Speech signal processing
三、实验课程编号: 0451714
四、实验课程性质:非独立设课
五、学时安排:理论课程学时42 实验课程学时12
六、实验课程学分:0学分
七、实验课程类型:专业课
八、实验课程要求:必修课
九、课程适用专业:电子信息科学与技术
十、教学目的:
使学生掌握语音信号各种处理方法的原理、算法、用matlab的编程方法和仿真。

通过实际应用和亲身体验,加深对所学知识的理解,增强动手能力。

十一、实验教学项目表
实验课教学内容项目表(必做)
十一、实验报告要求:
1.编写程序;
2.验证调试实验并写出调试结果,需指导教师确认。

十二、实验成绩评定:
分数分配:
预习:10%,操作:60%,实验报告:60%,创新能力:10%;
实验总计6个,满分20分,第一和第二个实验每个4分,第三、四、五、六个实验每个3分。

十三、教材及参考书:
1.《语音信号处理》.胡航编著.哈尔滨工业大学出版社
2.《语音信号处理实验指导书》自编
学院签署意见表。

大学本科语音信号处理实验讲义8学时

大学本科语音信号处理实验讲义8学时

语音信号处理实验讲义时间:2011-12目录实验一语音信号生成模型分析 (3)实验二语音信号时域特征分析 (7)实验三语音信号频域特征分析 (12)实验四语音信号的同态处理和倒谱分析 (16)实验一 语音信号生成模型分析一、实验目的1、了解语音信号的生成机理,了解由声门产生的激励函数、由声道产生的调制函数和由嘴唇产生的辐射函数。

2、编程实现声门激励波函数波形及频谱,与理论值进行比较。

3、编程实现已知语音信号的语谱图,区分浊音信号和清音信号在语谱图上的差别。

二、实验原理语音生成系统包含三部分:由声门产生的激励函数()G z 、由声道产生的调制函数()V z 和由嘴唇产生的辐射函数()R z 。

语音生成系统的传递函数由这三个函数级联而成,即()()()()H z G z V z R z =1、激励模型发浊音时,由于声门不断开启和关闭,产生间隙的脉冲。

经仪器测试它类似于斜三角波的脉冲。

也就是说,这时的激励波是一个以基音周期为周期的斜三角脉冲串。

单个斜三角波的频谱表现出一个低通滤波器的特性。

可以把它表示成z 变换的全极点形式121()(1)cTG z ez --=-⋅这里c 是一个常数,T 是脉冲持续时间。

周期的三角波脉冲还得跟单位脉冲串的z 变换相乘:1121()()()1(1)v cT A U z E z G z z e z ---=⋅=⋅--⋅这就是整个激励模型,v A 是一个幅值因子。

2、声道模型当声波通过声道时,受到声腔共振的影响,在某些频率附近形成谐振。

反映在信号频谱图上,在谐振频率处其谱线包络产生峰值,把它称为共振峰。

一个二阶谐振器的传输函数可以写成12()1ii i i A V z B z C z--=-- 实践表明,用前3个共振峰代表一个元音足够了。

对于较复杂的辅音或鼻音共振峰要到5个以上。

多个()i V z 叠加可以得到声道的共振峰模型12111()()11Rrr MMir i N ki i i ik k b zA V z V zB zC z a z -=---======---∑∑∑∑3、辐射模型从声道模型输出的是速度波,而语音信号是声压波。

语音信号处理及加密课程总结.doc

语音信号处理及加密课程总结.doc

《语音信号处理及加密》课程总结本学期,我选修丫《语音信号处理及加密》这门课。

在本门课程的学习屮,我系统地学习了现代语音编码技术的基本概念和基本知识,如什么是语音编码、对语音编码的要求、现代语音编码技术的作用和意义、现代语音编码系统的构成、分类以及主要性能指标等等,使我对现代语音编码有了初步的概要的了解。

最近的二十儿年来,随着数字通信、计算机、信号处理、微电子等相关技术的发展和广泛应用,语音编码技术发展非常迅速,取得了一系列突破性的成果,极大地促进了数字通信的发展和普及,是现代通信以及信息技术的一个亮点。

所谓的现代语音编码技术,主要就是指最近二十几年发展起來并得到广泛应用的语音编码技术。

一、为什么要学习语音编码技术?由于PCM的编码速率过高,不适应通信和信息技术发展的需要,为了压缩编码速率,减少传输占用的带宽,人们一直在致力于研宄开发新的语音编码技术。

这种强烈的客观需求是推动语音编码技术发展的巨大动力。

另一方面,最近二十儿年来,随着计算机、微电子、信号处理等相关技术的迅速发展和广泛应用,尤其是随着数字信号处理算法和器件(DSP芯片)的飞速发展和应用,为中、低速率语音编码器的发展和应用准备了必要条件。

正是在这种情况下,从20世纪80 年代以來的二十几年间,语音编码技术进入了一个飞速发展的时期。

现代语音编码技术就是指20世纪80年代以来发展起来的新的语咅编码技术,这些新的语音编码技术的出现,极大地推动了通信和信息技术的发展,是现代通信发展史中的一个闪光点。

学习和掌握现代语音编码技术的基础知识、分析方法、关键技术和算法十分重要,只有了解和掌握这些己经成熟或基本成熟的方法和技术,方能很好地适应现代通信和信息技术发展的需要,才能研究开发新的方案和算法,提出具有自主知识产权的技术方案。

二、我学到了什么?语音编码为信源编码,就是对模拟的语音信号进行编码,将模拟信号转化成数字信号,从而降低传输码率并使之可以在数字信道中传输。

数字语音信号处理实验(学生).

数字语音信号处理实验(学生).

数字语音信号处理实验指导书北方学院信息科学与工程学院电子教研室2014年1月前言语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科,是目前发展最为迅速的信息科学研究领域的核心技术之一。

通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。

同时,语言也是人与机器之间进行通信的重要工具,它是一种理想的人机通信方式,因而可为信息处理系统建立良好的人机交互环境,进一步推动计算机和其他智能机器的应用,提高社会的信息化程度。

语音信号处理是一门新兴的学科,同时又是综合性的多学科领域和涉及面很广的交叉学科。

虽然从事这一领域研究的人员主要来自信号与信息处理及计算机应用等学科,但是它与语音学、语言学、声学、认知科学、生理学、心理学等许多学科也有非常密切的联系。

20世纪60年代中期形成的一系列数字信号处理的理论和算法,如数字滤波器、快速傅立叶变换(FFT)等是语音信号数字处理的理论和技术基础。

随着信息科学技术的飞速发展,语音信号处理取得了重大的进展:进入70年代之后,提出了用于语音信号的信息压缩和特征提取的线性预测技术(LPC),并已成为语音信号处理最强有力的工具,广泛应用于语音信号的分析、合成及各个应用领域,以及用于输入语音与参考样本之间时间匹配的动态规划方法;80年代初一种新的基于聚类分析的高效数据压缩技术—矢量量化(VQ)应用于语音信号处理中;而用隐马尔可夫模型(HMM)描述语音信号过程的产生是80年代语音信号处理技术的重大发展,目前HMM已构成了现代语音识别研究的重要基石。

近年来人工神经网络(ANN)的研究取得了迅速发展,语音信号处理的各项课题是促进其发展的重要动力之一,同时,它的许多成果也体现在有关语音信号处理的各项技术之中。

为了深入理解语音信号数字处理的基础理论、算法原理、研究方法和难点,根据数字语音信号处理教学大纲,结合课程建设的需求,我们编写了本实验参考书。

本参考书针对教学大纲规定的八个研究设计型实验,每个实验给出了参考程序,目的是起一个抛砖引玉的作用,学生在学习过程中,可以针对某一个实验进行延伸的创新学习,比如说,语音端点的检测、语音共振峰提取、基于HMM或DTW的有限词汇或大词汇的特定人、非特定人的语音识别、识别率的提高(如何提高有噪环境下的识别率)、以及编码问题等,同时在学习中还可深入思考如何将有关的方法在嵌入式系统或DSP下的实现问题等。

《数字语音处理》课程教学大纲

《数字语音处理》课程教学大纲

《数字语音处理》课程教学大纲课程代码:ABJD0626课程中文名称:数字语音处理课程英文名称:Dig让a1AudioProcessing课程性质:选修课程学分数:2.5课程学时数:40(32学时论课时+8学时实验)授课对象:电子信息工程本课程的前导课程:信号与系统、数字信号处理一、课程简介本课程是通信工程专业、电子信息类专业、电气工程及其自动化等专业的任选课。

它是基于信号处理基础之上理论性和应用性较强的专业课程,其任务是:通过本课程的学习,学生掌握语音信号处理的基本原理;通过试验加深学生对语音信号处理方法的认识。

同时向学生介绍该学科领域近年取得的新成果、新发展及新技术,同时培养学生的独立研究和思考的能力二、教学基本内容和要求(-)语音信号处理的基础知识教学内容:一、语音信号处理的发展二、语音信号处理的过程的总体结构三、语音的发声机理和听觉机理四、语音的感知和信号模型课程的重点、难点:重点:语音的发生原理以及信号模型。

难点:语音信号的数字模型。

教学要求:1.了解本课程的性质和任务,理解掌握语音、语音信号处理的基本概念,了解语音信号的发展概况及其应用。

2.理解语音信号处理的基本过程,了解语音信号的特性和语音信号产生的数字模型,了解语音感知的概念;掌握语音信号产生的数字模型,了解人类的听觉系统的特性。

(二)语音信号的时域分析和短时傅里叶分析教学内容:一、语音信号的预处理二、语音信号的时域分析三、傅里叶变换的解释四、语音信号的频域分析课程的重点、难点:重点:语音信号的短时时域分析和短时频域分析。

难点:短时自相关函数和短时谱的时域及频域采样率。

教学要求:1.了解语音信号的时域分析的基本概念,理解并掌握语音信号的数字化和预处理过程。

2.理解短时能量分析,短时过零分析和短时相关分析的基本概念,掌握语音信号的能量、过零、相关各种时域分析方法。

3.理解语音信号的短时傅里叶分析的基本概念,理解短时傅里叶变换的取样率,掌握语音信号的短时综合方法,掌握语谱图的基本概念。

语音信号处理实验报告

语音信号处理实验报告

通信与信息工程学院信息处理综合实验报告班级:电子信息工程1502班指导教师:设计时间:2018/10/22-2018/11/23评语:通信与信息工程学院二〇一八年实验题目:语音信号分析与处理一、实验内容1. 设计内容利用MATLAB对采集的原始语音信号及加入人为干扰后的信号进行频谱分析,使用窗函数法设计滤波器滤除噪声、并恢复信号。

2.设计任务与要求1. 基本部分(1)录制语音信号并对其进行采样;画出采样后语音信号的时域波形和频谱图。

(2)对所录制的语音信号加入干扰噪声,并对加入噪声的信号进行频谱分析;画出加噪后信号的时域波形和频谱图。

(3)分别利用矩形窗、三角形窗、Hanning窗、Hamming窗及Blackman 窗几种函数设计数字滤波器滤除噪声,并画出各种函数所设计的滤波器的频率响应。

(4)画出使用几种滤波器滤波后信号时域波形和频谱,对滤波前后的信号、几种滤波器滤波后的信号进行对比,分析信号处理前后及使用不同滤波器的变化;回放语音信号。

2. 提高部分(5)录制一段音乐信号并对其进行采样;画出采样后语音信号的时域波形和频谱图。

(6)利用MATLAB产生一个不同于以上频段的信号;画出信号频谱图。

(7)将上述两段信号叠加,并加入干扰噪声,尝试多次逐渐加大噪声功率,对加入噪声的信号进行频谱分析;画出加噪后信号的时域波形和频谱图。

(8)选用一种合适的窗函数设计数字滤波器,画出滤波后音乐信号时域波形和频谱,对滤波前后的信号进行对比,回放音乐信号。

二、实验原理1.设计原理分析本设计主要是对语音信号的时频进行分析,并对语音信号加噪后设计滤波器对其进行滤波处理,对语音信号加噪声前后的频谱进行比较分析,对合成语音信号滤波前后进行频谱的分析比较。

首先用PC机WINDOWS下的录音机录制一段语音信号,并保存入MATLAB软件的根目录下,再运行MATLAB仿真软件把录制好的语音信号用audioread函数加载入MATLAB仿真软件的工作环境中,输入命令对语音信号进行时域,频谱变换。

哈尔滨工程大学语音信号处理实验报告讲述

哈尔滨工程大学语音信号处理实验报告讲述

实验报告实验课程名称:语音信号处理实验姓名:班级: 20120811 学号:Array指导教师张磊实验教室 21B#293实验时间 2015年4月12日实验成绩实验一 语音信号的端点检测一、实验目的1、掌握短时能量的求解方法2、掌握短时平均过零率的求解方法3、掌握利用短时平均过零率和短时能量等特征,对输入的语音信号进行端点检测。

二、实验设备 HP 计算机、Matlab 软件 三、实验原理 1、短时能量语音信号的短时能量分析给出了反应这些幅度变化的一个合适的描述方法。

对于信号)}({n x ,短时能量的定义如下:∑∑∞-∞=∞-∞=*=-=-=m m n n h n x m n h m xm n w m x E )()()()()]()([2222、短时平均过零率短时平均过零率是指每帧内信号通过零值的次数。

对于连续语音信号,可以考察其时域波形通过时间轴的情况。

对于离散信号,实质上就是信号采样点符号变化的次数。

过零率在一定程度上可以反映出频率的信息。

短时平均过零率的公式为:∑∑-+=∞-∞=--=---=1)]1(sgn[)](sgn[21 )()]1(sgn[)](sgn[21N n nm w w m n m x m x m n w m x m x Z其中,sgn[.]是符号函数,即⎩⎨⎧<-≥=0)(10)(1)](sgn[n x n x n x3、端点检测原理能够实现这些判决的依据在于,不同性质语音的各种短时参数具有不同的概率密度函数,以及相邻的若干帧语音应具有一致的语音特性,它们不会在S 、U 、V 之间随机地跳来跳去。

要正确判断每个输入语音的起点和终点,利用短时平均幅度参数E 和短时平均过零率Z 可以做到这一点。

首先,根据浊音情况下的短时能量参数的概率密度函数)|(V E P 确定一个阈值参数H E ,H E 值一般定的较高。

当一帧输入信号的短时平均幅度参数超过H E 时,就可以判定该帧语音信号不是无声,而有相当大的可能是浊音。

语音信号处理实验报告

语音信号处理实验报告

语⾳信号处理实验报告语⾳信号处理实验报告⼀、原理 1.端点检测语⾳信号⼀般可分为⽆声段、清⾳段和浊⾳段。

⽆声段是背景噪声段, 平均能量最低,波形变化缓慢,过零率最低; 浊⾳段为声带振动发出对应的语⾳信号段, 平均能量最⾼; 清⾳段是空⽓在⼝腔中的摩擦、冲击或爆破⽽发出的语⾳信号段, 平均能量居于前两者之间,波形上幅度变化剧烈, 过零率最⼤。

端点检测就是⾸先判断有声还是⽆声, 如果有声,则还要判断是清⾳还是浊⾳。

为正确地实现端点检测, ⼀般综合利⽤短时能量和过零率两个特征,采⽤/双门限检测法。

①语⾳信号x(n)进⾏分帧处理,每⼀帧记为Si (n ),n=1,2,…,N ,n 为离散语⾳信号时间序列,N 为帧长,i 表⽰帧数。

②短时能量:③过零率:2.基⾳检测能量有限的语⾳信号}{()s n 的短时⾃相关函数定义为: 10()[()()][()()]N n m R s n m w m s n m w m ττττ--==++++∑ 其中,τ为移位距离,()w m 是偶对称的窗函数。

短时⾃相关函数有以下重要性质:①如果}{()s n 是周期信号,周期是P ,则()R τ也是周期信号,且周期相同,即()()R R P ττ=+。

②当τ=0时,⾃相关函数具有最⼤值;当0,,2,3P P P τ=+++…处周期信号的⾃相关函数达到极⼤值。

③⾃相关函数是偶函数,即()()R R ττ=-。

短时⾃相关函数法基⾳检测的主要原理是利⽤短时⾃相关函数的第⼆条性质,通过⽐较原始信号和它移位后的信号之间的类似性来确定基⾳周期,如果移位距离等于基⾳周期,那么,两个信号具有最⼤类似性。

在实际采⽤短时⾃相关函数法进⾏基⾳检测时,使⽤⼀个窗函数,窗不动,语⾳信号移动,这是经典的短时⾃相关函数法。

3.⾃相关法解线性预测⽅程组⾃相关⽅法a.Levinson-durbin 递推算法()21N i n Ei s n ==∑()()1sgn sgn 1N i i n Zi s n s n ==--∑pj a a k k R E E k Ep j i p i i n p i i i j ...,3,2,1,1||,)1()0(,)1()(12)()1(2)(==≤-=-=∧=-∏ ki 称为反射系数,也称PARCOR 系数b.E(p)是预测残差能量在起始端,为了预测x(0),需要⽤到x(-1),x(-2),……,x(-p).但是这些值均为0,这样预测会带来误差。

语音信号实验讲义

语音信号实验讲义

实验一 语音信号的采集实验目的1、掌握语音信号录音;WA V 和DAT 文件的转换;数据的剪切、复制;2、初步了解元音、浊辅音、清辅音的特性。

实验原理1、音素的种类一次发出的,具有一个响亮的中心,并被明显感觉到的语音片段叫音节。

一个音节可以由一个音素(Phoneme )或几个音素构成。

音素是语音发音的最小单位。

音素有元音(V owel )和辅音(Consonant )两种。

(1)元音是当声带振动发出的声音气流从喉腔、咽腔进入口腔从唇腔出去时,这些声腔完全开放,气流顺利通过。

(2)辅音是呼出的声流,由于通路的某一部分封闭起来或受到阻碍,气流被阻不能畅通,而克服发音器官的这种阻碍而产生的音素。

发辅音时声带振动的是浊音,声带不振动的是清音。

(3)半元音的声道基本畅通,但某处声道比较狭窄,引起轻微的摩擦声。

元音构成一个音节的主干,从长度还是从能量看,元音在音节中都占主要部分。

辅音则只出现在音节的前端或后端或前后两端,它们的时长和能量与元音相比都很小。

2、元音的共振峰(Formant)声道看成是一根具有非均匀截面的声管,在发音时起共鸣器的作用。

当元音激励进入声道时会引起共振特性,产生一组共振频率,称为共振峰频率(简称共振峰)。

共振峰参数包括共振峰频率的位置和频带宽度。

在实际应用中,只用前三个共振峰,分别为1F 、2F 、3F 。

3、发音器官产生元音的条件:①声道受到声带振动的激励引起共振;②在语音流的持续过程中,声道不发生极端的狭窄,并维持较稳定的形状; ③和鼻腔不发生耦合,声音只从口腔辐射出去。

4、发音器官产生辅音的条件产生元音的三个条件中,只要缺少其中之一,则该语音就是辅音。

辅音没有明确的共振峰结构。

5、基音频率浊音的声带振动基本频率又称基音频率,用0F 表示。

各个音节的元音段的0F 都是随时间变化的,0F 的变化产生了声调,0F 的变化轨迹称为声调轨迹。

6、汉语的声调汉语声调只有阴平、阳平、上声、去声以及“轻声”等五种声调。

语音信号处理实验报告

语音信号处理实验报告

一、实验目的1. 理解语音信号处理的基本原理和流程。

2. 掌握语音信号的采集、预处理、特征提取和识别等关键技术。

3. 提高实际操作能力,运用所学知识解决实际问题。

二、实验原理语音信号处理是指对语音信号进行采集、预处理、特征提取、识别和合成等操作,使其能够应用于语音识别、语音合成、语音增强、语音编码等领域。

实验主要包括以下步骤:1. 语音信号的采集:使用麦克风等设备采集语音信号,并将其转换为数字信号。

2. 语音信号的预处理:对采集到的语音信号进行降噪、去噪、归一化等操作,提高信号质量。

3. 语音信号的特征提取:提取语音信号中的关键特征,如频率、幅度、倒谱等,为后续处理提供依据。

4. 语音信号的识别:根据提取的特征,使用语音识别算法对语音信号进行识别。

5. 语音信号的合成:根据识别结果,合成相应的语音信号。

三、实验步骤1. 语音信号的采集使用麦克风采集一段语音信号,并将其保存为.wav文件。

2. 语音信号的预处理使用MATLAB软件对采集到的语音信号进行预处理,包括:(1)降噪:使用谱减法、噪声抑制等算法对语音信号进行降噪。

(2)去噪:去除语音信号中的杂音、干扰等。

(3)归一化:将语音信号的幅度归一化到相同的水平。

3. 语音信号的特征提取使用MATLAB软件对预处理后的语音信号进行特征提取,包括:(1)频率分析:计算语音信号的频谱,提取频率特征。

(2)幅度分析:计算语音信号的幅度,提取幅度特征。

(3)倒谱分析:计算语音信号的倒谱,提取倒谱特征。

4. 语音信号的识别使用MATLAB软件中的语音识别工具箱,对提取的特征进行识别,识别结果如下:(1)将语音信号分为浊音和清音。

(2)识别语音信号的音素和音节。

5. 语音信号的合成根据识别结果,使用MATLAB软件中的语音合成工具箱,合成相应的语音信号。

四、实验结果与分析1. 语音信号的采集采集到的语音信号如图1所示。

图1 语音信号的波形图2. 语音信号的预处理预处理后的语音信号如图2所示。

语音信号处理课程实验教学大纲

语音信号处理课程实验教学大纲

《语音信号处理》课程实验教学大纲课程编号: 13006430 一、实验教学的目的通过实验,加深对语音信号处理基本概念的理解,学习语音信号处理的编程和处理方法。

二、实验教学任务1、掌握VC编程方法处理语音信号。

2、掌握改变参数对语音信号处理的差别。

三、具体实验项目名称、学时分配、适用专业及实验性质四、单项实验的内容、要求实验内容:实验一:语音信号的低通滤波和短时分析综合实验。

1.给出语音信号,要求设计一个低通滤波器,带宽为采样频率的四分之一,求输出信号;2.辨别原始语音信号与滤波器输出信号有何区别,说明原因;3.改变滤波器带宽,重复滤波实验,辨别语音信号的变化,说明原因;4.利用矩形窗和汉明窗对语音信号进行短时傅立叶分析,绘制语谱图并估计基音周期,分析两种窗函数对基音估计的影响;5.改变窗口长度,重复上一步,说明窗口长度对基音估计的影响。

实验二:语音信号的同态滤波综合实验。

1.给出语音信号,要求设计一个卷积同态系统,对声源和声道冲激响应进行有效分离;2.绘制语音信号的复倒谱,并利用复倒谱对语音信号进行基音估计;3.利用短时自相关函数进行基音估计,并与前者相比较,说明两种方法的优缺点。

实验三:语音信号的线性预测。

1. 声道传输函数建模:根据给出语音信号设计线性预测滤波器,求最佳预测系数;2 .利用自相关法对语音信号进行线性预测分析,求声道传输函数共振峰。

实验要求:1.正确使编程软件。

2.学会改变参数对语音信号处理的影响。

五、实验教材或讲义名称理论课程教材六、实验考核标准1、课程实验(占用课程总学时)6学时,考核成绩占总课程成绩的30%。

2、考核标准1)每次实验前应提交预习报告,明确实验目的,了解实验内容。

2)实验中遵守实验纪律,听从老师指导,爱护仪器设备,遵守操作规程。

3)课程实验完成时,应对学生实验技能进行检查,提出问题能说明清楚。

4)实验报告应及时完成,字要整洁、图表要规范,记录和处理的数据应准确。

华南理工大学语音信号处理实验-5次实验汇总版

华南理工大学语音信号处理实验-5次实验汇总版

《语音信号处理》实验报告实验名称端点检测学院电子与信息学院专业信息工程7班学生姓名提交日期 2014年4月 23日1.实验目的1.语音信号端点检测技术其目的就是从包含语音的一段信号中准确地确定语音的起始点和终止点,区分语音和非语音信号,它是语音处理技术中的一个重要方面。

本实验的目的就是要掌握基于MATLAB编程实现带噪语音信号端点检测,利用MATLAB对信号进行分析和处理,学会利用短时过零率和短时能量,对语音信号的端点进行检测。

2. 实验原理1、短时能量语音和噪声的区别可以体现在它们的能量上,语音段的能量比噪声段能量大,语音段的能量是噪声段能量叠加语音声波能量的和。

在信噪比很高时,那么只要计算输入信号的短时能量或短时平均幅度就能够把语音段和噪声背景区分开。

这是仅基于短时能量的端点检测方法。

信号{x(n)}的短时能量定义为:语音信号的短时平均幅度定义为:其中w(n)为窗函数。

2、短时平均过零率短时过零表示一帧语音信号波形穿过横轴(零电平)的次数。

过零分析是语音时域分析中最简单的一种。

对于连续语音信号,过零意味着时域波形通过时间轴;而对于离散信号,如果相邻的取样值的改变符号称为过零。

过零率就是样本改变符号次数。

信号{x(n)}的短时平均过零率定义为:式中,sgn为符号函数,即:过零率有两类重要的应用:第一,用于粗略地描述信号的频谱特性;第二,用于判别清音和浊音、有话和无话。

从上面提到的定义出发计算过零率容易受低频干扰,特别是50Hz交流干扰的影响。

解决这个问题的办法,一个是做高通滤波器或带通滤波,减小随机噪声的影响;另一个有效方法是对上述定义做一点修改,设一个门限T,将过零率的含义修改为跨过正负门限。

于是,有定义:3、检测方法利用过零率检测清音,用短时能量检测浊音,两者配合。

首先为短时能量和过零率分别确定两个门限,一个是较低的门限数值较小,对信号的变化比较敏感,很容易超过;另一个是比较高的门限,数值较大。

语音信号处理实验报告

语音信号处理实验报告

语音信号处理实验报告语音信号处理实验报告一、引言语音信号处理是一门研究如何对语音信号进行分析、合成和改善的学科。

在现代通信领域中,语音信号处理起着重要的作用。

本实验旨在探究语音信号处理的基本原理和方法,并通过实验验证其有效性。

二、实验目的1. 了解语音信号处理的基本概念和原理。

2. 学习使用MATLAB软件进行语音信号处理实验。

3. 掌握语音信号的分析、合成和改善方法。

三、实验设备和方法1. 设备:计算机、MATLAB软件。

2. 方法:通过MATLAB软件进行语音信号处理实验。

四、实验过程1. 语音信号的采集在实验开始前,我们首先需要采集一段语音信号作为实验的输入。

通过麦克风将语音信号输入计算机,并保存为.wav格式的文件。

2. 语音信号的预处理在进行语音信号处理之前,我们需要对采集到的语音信号进行预处理。

预处理包括去除噪声、归一化、去除静音等步骤,以提高后续处理的效果。

3. 语音信号的分析语音信号的分析是指对语音信号进行频谱分析、共振峰提取等操作。

通过分析语音信号的频谱特征,可以了解语音信号的频率分布情况,进而对语音信号进行进一步处理。

4. 语音信号的合成语音信号的合成是指根据分析得到的语音信号特征,通过合成算法生成新的语音信号。

合成算法可以基于传统的线性预测编码算法,也可以采用更先进的基于深度学习的合成方法。

5. 语音信号的改善语音信号的改善是指对语音信号进行降噪、增强等处理,以提高语音信号的质量和清晰度。

常用的语音信号改善方法包括时域滤波、频域滤波等。

六、实验结果与分析通过实验,我们得到了经过语音信号处理后的结果。

对于语音信号的分析,我们可以通过频谱图观察到不同频率成分的分布情况,从而了解语音信号的特点。

对于语音信号的合成,我们可以听到合成后的语音信号,并与原始语音信号进行对比。

对于语音信号的改善,我们可以通过降噪效果的评估来判断处理的效果。

七、实验总结通过本次实验,我们深入了解了语音信号处理的基本原理和方法,并通过实验验证了其有效性。

语音信号处理实验指导

语音信号处理实验指导

语音信号处理实验讲义王艳芬李剑编中国矿业大学信电学院学生实验守则一、学生进入实验室必须遵守实验室的规章制度,遵守课堂纪律,保持实验室的安静和整洁,爱护实验室的一切设施。

二、实验课前要认真预习实验指导书,写出实验预习报告,并经教师批阅后方可进行实验。

三、实验课中要遵守操作规程,不要带电连接、更改或拆除线路。

线路接好后,经指导老师检查后,方可接通电源进行实验。

对于软件上机实验,不得随意删改计算机中原有的文件。

四、学生实验前对实验所用仪器设备要了解其操作规程和使用方法,凡因不预习或不按使用方法进行操作而造成仪器设备损坏者,除书面检查外,按学校规定进行赔偿。

五、实验中主意安全,遇到事故应立即关断电源并报告教师检查处理。

六、实验完毕后要做好整理工作,实验数据必须经指导教师签阅后,才能拆除线路,并将仪器、设备、凳子等按规定放好,经同意后方可离开实验室。

七、因故缺课的学生可向实验室申请一次补做机会。

无故缺课或无故迟到(15分钟以上)的不予补做,该次实验无成绩;累计三次者,该实验课以不及格论,并不得参加该门理论课程的考试。

八、实验室仪器设备不能擅自搬动调换,更不能擅自带出实验室。

信电学院专业实验中心二零一一年九月目录实验一语音信号得基音参数提取 (1)实验二语音信号的谱分析 (7)实验三基于DTW算法的孤立字识别 (11)《语音信号处理实验讲义》是为了配合“语音信号处理”课程教学而编写的,适用于信息工程、电子科学与技术等专业。

前修课程为“数字信号处理”。

该课程总学时数为40学时,其中实验学时为8学时。

实验内容及参考学时安排如下:实验一语音信号的基音参数提取(3个学时)实验二语音信号的谱分析(3个学时)实验三基于DTW算法的孤立字识别(2个学时)实验一 语音信号的基音参数提取一、实验目的1.了解基音的基本概念以及清音与浊音的区别。

2.掌握几种基本的基音提取方法,熟悉自相关法、倒谱法和简化逆滤波法进行基音提取的matlab 编程。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

语音信号处理实验讲义时间:2011-12目录实验一语音信号生成模型分析 (3)实验二语音信号时域特征分析 (7)实验三语音信号频域特征分析 (12)实验四语音信号的同态处理和倒谱分析 (16)实验一 语音信号生成模型分析一、实验目的1、了解语音信号的生成机理,了解由声门产生的激励函数、由声道产生的调制函数和由嘴唇产生的辐射函数。

2、编程实现声门激励波函数波形及频谱,与理论值进行比较。

3、编程实现已知语音信号的语谱图,区分浊音信号和清音信号在语谱图上的差别。

二、实验原理语音生成系统包含三部分:由声门产生的激励函数()G z 、由声道产生的调制函数()V z 和由嘴唇产生的辐射函数()R z 。

语音生成系统的传递函数由这三个函数级联而成,即()()()()H z G z V z R z =1、激励模型发浊音时,由于声门不断开启和关闭,产生间隙的脉冲。

经仪器测试它类似于斜三角波的脉冲。

也就是说,这时的激励波是一个以基音周期为周期的斜三角脉冲串。

单个斜三角波的频谱表现出一个低通滤波器的特性。

可以把它表示成z 变换的全极点形式121()(1)cT G z e z --=-⋅这里c 是一个常数,T 是脉冲持续时间。

周期的三角波脉冲还得跟单位脉冲串的z 变换相乘:1121()()()1(1)v cT A U z E z G z z e z ---=⋅=⋅--⋅ 这就是整个激励模型,v A 是一个幅值因子。

2、声道模型当声波通过声道时,受到声腔共振的影响,在某些频率附近形成谐振。

反映在信号频谱图上,在谐振频率处其谱线包络产生峰值,把它称为共振峰。

一个二阶谐振器的传输函数可以写成12()1i i i i A V z B z C z--=-- 实践表明,用前3个共振峰代表一个元音足够了。

对于较复杂的辅音或鼻音共振峰要到5个以上。

多个()i V z 叠加可以得到声道的共振峰模型012111()()11R r r M M i r i Nki i i i k k b z A V z V z B z C z a z -=---======---∑∑∑∑ 3、辐射模型从声道模型输出的是速度波,而语音信号是声压波。

二者倒比称为辐射阻抗,它表征了口唇的辐射效应,可用下式表示:10()(1)R z R z -=-三、实验内容1、设声门脉冲单个三角波的数学表达式为11111221[1cos ] 02()()cos 20 n n N N n N g n N n N N N ππ⎧-≤≤⎪⎪⎪⎡⎤-⎪=≤≤+⎨⎢⎥⎣⎦⎪⎪⎪⎪⎩其他试画出三角波波形图及其频谱。

取12=5=3N N ,。

参考程序:%三角波及其频谱n=linspace(0,25,125);g=zeros(1,length(n));i=0;for i=0:40if n(i+1)<=5g(i+1)=0.5*(1-cos(n(i+1)*pi/5));elseg(i+1)=cos((n(i+1)-5)*pi/8);endendfigure(1)subplot(1,2,1)plot(n,g)xlabel('时间/ms')ylabel('幅度')axis([0,25,-0.4,1.2])r=fft(g,1024);r1=abs(r);yuanlai=20*log10(r1);signal(1:512)=yuanlai(1:512);pinlv=(0:1:511)*8000/1024;subplot(1,2,2)plot(pinlv,signal);xlabel('频率/Hz')ylabel('幅度/dB')axis([0,620,0,30])图1-1 三角波及其频谱2、给出语音段“数字信号处理”(speech.wav),画出它的语谱图。

clear all;[x,sr]=wavread('speech_dsp.wav');s=length(x);w=round(44*sr/1000);n=w;shift=w/2;h=w-shift;%win=hanning(n)';win=hamming(n)';c=1;ncols=1+fix((s-n)/h);d=zeros((1+n/2),ncols);for b=0:h:(s-n)u=win'.*x((b+1):(b+n));t=fft(u);d(:,c)=t(1:(1+n/2));c=c+1;endtt=[0:h:(s-n)]/sr;ff=[0:(n-2)]*sr/n;imagesc(tt,ff/1000,20*log10(abs(d)));colormap(gray);axis xyxlabel('时间/s')ylabel('频率/kHz')图1-2 语谱图四、思考题1、声门激励脉冲信号是高频衰减的还是高频增强的?2、画语谱图时为什么要给语音信号加汉明窗?若加矩形窗会有什么区别?3、在语谱图上观察,浊音信号的和清音信号的频谱有什么区别?实验二 语音信号时域特征分析一、实验目的1、了解自相关函数及自相关函数在语音信号处理中的应用。

2、编写程序分析语音信号的短时自相关特征,计算语音信号的基音周期。

3、编写修正短时自相关函数的程序,并与未修正的函数进行比较。

二、实验原理自相关函数用于衡量信号自身时间波形的相似性。

由前面的讨论可知,清音和浊音的发声机理不同,因而在波形上也存在着较大的差异。

浊音的时间波形呈现出一定的周期性,波形之间相似性较好;清音的时间波形呈现出随机噪声的特性,杂乱无章,样点间的相似性较差,这样,可以用短时自相关函数来测定语音的相似特性。

时域离散确定信号的自相关函数定义为:()()()m R k x m x m k α+=-∞=+∑ 对于语音信号来说,采用短时分析方法,可以定义短时自相关函数为()()()()()n m R k x m w n m x m k w n k m α+=-∞=-+--∑ 因为()()n n R k R k -=,所以()()[()()][()()]n n m R k R k x m x m k w n m w n m k α+=-∞=-=---+∑ 定义()()()k h n w n w n k =+,则上式可以写成()[()()]()n k m R k x m x m k h n m α+=-∞=--∑ 如果长基音周期用窄的窗,将得不到预期的基音周期;但是如果短的基音周期用长的窗,自相关函数将对多个基因周期做平均计算,从而模糊语音的短时特性,这是不希望的。

为了解决这个问题,可以采用修正的短时自相关函数,选择的窗长不一定要等于自相关函数的最大自变量取值。

这种方法可以采用较窄的窗,同时避免了短时自相关函数随k 增加而衰减的不足。

三、实验内容1、根据给出的浊音信号,分别画出浊音信号的时域波形、加矩形窗和加汉明窗后计算短时自相关归一化后的结果。

语音的抽样频率为8kHz ,窗长为320。

参考程序:[x,fs,nbits]=wavread('speech_dsp.wav');s1=x(2500:2819);N=320;A=[];for k=1:320sum=0;for m=1:N-k+1sum=sum+s1(m)*s1(m+k-1);endA(k)=sumendfor k=1:320A1(k)=A(k)/A(1);endf=zeros(1,320);n=1,j=1;while j<=320f(1,j)=s1(n)*[0.54-0.46*cos(2*pi*n/319)]; j=j+1;n=n+1;endB=[];for k=1:320sum=0;for m=1:N-k+1sum=sum+s1(m)*s1(m+k-1);endB(k)=sumendfor k=1:320B1(k)=B(k)/B(1);end%画图s2=s1/max(s1);figure(1)subplot(3,1,1)plot(s2)title('一帧语音信号');xlabel('样点数');ylabel('幅度');axis([0,320,-1,1]);subplot(3,1,2)plot(A1)title('加矩形窗的自相关函数')xlabel('延时k')ylabel('自相关函数R(k)')axis([0,320,-1,1]);subplot(3,1,3)plot(B1)title('加汉明窗的自相关函数')xlabel('延时k')ylabel('自相关函数R(k)')axis([0,320,-1,1]);图2-1 浊音信号加不同窗时的自相关函数2、仍选取上题中的语音信号,改变窗长和截取语音段的长度,计算修正的短时自相关函数。

取值分别为:(1)N=320,M=640;(2)N=160,M=320;(3)N=70,M=140;[x,fs,nbits]=wavread('speech_dsp.wav');s1=x(2500:3139);b=s1;%窗长640,自相关运算取320个点。

b1=b(1:640);N=320;A=[];for k=1:320sum=0;for m=1:Nsum=sum+b1(m)*b1(m+k-1); endA(k)=sum;endfor k=1:320A1(k)=A(k)/A(1);end%画图figure(1)subplot(3,1,1)plot(A1);xlabel('延时k')ylabel('R(k)')legend('N=320')axis([0,320,-0.5,1])%窗长320,自相关运算取160个点。

b2=b(1:320);N=160;A=[];for k=1:160sum=0;for m=1:Nsum=sum+b2(m)*b2(m+k-1); endB(k)=sum;endfor k=1:160B1(k)=B(k)/B(1);end%画图figure(1)subplot(3,1,2)plot(B1);xlabel('延时k')ylabel('R(k)')legend('N=160')axis([0,320,-0.5,1])%窗长140,自相关运算取70个点。

b3=b(1:140);N=70;A=[];for k=1:70sum=0;for m=1:Nsum=sum+b3(m)*b3(m+k-1);endC(k)=sum;endfor k=1:70C1(k)=C(k)/C(1);end%画图figure(1)subplot(3,1,3)plot(C1);xlabel('延时k')ylabel('R(k)')legend('N=70')axis([0,320,-0.5,1])图2-2 修正的自相关函数(参加自相关运算的点数N取不同值)四、思考题1、自相关函数的作用是什么?互相关函数的作用是什么?2、浊音信号分别加矩形窗和汉明窗时自相关函数有什么不同?3、清音信号的自相关函数和浊音信号的有什么区别?实验三 语音信号频域特征分析一、实验目的1、了解语音信号进行短时傅里叶分析的基础。

相关文档
最新文档