数字语音处理实验报告

合集下载

数字音频的处理实践报告(2篇)

数字音频的处理实践报告(2篇)

第1篇一、引言随着科技的不断发展,数字音频技术在各个领域得到了广泛应用。

数字音频处理是音频技术中的一个重要分支,它通过对音频信号进行数字化、压缩、解码、编辑、增强等操作,实现音频信息的存储、传输、播放和再现。

本文将结合实际操作,对数字音频处理技术进行实践报告,以期为相关领域的研究和开发提供参考。

二、实践目的1. 熟悉数字音频处理的基本概念和原理;2. 掌握数字音频处理软件的操作方法;3. 提高音频信号处理和编辑的能力;4. 了解数字音频处理在各个领域的应用。

三、实践内容1. 数字音频采集与转换(1)采集设备:使用笔记本电脑、麦克风等设备进行音频采集。

(2)采集软件:使用Audacity、Adobe Audition等软件进行音频采集。

(3)采集过程:将采集到的音频信号进行数字化处理,包括采样、量化等步骤。

2. 数字音频编辑(1)编辑软件:使用Audacity、Adobe Audition等软件进行音频编辑。

(2)编辑操作:包括剪辑、拼接、删除、复制、粘贴、调整音量等操作。

(3)编辑技巧:学习如何使用软件的特效功能,如降噪、均衡、混响等,对音频信号进行美化。

3. 数字音频压缩与编码(1)压缩算法:学习常用的音频压缩算法,如MP3、AAC、WMA等。

(2)编码软件:使用Audacity、Adobe Audition等软件进行音频编码。

(3)编码过程:对音频信号进行压缩,减小文件大小,提高传输效率。

4. 数字音频增强与修复(1)增强软件:使用Adobe Audition、iZotope RX等软件进行音频增强。

(2)增强操作:包括降噪、均衡、去噪、去抖等操作。

(3)修复技巧:学习如何修复损坏的音频文件,如修复静音、填补空白等。

5. 数字音频分析与处理(1)分析软件:使用MATLAB、Python等软件进行音频分析。

(2)分析过程:对音频信号进行频谱分析、时域分析等,提取有用信息。

(3)处理方法:根据分析结果,对音频信号进行相应的处理,如滤波、降噪等。

语音信号处理实验报告实验二

语音信号处理实验报告实验二

语音信号处理实验报告实验二一、实验目的本次语音信号处理实验的目的是深入了解语音信号的特性,掌握语音信号处理的基本方法和技术,并通过实际操作和数据分析来验证和巩固所学的理论知识。

具体而言,本次实验旨在:1、熟悉语音信号的采集和预处理过程,包括录音设备的使用、音频格式的转换以及噪声去除等操作。

2、掌握语音信号的时域和频域分析方法,能够使用相关工具和算法计算语音信号的短时能量、短时过零率、频谱等特征参数。

3、研究语音信号的编码和解码技术,了解不同编码算法对语音质量和数据压缩率的影响。

4、通过实验,培养我们的动手能力、问题解决能力和团队协作精神,提高我们对语音信号处理领域的兴趣和探索欲望。

二、实验原理(一)语音信号的采集和预处理语音信号的采集通常使用麦克风等设备将声音转换为电信号,然后通过模数转换器(ADC)将模拟信号转换为数字信号。

在采集过程中,可能会引入噪声和干扰,因此需要进行预处理,如滤波、降噪等操作,以提高信号的质量。

(二)语音信号的时域分析时域分析是对语音信号在时间轴上的特征进行分析。

常用的时域参数包括短时能量、短时过零率等。

短时能量反映了语音信号在短时间内的能量分布情况,短时过零率则表示信号在单位时间内穿过零电平的次数,可用于区分清音和浊音。

(三)语音信号的频域分析频域分析是将语音信号从时域转换到频域进行分析。

通过快速傅里叶变换(FFT)可以得到语音信号的频谱,从而了解信号的频率成分和分布情况。

(四)语音信号的编码和解码语音编码的目的是在保证一定语音质量的前提下,尽可能降低编码比特率,以减少存储空间和传输带宽的需求。

常见的编码算法有脉冲编码调制(PCM)、自适应差分脉冲编码调制(ADPCM)等。

三、实验设备和软件1、计算机一台2、音频采集设备(如麦克风)3、音频处理软件(如 Audacity、Matlab 等)四、实验步骤(一)语音信号的采集使用麦克风和音频采集软件录制一段语音,保存为常见的音频格式(如 WAV)。

数字语音处理课程实验报告

数字语音处理课程实验报告

数字语音处理课程报告语音信号的采集与分析摘要语音信号的采集与分析技术是一门涉及面很广的交叉科学,它的应用和发展与语音学、声音测量学、电子测量技术以及数字信号处理等学科紧密联系。

其中语音采集和分析仪器的小型化、智能化、数字化以及多功能化的发展越来越快,分析速度较以往也有了大幅度的高。

本文简要介绍了语音信号采集与分析的发展史以及语音信号的特征、采集与分析方法,并通过PC机录制自己的一段声音,运用Matlab进行仿真分析,最后加入噪声进行滤波处理,比较滤波前后的变化。

关键词:语音信号,采集与分析,时域,频域0 引言通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息的形式。

语言是人类持有的功能.声音是人类常用的工具,是相互传递信息的最主要的手段。

因此,语音信号是人们构成思想疏通和感情交流的最主要的途径。

并且,由于语言和语音与人的智力活动密切相关,与社会文化和进步紧密相连,所以它具有最大的信息容量和最高的智能水平。

现在,人类已开始进入了信息化时代,用现代手段研究语音信号,使人们能更加有效地产生、传输、存储、获取和应用语音信息,这对于促进社会的发展具有十分重要的意义。

让计算机能听懂人类的语言,是人类自计算机诞生以来梦寐以求的想法。

随着计算机越来越向便携化方向发展,随着计算环境的日趋复杂化,人们越来越迫切要求摆脱键盘的束缚而代之以语音输人这样便于使用的、自然的、人性化的输人方式。

作为高科技应用领域的研究热点,语音信号采集与分析从理论的研究到产品的开发已经走过了几十个春秋并且取得了长足的进步。

它正在直接与办公、交通、金融、公安、商业、旅游等行业的语音咨询与管理.工业生产部门的语声控制,电话、电信系统的自动拨号、辅助控制与查询以及医疗卫生和福利事业的生活支援系统等各种实际应用领域相接轨,并且有望成为下一代操作系统和应用程序的用户界面。

可见,语音信号采集与分析的研究将是一项极具市场价值和挑战性的工作。

我们今天进行这一领域的研究与开拓就是要让语音信号处理技术走人人们的日常生活当中,并不断朝更高目标而努力。

推荐-太原理工大学数字语音处理实验报告 精品

推荐-太原理工大学数字语音处理实验报告 精品

本科实验报告课程名称:数字语音处理实验项目:语音短时平均能量的实现实验地点:跨越机房专业班级:学号:学生姓名:指导教师:年月实验一 语音短时平均能量的实现一、 实验目的1.熟悉Matlab 基本程序的运用。

2.充分理解取不同窗长时的语音短时平均能量的变化情况。

3.熟悉Matlab 编程语言在语音信号处理中的作用。

4.能够实现程序的重新编制。

二、 实验原理定义n 时刻某语音信号的短时平均能量nE 为:∑∑--=+∞-∞=-=-=nN n m m n m n w m x m n w m x E )1(22)]()([)]()([式中N 为窗长,可见短时平均能量为为一帧样点值的甲醛平方和。

特殊地,当窗函数为矩形窗时,有∑--==nN n m n m xE )1(2)(三、 实验要求1.实验前自己用Cool Edit 音频编辑软件录制声音“我到北京去”,并把它保存为.txt 文件。

2.编程实现不同矩形窗长N=50、100、200、800的短时平均能量。

3.用Matlab 画出不同窗长的短时平均能量的图形。

4.写出实验报告,分析实验结果。

四、 实验难点对采集到的语音阳电只进行分帧。

五、 实验条件计算机,Matlab 软件,2学时六、 实验步骤1.用Cooledit 读入语音“我到北京去”。

设置采样率为8kHz ,16位,单声道。

2.将读入的语音wav 文件保存为txt 文件。

3.把保存的文件speech.txt 读入Matlab 。

fid=fopen('speech.txt','rt');x=fscanf(fid,'%f');fclose(fid);4.对采集到得语音样点值进行分帧。

分帧子程序为fra.mfunction f=fra(len,inc,x)fh=fix(((size(x,1)-len)/inc)+1)f=zeros(fh,len);i=1;n=1;while i<=fhj=1;while j<=lenf(i,j)=x(n);j=j+1;n=n+1;endn=n-len+inc;i=i+1;end5.对照取不同矩形窗N的短时平均能量,画出图形。

数字语音信号处理实验(学生).

数字语音信号处理实验(学生).

数字语音信号处理实验指导书北方学院信息科学与工程学院电子教研室2014年1月前言语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科,是目前发展最为迅速的信息科学研究领域的核心技术之一。

通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。

同时,语言也是人与机器之间进行通信的重要工具,它是一种理想的人机通信方式,因而可为信息处理系统建立良好的人机交互环境,进一步推动计算机和其他智能机器的应用,提高社会的信息化程度。

语音信号处理是一门新兴的学科,同时又是综合性的多学科领域和涉及面很广的交叉学科。

虽然从事这一领域研究的人员主要来自信号与信息处理及计算机应用等学科,但是它与语音学、语言学、声学、认知科学、生理学、心理学等许多学科也有非常密切的联系。

20世纪60年代中期形成的一系列数字信号处理的理论和算法,如数字滤波器、快速傅立叶变换(FFT)等是语音信号数字处理的理论和技术基础。

随着信息科学技术的飞速发展,语音信号处理取得了重大的进展:进入70年代之后,提出了用于语音信号的信息压缩和特征提取的线性预测技术(LPC),并已成为语音信号处理最强有力的工具,广泛应用于语音信号的分析、合成及各个应用领域,以及用于输入语音与参考样本之间时间匹配的动态规划方法;80年代初一种新的基于聚类分析的高效数据压缩技术—矢量量化(VQ)应用于语音信号处理中;而用隐马尔可夫模型(HMM)描述语音信号过程的产生是80年代语音信号处理技术的重大发展,目前HMM已构成了现代语音识别研究的重要基石。

近年来人工神经网络(ANN)的研究取得了迅速发展,语音信号处理的各项课题是促进其发展的重要动力之一,同时,它的许多成果也体现在有关语音信号处理的各项技术之中。

为了深入理解语音信号数字处理的基础理论、算法原理、研究方法和难点,根据数字语音信号处理教学大纲,结合课程建设的需求,我们编写了本实验参考书。

本参考书针对教学大纲规定的八个研究设计型实验,每个实验给出了参考程序,目的是起一个抛砖引玉的作用,学生在学习过程中,可以针对某一个实验进行延伸的创新学习,比如说,语音端点的检测、语音共振峰提取、基于HMM或DTW的有限词汇或大词汇的特定人、非特定人的语音识别、识别率的提高(如何提高有噪环境下的识别率)、以及编码问题等,同时在学习中还可深入思考如何将有关的方法在嵌入式系统或DSP下的实现问题等。

北京科技大学现代通信技术实验报告---语音信号数字处理

北京科技大学现代通信技术实验报告---语音信号数字处理

北京科技大学实验报告学院:自动化学院专业:班级:姓名:学号:实验日期:2018年3月31日实验名称:实验一语音信号数字处理实验目的:观察并验证语音信号的时域特性,理解并掌握典型的语音信号时域分析方法和时域特征,为深入学习语音信号处理的各种应用奠定基础。

实验仪器:matlab R2014实验原理:采样频率:是指计算机每秒钟采集多少个声音样本,是描述声音文件的音质、音调,衡量声卡、声音文件的质量标准。

采样频率越高,即采样的间隔时间越短,则在单位时间内计算机得到的声音样本数据就越多,对声音波形的表示也越精确。

采样频率与声音频率之间有一定的关系,根据奎斯特理论,只有采样频率高于声音信号最高频率的两倍时,才能把数字信号表示的声音还原成为原来的声音。

这就是说采样频率是衡量声卡采集、记录和还原声音文件的质量标准。

采样定理:在进行模拟/数字信号的转换过程中,当采样频率fs.max大于信号中,最高频率fmax的2倍时,即:fs.max>=2fmax,则采样之后的数字信号完整地保留了原始信号中的信息,一般实际应用中保证采样频率为信号最高频率的5~10倍;采样定理又称奈奎斯特定理。

采样位数:即采样值或取样值,用来衡量声音波动变化的参数,是指声卡在采集和播放声音文件时所使用数字声音信号的二进制位数。

采样频率是指录音设备在一秒钟内对声音信号的采样次数,采样频率越高声音的还原就越真实越自然。

样位数和采样率对于音频接口来说是最为重要的两个指标,也是选择音频接口的两个重要标准。

无论采样频率如何,理论上来说采样的位数决定了音频数据最大的力度范围。

每增加一个采样位数相当于力度范围增加了6dB。

采样位数越多则捕捉到的信号越精确。

对于采样率来说你可以想象它类似于一个照相机,44.1kHz意味着音频流进入计算机时计算机每秒会对其拍照达441000次。

显然采样率越高,计算机摄取的图片越多,对于原始音频的还原也越加精确。

FFT变换:对于给定的时域信号y,可以通过Fourier变换得到频域信息Y。

语音编码技术实验报告(3篇)

语音编码技术实验报告(3篇)

第1篇一、实验目的本次实验旨在了解和掌握语音编码技术的基本原理,通过实验加深对语音编码算法的理解,并评估不同编码算法在语音质量与编码效率之间的平衡。

二、实验内容1. 实验原理语音编码技术是数字通信领域的重要组成部分,其主要目的是将模拟语音信号转换为数字信号,以适应数字传输和处理的需要。

语音编码技术分为两大类:波形编码和参数编码。

2. 实验工具- 语音信号采集设备- 语音信号处理软件(如MATLAB)- 语音编码算法实现代码3. 实验步骤(1)信号采集使用语音信号采集设备采集一段语音信号,并保存为.wav格式。

(2)波形编码实验- 实验一:PCM编码使用PCM(脉冲编码调制)算法对采集的语音信号进行编码,设置不同的采样频率和量化位数,观察编码后的信号波形和码率。

- 实验二:波形编码改进对比分析不同预处理器(如噪声抑制、滤波等)对PCM编码的影响。

(3)参数编码实验- 实验三:线性预测编码(LPC)使用LPC算法对采集的语音信号进行编码,设置不同的预测阶数,观察编码后的信号和重建语音质量。

- 实验四:多带激励编码(MBE)使用MBE算法对采集的语音信号进行编码,观察编码后的信号和重建语音质量。

- 实验五:矢量量化编码(VQ)使用VQ算法对采集的语音信号进行编码,设置不同的码书大小和量化位数,观察编码后的信号和重建语音质量。

4. 实验结果与分析(1)PCM编码随着采样频率的提高,PCM编码后的信号质量逐渐提高,但码率也随之增加。

量化位数越多,信号质量越好,但码率也越高。

(2)波形编码改进预处理器对PCM编码的影响主要体现在降低噪声和抑制非线性失真,从而提高编码后的信号质量。

(3)线性预测编码(LPC)LPC编码后的信号质量与预测阶数密切相关。

预测阶数越高,编码后的信号质量越好,但计算复杂度也随之增加。

(4)多带激励编码(MBE)MBE编码后的信号质量较好,且在低码率下仍能保持较好的语音质量。

(5)矢量量化编码(VQ)VQ编码后的信号质量与码书大小和量化位数密切相关。

数字声音处理实践报告(2篇)

数字声音处理实践报告(2篇)

第1篇一、引言随着科技的不断发展,数字声音处理技术已经广泛应用于我们的日常生活中。

数字声音处理技术可以对声音进行各种处理,如降噪、回声消除、声音增强等。

本实践报告主要针对数字声音处理技术进行实践,通过对声音信号进行采集、处理和分析,探讨数字声音处理在实际应用中的效果和可行性。

二、实践内容1. 实验环境实验环境:计算机、数字声音处理软件(如MATLAB、Python等)、麦克风、耳机等。

2. 实验步骤(1)声音信号采集首先,使用麦克风采集一段需要处理的声音信号,并保存为.wav格式文件。

(2)声音信号预处理对采集到的声音信号进行预处理,包括降噪、回声消除、均衡等操作。

(3)声音信号增强对预处理后的声音信号进行增强处理,提高声音质量。

(4)声音信号分析对处理后的声音信号进行频谱分析、时域分析等,评估处理效果。

三、实践结果与分析1. 声音信号采集采集到的声音信号为一段普通的对话,采样频率为44.1kHz,采样精度为16位。

2. 声音信号预处理(1)降噪使用数字声音处理软件对采集到的声音信号进行降噪处理。

降噪过程中,采用谱减法进行噪声估计,并对噪声进行抑制。

处理后,声音信号中的噪声明显减少,人声清晰度提高。

(2)回声消除使用数字声音处理软件对采集到的声音信号进行回声消除处理。

回声消除过程中,采用自适应滤波器对回声进行抑制。

处理后,声音信号中的回声明显减少,声音更加自然。

(3)均衡使用数字声音处理软件对采集到的声音信号进行均衡处理。

均衡过程中,根据人耳的听觉特性,对声音信号进行频谱均衡。

处理后,声音信号中的低频和高频成分得到改善,声音更加舒适。

3. 声音信号增强对预处理后的声音信号进行增强处理,提高声音质量。

增强过程中,采用动态范围压缩、增益调整等技术。

处理后,声音信号的平均功率得到提升,声音更加响亮。

4. 声音信号分析对处理后的声音信号进行频谱分析、时域分析等,评估处理效果。

(1)频谱分析通过频谱分析,可以看出处理后声音信号的频谱分布更加均匀,无明显噪声和回声成分。

数字语音信号处理实验

数字语音信号处理实验

语音信号处理实验班级:学号:姓名:2015年10月语音信号处理实验实验学时数:8实验学分:0.5实验项目数:41、目的与基本要求实验为研究型(设计型)实验,共安排4个,为了真正达到研究设计型实验的目的,采用开放实验的办法,将自主学习和研究设计型实验结合起来,统一安排。

自主学习内容由学生自主学习参考教材的内容,并采用多种渠道,如查阅最新语音信号处理方面的科技文献、资料,作出学习报告。

目的是培养学生的自学能力和科技文献的检索和查阅能力,同时可以有助于学生了解和掌握语音信号处理领域的最新技术进展和应用情况,将理论知识和实际应用结合起来,促进学生学习的积极性和主动性。

通过开放实验,目的使学生进一步理解数字语音信息处理的基本方法,提高学生自主分析、发现及解决问题的能力,锻炼学生论文写作能力,为实际的应用打下扎实的基础。

2、研究设计型实验的内容1)研究设计型实验1:基于MATLAB的语音信号时域特征分析要求:按所学相关语音处理的知识,通过网上学习、资料查阅,自己设计程序,给出某一语音信号的短时过零率、短时能量、短时自相关特征的分析结果,并借助时域分析方法检测所分析语音信号的基音周期。

2)研究设计型实验2:基于MATLAB分析语音信号频域特征要求:按所学相关语音处理的得知识,通过网上学习、资料查阅,自己设计程序,给出某一语音信号的短时谱、倒谱、语谱图的分析结果,并借助频域分析方法检测所分析语音信号的基音周期或共振峰。

3)研究设计型实验3:基于MATLAB进行语音信号的LPC分析要求:按所学相关语音处理的知识,通过网上学习、资料查阅,自己设计程序,给出某一语音信号的LPC分析结果,包括LPC谱、LPCC谱的分析结果,并借助LPC分析方法检测所分析语音信号的基音周期和共振峰。

4)研究设计型实验4:基于VQ的特定人孤立词语音识别研究要求:按所学相关语音处理的知识,通过网上学习、资料查阅,借助MATLAB工具,自己设计基于VQ的码本训练程序和识别程序(尽量选用所学HMM或DTW方法设计识别程序),能识别特定人的语音,分析所设计系统的特性。

实验一 数字音频处理实验

实验一 数字音频处理实验

实验一数字音频处理实验一、实验目的:1、探讨采样频率对数据量的影响,对音质的影响以及带来的其他问题。

2、学习并掌握基本的音频处理手段。

3、熟悉和掌握WAV标准音频文件和MP3压缩音频文件的编辑方法。

二、实验要求:独立进行实验,完成实验报告。

三、实验内容:1、理论内容:在多媒体产品中,声音是必不可少的对象,其主要表现形式是语音、自然声和音乐。

要处理声音,首先要把声音数字化,这个过程叫做音频采样。

有了数字化声音后,接着对其进行处理。

处理方式主要有:剪辑、合成、制作特殊效果、增加混响、调整时间长度、改善频响特性等。

音质的好坏与采样频率成正比,当然,也与数据量成正比。

换言之,采样频率越高,音质越好,数据量也越大。

2、实验内容:(1)获取声音:准备好以WAV和MP3两种格式保存的文件,WAV格式无压缩,音质好,能够忠实地还原自然声;MP3格式是压缩格式,在压缩比不大的情况下,音质也非常好。

(2)录制声音:在录制之前,把麦克风连接到声卡上,如果使用的是带麦克风的头带耳机,检查连接线是否接好。

A、使用“录音机”录制练习:如果录制小于1min的声音,可使用Windows自带的“录音机”软件录制。

操作步骤:a、启动录音机软件。

b、单击录音按钮,开始录音。

此时,进程滑块向右移动,到右端终点位置停止,时间正好1min。

c、单击播放按钮,聆听效果。

如果不满意,选择“文件/新建”菜单,清除录音,重新进行步骤b。

d、转换采样频率。

选择“文件/属性”菜单,显示“声音的属性”画面。

“声音的属性”画面自上而下显示了声音文件的版权、长度、数据大小、音频格式。

其中的音频格式就是当前文件的采样频率。

画面显示“PCM 44100 Hz,16位,立体声”,对于语音来说,采样频率过高了,数据量过大,造成存储空间的浪费。

单击开始转换按钮,显示“选择声音”画面。

在“选择声音”画面的“属性”选择框中,选择适合语音的采样频率“22050Hz,8位,单声道22KB/s”,单击“确定”按钮。

数字信号处理语音处理课程设计实验报告

数字信号处理语音处理课程设计实验报告

实验报告(1)语音采样和观察clear,clc;[y,fs]=audioread('E:\大学课程\大三上\数字信号处理\201400121184吴蔓.mp3'); %语音信号的采集,把采样值放在y中subplot(3,1,1)plot(y);title('时域波形');sound(y,fs); %语音信号的播放n=length(y) %计算语音信号的长度Y=fft(y) ; %快速傅里叶变换subplot(3,1,2)plot(abs(Y)); %绘出频域波形title('幅频特性');subplot(3,1,3)plot(angle(Y));title('相频特性');plot(angle(Y1)); title('延时后相频特性');0.511.522.533.544.5x 105-0.500.5延时后时域波形0.511.522.533.544.5x 10505001000延时后幅频特性0.511.522.533.544.5x 105-505延时后相频特性我延时了和原信号一样长的点数,可以看出来延时后的信号要后播放一小段时间并且幅频相频差别不大。

(3)混响: clear,clc;[y,fs]=audioread('E:\大学课程\大三上\数字信号处理\201400121184吴蔓.mp3'); %语音信号的采集一,加一撇表示转置。

如右图二,语音信号真的大多数是在3.4khz以内的,由下面三图对比可以发现,实际人的声音只在一段频率范围内,并且主要集中在3400hz以内。

但录制的语音还有一些少许的幅度很低的高频信号达到了100khz,那都是人耳听不见的声音。

也可以看出声音占得频谱很宽,并且是在数字域的pi也就是模拟域的FS以内,audioread函数读取Mp3格式的采样率大约是44100hz。

也可以看出采样时大致满足奈奎斯特定理,fs约等于2fh.(5)多重回声(回声数量有限):clear,clc;[y,fs]=audioread('E:\大学课程\大三上\数字信号处理\201400121184吴蔓.mp3') ; %语音信号的采集,从命令行窗口的输出可以看出%采样后的信号矩阵是多行一列的,下面n=length(y0)语句计算出来有220032个采样数据,有的数据为0,大多数数据是复数y0= y (:,1);%冒号代表“所有的”,这里指的是把y的所有行的第一列给y0,实际上y0和y 一样的,这句指令用来取单声道信号N=3; %三重回声y1=filter(1,[1,zeros(1,80000/(N+1)),0.5],y');%这里的y'指的是y的转置矩阵,故是一行多列的,y'作为filter函数的输入矩阵%[1,zeros(1,30000),0.5]是分母矩阵,1是分子,就相当于这是个无限长的信号,求其差分方程,y1是输出矩阵,这里filter函数相当于是个IIR滤波器,系统函数%相当于H(Z)=1/(1-0.5Z.^(-30001)).sound(10*y1,fs); %回放三重回声信号,这里乘以10以加强信号,便于听取,因为如果衰减系数太大则回声难以听见n=length(y0) ;Y0=fft(y0) ;Y=fft(y1) ;figure(1);subplot(2,1,1)plot(y);title('原音时域波形');axis([0 225000 -0.4 0.6]);subplot(2,1,2)plot(y1);title('多重回声时域波形');。

数字语音信号处理实验报告

数字语音信号处理实验报告

语音信号处理实验报告专业班级电子信息1203学生姓名钟英爽指导教师覃爱娜完成日期2015年4月28日电子信息工程系信息科学与工程学院实验一语音波形文件的分析和读取一、实验学时:2 学时二、实验的任务、性质与目的:本实验是选修《语音信号处理》课的电子信息类专业学生的基础实验。

通过实验(1)掌握语音信号的基本特性理论:随机性,时变特性,短时平稳性,相关性等;(2)掌握语音信号的录入方式和*.WAV音波文件的存储结构;(3)使学生初步掌握语音信号处理的一般实验方法。

三、实验原理和步骤:WAV 文件格式简介WAV 文件是多媒体中使用了声波文件的格式之一,它是以RIFF格式为标准。

每个WAV 文件的头四个字节就是“RIFF”。

WAV 文件由文件头和数据体两大部分组成,其中文件头又分为RIFF/WAV 文件标识段和声音数据格式说明段两部分。

常见的WAV 声音文件有两种,分别对应于单声道(11.025KHz 采样率、8Bit 的采样值)和双声道(44.1KHz 采样率、16Bit 的采样值)。

采样率是指声音信号在“模拟→数字”转换过程中,单位时间内采样的次数;采样值是指每一次采样周期内声音模拟信号的积分值。

对于单声道声音文件,采样数据为8 位的短整数(short int 00H-FFH);而对于双声道立体声声音文件,每次采样数据为一个16 位的整数(int),高八位和低八位分别代表左右两个声道。

WAV 文件数据块包含以脉冲编码调制(PCM)格式表示的样本。

在单声道WAV 文件中,道0 代表左声道,声道1 代表右声道;在多声道WAV 文件中,样本是交替出现的。

WAV 文件的格式表1 wav文件格式说明表(1)选取WINDOWS 下MEDIA 中的任一WAV 文件,采用播放器进行播放,观察其播放波形,定性描述其特征;(2)录入并存储本人姓名语音文件(姓名.wav),根据WAV 文件的储格式,利用MATLAB 或C 语言,分析并读取文件头和数据信息;(3)将文件的通道数、采样频率、样本位数和第一个数据读取并示出来。

数字录音实验报告

数字录音实验报告

一、实验目的1. 了解数字录音的基本原理和过程;2. 掌握数字录音设备的使用方法;3. 学习数字录音后期处理技巧;4. 提高音频编辑能力。

二、实验原理数字录音是将模拟信号通过模数转换器(ADC)转换成数字信号,再通过数字信号处理器(DSP)进行处理,最后将数字信号转换成模拟信号输出。

数字录音具有失真小、信噪比高、便于存储和传输等优点。

三、实验设备1. 录音机:数字录音机或手机等具有录音功能的设备;2. 音频编辑软件:Audacity、Adobe Audition等;3. 音频播放器:电脑、手机等。

四、实验步骤1. 准备工作(1)检查录音设备是否正常工作;(2)打开音频编辑软件,创建一个新的音频文件;(3)选择合适的采样率和比特率,一般为44.1kHz和16bit。

2. 录音(1)将麦克风连接到录音设备;(2)调整录音设备音量,避免过载;(3)按下录音按钮,开始录音;(4)录音过程中注意环境噪音,尽量保持录音环境安静;(5)录音结束后,停止录音。

3. 录音文件导入(1)将录音文件从录音设备导出到电脑;(2)在音频编辑软件中打开录音文件。

4. 音频编辑(1)调整音频波形,去除杂音;(2)进行降噪处理,提高信噪比;(3)调整音频音量,使声音平衡;(4)添加混响效果,使声音更具空间感;(5)剪切、复制、粘贴音频片段,进行剪辑;(6)调整音频时长,使音频符合需求。

5. 保存和输出(1)将编辑好的音频文件保存为合适的格式;(2)将音频文件输出到播放设备。

五、实验结果与分析1. 实验结果通过数字录音实验,成功完成了录音、编辑和输出等环节,最终得到满意的音频文件。

2. 实验分析(1)数字录音具有失真小、信噪比高、便于存储和传输等优点,在实际应用中具有广泛的前景;(2)录音过程中,要注意录音设备的正确使用和录音环境的安静,以保证录音质量;(3)音频编辑软件的使用对提高音频质量至关重要,合理运用音频编辑技巧,可以使音频更具吸引力。

语音信号处理实验报告

语音信号处理实验报告

一、实验目的1. 理解语音信号处理的基本原理和流程。

2. 掌握语音信号的采集、预处理、特征提取和识别等关键技术。

3. 提高实际操作能力,运用所学知识解决实际问题。

二、实验原理语音信号处理是指对语音信号进行采集、预处理、特征提取、识别和合成等操作,使其能够应用于语音识别、语音合成、语音增强、语音编码等领域。

实验主要包括以下步骤:1. 语音信号的采集:使用麦克风等设备采集语音信号,并将其转换为数字信号。

2. 语音信号的预处理:对采集到的语音信号进行降噪、去噪、归一化等操作,提高信号质量。

3. 语音信号的特征提取:提取语音信号中的关键特征,如频率、幅度、倒谱等,为后续处理提供依据。

4. 语音信号的识别:根据提取的特征,使用语音识别算法对语音信号进行识别。

5. 语音信号的合成:根据识别结果,合成相应的语音信号。

三、实验步骤1. 语音信号的采集使用麦克风采集一段语音信号,并将其保存为.wav文件。

2. 语音信号的预处理使用MATLAB软件对采集到的语音信号进行预处理,包括:(1)降噪:使用谱减法、噪声抑制等算法对语音信号进行降噪。

(2)去噪:去除语音信号中的杂音、干扰等。

(3)归一化:将语音信号的幅度归一化到相同的水平。

3. 语音信号的特征提取使用MATLAB软件对预处理后的语音信号进行特征提取,包括:(1)频率分析:计算语音信号的频谱,提取频率特征。

(2)幅度分析:计算语音信号的幅度,提取幅度特征。

(3)倒谱分析:计算语音信号的倒谱,提取倒谱特征。

4. 语音信号的识别使用MATLAB软件中的语音识别工具箱,对提取的特征进行识别,识别结果如下:(1)将语音信号分为浊音和清音。

(2)识别语音信号的音素和音节。

5. 语音信号的合成根据识别结果,使用MATLAB软件中的语音合成工具箱,合成相应的语音信号。

四、实验结果与分析1. 语音信号的采集采集到的语音信号如图1所示。

图1 语音信号的波形图2. 语音信号的预处理预处理后的语音信号如图2所示。

声音数字编辑实验报告

声音数字编辑实验报告

一、实验目的1. 掌握声音数字化的基本原理和方法。

2. 熟悉音频处理软件的基本操作,包括声音的录制、编辑、效果处理和输出。

3. 通过实验,提高对音频信号处理技术的理解和应用能力。

二、实验环境1. 硬件:高性能计算机一台,配备高性能声卡、麦克风和耳机。

2. 软件:Adobe Audition CC 或同类音频处理软件。

三、实验内容本次实验主要分为以下几个步骤:1. 声音录制:使用麦克风录制一段自然声音,如说话、音乐或自然界的声音。

2. 声音编辑:对录制好的声音进行剪辑、合并、静音、复制、粘贴等基本操作。

3. 效果处理:对声音添加各种效果,如降噪、均衡、混响、延时等。

4. 声音合成:将编辑好的声音与背景音乐或其他声音进行混合。

5. 输出:将处理好的音频文件导出为不同的格式,如MP3、WAV等。

四、实验步骤1. 声音录制:- 打开音频处理软件,选择“录音”功能。

- 连接麦克风和计算机,确保声音输入正常。

- 开始录制,注意保持声音清晰、稳定。

- 录制完成后,保存音频文件。

2. 声音编辑:- 打开音频文件,使用“剪辑”工具进行剪辑、合并、静音等操作。

- 使用“复制”、“粘贴”功能对声音进行复制、粘贴。

- 使用“裁剪”功能删除不需要的部分。

3. 效果处理:- 选择“效果”菜单,添加各种效果,如降噪、均衡、混响、延时等。

- 调整效果参数,使声音更加丰富、动听。

- 使用“混响”效果模拟真实环境,增加空间感。

4. 声音合成:- 打开背景音乐或其他声音文件。

- 将编辑好的声音与背景音乐进行混合,调整音量平衡。

- 可以使用“淡入淡出”功能,使声音过渡更加自然。

5. 输出:- 选择“文件”菜单,选择“导出”功能。

- 选择输出格式,如MP3、WAV等。

- 设置输出参数,如采样率、比特率等。

- 导出音频文件,保存到指定位置。

五、实验结果与分析1. 通过实验,成功录制、编辑、处理和输出了一段音频文件。

2. 学会了使用音频处理软件的基本操作,包括声音的录制、剪辑、合并、效果处理和输出。

数字音频基本编辑实训报告

数字音频基本编辑实训报告

一、实训背景随着信息技术的飞速发展,数字音频技术已经成为现代生活中不可或缺的一部分。

为了提高自己的专业技能,我参加了数字音频基本编辑实训课程。

通过这次实训,我深入了解了数字音频的基本原理、编辑技巧以及相关软件的使用方法。

以下是我对本次实训的总结和反思。

二、实训目的1. 掌握数字音频的基本概念和原理;2. 熟练运用数字音频编辑软件;3. 学会音频素材的采集、剪辑、合成和输出;4. 提高自己的音乐素养和审美能力。

三、实训内容1. 数字音频基本概念数字音频是指以数字形式存储和处理的音频信号。

与模拟音频相比,数字音频具有不失真、抗干扰、易于存储和传输等优点。

数字音频的采样率、量化位数和声道数是衡量音频质量的重要指标。

2. 数字音频编辑软件本次实训主要使用了Audacity这款免费、开源的数字音频编辑软件。

Audacity具有操作简单、功能强大等特点,适合初学者和专业人士使用。

3. 音频素材的采集音频素材的采集主要包括录音和导入现有音频文件。

录音可以使用电脑内置的麦克风或者外接麦克风进行。

导入现有音频文件可以使用Audacity的“文件”菜单中的“打开”功能。

4. 音频剪辑音频剪辑是指对音频素材进行分割、拼接、裁剪等操作。

在Audacity中,可以使用“工具栏”中的“剪辑工具”进行音频剪辑。

具体操作步骤如下:(1)选择要剪辑的音频片段;(2)使用“剪辑工具”选择“裁剪”或“删除”功能;(3)调整剪辑点,确认剪辑效果。

5. 音频合成音频合成是指将多个音频素材进行组合,形成新的音频作品。

在Audacity中,可以使用“工具栏”中的“波形工具”或“音轨工具”进行音频合成。

具体操作步骤如下:(1)打开要合成的音频素材;(2)将不同素材拖拽到同一项目窗口中;(3)调整素材位置,确保音频同步;(4)使用“工具栏”中的“混音工具”调整音量、均衡等参数。

6. 音频输出音频输出是指将编辑好的音频作品保存或导出为其他格式。

在Audacity中,可以使用“文件”菜单中的“导出”功能进行音频输出。

数字语音处理实验报告

数字语音处理实验报告

实验一、用MATLAB实现语音信号的时域分析学院:信息与通信工程学院专业:通信工程班级:通信144学号:2014136410:新雨指导教师:艳秋1.实验目的观察并验证语音信号的时域特性,理解并掌握典型的语音信号时域分析方法和时域特征,为深入学习语音信号处理的各种应用奠定基础。

2.MATLAB程序代码(1)由麦克风采集语音数据,将采集的数据存成WAV文件(采样率为8000Hz),存在本人的文件夹中。

所用程序代码为:clear;close all;Fs=11025;y=wavrecord(5*Fs,Fs,'double');wavwrite(y,'D:\\lxy');soundview(y,Fs);(2)读取WAV文件,显示语音信号的波形。

所用程序代码为:clear;close all;x = wavread('D:\\lxy.wav');figure;plot(x);axis([0,size(x,1),-0.35,0.3]);title('语音信号时域波形');xlabel('样点数'); ylabel('幅度');(3)读取WAV文件,计算并显示语音的短时能量(窗函数为矩形窗,帧长为50,200,400,600)。

所用程序代码为:clear;close all;x = wavread('d:\\k.wav');x = double(x);f1= enframe(x,50, 50);energy1 = sum(abs(f1), 2);subplot(2,2,1);plot(energy1);title('语音信号的短时能量');legend('帧长LEN =50');f2= enframe(x,200, 200);energy2 = sum(abs(f2), 2);subplot(2,2,2);plot(energy2);title('语音信号的短时能量');legend('帧长LEN = 200');f3= enframe(x,400, 400);energy3 = sum(abs(f3), 2);subplot(2,2,3);plot(energy3);title('语音信号的短时能量');legend('帧长LEN = 400');f4= enframe(x,600,600);energy4 = sum(abs(f4), 2);subplot(2,2,4);plot(energy4);title('语音信号的短时能量');legend('帧长LEN = 600');(4)读取WAV文件,计算并显示语音的短时过零率(窗函数为矩形窗,帧长为256,帧移为128),所用程序代码为:clear;close all;x = wavread('D:\\lxy.wav');x = double(x);LEN = 300;INC= 150;f = enframe(x, LEN, INC);% 计算短时过零率z = zeros(size(f,1),1);difs =0.01;for i=1:size(f,1)s=f(i,:);for j=1:(length(s)-1)if s(j)* s(j+1)<0&abs(s(j)-s(j+1))>difs;z(i)= z(i)+1;endendendsubplot(2,1,1); plot(x);axis([0,size(x,1),-0.35,0.3]);title('语音信号时域波形'); xlabel('样点数'); ylabel('幅度');subplot(2,1,2);plot(z);title('语音信号的短时过零率');xlabel('帧数'); ylabel('短时过零率');(5)读取WAV文件,计算浊音与清音的短时自相关函数所用的程序代码为:clear;close all;x = wavread('D:\\lxy.wav');x = double(x);LEN = 256;INC= 128;f = enframe(x, LEN, INC);ff=f(15,:);N=LEN;R=zeros(1,N);for k=1:NR(k)= sum(ff(k:N).*ff(1:N-k+1));endfor k=1:NR1(k)= R(k)/R(1);endsubplot(2,1,1);plot(ff);axis([0,N,-0.5,0.75])title('加矩形窗的语音帧'); xlabel('样点数'); ylabel('幅度'); subplot(2,1,2); plot(R1);axis([0,N,-1,1])title('加矩形窗的短时自相关函数'); xlabel('k'); ylabel('R(k)');clear;close all;x = wavread('d:\\k.wav');x = double(x);LEN = 256;INC= 128;f = enframe(x, LEN, INC);ff=f(124,:);ff=ff'.*hamming(length(ff));N=LEN;R=zeros(1,N);for k=1:NR(k)= sum(ff(k:N).*ff(1:N-k+1));endfor k=1:NR1(k)= R(k)/R(1);endsubplot(2,1,1);plot(ff);axis([0,N,-0.5,0.75])title('加汉明窗的语音帧'); xlabel('样点数'); ylabel('幅度'); subplot(2,1,2); plot(R1);axis([0,N,-1,1])title('加汉明窗的短时自相关函数'); xlabel('k'); ylabel('R(k)');clear;close all;x = wavread('D:\\lxy.wav');x = double(x);LEN = 10;INC= 10;f = enframe(x, LEN, INC);ff=f(500,:);N=LEN;R=zeros(1,N);for k=1:NR(k)= sum(ff(k:N).*ff(1:N-k+1));endfor k=1:NR1(k)= R(k)/R(1);endsubplot(2,1,1);plot(ff);axis([0,N,-0.05,0.05])title('加矩形窗的语音帧'); xlabel('样点数'); ylabel('幅度');subplot(2,1,2); plot(R1);axis([0,N,-0.5,0.5])title('加矩形窗的短时自相关函数'); xlabel('k'); ylabel('R(k)');clear;close all;x = wavread('D:\lxy.wav');x = double(x);LEN = 256;INC= 128;f = enframe(x, LEN, INC);ff=f(25,:);N=LEN;R=zeros(1,N);for k=1:NR(k)= sum(ff(k:N).*ff(1:N-k+1));endfor k=1:NR1(k)= R(k)/R(1);endsubplot(2,1,1);plot(ff);axis([0,N,-0.05,0.05])title('加矩形窗的语音帧'); xlabel('样点数'); ylabel('幅度');subplot(2,1,2); plot(R1);axis([0,N,-0.5,0.5])title('加矩形窗的短时自相关函数'); xlabel('k'); ylabel('R(k)');3.实验结果及其分析(1)本实验利用11025Hz的采样频率对输入的语音信号进行采样,采样点数为55125个,持续时间为5秒,存储格式为double。

实验四数字音频处理实验报告

实验四数字音频处理实验报告

实验四数字音频处理实验报告云南大学软件学院实验报告序号:姓名:学号:指导教师:刘春花,刘宇成绩:实验四数字音频处理一、实验目的1、熟悉并掌握MATLAB工具的使用;2、实现音频文件的生成、读取、播放和转换的基本操作。

二、实验环境MATLAB 6.5以上版本、WIN XP或WIN2000计算机三、实验内容1、用matlab 产生音乐。

在matlab命令窗口执行下列命令,并回答问题cf = 220;sf = 22050;d = 0.5;n = sf * d;t = (1:n)/sf;s0 = sin(2*pi*cf*t);sound(s0, sf);1)信号的频率是多少? 采样频率是多少?采样间隔是多少?一共有多少个采样点?声音有多少秒?频率:220 采样频率:22050 采样间隔: (1:n)/sf采样点: sin(2*pi*cf*t) 时长:0.5s2)请解释sound(s, sf)函数的参数和实现的功能。

如果把sound(s0,sf)改为sound(s0,2*sf)听起来会有什么不同,为什么?时间更短,因为频率发生改变,变成了原来的2倍3)执行sound1.m,听一听,能否在此程序基础上做修改,实现一小段音乐旋律,时间不少于10秒。

并保存为为wav文件。

2、1)读取wav 文件。

获取相应参数,填空执行语句:[B, fs, nbits]=wavread('C:\TEMP\hootie.wav'); % loads the clip size(B); % the size of Bsound(B,fs) % plays the sound.采样频率:44100采样位数:16采样通道数:2采样数据率:1411200采样时间:2)对wav文件做回声处理变换。

(对矩阵做变换)四、实验小结,总结实验中出现的问题和解决方法;通过此次实验你的收获;对本次实验有无改进的意见。

1.在实验过程中遇到的问题包括代码错误,无法读取保存wav文件,以及回音算法的应用。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

学院:信息与通信工程学院专业:通信工程班级:通信144学号:10姓名:刘新雨指导教师:崔艳秋1.实验目的观察并验证语音信号的时域特性,理解并掌握典型的语音信号时域分析方法和时域特征,为深入学习语音信号处理的各种应用奠定基础。

2.MATLAB程序代码(1)由麦克风采集语音数据,将采集的数据存成WAV文件(采样率为8000Hz),存在本人的文件夹中。

所用程序代码为:clear;close all;Fs=11025;y=wavrecord(5*Fs,Fs,'double');wavwrite(y,'D:\\lxy');soundview(y,Fs);(2)读取WAV文件,显示语音信号的波形。

所用程序代码为:clear;close all;x = wavread('D:\\');figure;plot(x);axis([0,size(x,1),,]);title('语音信号时域波形');xlabel('样点数'); ylabel('幅度');(3)读取WAV文件,计算并显示语音的短时能量(窗函数为矩形窗,帧长为50,200,400,600)。

所用程序代码为:clear;close all;x = wavread('d:\\');x = double(x);f1= enframe(x,50, 50);energy1 = sum(abs(f1), 2);subplot(2,2,1);plot(energy1);title('语音信号的短时能量');legend('帧长LEN =50');f2= enframe(x,200, 200);energy2 = sum(abs(f2), 2);subplot(2,2,2);plot(energy2);title('语音信号的短时能量');legend('帧长LEN = 200');f3= enframe(x,400, 400);energy3 = sum(abs(f3), 2);subplot(2,2,3);plot(energy3);title('语音信号的短时能量');legend('帧长LEN = 400');f4= enframe(x,600,600);energy4 = sum(abs(f4), 2);subplot(2,2,4);plot(energy4);title('语音信号的短时能量');legend('帧长LEN = 600');(4)读取WAV文件,计算并显示语音的短时过零率(窗函数为矩形窗,帧长为256,帧移为128),所用程序代码为:clear;close all;x = wavread('D:\\');x = double(x);LEN = 300;INC= 150;f = enframe(x, LEN, INC);% 计算短时过零率z = zeros(size(f,1),1);difs =;for i=1:size(f,1)s=f(i,:);for j=1:(length(s)-1)if s(j)* s(j+1)<0&abs(s(j)-s(j+1))>difs;z(i)= z(i)+1;endendendsubplot(2,1,1); plot(x);axis([0,size(x,1),,]);title('语音信号时域波形'); xlabel('样点数'); ylabel('幅度');subplot(2,1,2);plot(z);title('语音信号的短时过零率');xlabel('帧数'); ylabel('短时过零率');(5)读取WAV文件,计算浊音与清音的短时自相关函数所用的程序代码为:clear;close all;x = wavread('D:\\');x = double(x);LEN = 256;INC= 128;f = enframe(x, LEN, INC);ff=f(15,:);N=LEN;R=zeros(1,N);for k=1:NR(k)= sum(ff(k:N).*ff(1:N-k+1));endfor k=1:NR1(k)= R(k)/R(1);endsubplot(2,1,1);plot(ff);axis([0,N,,])title('加矩形窗的语音帧'); xlabel('样点数'); ylabel('幅度'); subplot(2,1,2); plot(R1);axis([0,N,-1,1])title('加矩形窗的短时自相关函数'); xlabel('k'); ylabel('R(k)');clear;close all;x = wavread('d:\\');x = double(x);LEN = 256;INC= 128;f = enframe(x, LEN, INC);ff=f(124,:);ff=ff'.*hamming(length(ff));N=LEN;R=zeros(1,N);for k=1:NR(k)= sum(ff(k:N).*ff(1:N-k+1));endfor k=1:NR1(k)= R(k)/R(1);endsubplot(2,1,1);plot(ff);axis([0,N,,])title('加汉明窗的语音帧'); xlabel('样点数'); ylabel('幅度'); subplot(2,1,2); plot(R1);axis([0,N,-1,1])title('加汉明窗的短时自相关函数'); xlabel('k'); ylabel('R(k)');clear;close all;x = wavread('D:\\');x = double(x);LEN = 10;INC= 10;f = enframe(x, LEN, INC);ff=f(500,:);N=LEN;R=zeros(1,N);for k=1:NR(k)= sum(ff(k:N).*ff(1:N-k+1));endfor k=1:NR1(k)= R(k)/R(1);endsubplot(2,1,1);plot(ff);axis([0,N,,])title('加矩形窗的语音帧'); xlabel('样点数'); ylabel('幅度');subplot(2,1,2); plot(R1);axis([0,N,,])title('加矩形窗的短时自相关函数'); xlabel('k'); ylabel('R(k)');clear;close all;x = wavread('D:\');x = double(x);LEN = 256;INC= 128;f = enframe(x, LEN, INC);ff=f(25,:);N=LEN;R=zeros(1,N);for k=1:NR(k)= sum(ff(k:N).*ff(1:N-k+1));endfor k=1:NR1(k)= R(k)/R(1);endsubplot(2,1,1);plot(ff);axis([0,N,,])title('加矩形窗的语音帧'); xlabel('样点数'); ylabel('幅度');subplot(2,1,2); plot(R1);axis([0,N,,])title('加矩形窗的短时自相关函数'); xlabel('k'); ylabel('R(k)');3.实验结果及其分析(1)本实验利用11025Hz的采样频率对输入的语音信号进行采样,采样点数为55125个,持续时间为5秒,存储格式为double。

之后将数字语音数据写入D盘的文件,并通过放音设备进行回放。

回放的GUI界面如图1所示,通过该界面可以观察采集的语音信号。

图1 用soundview函数显示的语音信号(2)本实验将D盘的文件读取出来,并显示文件中的语音信号波形,显示的波形如图2所示。

该波形是汉语拼音“Xu”的时域波形。

从图2可以看出,[X]是清音,它的波形幅值较小,且没有周期性;[u]是浊音,它的波形幅值较大且有明显的周期性起伏结构。

图2 语音“Xu”的时域波形(3)本实验将D盘的文件读取出来,当帧长取不同值时计算语音信号的短时能量,如图3所示。

从图3可以看出,浊音短时能量大,短时平均幅度大,短时过零率低,浊音具有较强的能量值,音段内隐藏信息的能力高。

轻音短时能量小,短时平均幅度小,能量值较低,音段内隐藏信息的能力较低。

图3 不同帧长对应的短时能量(4)本实验首先读取中的语音数据,之后计算每一帧的短时过零率,最后将原始语音信号和短时过零率显示出来,如图4所示。

从图4可以看出,清音的过零率较高,浊音的过零率较低。

图4 短时过零率(5)本实验首先读取中的语音数据,之后对数据进行分帧加窗处理,帧长为256,帧移为128。

选取其中的一帧浊音(第15帧)并计算这帧的短时自相关函数。

当窗函数分别为矩形窗和汉明窗时,截取的语音信号和短时自相关函数如图5和图6所示。

从图5和图6可以看出,矩形窗能够比汉明窗更明显的显示出第一个峰值。

当窗函数为矩形窗,不同帧长(帧移=帧长)的一帧浊音对应的短时自相关函数如图7和图8所示。

从图7和图8可以看出,帧长越长,越容易区分其最大值。

当窗函数为矩形窗,帧长为256,帧移为128,选取一帧清音,获得的短时自相关函数如图9所示。

从图5和图9可以看出,浊音具有明显的周期性,清音无明显周期。

图5 加矩形窗的短时自相关函数图6 加汉明窗的短时自相关函数图7 帧长为10时的短时自相关函数图8 帧长为100时的短时自相关函数图9 清音的短时自相关函数4.思考题短时能量的主要用途有哪些?答:可以区分清音段与浊音段,可以用来区分,有声与无声的分界,生母和韵母的分界等,也可以用于语音识别中。

相关文档
最新文档