语音信号的时域特征与频域特征
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验报告
课程名称____________语音信号处理__________________ 实验项目语音信号的时域特征与频域特征
实验仪器__台式计算机、Matlab软件、Cool Edit__
系别____信息与通信工程学院_____
专业_____电子信息工程专业______
班级/学号_____
学生姓名___________________
实验日期_______2013/4/17________
成绩_________________________
指导教师_____________________
实验一:语音信号的时域特征与频域特征
一、实验目的
使学生通过本实验观察语音信号在时域和频域的基本特征(语音波形、基音频率、过零数、共振峰),验证教材中关于语音信号在时域和频域的基本特征的概念与论述;通过采集语音数据与在实验中记录每个元音的基音周期、过零数、共振峰等环节熟悉这些语音的基本特征,为今后深入学习语音信号处理奠定基础。
二、实验内容
学习音频编辑软件Cool Edit的使用方法及语音文件的建立;采集语音数据;观察语音波形;记录每个元音的基音周期(其倒数为基音频率)、过零数、共振峰;观察语音频域特征;分析不同元音的共振峰模式的特点(频率、相对振幅)。
三、实验原理
元音与辅音在发音方法有如下基本区别:发元音时气流顺利通过声腔,声带颤动,形成的声波是周期性的;发辅音时气流暂时被阻不能通过或只能勉强挤出去。
元音具有基音与共振峰结构,辅音则不具有这两者。
基音由声带振动频率产生,决定语音的音高、音调。在语音波形中表现为准周期峰值。
共振峰是语音频谱上的强频区,表现为频谱上呈峰状。共振峰由声腔形状的变化决定,不同的声腔形状有不同的固有频率,产生不同的共振峰模式。每个元音有特定的共振峰模式。
四、实验方法与实验步骤
(一)音频编辑软件Cool Edit的使用方法及语音文件的建立
①点击桌面上“cool edit”图标,选不同项可激活cool edit菜单中不同功能。
②点击“file”菜单中的“new”,设抽样频率为8KHz,单声道“mono”,“8 bit”。
③点击“Record”录音,将录音存成“.wav”文件。
④点击菜单中“View”中的“Spectral View”可观看语谱图。
⑤点击菜单中“Analyze”中的“Frequence Analysis”可分析频谱。
⑥点击菜单中“Effects”中的“Amplitude”可改变幅度。
(二)观察语音时域特征
在E盘或D盘建立实验者本人的文件夹,然后做以下实验。
①发【a】、【i】、【e】、【u】这四个元音,由麦克风采集语音数据,分别存成“a.wav”、“i.wav”、“e.wav”、“u.wav”文件,存在本人的文件夹中。
②利用Cool Edit打开并观察以上语音数据的波形。
③元音波形中的准周期结构与声带振动频率对应,其周期称为“基音周期”(其倒数为基音频率),利用Cool Edit观察元音的波形,记录每个元音的前部、中部和后部的各一个基音周期。
④记录每个元音的任意一个基音周期中的过零数。
⑤共振峰是语音频谱的峰状区域,利用Cool Edit观察上述每个元音的频谱,记录每个元音的前三个共振峰的数值。
波形截图:
图(1)元音a前部
图(2)元音a中部
图(3)元音a后部
图(4)元音i前部
图(5)元音i中部
图(6)元音i后部
图(7)元音e前部
图(8)元音e中部
图(9)元音e后部
图(10)元音u前部
图(11)元音u中部
图(12)元音u后部
图(13)元音a的共
振峰频率分析图
图(14)元音i的共振峰频率分析图
图(15)元音e的共
振峰频率分析图
(三)观察语音频域特征 对你发的【a 】、【i 】、【e 】、【u 】这四个元音中每一个元音,分别选取稳定段的256个抽样,利用 Matlab 的 FFT 计算其频谱,并利用subplot 命令以波形和频谱对应的形式画出图形。部分参考程序如下
y = wavread('e.wav'); t=1:length(y);
y2 = wavread('e.wav',[4000 4512]); y2F=fft(y2); subplot(3,1,1)
plot(t,y,'-b',4000,[0.2:0.005:0.4],'-r',4512,[0.2:0.005:0.4],'-r') subplot(3,1,2),plot(y2);grid on
subplot(3,1,3), plot(log(abs(y2F)));grid on
Matlab 程序结果截图
图(16)元音u 的共振峰频率分析图
图(17)元音a 的时域波形和频域波形
图(18)元音i的时域波形和频域波形
图(19)元音e的时域波形和频域波形
图(20)元音u的
时域波形和频域
波形
表1 实验数据记录表
基音频率过零率共振峰(dB)
前中后0Hz 148Hz 290Hz
a 66 53 55 13 -41.91 -50.36 -50.14
i 50 52 53 14 -42.07 -52.74 -53.13
e 49 52 53 16 -43.42 -52.03 -53.23
u 56 57 60 10 -45.74 -51.64 -52.61
五、思考题
(1)共振峰与语音波形有什么相关之处?
答:共振峰是指在声音的频谱中能量相对集中的一些区域,共振峰不但是音质的决定因素,而且反映了声道(共振腔)的物理特征。在语音声学中,共振峰决定着元音的音质,而在计算机音乐中,它们是决定音色和音质的重要参数。共振峰是语音频谱上的强频区,表现为频谱上呈峰状。共振峰由声腔形状的变化决定,不同的声腔形状有不同的固有频率,产生不同的共振峰模式。每个元音有特定的共振峰模式。因此,不同的语音波形有不同的与之对应的共振峰模式。(2)基音周期与音调的高低有什么对应关系?
答:基音由声带振动频率产生,决定语音的音高、音调。因此,音调的高低决定了基因频率,从而决定了基因周期大小。