大学本科语音信号处理实验讲义8学时汇总

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

语音信号处理实验讲义

时间:2011-12

目录

实验一语音信号生成模型分析 (3)

实验二语音信号时域特征分析 (7)

实验三语音信号频域特征分析 (12)

实验四语音信号的同态处理和倒谱分析 (16)

实验一 语音信号生成模型分析

一、实验目的

1、了解语音信号的生成机理,了解由声门产生的激励函数、由声道产生的调制函数和由嘴唇产生的辐射函数。

2、编程实现声门激励波函数波形及频谱,与理论值进行比较。

3、编程实现已知语音信号的语谱图,区分浊音信号和清音信号在语谱图上的差别。

二、实验原理

语音生成系统包含三部分:由声门产生的激励函数()G z 、由声道产生的调制函数()V z 和由嘴唇产生的辐射函数()R z 。语音生成系统的传递函数由这三个函数级联而成,即

()()()()H z G z V z R z =

1、激励模型

发浊音时,由于声门不断开启和关闭,产生间隙的脉冲。经仪器测试它类似于斜三角波的脉冲。也就是说,这时的激励波是一个以基音周期为周期的斜三角脉冲串。单个斜三角波的频谱表现出一个低通滤波器的特性。可以把它表示成z 变换的全极点形式

121

()(1)cT G z e z --=-⋅

这里c 是一个常数,T 是脉冲持续时间。周期的三角波脉冲还得跟单位脉冲串的z 变换相乘:

112

1()()()1(1)v cT A U z E z G z z e z ---=⋅=⋅--⋅ 这就是整个激励模型,v A 是一个幅值因子。

2、声道模型

当声波通过声道时,受到声腔共振的影响,在某些频率附近形成谐振。反映在信号频谱图上,在谐振频率处其谱线包络产生峰值,把它称为共振峰。

一个二阶谐振器的传输函数可以写成

12()1i i i i A V z B z C z

--=-- 实践表明,用前3个共振峰代表一个元音足够了。对于较复杂的辅音或鼻音共振峰要到5个以上。多个()i V z 叠加可以得到声道的共振峰模型

012111()()11R r r M M i r i N

k

i i i i k k b z A V z V z B z C z a z -=---======---∑∑∑∑ 3、辐射模型

从声道模型输出的是速度波,而语音信号是声压波。二者倒比称为辐射阻抗,它表征了

口唇的辐射效应,可用下式表示:

10()(1)R z R z -=-

三、实验内容

1、设声门脉冲单个三角波的数学表达式为

11111221[1cos ] 02()()cos 20 n n N N n N g n N n N N N ππ⎧-≤≤⎪⎪⎪⎡⎤-⎪=≤≤+⎨⎢⎥⎣⎦⎪⎪⎪⎪⎩

其他

试画出三角波波形图及其频谱。取12=5=3N N ,。

参考程序:

%三角波及其频谱

n=linspace(0,25,125);

g=zeros(1,length(n));

i=0;

for i=0:40

if n(i+1)<=5

g(i+1)=0.5*(1-cos(n(i+1)*pi/5));

else

g(i+1)=cos((n(i+1)-5)*pi/8);

end

end

figure(1)

subplot(1,2,1)

plot(n,g)

xlabel('时间/ms')

ylabel('幅度')

axis([0,25,-0.4,1.2])

r=fft(g,1024);

r1=abs(r);

yuanlai=20*log10(r1);

signal(1:512)=yuanlai(1:512);

pinlv=(0:1:511)*8000/1024;

subplot(1,2,2)

plot(pinlv,signal);

xlabel('频率/Hz')

ylabel('幅度/dB')

axis([0,620,0,30])

图1-1 三角波及其频谱

2、给出语音段“数字信号处理”(speech.wav),画出它的语谱图。clear all;

[x,sr]=wavread('speech_dsp.wav');

s=length(x);

w=round(44*sr/1000);

n=w;

shift=w/2;

h=w-shift;

%win=hanning(n)';

win=hamming(n)';

c=1;

ncols=1+fix((s-n)/h);

d=zeros((1+n/2),ncols);

for b=0:h:(s-n)

u=win'.*x((b+1):(b+n));

t=fft(u);

d(:,c)=t(1:(1+n/2));

c=c+1;

end

tt=[0:h:(s-n)]/sr;

ff=[0:(n-2)]*sr/n;

imagesc(tt,ff/1000,20*log10(abs(d)));

colormap(gray);

axis xy

xlabel('时间/s')

ylabel('频率/kHz')

图1-2 语谱图

四、思考题

1、声门激励脉冲信号是高频衰减的还是高频增强的?

2、画语谱图时为什么要给语音信号加汉明窗?若加矩形窗会有什么区别?

3、在语谱图上观察,浊音信号的和清音信号的频谱有什么区别?

相关文档
最新文档