大学本科语音信号处理实验讲义8学时汇总
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
语音信号处理实验讲义
时间:2011-12
目录
实验一语音信号生成模型分析 (3)
实验二语音信号时域特征分析 (7)
实验三语音信号频域特征分析 (12)
实验四语音信号的同态处理和倒谱分析 (16)
实验一 语音信号生成模型分析
一、实验目的
1、了解语音信号的生成机理,了解由声门产生的激励函数、由声道产生的调制函数和由嘴唇产生的辐射函数。
2、编程实现声门激励波函数波形及频谱,与理论值进行比较。
3、编程实现已知语音信号的语谱图,区分浊音信号和清音信号在语谱图上的差别。
二、实验原理
语音生成系统包含三部分:由声门产生的激励函数()G z 、由声道产生的调制函数()V z 和由嘴唇产生的辐射函数()R z 。语音生成系统的传递函数由这三个函数级联而成,即
()()()()H z G z V z R z =
1、激励模型
发浊音时,由于声门不断开启和关闭,产生间隙的脉冲。经仪器测试它类似于斜三角波的脉冲。也就是说,这时的激励波是一个以基音周期为周期的斜三角脉冲串。单个斜三角波的频谱表现出一个低通滤波器的特性。可以把它表示成z 变换的全极点形式
121
()(1)cT G z e z --=-⋅
这里c 是一个常数,T 是脉冲持续时间。周期的三角波脉冲还得跟单位脉冲串的z 变换相乘:
112
1()()()1(1)v cT A U z E z G z z e z ---=⋅=⋅--⋅ 这就是整个激励模型,v A 是一个幅值因子。
2、声道模型
当声波通过声道时,受到声腔共振的影响,在某些频率附近形成谐振。反映在信号频谱图上,在谐振频率处其谱线包络产生峰值,把它称为共振峰。
一个二阶谐振器的传输函数可以写成
12()1i i i i A V z B z C z
--=-- 实践表明,用前3个共振峰代表一个元音足够了。对于较复杂的辅音或鼻音共振峰要到5个以上。多个()i V z 叠加可以得到声道的共振峰模型
012111()()11R r r M M i r i N
k
i i i i k k b z A V z V z B z C z a z -=---======---∑∑∑∑ 3、辐射模型
从声道模型输出的是速度波,而语音信号是声压波。二者倒比称为辐射阻抗,它表征了
口唇的辐射效应,可用下式表示:
10()(1)R z R z -=-
三、实验内容
1、设声门脉冲单个三角波的数学表达式为
11111221[1cos ] 02()()cos 20 n n N N n N g n N n N N N ππ⎧-≤≤⎪⎪⎪⎡⎤-⎪=≤≤+⎨⎢⎥⎣⎦⎪⎪⎪⎪⎩
其他
试画出三角波波形图及其频谱。取12=5=3N N ,。
参考程序:
%三角波及其频谱
n=linspace(0,25,125);
g=zeros(1,length(n));
i=0;
for i=0:40
if n(i+1)<=5
g(i+1)=0.5*(1-cos(n(i+1)*pi/5));
else
g(i+1)=cos((n(i+1)-5)*pi/8);
end
end
figure(1)
subplot(1,2,1)
plot(n,g)
xlabel('时间/ms')
ylabel('幅度')
axis([0,25,-0.4,1.2])
r=fft(g,1024);
r1=abs(r);
yuanlai=20*log10(r1);
signal(1:512)=yuanlai(1:512);
pinlv=(0:1:511)*8000/1024;
subplot(1,2,2)
plot(pinlv,signal);
xlabel('频率/Hz')
ylabel('幅度/dB')
axis([0,620,0,30])
图1-1 三角波及其频谱
2、给出语音段“数字信号处理”(speech.wav),画出它的语谱图。clear all;
[x,sr]=wavread('speech_dsp.wav');
s=length(x);
w=round(44*sr/1000);
n=w;
shift=w/2;
h=w-shift;
%win=hanning(n)';
win=hamming(n)';
c=1;
ncols=1+fix((s-n)/h);
d=zeros((1+n/2),ncols);
for b=0:h:(s-n)
u=win'.*x((b+1):(b+n));
t=fft(u);
d(:,c)=t(1:(1+n/2));
c=c+1;
end
tt=[0:h:(s-n)]/sr;
ff=[0:(n-2)]*sr/n;
imagesc(tt,ff/1000,20*log10(abs(d)));
colormap(gray);
axis xy
xlabel('时间/s')
ylabel('频率/kHz')
图1-2 语谱图
四、思考题
1、声门激励脉冲信号是高频衰减的还是高频增强的?
2、画语谱图时为什么要给语音信号加汉明窗?若加矩形窗会有什么区别?
3、在语谱图上观察,浊音信号的和清音信号的频谱有什么区别?