《语音信号处理》实验3-LPC特征提取
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
华南理工大学《语音信号处理》实验报告
实验名称:LPC特征提取
姓名:
学号:
班级:10级电信5班
日期:2013年5 月24日
1. 实验目的
1、熟练运用MATLAB 软件进行语音信号实验;
2、熟悉短时分析原理、LPC 的原理;
3、学习运用MATLAB 编程进行LPC 的提取;
4、学会利用短时分析原理提取LPC 特征序列。
2. 实验原理
1、LPC 分析基本原理
LPC 分析为线性时不变因果稳定系统V (z )建立一个全极点模型,并利用均方误差准则,对已知的语音信号s(n)进行模型参数估计。
如果利用P 个取样值来进行预测,则称为P 阶线性预测。假设用过去P 个取样值()()(){}
1,2,
S n S n S n p ---的加权之和来预测信号当前取样值()S n
,则预测
信号
()
S n ∧
为:
()()
1
p
k k S n a n k ∧
==-∑ (1)
其中加权系数用k a 表示,称为预测系数,则预测误差为:
()()()()()
1
p
k k e n s n S n s n a n k ∧
==-=--∑ (2)
要使预测最佳,则要使短时平均预测误差最小有:
()2
min
E e n ε⎡⎤==⎣⎦ (3)
()20,(1)
k
e n k p a ⎡⎤∂⎣⎦
=≤≤∂ (4)
令
()()(),,i k E s n i S n k φ=--⎡⎤⎣⎦
(5)
最小的ε可表示成:
()()
min 1
0,00,p
k k a k εφφ==-∑ (6)
显然,误差越接近于零,线性预测的准确度在均方误差最小的意义上为最佳,由此可以计算出预测系数。
通过LPC 分析,由若干帧语音可以得到若干组LPC 参数,每组参数形成一个描绘该帧语音特征的矢量,即LPC 特征矢量。由LPC 特征矢量可以进一步得到很多种派生特征矢量,例如线性预测倒谱系数、线谱对特征、部分相关系数、对数面积比等等。不同的特征矢量具有不同的特点,它们在语音编码和识别领域有着不同的应用价值。 2 、自相关法
在最佳线性预测中,若用下式定义的时间平均最小均方准则代替(3)式的集合平均最小均方准则,即令
()120
1min
N p n e n N
ε+-==
=∑
(7)
事实上就是短时自相关函数,因而
()()
,R i k i k φ-=
(8)
()()(),R k E S n S n k =-⎡⎤⎣⎦
(9)
根据平稳随机信号的自相关性质,可得
()(),,1,2
;0,1
i k R i k i p k p
φ=-== (10)
由(6)式,可得:
()()
min 10p
k k R a R k ε==-∑ (11)
综上所述,可以得到如下矩阵形式:
()
()
()()()()()()()011102120R R R P R R R P R P R P R -⎛⎫
⎪
- ⎪
⎪
⎪
⎪
-- ⎪ ⎪⎝
⎭
(12)
值得注意的是,自相关法在计算预测误差时,数据段
()()(){}
0,1,1S S S n -的
两端都需要加P 个零取样值,因而可造成谱估计失真。特别是在短数据段的情况下,这一现实更为严重。另外,当预测系数量化时,有可能造成实际系统的不稳定。
自相关解法主要有杜宾算法、格型算法和舒尔算法等几种高效递推算法。 3、 协方差法
如果在最佳线性预测中,用下式定义的时间平均最小均方准则代替(3)式的集合平均最小均方准则,则可得到类似的方程:
()121
min
N n p
e n N
ε-==
=∑ (13)
可以看出,这里的数据段两端不需要添加零取样值。在理论上,协方差法计算出来的预测系数有可能造成预测误差滤波器的不稳定,但在实际上当每帧信号取样足够多时,其计算结果将与自相关法的结果很接近,因而稳定性一般是能够保证的 (当然这种方法也有量化效应可能引起不稳定的缺点)。
协方差解法的最大优点在于不存在自相关法中两端出现很大预测误差的情况,在N 和P 相差不大时,其参数估值比自相关法要精确的多。但是在语音信号处理时,往往取N 在200左右。此时,自相关法具有较大误差的段落在整个语音段中所占的比例很小,参数估值也是比较准确的。在这种情况下,协方差法
()()()()123123n R a R a a R a R p ⎛⎫⎛⎫ ⎪
⎪
⎪ ⎪ ⎪
⎪=
⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭
误差较小的优点就不再突出,其缺乏高效递推算法的缺点成为了制约因素。所以,在语音信号处理中往往使用高效的自相关法。
5、LPC
由于频率响应)(jw e H 反映声道的频率响应和被分析信号的谱包络,因此用
|)(|log jw e H 做反傅里叶变换求出的LPC 倒谱系数。
通过线性预测分析得到的合成滤波器的系统函数为)1/(1)(1
∑=--=p
i i i z a z H ,其
冲激响应为h(n)。h(n)的倒谱为)(^n h ,∑+∞=-=1
^
^
)()(n n
z
n h z H 就是说)(^
z H 的逆变换
)(^n h 是存在的。设0)0(^=h ,将式∑+∞=-=1
^
^
)()(n n z n h z H 两边同时对1-z 求导,得
∑∑+∞=--=--∂∂=-∂∂
1^1111
)(]11log[n n
p
i i z n h z z
a z
得到∑∑∑∞+==-=+-+--=1
1
1
1
1^1)(n p i i
i p
i i i
n z a z
ia z n h n ,于是有
∑∑∑+∞
=+∞
=+-+-=-=-1
1
11
^
1
1
)()1(n n i i n p
i i z ia z
n h n z a 令其左右两边z 的各次幂前系数分别相
等,得到)(^
n h 和i a 间的递推关系
⎪⎪
⎪⎩
⎪
⎪⎪⎨⎧
>--=≤≤--+==∑∑=-=p i i n i i n p n n h a n i n h p
n k n h a n i a n h a h 1^^11^^
1^
),1()1()(1),()1()()1( ,按其可直接从预测系数{i a }求得倒谱)(^
n h 。这个倒谱是根据线性预测模型得到的,又称为LPC 倒谱。LPC 倒谱由于利用线性预测中声道系统函数H (z )的最小相位特性,因此避免了一般同态处理中求复对数的麻烦。