线性预测分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

i 1
AR 模型
问题:如何在已知x(n)的条件下,求出系数 {ai} i=1,…, p ?
解答:线性预测分析的方法。
Ⅲ 时域、频域处理方法(51)
思路:一个语音的采样能够用过去若干个语音采样的线 性组合来逼近。通过使线性预测到的采样在最小均方误 差意义上逼近实际语音采样,可以求取一组唯一的预测 系数。
莱文逊—杜宾递推算法
(1)计算自相关系数 Rn( j),
j 0,1,..., p
(2)初值
E (0) Rn (0) i 1
(3)开始按如下公式进行递推运算
i 1
Rn (i)
a ( i 1) j
Rn
(i
j)
ki
j 1
E (i1)
ai(i) ki
a(i) j
a(i1) j
k a(i1) i i j
递推过程中设一辅助序列
q(i) j
i
q(i) j
ak(i)rn (| k j |)
k 0
j p ~ p
i 0,1,..., p
Ⅲ 时域、频域处理方法(63)
可以证明,
q(i) j
有如下性质:
(1)当 i 0 时,
q(i) j
rn (
j)
(2)反射系数
ki
q(i1) i
q(i1) 0
j p ~ p i 1, 2,.., p
➢ i阶方程组的解可以用i-1阶方程组的解来表示,i-1阶方程 组的解又可以用i-2阶方程组的解表示,依此类推。
因此,只要解出一阶方程组的解,就可以一步一步地递推来 解出任意阶方程组的解。典型的方法有:
➢ 莱文逊—杜宾(Levinson—Durbin)递推算法
➢ 舒尔(Schur)递推算法
Ⅲ 时域、频域处理方法(60)
Ⅲ 时域、频域处理方法(70)
将这两部分信号分别定义为正向预测误差信号 e(i) (n) 和反向 预测误差信号 b(i) (n) 。 前者的计算公式前面已经给出,后者可以推导出:
B(i) (z)
z i
A(i )
(z1) X
(z)
z i
1
i
a
(i j
)
z
j
X
(
z)
j1
Z反变换
i
b(i) (n) x(n i) a(ji) x(n i j)
xw(n) 为加窗后的语音数据。
N 1 p
(k,i) xw (n k)xw (n i) n0

k 1, 2,, p i 0,1, 2,, p
N 1(k i)
k 1, 2,, p
(k,i)
xw (n)xw (n k i) i 0,1, 2,, p
n0
Ⅲ 时域、频域处理方法(57)
Eˆn 又被称为预测残差能量,它由一个固定分量和一个依赖
于预测系数的分量组成。
Ⅲ 时域、频域处理方法(54)
要构造信号的AR模型,还应估算增益因子。
AR模型的差分方程形式 因此可计算预测误差
p
x(n) ai x(n k) Gu(n) i 1
e(n) [x(n) x%(n)] Gu(n)
预测误差: E(i) (z) A(i1) (z) X (z) ki zi A(i1) (z 1) X (z) E (i1) (z) ki z 1B(i1) (z)
其中, B(i1) (z) z(i1) A(i1) (z1) X (z)
上式表明,第 i 阶线性预测误差滤波器的输出可以分解成两部 分,一是第i1阶滤波器的输出;第二部分是与第i1阶有关的 输出信号b(i1) (n) 经单位移序和 ki 加权后的信号。
n
n

En G 2 u 2 (n)
n
激励信号u(n)总能量可以认为近似为1,因此有 Gˆ Eˆn1/2
Ⅲ 时域、频域处理方法(55)
求LPC系数需考虑两个因素:
(1)模型阶数的选择。
(2)由于声门脉冲形状和口唇辐射的影响,语音信号的 频谱在总趋势上会产生高频衰落的现象,可通过预加重 进行高频提升。
j 1
正向预测误差信号是用i个过去的样本值 x(n 1), x(n 2),..., x(n i) 来预测 x(n) 时的误差。
反向预测误差是用时间上延迟时刻的样本值 x(n i 1), x(n i 2),..., x(n) 来预测 x(n i)时的误差。
Ⅲ 时域、频域处理方法(71)
这两种预测情况如下图所示。
方程两边同时左乘 1 z1 ... zi ,得
1
i
ak(i) z k
1
i 1
a(i1) k
z
k
ki zi 1
i1
a(i1) k
z
k
k 1
k 1
源自文库
k1
可以导出:
A(i) (z) A(i1) (z) ki z i A(i1) (z 1)
Ⅲ 时域、频域处理方法(69)
A(i) (z) A(i1) (z) ki z i A(i1) (z 1)
...
Rn
(
p
2)
aˆ2
Rn
(2)
Rn (2) ...
Rn (1) ...
Rn (0) ...
... ...
Rn
(
p ...
3)
.aˆ..3
Rn (3) ...
...
...
... ... ... ... ...
Rn ( p 1) Rn ( p 2) Rn ( p 3) ...
由于短时自相关函数可以表示为:
N 1k
Rn (k) xw (n)xw (n k) n0
且有Rn (k) Rn (k),Rn (k i) 仅与k、i 的相对值有关。
则 (k,i) 可以表示为
k 1, 2,, p (k,i) Rn (k i) Rn (| k i |) i 0,1, 2,, p
由于各阶预测器的预测残差能量都是非负的,可以推知
ki 1,
i 1, 2,...., p
ki称为反射系数。
且 E(i)必随预测器阶数的增加而减少。
Ⅲ 时域、频域处理方法(62)
舒尔递推算法:
定义归一化的自相关函数如下:
rn ( j) Rn ( j) / Rn (0)
j p ~ p
将前面方程中的自相关函数都转化为其归一化形式。 归一化自相关函数永远不大于1,因而,递推过程中的所有变 量都小于或等于1。
n
i1 n
若定义 (k,i) x(n k)x(n i) k 1,2,, p i 0,1,2,, p
n p
则方程组可简写为
ai(k,i) (k,0)
i1
求解方程,可得到LPC系数
一个由p个方程组成的有p 个未知数的线性方程组
并可以计算最小预测误差能量
p
Eˆn n (0,0) aˆi(0, i) i 1
最终得到的是相应的反射系数。
如果在第(5)步的递推过程加入相应的递推式, 也可以同步求出线性预测系数和预测残差能量。
Ⅲ 时域、频域处理方法(66)
格型法 :
引入了“正向预测”和“反向预测”的概念,阐述了参 数ki的物理意义。
➢ 首先提出了逆滤波器A(z)的格型结构形式,由此给出了 线性预测分析的格型法。
常简称为LPC(Linear Prediction Coding),系数称为 线性预测系数或LPC系数。
几个概念
预测器:
p
F (z) ai zi 它的差分方程为
p
x%(n) ai x(n i)
i1
i 1
从时域角度可以理解为,用信号的前p个样本来预测当
前的样本得到预测值。
Ⅲ 时域、频域处理方法(52)
Rn (0)
aˆp
Rn ( p)
这种方程为Yule-Walker方程 ,其系数矩阵被称为托布里 兹(Toeplitz)矩阵。具有如下特点:
(1)p×p阶的对称阵。 (2)沿着主对角线及任何一条与主对角线平行的斜线上 的所有元素都相等 。
Ⅲ 时域、频域处理方法(59)
利用Toeplitz矩阵特点:
声门激励是一个双极点模型,口唇辐射是一个零点模型,
如一个零点抵消一个极点,则还有一个极点的影响。因
此,模型阶数为
p ,2D 其1中 为共振D 峰的个数。
Ⅲ 时域、频域处理方法(56)
线性预测方程组的解法: 自相关法
我们定义 (k,i) x(n k)x(n i) 时,未将求和范围具体化。
n
采用短时分析技术,只计算范围(0≤n≤N-1)以内的语 音数据。
定义如下:
i
A(i) (z) 1
a
(i j
)
z
j
j 1
这个滤波器输入信号是 x(n),输出信号为预测误差 e(i) (n) ,
i
e(i) (n) x(n)
a
(i j
)
x(n
j)
j 1
写成z变换形式为:
E(i) (z) X (z) A(i) (z)
Ⅲ 时域、频域处理方法(68)
利用前面的递推式:ai(i) ki
线性预测分析
Ⅲ 时域、频域处理方法(50)
3.7 线性预测(Linear Prediction)分析
根据语音信号的产生模型,语音信号x(n)可以看作以u(n)
为激励的一个全极点滤波器的响应。
V (z) p 1
ai z i
i0
u (n)
x(n)
H (z)
语音信号的模型化
H(z)
G
p
1 ai zi
求解LPC系数的方程组就可以写为:
p
Rn (| k i |)aˆi Rn (k )
i 1
k 1,2, , p
Ⅲ 时域、频域处理方法(58)
将其转换成矩阵形式
Rn (0)
Rn (1)
Rn (1) Rn (0)
Rn (2) Rn (1)
... Rn ( p 1) aˆ1 Rn (1)
(3)令 a0 1
q(0) j
rn (
j)
E (0) 1;
(4)令 i 1
(5)对于 i p j p 计算:
q(i) j
q(i1) j
ki
q(i1) i j
ki
q(i1) i
q(i1) 0
(6)i i 1 。若 i p 则算法结束退出,否则返回(5)。
Ⅲ 时域、频域处理方法(65)
j 1,...,i 1
E (i)
(1
k
2 i
)E
(i1)
(4) i=i+1。若i >p则算法结束退出,否则返回第(3)步,
这样经过递推计算后,可得到i=1,2,…,p各阶预测器的解。
Ⅲ 时域、频域处理方法(61)
经过递推计算后,最终解为:
aˆ j a(jp) ,
j 1,2,...., p
p
E( p) Rn (0) (1 ki2 ) i 1
p
预测误差 : e(n) x(n) x%(n) x(n) ai x(n i)
i 1
预测误差滤波器:
p
A(z) 1 F (z) 1 ai z i
i1
可知H(z)=G/A(z),即预测误差滤波器是系统的逆滤波器。
p
短时预测均方误差: En e2 (n) [x(n) x%(n)]2 [x(n) ai x(n i)]2
a(i) j
a(i1) j
ki
a(i1) i j
写成矩阵形式:
1 1 0
a1(i
)
a1(i
1)
ai(i11)
a2(i
)
a2(i
1)
ai(i21)
. . ki .
.
.
.
ai(i1)
ai(i)
ai(i11)
0
a1(i
1)
1
j 1,...,i 1
➢ 格型法不需要用窗口函数对信号进行加权,同时又保证 了解的稳定性,较好地解决了精度和稳定性的矛盾。
Ⅲ 时域、频域处理方法(67)
格型法的基本原理:
在基于自相关的杜宾递推算法中,当递推进行到第 i 阶
时,可得到该阶预测系数
a(i) j
(
j
1,2,...,i)
可以定义一个 i 阶的线性预测误差滤波器,它的传输函数
反向预测
i
e(i) (n) x(n) a(ji) x(n j) j 1
i
b(i) (n) x(n i)
a
(i) j
x(n
i
j)
j 1
x(ni+2) x(ni+1)
x(ni)
x(n3) x(n1)
x(ni+3)
x(n2) x(n)
正向预测
用 i 阶预测器作前向后向预测示意图
Ⅲ 时域、频域处理方法(72)
n
n
n
i 1
线性预测分析应该在短时的语音段上进行,求解过程
使 En / ak 0, (k 1,2,, p) 则有:
En (2
ak
n
p
x(n)x(n k ) 2 ai
i 1
n
x(n k)x(n i))
Ⅲ 时域、频域处理方法(53)
得到线性方程组
p
x(n)x(n k) ai x(n k)x(n i) k 1,2, , p
(3)递推式
q(i) j
q(i1) j
ki
q(i1) i j
成立;
(4) | qi ( j) | rn (0) ,其中等号仅当 i j 0 时成立。
Ⅲ 时域、频域处理方法(64)
舒尔递推算法描述如下:
(1)计算自相关系数 Rn ( j) , j p ~ p (2)计算归一化自相关系数 rn ( j) Rn ( j) / Rn (0)
基于正向预测和反向预测,可以推出线性预测分析采用 的格型滤波器结构。 对于正向预测,可得到如下的递推公式:
e(i) (n) e(i1) (n) kib(i1) (n 1) 将 A(i) (z) A(i1) (z) ki z i A(i1) (z 1)
相关文档
最新文档