线性预测分析LPC

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

语音信号的线性预测分析概述

参数模型法是现代谱估计的主要内容,经常采用的模型有3个

1.自回归模型是一个全极点模型AR

2.移动平均模型是一个全零点模型MA

3.自回归-移动平均模型是一个既有零点,又有极点的模型。ARMA

AR模型反应频谱中的峰值,MA模型反应频谱中的谷值,ARMA模型反映两者。AR模型可以与基于级联无损声管的语音产生模型相联系,因此在语音处理中他是被广泛采用的模型;而与其相关的线性预测分析也是语音信号中普遍采用的核心技术之一。

对语音信号进行线性预测分析的基本思想是:一个语音的采样能够用过去若干个语音采样的线性组合来逼近。通过使线性预测到的采样在最小均方误差意义上逼近实际语音采样,可以求取一组唯一的预测系数。这里的预测系数就是线性组合中所用的加权系数。这种线性预测分析技术最早用于语音编码中,因此也常被简称为LPC。

线性预测的基本原理

根据参数模型功率谱估计的思想,语音信号可以看做使用一个输入序列激励一个全极点的系统模型而产生的输出。

最小均方误差准则

线性预测系数或LPC系数

预测残差能量

浊音情况下,激励可以看做是准周期的脉冲串;在清音情况下,可以看做是高斯白噪声。考虑模型阶数的选择,通过预加重对高频部分的提升。

由于声门脉冲形状和口唇辐射的影响,语音信号的频谱在总趋势上会有高频衰落的现象,大约每倍程下降6DB。抵消这一影响,通常在做LPC分析之前采用一个非常简单的一阶FIR 滤波器进行预加重,进行高频提升。

线性预测分析是在短时平稳这一现实的假定基础上进行的,即一段语音信号是各态历经的平稳随机过程。线性预测分析被普遍应用到语音处理的各个方面。大量的实践证明:LPC参数是反映语音信号特征的良好参数。

线性预测方程组的解法

线性预测系数为变量的线性方程组。有两种经典的解法:自相关法和协方差法,还可以避开自相关和协方差计算,直接由样本递推的线性预测解法:格型法。

自相关法:定义n的求和范围的一种较直接的方法是,认为语音段外的数据全为零,只计算范围n以内的语音数据。相当于先将语音加窗,在进行处理。存在误差,为了减少误差的影响,在LPC中一般不采用突变的矩形窗,采用两端平滑过渡特性的窗函数。如汉明窗。求解Yule-Walker方程,其系数矩阵,即自相关矩阵是一个p阶对称矩阵,称为托布利兹矩阵。可以特殊的递推算法来求解。指导思想为:第i阶方程组的解可以用第i-1阶方程组的

解来表示,以此类推。只需解出一阶方程组的解,可以递推求出任意阶方程组的解。递推算法有莱文逊杜宾递推算法和舒尔递推算法。

协方差法:修正自相关函数,不需要加窗处理。系数矩阵不再是托布利兹矩阵。线性方程组解法是乔利斯基分解法,基本思想是将系数矩阵采用消元法化成主对角元素为1的上三角矩阵,然后对各变量逐个递推求解。

格型法:前面方法分两步:先计算自相关矩阵,再解一组线性方程组。格型法引入正向预测和反向预测的概念,是运用均方误差最小逼近准则更加灵活。正向预测误差就是通常意义上的线性预测误差,它是用i个过去的样本值来预测下一个的误差。反向预测误差可以看做是用时间上延迟时刻的样本值,来预测前面一个的误差。建立格型分析滤波器和格型合成滤波器。

p阶滤波器可以由p节斜格构成,尤其是合成滤波器的结构直接与声道的级联声管模型相对应。在省管模型中,声道被模拟成一系列长度和截面积不等的无损声管的级联,这里,可以认为每一个格型网络就相当于一小段管段。滤波器结构中的关键的参数是反射系数,他反映了第i节格型网络处的反射,与声波在各声管段边界处的反射量相对应。

格型法的求解:依据最小误差准则,求出各反射系数。进一步计算出LPC系数,由于在个性滤波器中有正向预测误差和反向预测误差两种误差数据,因而在求解反射系数时可以依照几种不同的最优准则来进行。

正向格型法:使格型滤波器的第i节正向均方误差最小。

反向格型法:使格型滤波器的第i节反向均方误差最小。稳定性不能保证。

几何平均格型法:保证稳定性。PARCOR系数即部分相关系数。

伯格发:使格型滤波器第i节正向和反向均方误差之和最小。保证系统稳定。

几种求解线性预测方法比较

自相关必须对语音信号进行加窗处理,规定信号的长度范围,假定窗外的语音样本值为零,所以自相关法误差较大,精度较差。理论上,其能保证系统的稳定性实际不行。如果对语音信号预加重,使得它的谱尽可能平滑,则可以保证有限字长的影响减至最小程度。

协方差法不需要加窗,参数估值比自相关法精确,同时也优于格型法的精度,但其不稳定,可以用判根和最小相位化的方法来纠正极点位置。计算量也大。自相关法适用于平稳信号,协方差法适用于非平稳信号。

格型法无需加窗,也不需要计算自相关矩阵,直接通过语音样本递推得到预测器系数。精度很高,稳定性也有保证,很好的线性预测算法。运算量大,有人在格型法基础上改进,提出协方差格型法,将计算量恢复到自相关法的水平上。格型法是一种很有生命力的线性预测算法。

线性预测的集中推演参数

线性预测分析法求得的是一个全极点模型的传递函数,在语音产生模型中,这一全极点模型与声道滤波器的假定相符合,形式上是一递归滤波器。递归滤波器有多重实现结构,直接法,链接法,格型法,相应的有多种不同的滤波器参数。他们所实现的滤波器是等价的。有7种推演系数,还有一种线谱对的参数。

归一化自相关函数

反射系数

声道可以被模拟成一系列长度和截面积不等的无损声管的级联,反射系数反映了声波在各声管段边界处的反射量。反射系数在低速率语音编码、语音合成、语音识别和说话人识别等许多领域中都是非常重要的特征参数。

预测器多项式的根

LPC分析是估计语音信号功率谱的一种有效方法。通过求取预测器多项式的根,可以实现对共振峰的估计。

LPC倒谱

语音信号的倒谱可以通过对信号做傅里叶变换,取膜的对数,再求反傅里叶变换得到。LPC 倒谱由于利用线性预测中声道系数函数的最小相位特性,避免了一般同态处理中求复对数的麻烦

全极点系统的冲击响应及其自相关函数

预测误差滤波器的冲激响应及其自相关函数

对数面积比系数

由反射系数直接推导出一组重要参数---对数面积比系数g=In(Ai/Aj);

Ai是多节无损声管中第i节的截面积。对数面积比系数g相对于谱的变化的灵敏度较平缓,特别适于量化。

相关文档
最新文档