语音信号的倒谱分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
– 只有零点没有极点的情况,称为滑动平均模型。即MA模型 – 只有极点没有零点的情况,称为自回归模型。即AR模型
– 既有零点又有极点的情况,称为自回归滑动平均模型。即 ARMA模型
线性预测原理
– 全极点模型的参数估计十分简单,只需很小的几个极点就可以相当好 的估计一种频谱或一种系统的频率响应,因此传递函数相当于一个递 归数字滤波器。即IIR滤波器
• 但其缺点是运算量比其他参数大,尽管如此,倒 谱分析方法仍不失为一种有效的语音信号的分析 方法。
同态分析的基本原理
• 有很多客观物理现象中的信号,其中各组成分量的组 合,并不是按照加法组合原则组合起来的,如图像信 号、地震信号、调制信号、语音信号等,它们都不是 加性信号,而是乘积性或卷积性组合的信号。
卷积同态信号处理系统
特征系统与逆特征系统的组成
语音信号的倒谱
xˆ(n)是x(n)的复倒谱,其英文为ComplexCep strum。 同样yˆ(n)是y(n)的复倒谱。复倒谱所处 的离散时域称为复倒谱 域。 特征系统将离散时域中 的卷积运算转换为复倒 谱域中加运算, 而逆特征系统则为其逆 运算。
– 第二类算法称为非模型解卷。同态信号处理完成解卷 任务就是其中最重要的一种。
语音信号的倒谱分析
• 对信号进行分析得出它的倒谱参数的过程称为同 态处理。
• 对语音信号的某一帧同样可以分析出它的短时倒 谱参数,总的说来,无论对于语音通信、语音合 成或语音识别,倒谱参数所含的信息比其他参数 多,也就是语音质量好,识别正确率高。
xˆ(n) F 1[ Xˆ (exp jw)] 1 Xˆ (exp jw)exp( jwn)dw
2
语音信号的倒谱
求得倒谱的特征系统
N2
X (exp jw) F[x(n)] x(n)exp( jwn)
n N1
C(exp jw) ln[ X (exp jw) ]
c(n) F 1[C(exp jw)] 1
励是以基调周期为周期的周期脉冲序列
语音信号倒谱和复倒谱的性质
语音信号倒谱和复倒谱的性质
eˆ(n)
非零值,
0,
n
N p ,2N p,3N n取其他值
p
,
• 由上式可以得出以下结论:一个周期冲激的有限长度序列, 其复倒谱也是一个同周期长度的周期冲激序列,只是其长度 变为无限长度、振幅随着K值的增加而衰减,衰减速度比原 来序列要快,显然,周期冲激序列的倒谱的这些性质对于语 音信号的分析是很有用的,这意味着除了原点之外,可以用 “高时窗”来从语音信号的倒谱中提取浊音激励信号的倒谱, 从而使倒谱法提取音调成为现实。
C(exp jw)exp( jwn)dw
2
c(n)称为倒频谱,简称为倒 谱Cepstrum。
复倒谱经过正逆两个特征系统变换后,序列可以还原为 本身。但是倒谱经过正逆两个特征系统变换后,序列不 可以还原为本身。
由序列的复倒谱求倒谱的方法
如果已知一个实序列 x(n)的复倒谱xˆ(n),那么可以由xˆ(n)求出 它的倒谱c(n)。 首先将xˆ(n)表示为一个偶对称序列 xˆe (n)和一个奇对称xˆo (n)之和 的形式:
E(Z )V (Z ) S(Z ), 根据V (Z )和S(Z )便可以求得E(Z),从而全部解决
解卷的的问题。
对模型的限制
• 为了得到一种高效的求解方法。 • 令G(Z)=1,模型中只含有极点不含有零点。这种
模型称为全极点模型; • 对未知序列e(n)加以限制,表示成Ge(n)的形式,
其中e(n)是一个周期脉冲序列或者高斯白噪声序 列;系数G是非负实数,用来控制输出序列的幅 度。
P
sˆ(n) ai s(n i)
i 1
P
P
e(n) s(n) sˆ(n) s(n) ai s(n i) ai s(n i)
i 1
i0
线性预测原理
• 线性预测是目前分析语音信号的最有效的方法之一,分 析的结果是得到一组信号的全极点模型参数,所以又称 为信号参数模型法。
• 这个方法的基本思想是将被分析信号模型化,即用有限 数目的模型参数来描述信号中的信息,具体来说,将被 分析信号s(n)视为某系统(即模型)的输出,而系统的 输入,在s(n)为确定性信号是采用单位取样序列。在 s(n)为随机信号是采用白噪声序列。
a1 ~ ap;其次,在估计得到 V(Z)的基础上,求得G和e(n),并且判断
求复倒谱的一种有效的递推算法
• 前提:x(n)是最小相位序列。
N 1
X (Z ) x(n)Z n
n0
X '(Z )
dX (Z )
N 1
Z 1 (n)x(n)Z n
Z 1Z[nx(n)]
dZ
n0
• 因为
Xˆ (Z ) ln( X (Z ))
X ' (Z ) Xˆ ' (Z ) X (Z )
零极点都应该在单位圆内。
语音信号倒谱和复倒谱的性质
• 根据语音信号产生的模型,在z域中语音信号S(Z)等于激 励信号E(Z)和声道传输函数V(Z)的乘积,即 S(Z)=E(Z)V(Z)。经过同态系统后可以得到:
• 先量讨较论小声、门频激谱励均信匀号分。布sˆ(n除的) 了白 eˆ人噪(n们声) 发之vˆ清外(n)音;时发,浊声音门时激,励声是门能激
x(0) l0 n x(0)
n 1时,xˆ(1) x(1)
由前面的推导可知, xˆ(0) ln A, 对于因果序列而言, x(0) A, 所以,可以得出 : xˆ(0) ln x(0).
x(0)
n 2时,xˆ(2) x(2) 1 xˆ(1) x(1)
x(0) 2 x(0)
x 3时,xˆ(3) x(3) 1 xˆ(1)x(2) 2 xˆ(2)x(1) x(0) 3 x(0) 3 x(0)
• 显然,这时不能用线性系统来处理,而必须用满足该 组合规则的非线性系统来处理。但是非线性系统地分 析非常困难。
• 同态信号处理法就是设法将非线性问题转化为线性问 题来处理的一种方法。按照被处理的信号来分类,大 由于语音信号可以视为声门激励信号和声道响应信号 的卷积结果。我们仅讨论卷积同态信号处理系统的问 题。
因此
c(n)
xe (n)
1 2
[ xˆ (n)
xˆ(n)]
相位倒谱的概念
假设
p(n) F 1[ Arg[ X (exp jw)]]

p(n) xˆo (n) 称p(n)为相位倒谱。
1 2
[ xˆ (n)
xˆ(n)]
不难看出,c(n)表现的是X (exp jw)的模函数的特征, p(n)表现的是X (exp jw)的相位函数的特征, 而xˆ(n)则包含两个方面的特征 。
求复倒谱的一种有效的递推算法
Z[nx(n)] Z(nxˆ(n))Z[x(n)]
n(x(n)) {nxˆ(n)} x(n) lxˆ(l)x(n l)
x(n)
n1
(
l
) xˆ (l ) x(n
l)
l
xˆ (n) x(0)
l0 n
可推导出:
xˆ(n)
x(n)
n1
(
l
)
xˆ(l) x(n l)
且可以用一个线性差分 方程描述,那么其特性 可以用其Z域传输函数
Q
P
V (Z )来表示。且V (Z ) G(Z ) / A(Z ), G(Z ) g jZ j , A(Z ) aiZ i
j0
i0
g j和ai都是实数,且a0 1。如果能有一种算法, 可能根据已知的s(n)
正确的估计出这些参数 ,那么未知的系统V(Z)便可求得。由于
已知倒谱求复倒谱的方法
要想由倒谱求复倒谱,首先复倒谱必须满足一 定的条件,比如是因果序列
xˆ(n) xˆ(n)u(n)

c(n)
xˆe (n)
1 [xˆ(n) 2
xˆ(n)]
1 xˆ(n) 2 xˆ(n)
1 2
xˆ(n)
n0 n0
n0
因此
2c(n) n 0
xˆ(n)
c(n)
n0
0 n 0
语音信号倒谱和复倒谱的性质
语音信号倒谱和复倒谱的性质
语音信号倒谱和复倒谱的性质
语音信号倒谱和复倒谱的性质
语音信号倒谱和复倒谱的性质
语音信号倒谱和复倒谱的性质
• 在清音情况下,e(n)具有噪声特性,因而其复倒谱也没有明显的峰起点,且 分布范围很宽,从低时域延伸到高时域。而v(n)的复倒谱仍然只分布在低时 域中。
xˆ(n) xˆe (n) xˆo (n)
• 由于偶对称序列的DTFT是实函数,奇对 称序列的DTFT是虚函数。
由序列的复倒谱求倒谱的方法
Xˆ (exp jw) ln[ X (exp jw)] ln X (exp jw) jArg[ X (exp jw)] Re[ X (exp jw)] j Im[X (exp jw)]
语音信号的倒谱分析
• 根据语音信号的产生模型,语音信号S(Z)是一个 线性非移变因果稳定系统V(Z)受到信号E(Z)激励
后所产生的输出。
• 在时域中,语音信号s(n)是该系统的单位取样响 应v(n)和激励信号e(n)的卷积。
• 在语音信号数字处理所涉及的各个领域中,根据
s(n)来求得v(n)和e(n)具有非常重要的意义。
当e(n)是一个周期脉冲序列时 ,可以表示为:
e(n) (n rN p )
r
其中,当n 0时, (n) 1。而对于其他值, (n) 0。
N p为周期。
做了这些限制之后,可 以将参数解卷问题归结 为首先正确估计
模型V (Z ) 1/ A(Z ),也就是估计A(Z)的阶数P和它的各个系数
• 由卷积信号求得参与卷积的各个信号的过程称为 解卷过程。
语音信号的倒谱分析
• 解卷算法可以分为两大类:
– 第一类是首先为线性系统V(Z)建立一个模型,然后对 模型参数按照某种最佳准则进行估计,这种方法称为 参数解卷方法。采用的模型可以分为全极点模型(AR 模型)和零极点模型(ARMA模型),如果采用最小均 方误差准则对AR模型进行估计,就得到线性预测编码 算法(LPC)。
绝大多数数字信号处理 问题中,X (Z ), Xˆ (Z ),Y (Z ),Yˆ(Z )的收敛域 都包含单位圆,正反Z变换都可以利用正负福 利叶变换来代替。
求得复倒谱的另一个特 征系统
N2
X (exp jw) F[x(n)] x(n)exp( jwn)
n N1
Xˆ (exp jw) ln[X (exp jw)]
– 线性预测法正是基于全极点模型的假定,采用时域均方最小误差准则
来估计模型参数的。
参数解卷的通用模型
e(n)
s(n)
E(Z )
V (Z ) G(Z ) / A(Z )
S (Z )
(未知)
(未知)
(已知)
假设一个已知序列 s(n)是一个未知的序列 e(n) 激励一个未知的系统
v(n)产生的。如果假设这个 未知系统是一个线性非 移变因果稳定系统,
卷积同态信号处理系统
同态系统可以分解为两个特征系统(即特征系统和 逆特征系统)(指取决于信号的组合规则)和一 个线性系统(仅取决于处理要求)
卷积同态信号处理系统
卷积同态信号处理系统
• 由于加性信号的Z变换结果仍为加性信号,所以倒谱这种时 域信号,是可以用线性系统来处理的,经线性处理之后,如 欲在恢复出语音信号,则可以采用逆特征系统来实现,即特 征系统的逆运算。即将线性系统输出的加性倒谱信号:
语音信号的模型
• 常用来产生合成语音,所以称为合成滤波器
H(z) S(z) G
U (z)
P
1 ai z i
i 1
求解滤波器参数和G 的过程就是线性预测 的分析过程。
{ai }(1 i P)
线性预测原理
• 在基于参数模型的谱估计方法和系统辨识中,常常假 定系统的传递函数是有理函数,也就是变量Z的有理分 式,这种有理分式有三种情况:
语音信号的线性预测分析
• Linear Prediction – 1947年维纳提出; – 1967年板仓等人应用于语音分析与合成;
• 语音信号处理与分析的核心技术 – 提供了预测功能; – 提供了声道模型和声道模型的参数估计方法;
• 基本思想:
语音样本之间存在相关性,一个语音信号的样本 可以用过去若干个样本的线性组合来逼近;
已知倒谱求复倒谱的方法 • 如果复倒谱是一个反因果序列:

则可以推导出:
xˆ(n) xˆ(n)u(n)
0 n0
xˆ(n)
c(n)
n0
• 只序有列当才是x(一n)个是因一果个稳因2定果c(序最n) 列小n。相 0这位要序求列x是(n其)应复满倒足谱
两个条件:1 x(n)=x(n)u(n);2 X(Z)=Z[x(n)]的
相关文档
最新文档