第四讲 语音信号处理第3.5~3.6章
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
下面我们根据上面的讨论来分析一下复倒谱和倒谱特点和关 系。 (1)复倒谱要进行复对数运算,而倒谱只进行实对数运算。 (2)在倒谱情况下一个序列经过正逆两个特征系统变换后, 不能还原成自身,因为在计算倒谱的过程中将序列的相位信 息丢失了。 (3)与复倒谱类似,如果c1(n)和c2(n)分别是x1(n)和x2(n)的 倒谱,并且x(n)= x1(n)*x2(n),则x(n)的倒谱c(n)= c1(n)+c2(n) 。 (4)已知一个实数序列x(n)的复倒谱x^(n),可以由x^(n)求 出它的倒谱c(n)。 (5)已知一个实数序列x(n)的倒谱c(n),能否用它来求出复 倒谱x^(n)?
为了提高过零率计算的鲁棒 性(Robustness),除了对 原始信号进行带通滤波,一种 有效的方法是修正过零率的定 义,加入门限的定义.如图 所示。
上门限
下门限
6.门限过零率
设一个门限值T,将过零的定义修正为穿越正负门限,带门限的过 零率计算公式为
1 N 1 Z n sgn xn (m) T sgn xn (m 1) T sgn xn (m) T sgn xn (m 1) T 2 m 0
* n
j
j
j
ห้องสมุดไป่ตู้j
2
S n (k ) X n (k ) X (k ) X n (k )
* n
2
功率谱Sn(ejω)是短时自相关函数Rn(k)的傅里叶变 换。
S n (e j ) X n (e j )
2 jk R ( k ) e n N 1
k N 1
D*-1[
]=
{ {
ˆ (e j ) F[ y ˆ (n)] Y ˆ (e j )] Y (e j ) exp[ Y
y(n) F 1[Y (e j )]
设:
X (e ) X (e ) e
j
j
j arg[ X ( e j )]
则取其对数得: ˆ (e j ) ln X (e j ) j arg[ X (e j )] X 即复数的对数仍是复数,它包含实部和虚部。注意,这时对 数的虚部arg[X(ejω)]由于是X(ejω)的相位,所以将产生不一 致性。如果,我们只考虑X^(ejω)的实部,令: c(n) F 1[ln X (e j ) ]
s(n) e(n) * v(n)
设三者的倒谱分别为s^(n)、e^(n)及v^(n),则有:
ˆ(n) e ˆ(n) v ˆ(n) s
语音信号倒谱分析实例
显然c(n)是序列x(n)对数幅度谱的傅里叶逆变换。c(n)称为 “倒频谱”或简称为“倒谱”,有时也称“对数倒频谱”。 倒谱对应的量纲是“Quefrency”,它也是一个新造的英文 词,是由“Frequency”转变而来的,因此也称为“倒频”, 它的量纲是时间。c(n)实际上就是我们要求取的语音信号倒 谱特征。
1 2
(3) y(n) Z 1[Y1 ( z) Y2 ( z)] y1 (n) * y2 (n) 从而得到卷积性的恢复信号。
复倒谱和倒谱
虽然D*[ ]与D*-1[ ]系统中的x^(n)和y^(n)信号也 均是时域序列,但它们所处的离散时域显然不同于 x(n)和y(n)所处的离散时域,所以我们把它称之为 “复倒频谱域”。 x^(n)是x(n)的“复倒频谱”, 简称为“复倒谱”,有时也称作对数复倒谱。其英 文原文为“Complex Cepstrum”,Cepstrum是一个 新造的英文词,它是由Spectrum这个词的前四个字 母倒置而构成的。同样,序列y^(n)也是y(n)的复倒 谱。
同态信号处理的基本原理
我们日常生活中遇到的许多信号,它们并不是加性 信号(即组成各分量按加法原则组合起来)而是乘积 性信号或卷积性信号,如语音信号、图像信号、通 信中的衰落信号、调制信号等。这些信号要用非线 性系统来处理。 同态信号处理就是将非线性问题转化为线性问题的 处理方法。按被处理的信号来分类,大体分为乘积 同态处理和卷积同态处理两种。由于语音信号可视 为声门激励信号和声道冲击响应的卷积,所以这里 仅讨论卷积同态信号处理。
我们还可以将式(3-27)写成另一种形式。设语音信号序列和 窗口序列的标准傅里叶变换均存在。当n取固定值时,ω(nm)的傅里叶变换为:
m jm jm j ( n m ) e e W ( e )
根据卷积定理有:
X n (e j ) X (e j ) [e jn W (e j )] 因为上式右边两个卷积项均为关于角频率ω的以2π为周期 的连续函数,所以也可将其写成以下的卷积积分形式: 1 j X n (e ) [W (e j )e jn ] [ X (e j ( ) )]d 2
3.5 语音信号的倒谱分析
语音信号的倒谱分析就是求取语音倒谱特征参数的 过程,它可以通过同态处理来实现。 同态信号处理也称为同态滤波,它实现了将卷积关 系变换为求和关系的分离处理,即解卷。 对语音信号进行解卷,可将语音信号的声门激励信 息及声道响应信息分离开来,从而求得声道共振特 征和基音周期,用于语音编码、合成、识别等。 求倒谱特征参数的方法有两种,一种是线性预测分 析,一种是同态分析处理。
同态信号处理的基本原理
卷积同态系统的模型(图3-9a),该系统的输人卷积信号经 过系统变换后的输出是一个处理过的卷积信号。 同态系统可分解为三个子系统,如图3-9b所示,即两个特征 子系统(它们只取决于信号的组合规则)和一个线性子系统 (它仅取决于处理的要求)。 第一个子系统,如图3-9c所示,它完成将卷积性信号转化为 加性信号的运算;第二个子系统是一个普通线性系统,满足 线性叠加原理,用于对加性信号进行线性变换;第三个子系 统是第一个子系统的逆变换,它将加性信号反变换为卷积性 信号,如图3-10d所示。
1, m 0 ~ ( N 1) (m) 0, m 其它值 其中,n=0,1T,2T,…,并且N为帧长,T为帧移长度。 设第n帧语音信号xn(m)的短时能量用En表示,则其计算公式 如下:
2 En xn (m) m 0 N 1
短时过零率分析
门限过零率
由定义可以看出,短时过零率对噪音的存在非常敏感,如果 背景中有反复穿越坐标轴的随机噪声,那么会产生大量的“ 虚假”的过零,影响计算结果。
Fn (k )
N 1 k m 0
x (m) x (m k )
n n
可以证明平均幅度差函数和自相关函数有密切的关系,两者 之间的关系可由下式表达:
Fn (k ) 2 (k )[Rn (0) Rn (k )]1/ 2
3.4 语音信号的频域分析
从广义上讲,语音信号的频域分析包括语音信号的频谱、功 率谱、倒频谱、频谱包络分析等,常用的频域分析方法有
①表示语音信号比较直观、物理意义明确。
②实现起来比较简单、运算量少。 ③可以得到语音的一些重要的参数。 ④只使用示波器等通用设备,使用较为简单等。
短时能量
过零率
短时平均幅度差
短时能量及短时平均幅度分析
如图3-2所示,设语音波形时域信号为x(t)、加窗分帧处理 后得到的第n帧语音信号为xn(m),则xn(m)满足下式: xn(m)=ω(m)x(n+m)
这样.噪音信号的振荡只要不超过门限间的区域,就不会对真实的 过零率产生影响。 一般说来,短时过零率的最主要用处是分辨清音和浊音、有声与无 声。
7.端点检测
如何区分?能量?过零率?
元音
背景 噪音 辅音
语音“三”的波形图
7.端点检测
如何区分?能量?过零率?
背景 噪音
辅音
短时平均幅度差函数
对于实际的语音信号,d(n)虽不为零,但其值很小。这些极 小值将出现在整数倍周期的位置上。为此,可定义短时平均 幅度差函数:
3.1概述 3.2语音信号的数字化和预处理 3.3语音信号的时域分析 3.4语音信号的频域分析 3.5语音信号的倒谱分析 3.6语音信号的线性预测分析 *3.7 语音信号的小波分析 3.8 基音周期估计 3.9共振峰估计
3.5语音信号的倒谱分析 3.6语音信号的线性预测分析
回顾
语音信号的时域分析就是分析和提取语音信号的时域参数。 进行语音分析时,最先接触到并且也是最直观的是它的时域 波形。语音信号本身就是时域信号,因而时域分析是最早使 用,也是应用最广泛的一种分析方法,这种方法直接利用语 音信号的时域波形。时域分析通常用于最基本的参数分析及 应用,如语音的分割、预处理、大分类等。这种分析方法的 特点是:
语音信号倒谱分析实例
1.由同态分析求出的语音信号倒谱实例 一个信号的倒谱定义为信号频谱模的自然对数的逆傅里叶变 换(即设相位恒定为零)。设信号为s(n),则其倒谱为: ˆ(n) IDFT s ln DFT[s(n)]
根据语音信号产生模型,语音信号s(n)是由声门脉冲激励 e(n)经声道响应v(n)滤波而得到,即:
同态信号处理的基本原理
同态信号处理的基本原理
第一个子系统D*[ ]完成将卷积性信号转化为加性信号的 运算,即对于信号x(n)=xl(n)*x2(n)进行了如下运算处理:
{
(1)Z[ x(n)] X ( z) X1 ( z ) X 2 ( z)
ˆ ( z) X ˆ ( z) X ˆ ( z) (2) ln X ( z) ln X1 ( z) ln X 2 ( z) X 1 2 ˆ ( z)] Z 1[ X ˆ ( z) X ˆ ( z)] x ˆ (n) x ˆ (n) x ˆ(n) (3)Z 1[ X
带通滤波器组法 傅里叶变换法 线性预测法 ……
本节介绍傅里叶分析法。因为语音波是一个非平稳过程,因 此适用于周期、瞬变或平稳随机信号的标准傅里叶变换不能 用来直接表示语音信号,而应该用短时傅里叶变换对语音信 号的频谱进行分析,相应的频谱称为“短时谱”。
利用语音的短时傅里叶变换求语音的短时谱
1 2 1 2
同态信号处理的基本原理
由于x^(n)为加性信号,所以第二个子系统可对其进行需要 的线性处理得到y^(n)。第三个子系统是逆特征系统D*-1[ ], 它对y^(n)= y1^(n)+y2^(n)进行逆变换,使其恢复为卷积性 信号,即进行了如下处理:
{
ˆ ( z) Y ˆ ( z) Y ˆ ( z) ˆ (n)] Y (1)Z[ y 1 2 ˆ ( z) Y ( z) Y ( z) Y ( z) (2) expY
即,假设x(m)的DTFT是X(ejω),且ω(m)的DTFT是X(ejω), 那么Xn(ejω)是X(ejω)和W(ejω)的周期卷积。
功率谱:根据功率谱定义,可以写出短时功率谱与短时傅里 叶变换之间的关系:
或者:
S n (e ) X n (e ) X (e ) X n (e )
对第n帧语音信号xn(m)进行傅里叶变换(离散时域傅里叶变 换,DTFT),可得到短时傅里叶变换,其定义如下:
X n (e j ) xn (m)e jm
m 0
N 1
由定义可知,短时傅里叶变换实际就是窗选语音信号的标准 傅里叶变换。这里,窗ω(n)是一个“滑动的”窗口,它随n 的变化而沿着序列x(m)滑动。由于窗口是有限长度的,满足 绝对可和条件,所以这个变换是存在的。当然窗口函数不同, 傅里叶变换的结果也将不同。
复倒谱和倒谱
在绝大多数数字信号处理中,X(z),X^(z),Y(z),Y^(z)的 收敛域均包含单位圆,因而D*[ ]与D*-1[ ]系统有如下形 式: F ( xn ) X (e j ) ˆ (e j ) ln[X (e j )] X D* [ ]= ˆ (e j )] ˆ(n) F 1[ X x