语音信号处理第14章

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

R
r21
r22
r2
D
rD
1
rDD
rij
Байду номын сангаас
s ij s ii s jj
s
ij
1 N

N
( y ni
n 1
y i )( y nj
y j)
N
y nd
y
d
n 1
N
这里,rij 是相关系数,s ij 是样本的方差或协方差,y d是样本各
维变量的均值。然后求出满足式(14-13)的矩阵R的本征值
1)采用语音增强算法,提高语音识别系统前端预处理的抗噪 声能力,提高输入信号的信噪比。(与后端应用无关)
2)第二类方法是寻找稳健的耐噪声的语音特征参数。 如采用 短时修正的相干系数(Short-Time Modified Coherence Coefficient,简称为SMC)作为语音特征参数。
3)第三类方法是基于模型参数适应化的噪声补偿算法,如针 对加法性噪声的HMM合成法,和针对乘法性噪声的 Stochastic Matching法等。通常只考虑到噪声环境是平稳的, 在低信噪比语音以及非平稳噪声环境中的效果并不理想。
W(k)W(k1)(k)R(k)(,总输 1 出 ) 功率
❖ 2对称自适应去相关的改进型
实际应用中,参考输入 r(t)除包含与噪声相关的参考噪声外 ,还可能含有低电平的信号分量。图14-5给出了原始语音信 号 s(t)通过一个传输函数为 J(t)的信道泄露到参考输入中的 情景。
为了解决信号分量的泄露导致系统性能恶化的问题,D.Van Compernolle 提出了对称自适应去相关(SAD)算法,其基 本原理如图14-6所示。
和本征向量 Ai(i1,2,...D .),
i
R•A•A
这里,D维的本征向量Ai(i1,2,...D .), 又被称为主分量基
向量。
14.5非线性处理法语音增强技术
❖ 14.5.1 中心削波法
对于噪声频谱遍布于语音信号频谱之中的宽带噪声,如果 噪声振幅比大部分的语音信号低,则削去低振幅成分也就削 去了宽带噪声。
我们在频域中采用中心限幅的方法,即让带噪语音信号通过 一限幅滤波器,高幅度频谱可以通过而低幅不允许通过,实 现抗噪。
❖ 14.5.2 通态滤波法
加性噪声适用线性滤波,非加性则适用同态滤波法,其降噪 过程的原理框图如图14-9所示。
同台滤波器可以用于识别系统的预处理,常适用倒谱这一特 征,所以求出带非加性噪声的语音信号的倒谱以后,可以利 用倒谱均值规整(CMN)降噪声技术,清楚带非加性噪声的 语音信号的倒谱的噪声成分,从而获得语音增强的倒谱。
❖ (4)语音干扰:干扰语音信号和待传语音信号同时在一个 信道中传输所造成语音干扰称为语音干扰。区别有用语音和 干扰语音的基本方法是利用它们的基音差别。考虑到一般情 况下两种语音的基音不同,也不成整数倍,这样可以用梳状 滤波器提取基音和各次谐波,再恢复出有用语音信号。
❖ (5)传输噪声:这是传输系统的电路噪声。与背景噪声不 同,它在时间域里是语音和噪声的卷积。处理这种噪声可以 采用同态处理的方法,把非加性噪声变换为加性噪声来处理。
❖ (2)周期噪声:最常见的有电动机,风扇之类周 期运转的机械所发出的周期噪声,50Hz交流电源哼 哼声也是周期噪声。在频谱图上它们表现为离散的 窄谱,通常可以采用陷波器方法予以滤除。
❖ 3)宽带噪声:说话时同时伴随着呼吸引起的噪声,随机噪 声源产生的噪声,以及量化噪声等都可以视为宽带噪声,应 用中常近似为Gauss噪声或白噪声。其显著特点是噪声频谱 遍布于语音信号频谱之中,导致消除噪声较为困难。一般需 要采取非线性处理方法。
14.2.2 人耳感知特性 ❖ 对于声波频率高低的感觉与实际频率的高低不呈线
性关系,而近似为对数关系;对频率的分辨能力受 声强的影响;对语音信号的幅度谱较为敏感,对相 位不敏感。
❖ 人耳掩蔽效应:产生一个声音由于另外一个声音的 出现而导致该声音能被感知的阀值提高的现象。
语音增强的最终效果度量是人耳的主观感觉,所以在语音 增强中可以利用人耳感知特性来减少运算代价。
R(k ) 为噪声 的输入向量。设代价函数为:
JE {y(|k) W T(k)R (k)|2 }
R r rE { R T (k )R (k )} R ry ,E { R (k )y (k )}
对上式求导,可以得到最小均方意义下的最佳系数向量为:
WoptRrr1RXY
下面不加证明的给出Widrow-Hoff的LMS算法加权系数递推公 式:
由于自相关处理时会产生二次谐波,因此不宜直接用带噪语 音信号y(t)的自相关系数作为识别特征,而应采用帧信号平 方的自相关系数作为识别特征。即如图14-8所示。
❖ 14.4.2 利用复数帧段主分量特征的降噪方法
复数帧段特征量就是采用相继的复数帧组成的特征参数矢量 作为语音识别输入特征量的方法,它是在语音识别中利用语 音帧间相关信息最直接最简便的方法。
14.2语音特性、人耳感知特性及噪 声特性
14.2.1语音特性 ❖ 语音信号是一种非平稳的随机信号
❖ 任何语言的语音都有元音和辅音两种音素,根据发 音机理的不同,辅音又可以分为清辅音和浊辅音。
❖ 语音信号,作为非平稳、非遍历随机过程的样本函 数,其短时谱的统计特性在语音增强中又着举足轻 重的作用。(据中心极限定理,语音的短时谱的统计特性 服从高斯分布。)
T
1 t[ s ( t ) s ( t ) s ( t ) n ( t ) n ( t ) s ( t ) n ( t ) n ( t ) w ( t ] ) d T
式中 w(t) 为短时平稳所加的时间窗函数。上式第一项为纯净 语音信号的自相关,第二项到第四项分别为语音与噪声、噪 声与噪声的相关函数。由于语音信号与噪声、噪声与噪声可 认为互相不相关。所以上式第二项到第四项的积分结果可认 为是近似为零或甚小。这样就有:
14.1概述 14.2语音特性、人耳感知特性及噪声特性 14.3滤波法语音增强技术 14.4利用相关特性的语音增强技术 14.5非线性处理法语音增强技术 14.6减谱法语音增强技术 14.7利用Weiner滤波法的语音增强技术
14.1 概述
❖ 语音信号作为信息的最普遍最直接的表达方式,在许多领域 具有广泛的应用前景。现实生活中的语音不可避免的要受到 环境的影响。
❖ 噪声分类: 按类别:可分为环境噪声等的加性噪声和残响及电器线路干 扰等的乘法性噪声 按性质:平稳噪声和非平稳噪声
❖ LomBard现象:在噪声环境下,说话者情绪会发生变化, 从而引起声带的变化(对语音处理系统的影响相对较小)
国内外语音信号处理研究成果
目前国内外的研究成果从增强思想上主要分 为以下三类:
❖ 图14-4中将 s , (t ) 看作是r(t) 估计y(t)而得到的误差,
据最小均方准则,当 E{|y(t)r,(t)|2}为最小时的
误差 (t) 也就是降噪后的 s , (t ) 。这里采用LMS递推
算法简要说明横向滤波器系数的求法。
设横向滤波器的加权向量记为W,误差信号 (k) ,则有: ( k ) y ( k ) r ,( k ) y ( k ) W T ( k ) R ( k )
❖ 通过语音增强技术来改善语音质量的过程如 图14-1所示
14.3滤波法语音增强技术
14.3.1 陷波器法
对于周期噪声采用陷波器是较为简便和有效的 方法,其基本思路和要求是设计的陷波器的幅频曲 线的凹处对应于周期噪声的基频和各次谐波如图 14.2所示,并通过合理设计使这些基频处的陷波宽 度足够窄。
变得越窄,通带较为平坦,陷波效果越好。其模拟框图如图 14-3所示
❖ 14.3.2 自适应滤波器
1.基本型
自适应滤波器最重要的特性是能有效地在未知环境中跟踪 时变的输入信号,使输出信号达到最优,因此可以用来构成 自适应的噪声消除器,其基本原理框图如图14-4所示。
❖ 图中s(t)为语音信号,n(t)为未知噪声信号,y(t)带噪 语音信号,r(t)为参考噪声输入, r(t)与s(t)无关,而 与n(t)相关。
以上的方法是传统的CMN方法,由于它用整个带噪语音输入
语句(共N帧)来求倒谱平均值 Csn (t) ,所以又称为长时
CMN方法。
这种方法存在两个问题,一是由于输入语句中音素的出现频
率 点 此会为,改止可变计以算仿Csn完照(t) 成H的M以大M后小参,,数才直的能接最算影大出响后规C验sn整(概t)的率,效(影果M响。A了P二实)是时学必性习须。算到为法终
❖ 14.2.3 噪声特性 噪声可分为: 1. 平稳和非平稳噪声
2. 加法性噪声:冲激噪声、周期噪声、宽带噪声、语 音干扰
3. 乘法性噪声:残响及传输网络的电路噪声(非加性噪
声往往可以通过某种变换,如同态滤波,转为加性噪声)
❖ (1)冲激噪声:例如放电,打火,爆炸都会引起 冲激噪声,它的时域波形是类似于冲激函数的窄脉 冲。消除冲激噪声影响的方法通常有两种:对带噪 语音信号的幅度求均值,将该均值做为判断阈,凡 是超过该阈值的均判为冲激噪声,在时域中将其滤 除;当冲激脉冲不太密集时,也可以通过某些点内 插的方法避开或者平滑掉冲激点,从而能在重建语 音信号去掉冲激噪声。
❖ 简单的数字陷波器的传递函数如下:
H(z)1zT
由 H(ejw)1ejw可T 以看出 f N/T(T为正整)数 的频率将被 滤除掉。根据数字信号处理的基本知识可以知道,数字滤波 器的极零点接近时,信号频谱变化较为缓慢,而在陷波频率 处急剧衰减,故引入反馈:
1zT H(z) 1bzT
当 b越接近1时,分母在零点附近处由抵消作用,梳齿带宽
❖ 3 用延迟的改进型
从图14-4和图14-6中可以看出自适应滤波器需要有 与n(t)相关的参考噪声r(t)输入,这在实际应用中往 往比较困难,如果噪声相关性较弱时(例如白噪声 ),有如图14-7所示的改进型。
14.4利用相关特性的语音增强技术
❖ 14.4.1 自相关处理抗噪法语音增强技术 此方法利用语音信号本身相关,而语音与噪声、噪 声与噪声可认为互不相关的性质,对带噪语音信号 作自相关处理,可以得到与不带噪语音信号同样的 自相关帧序列。下面说明:
由于每一帧的噪声的倒谱相同,则有:
Csn(t)N 1tN 1Cs(t)Cn(t)
利用CMN法处理得到的语音增强的倒谱为:
C ˆ s ( t) C s( tn ) C s( tn ) C s ( t) C n ( t) N 1 tN 1 C s ( t) C n ( t) C s ( t) N 1 tN 1 C s ( t)
R y ( ) T 1 t y ( t ) y ( t ) w ( t ) d T 1 t t [ s ( t ) s ( t ) w ( t ] ) d R s ( t)
即Ry ( )与噪声无关,只约等于纯净语音的自相关函数Rs ( )。所 以,如果将自相关系数作为识别系统的特征,就可以达到抗 噪的目的。
为了在复数帧特征中进一步加强降噪措施,可利用主分量分 析方法,求取复数帧段参数特征的主分量特征。方法如下:
设有N个D维样本Y i { y i1 ,y i1 ,.y i.} D t( .i ,1 ,2 ,.N .),.则.根,
据这些抽样样本,由(14-11)和(14-14)两式求取相关矩 阵R。
r11 r12 r1D
利用CMN方法抑制由输入和传输电路系统引起的乘法性噪 声的原理是: 设对于第t帧语音,带噪语音的倒谱是Csn (t)、纯净语音的倒谱 是C s (t )、噪声的倒谱是 Cn (t) 、除噪后增强语音的倒谱是Cˆ s (t ) ,则有关系:
C s(nt)C s(t)C n(t)
设Csn (t)为整个带噪语音输入语句(共N帧)的倒谱平均值,
,利用(MAP)算法来提高计算 Csn (t) 的精度,即:
设带噪语音为:y(t)s(t)n(t)
其中,s (t ) 为纯净语音信号,n (t ) 为近似白噪声的噪声信号。考 虑到他们的短时平稳的特性,计算 y(t) 的自相关函数
Ry()T 1 ty(t)y(t)w (t)dt 1t [s (t) n (t)• ] [s (t) n (t)w ] (t)dt
相关文档
最新文档