语音信号处理第7讲
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
噪声的度量——声压、声强和声功率:
① 声压级
P Lp 20lg P0 20 Pa P0 I LI 20lg I 0 1012 W m2 I0 W LW 20lg W0 1012 W W0
② 声强级
③ 声功率级
N 所有 f (N为整数)的频率将被滤除掉 T
由于数字滤波器的极零点接近时,信号频谱变化较为缓慢,而在陷波频 率处急剧衰减,可引入反馈: 1 z r H ( z) 1 bz r 当 b 1时,分母在零点附件处有抵消作用,梳齿带宽变得越窄,通带 较为平坦,陷波效果越好。
数字陷波器模拟框图
纯净语音 背景噪声
信道
语音增强 处理
增强语音
常用的语音增强技术有滤波法、自相关抗噪法、非线性处理法、减谱法 和维纳滤波法等 陷波器法:消除周期噪声较为简便有效的方法 基本思路和要求:陷波器的幅频曲线的凹处对应于周 期噪声的基频和各次谐波(关键是通过合理设计使这 些频率处的陷波宽度足够窄)
j j T 陷波器:传递函数为 H ( z) 1 z T uuuuuu z e j r H (e ) 1 e
设有N个D维样本 Yi yi1
r11 r12 r r22 21 R M M rD1 rD 2 L L O L
ynd N 1 r1D n 1 r , s y y y y , y ij ij ni i nj j d N n1 N sii s jj r2 D , M 求R的特征值 , i 1,2,L , D及对应特征向量A i i rDD
声压和声压级表征声音在物理上的强弱,是对噪声的客观 评价,不能表征人对声音的主观感觉。 噪声度量的另一个参数就是信噪比SNR,考量的是输入信号 的SNR和输出信号的SNR变化
噪声特性:
冲激噪声:放电、打火、爆炸都会引起冲激噪声,它的波形类似于冲 激函数的窄脉冲。
消除方法: (1)对带噪声语音信号的幅度求均值,将该均值作为判断阈值,凡是超过该阈 值的判断为冲激噪声,在时域中将其滤除; (2)当冲激脉冲不太密集时,可以通过某些点内插的方法避开或平滑掉冲激点 ,从重建的语音信号中消除冲激噪声
人耳感知特性:
(1)人耳对于声波频率高低的感觉与实际频率的高低不呈线性关系,而近 似为对数关系
(2)人耳对声强的感觉很灵敏且有很大的动态范围,对频率的分辨能力受 声强的影响,过强或过弱的声音都会导致对频率的分辨力降低
(3)人耳对语音信号的幅度谱较为敏感,对相位不敏感 (4)语音增强的最终度量是人耳的主观感觉——可以利用人耳特性减少运 算代价
噪声特性:
定义:是扣除被测信号真实值后的各种测量值,可能来自外界环境、 物理系统、操作人员等。广义将噪声称为干扰 噪声的分类(可根据产生原因和噪声性质分类) ① 产生原因:产生于物理系统外部,并以声、光、电、机械等方式作 用于物理系统,称为外部噪声;物理系统内部产生的噪声称为内部 噪声,例如量子噪声等 ② 按性质分为:脉冲噪声(爆炸、碰撞和放电)和连续噪声;周期性 噪声(如交流电的干扰)和非周期噪声;按统计特性分为:平稳噪 声(如白噪声)和非平稳噪声(如色噪声);按噪声和信号相关的 性质分为加性噪声和乘性噪声 注:语音信号研究的噪声是声音的一种,具有声波的一切特性,称为声 噪声
Y (e j ) S (e j ) N (e j ) Py Ps Pn
2 2 2
从发声前的“寂静段”估计噪声功率谱,从而获得纯净语音功率谱
Ps Py Pn
完整的描述:
Py Pn , Py Pn Ps Py Pn 0,
意义:
① 日常生活中,经常遇到在噪声干扰 下进行语音通信的问题 ② 军事通信中,指挥员的作战命令和 战斗员的战情汇报 ③ 窃听技术中需要语音增强 ④ 语音识别技术需要语音增强
原因:
在实际生活中,语音信号无时无地不受各种噪声干扰。如人们正常的生活环 境是一个声级为60dB的噪声环境。
语音特性:
同态滤波法原理框图
利用倒谱值规整(CMN)降噪声技术,清除带非加性噪声的语音信号 的倒谱的噪声成分,从而获得增强语音的倒谱
同态滤波法:
倒谱值规整(CMN)降噪声技术原理:设对于第t帧语音,带噪语音的 倒谱是 Csn (t ) ,纯净语音的倒谱 Cs (t ),噪声的倒谱 Cn (t ) ,去噪后增强 ˆ (t ) 则 语音的倒谱 C
噪声特性:
语音干扰:干扰语音信号和待传语音信号同时在一个信道中传输所造 成的语音干扰称为语音干扰。
消除方法:利用语音和干扰语音的基音不同,采用梳状滤波器提取基音和各 次谐波,再恢复出有用语音信号。
传输噪声:传输系统的电路噪声与背景噪声不同,在时间域里是语音 和噪声的卷积。
消除方法:采用同态处理,把非加性噪声变换为加性噪声处理。 干扰语音 传输噪声
声帧功率谱会随机变化,且相差较大。为此,改进的减谱法被提出。
改进的减谱法——被减项加权值处理:
在幅度较高的时帧处减去 aPn , a 1 更好的突出语音谱,抑制纯音噪 声,改善降噪性能;在语音谱中保留少量的宽带噪声,在听觉上起到一 定的掩蔽纯噪声的作用,故改进后的减谱法公式为 有语音信号与加性噪声的相互独立得
利用复数帧段主分量特征的降噪方法:鉴于来自环境的噪声具有帧间 相关性小,能量分布频率范围广且数值小,在语音信号主分量特征中 对应的贡献率交小的特点,可以利用复数帧段主分量特征来提高噪声 环境下的抗噪性 优点:既能起到降低噪声的作用,又能很好地解决输入特征参数矢量的 维数增加导致的参数估计误差及计算量增大问题
基本型自适应滤波器
s(t ) 是估计 y (t ) 而得到的误差,根据最小均方准则,当 E y (t ) r (t )
2
对称自适应去相关的改进型自适应滤波器:在一些实际应用中,参考 输入 r (t ) 中还可能含有低电平的信号分量,会对消原始输入中的语音 信号成分,导致输出信号中原始语音信号的损失
r (t )对 s (t )有影响,且与未知噪声信号 n(t )相关,导致输出原始信号损失
原始信号通过传递函数J(z)的 信道泄露到参考输入中 为解决这一问题,提出了对 称自适应去相关(SAD)算 法 自适应噪声对消器
用时延的改进型自适应滤波器:解决要求与噪声相关的参考噪声输入 的要求(该要求实现较困难,如白噪声,相关性较弱) 提出将噪声延迟一个周期T,使得参考信号 r (t ) s(t T ) n(t T )
自相关函数为: 1 t Ry ( ) y (t ) y (t ) (t )dt T 互不相关,积分结果 t 1 s (t ) n(t ) s (t ) n(t ) (t )dt 近似为零 T 1 t s (t ) s (t ) n(t ) s (t ) s (t ) n(t ) n(t ) n(t ) (t ) dt T 1 t s (t ) s (t ) (t ) dt Rs ( ) T
6.1 概述 6.2 语音特性、人耳感知特性及噪声特性 6.3 滤波器法 6.4 相关特征法 6.5 非线性处理法 6.6 减谱法 6.7 Weiner滤波法
语音增强:
指当语音信号被各种各样的噪声干扰、甚至淹没后,从噪声背ຫໍສະໝຸດ Baidu中提取有 用的语音信号,抑制、降低噪声干扰的技术。(即:从含噪语音中提取尽 可能纯净的原始语音)
ˆ (t ) 中不再包含噪声的倒谱,而是包含纯净语音倒谱的平均值 C s
基本原理:
减谱法是处理带宽噪声较为传统和有效的方法,基本思想是:在假定加 性噪声与短时平稳的语音信号相互独立的条件下,从带噪语音的功率谱 中减去噪声功率谱,从而得到较为纯净的语音频谱
y(t ) s(t ) n(t ) uuuuuuuu FT rY (e j ) S (e j ) N (e j ) 有语音信号与加性噪声的相互独立得
语音信号是一种非平稳的随机信号,考虑到人类发声过程中的变化 速度具有一定的限度,且远小于语音信号的变化速度,具有短时平稳性, 采用加窗分帧,用平稳随机过程来分析语音信号
任何语音都分元音和辅音两种因素,根据发音机理不同,辅音又分清辅音 和浊辅音。 从时域波形上可以看出浊音(包括元音)具有明显的准周期性和较强的振 幅,其周期所对应的频率就是基音频率;清辅音的波形类似与白噪声并具 有较弱的振幅。 语音增强利用浊音具有明显的周期性来区别和抑制非语音噪声,而清辅音 和宽带噪声就很难区别分
s (t ) 与其延迟相关性大,而 n(t ) 与其延迟相关性小,基于自适应滤 波器思想对纯净信号估计
用时延的改进型自适应滤波器
自相关处理抗噪法语音增强技术:利用语音信号本身相关,而语音与 噪声,噪声之间互不相关的性质,对带噪语音信号处理,得到与不带 噪语音信号相同的自相关帧序列 设带噪语音信号为: y(t ) s(t ) n(t )
自适应滤波器:有效地在未知环境中跟踪实变的输入信号,使输出信 号达到最优,其基本原理框图如下
r (t ) 与 s (t ) 无关,而与未知噪声
信号 n(t ) 相关 自适应滤波器的实质在于实现带躁信号 中的噪声估计,并用原始信号中去除估 计噪声,达到语音增强的目的 为最小的误差 (t ) 也就是降噪后的 s(t )
yi 2 L sij
yiD , i 1,2,L , N
T
N
特征值又称为本征值,表示去相关处理后各主分量特征的功率 大小及对特征矢量的贡献大小,值小的贡献小。按大小排列后, 选择前P个主分量作为有效主分量组成新的低噪声特征矢量,达到降低噪声的目的
主分量基向量, 又称本征向量
同态滤波法:对于加性噪声的语音增强,通常采用线性滤波法,而对 于非线性噪声(如乘积或卷积噪声),一般采用同态滤波的方式
基本原理:
当2,和1/2被改进为k,和1/k,k>0, 可以得到更普遍的减谱法的形式,称 为功率谱修正处理
2
用带噪语音信号的相位谱代替估计后语音信号的相位谱来恢复降噪后的
语音信号
但实际处理中的效果不是很理想,因为语音的能量往往集中在某些频段 内,在这些频段的幅度相对较高,而噪声的能量统计服从正态分布,噪
s
Csn (t ) Cs (t ) Cn (t )
设 Csn (t ) 为整个带噪语音输入语句(共N帧)的倒谱平均值,由于每一 帧噪声的倒谱相同,则有
1 N Csn (t ) Cs (t ) Cn (t ) N t 1 利用CMN法处理得到的增强语音的倒谱为
N 1 ˆ (t ) C (t ) C (t ) C (t ) C Cs (t ) s sn sn s N t 1
将自相关系数作为识别系统的特征,达到抗噪目的
自相关处理抗噪法语音增强技术: 自相关处理会产生二次谐波,具体操作时,并非直接用带噪语音信号的 相关系数作为识别特征,而是采用帧信号平方的自相关系数作为识别特 征
Tp
流程:带噪语音 信号开放后延迟一个周期,求自相关系数,通过相关 峰分析确定波形周期 T p ,然后进行切波和续波,由此输出不再产生二 次谐波
周期噪声:最常见的有电动机、风扇之类周期运转的机械所发出的周 期噪声,50Hz交流电源也是周期噪声。
消除方法:在频谱图上表现为离散的窄谱,可以采用陷波器方法予以滤除
宽带噪声:说话时同时伴随着呼吸引起的噪声,随机噪声源产生的噪 声,以及量化噪声等都可视为宽带噪声,近似为高斯噪声或白噪声。
消除方法:宽带噪声的显著特点是噪声频谱遍布语音信号的频谱中,消除比 较困难,一般采用非线性处理方法