一种改进的维纳滤波语音增强算法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

130
2010, 46 (26)
Computer Engineering and Applications 计算机工程与应用
Ephraim 和 Malah 提出的 “直接判决” 估计来计算先验信噪比的 方法是最有效的和最容易计算的 对于第k 帧带噪语音信号:
y k (t) = s k (t) + n k (t)
Computer Engineering and Applications 计算机工程与应用
2010, 46 (26)
129
一种改进的维纳滤波语音增强算法
张 亮, 龚卫国 ZHANG Liang, GONG Wei-guo
重庆大学 光电技术及系统教育部重点实验室, 重庆 400030 Key Laboratory for Optoelectronic Technology and System of the Education Ministry of China, Chongqing University, Chongqing 400030, China E-mail: wggong@ ZHANG Liang, GONG Wei-guo.Improved Wiener filtering speech enhancement puter Engineering and Applications, 2010, 46 (26) : 129-131. Abstract:An improved speech enhancement algorithm is proposed, which is based on a priori SNR estimation Wiener filtering.Firstly, the initial noise power spectrum NPS is estimated by computing the statistical average of the silent segments. Next, the power spectrum of the speech segments is estimated and the noise power spectrum is updated by smoothing the initial noise power spectrum and the noisy speech power spectrum stly, the abrupt increases in noise level are taken into account and the power spectrum of the noise is adjusted adaptively according to the rate of the NSPS to NPS.The verification experiment between the proposed algorithm and other speech enhancement algorithm which based on short-time spectral estimation is implemented.The experiment result shows that the residual noise is reduced significantly and the speech distortion, and then the speech intelligibility are increased. Key words:speech enhancement; Wiener filtering; a priori Signal to Noise Ratio (SNR) ; decision directed 摘 要: 提出了一种改进的语音增强算法, 该算法以基于先验信噪比估计的维纳滤波法为基础。首先通过计算无声段的统计平
由此, 可以看出, 在维纳滤波算法中, 关键是对G ( ξ γ )的求 解。基于最小均方误差的判别方法[3], 维纳滤波的谱增益函数为: SNR ξ prio G ω ( ξ k γ k ) = k = (5) 1 + ξ k 1 + SNR prio
5] 根据 “直接判决” 的方法[2, 计算先验信噪比和后验信噪比:
1
引言
随着计算机通信技术的迅猛发展, 语音信号处理技术的重
和 Israel Cohen 对 Ephriam 和 Malah 提出的方法进行了改进[5-6]。 在上述方法中, 需要估计当前帧的噪声功率谱, 常常只通过计 算无声期间的统计平均来估计噪声。但是仅仅依靠无声段来 估计噪声, 这样的估计过程显然是不够全面的。另外, 虽然上 述的方法能有效地抑制变化范围不大或是稳定的噪声, 但是 对实际中的变化范围很广的噪声效果不是很理想。 首先描述了维纳滤波语音增强算法的基本思想, 然后对 先验信噪比和后验信噪比的计算进行了简单推导, 最后提出 了一种改进的算法。通过计算机仿真实验, 将提出的算法与 最常见的谱减法进行了比较。实验结果表明该改进算法有效 地提高了增强效果, 更好的抑制了噪声, 提高了语音质量。
[2-3] [1]
。 Olivier Cappé在文献 [4]中分析了上述方法能
有效抑制残留噪声, 是因为在计算增益函数时引入了先验信 噪比, 并采用了 “直接判决” 法对先验信噪比进行估计。Scalart
2
基于先验信噪比估计的维纳滤波语音增强
先验信噪比是语音增强算法中非常重要的参数。通过
作者简介: 张亮 (1983-) , 男, 硕士, 主要研究领域为信息获取和处理; 龚卫国 (1957-) , 男, 教授, 主要研究方向为模式识别及机器视觉、 智能化信息 技术及系统。 收稿日期: 2009-02-20 修回日期: 2010-04-22
假设 s k (t)和 n k (t)都是短时平稳随机信号, 且二者互不相关 [7]。 对上式进行傅里叶变换, 得到:
Y k (ω) = S k (ω) + N k (ω)
其次, 从起始帧开始, 判断当前帧为语音信号还是噪声信 号, 更新对噪声功率谱的估计, 以便通过式 (6) 计算先验信噪 比和后验信噪比。若是噪声信号, 则通过对 N̂ ( ω)
[2-6]
。 (1)
| N̂ (ω) | 式中| N̂ ( ω) |
2 NIS
=
å æ| Y k (ω) | ö ø k = 1è
2
S
L
(7)
2 NIS
表示噪声功率谱的初值, S 表示第S 帧为语音起始
n k (t)为第 k 帧加性噪声信号, 其中 s k (t)为第 k 帧纯净语音信号,
L表示帧长。 帧,
|
|
式中 Ŝ k - 1( ω) 为第k - 1帧纯净语音信号的功率谱估计, | Y k (ω) |
|
|
2
2
为第 k 帧带噪语音信号的功率谱,N̂ k ( ω) 为对第 k 帧的噪声功 率谱估计[6]。
|
|
2
|
|
2 NIS

(2) 从语音信号起始帧 NIS 开始, 判断当前帧为语音信号 还是噪声信号。若是噪声信号, 通过式 (8) 对 N̂ ( ω)
3
改进算法
在基于先验信噪比估计的维纳滤波语音增强算法中, 需
|
|
2 NIS
与当前
2 new
帧的功率谱做平滑处理, 更新对噪声功率谱的估计| N k ( ω) | ; 若是语音信号, 进行下一步计算; (3) 通过式 (9) 依次更新当前帧中每个点的噪声功率谱
要估计当前帧的噪声功率谱, 经典的算法常常只通过计算无 声期间的统计平均来估计噪声功率谱, 这是假设噪声的功率 谱在发声前和发声期间基本没有变化前提下的, 这样的估计 和假设显然是不够全面的。另外, 经典的算法能有效地抑制 变化范围不大或是稳定的噪声, 但是对实际中的变化范围很 广的噪声效果不是很好。 为了解决上述问题, 在基于先验信噪比估计的维纳滤波 算法基础上, 提出了一种改进的算法。本算法对传统的估计 噪声功率谱的方法做出了改进, 首先在计算无声段信号统计 平均得到初始噪声功率谱的基础上, 通过平滑处理初始噪声 功率谱和带噪语音功率谱得到新的噪声功率谱, 弥补了经典 算法中仅依靠无声段估计噪声功率谱的不足。其次, 通过计 算带噪语音功率谱与噪声功率谱的比值, 更新噪声功率谱, 一 定程度上改善了经典算法仅适用于稳定或变化不大的噪声的 不足。 首先, 对带噪语音进行端点检测确定语音起始帧, 并通过 无声期间统计平均的噪声方差作为噪声功率谱的初值。
要性日益突出, 它被广泛地应用在网络、 通信、 智能仪表及工业控 制领域中, 已经成为现代工业发展的一个必备的基本技术 。 基于语音短时谱估计的方法具有适用信噪比范围大、 方 法简单、 易于实时处理等优点, 尽管研究比较早, 但仍有很强 的生命力, 已成为应用最广泛的语音增强方法。基于语音短 时谱估计的增强方法种类繁多, 如谱减法、 维纳滤波法、 最小 均方误差法等。 传统的基于语音短时谱估计的方法均不同程度存在着残 留噪声大的问题。Ephriam 和 Malah 提出的方法可以有效地抑 制残留噪声
均得到初始噪声功率谱; 其次, 计算语音段间带噪语音功率谱, 并平滑处理初始噪声功率谱和带噪语音功率谱, 更新了噪声功率 谱; 最后, 考虑了某频率点处噪声急剧增大的情况, 通过计算带噪语音功率谱与噪声功率谱的比值, 自适应地调整噪声功率谱。 将该算法与其他基于短时谱估计的语音增强算法进行了对比实验, 实验结果表明: 该算法能有效地减少残留噪声和语音畸变, 提 高语音可懂度。 关键词: 语音增强; 维纳滤波; 先验信噪比; 直接判决 DOI: 10.3778/j.issn.1002-8331.2010.26.040 文章编号: 1002-8331 (2010) 26-0129-03 文献标识码: A 中图分类号: TP391.4
2
|Y |(ω) > u| N (ω) | | Y (ω) | < d | N (ω) |
i k 2 i k i k 2 i k
2 new 2 new
(9)
其他
|
|
Y ki ( ω) 分别表示第 k 帧第i 个频率点的噪声 上式中的 N ki ( ω) ,
|
|
2
谱功率谱和带噪语音信号的功率谱。通过这样的调整, 在一 定程度上滤除了变化较大的噪声。 依据改进的算法, 具体的实施步骤为: (1) 对分帧后的信号进行端点检测, 得到语音信号的起止 点 NIS ; 通过无声期间统计平均的噪声方差来估计噪声的功率 谱 N̂ ( ω)
ŝ k (n) = F -1[Ŝ k ( ω)]
| N k (ω) |new =
2 2 new
β × N̂ ( ω)
|
|
2 NIS
+ | Y k (ω) |
2
1+β
(8)
其中| N k ( ω) | 表示通过平滑处理后对当前帧的噪声功率谱估 计。 β为噪声平滑因子。| Y k | 为第k 帧带噪语音信号的功率谱。
2
(4)
如果是语音信号, 通过计算各个频率点带噪语音功率谱 与噪声功率谱的比值再次调整噪声功率谱, 依次处理当前帧 的每个点, 更新对噪声功率谱的估计:
ìu N i ( ω) 2 k ï new ï ï 2 2 ï i i N k ( ω) = íd N k ( ω)new ï ï 2 ï ï N ki ( ω) new î
|
|
2 ì ̂ ïξ = SNR = α. S k - 1( ω) + (1 - a) × max[SNR - 1 0] prio post 2 ï k N̂ k ( ω) ï (6) í 2 ï Y k (ω) | | ïγ k = SNR post = 2 ï N̂ k ( ω) î
|
ห้องสมุดไป่ตู้
|
| | | | | | | |
(2) (3)
根据文献[4], 得到对纯净语音信号频谱的估计: Ŝ ( ω) = G ( ξ γ ) × Y (ω)
k k k k
|
|
2 NIS
与当前帧
2 new
的功率谱做平滑处理, 更新对噪声功率谱的估计| N k ( ω) | 。
式中Y k (ω)和 Ŝ k ( ω)分别表示第 k 帧带噪语音和纯净语音傅里叶 变换的估计, G ( ξ k γ k )表示谱增益函数 [8-9], 其中 ξ k γ k 分别表示 先验信噪比和后验信噪比。 Ŝ k ( ω)的相位谱用 Ŝ k ( ω)的相位谱 来近似代替, 最后由反傅里叶变换得到降噪以后的语音信号 的时域表示:
相关文档
最新文档