二次离散小波变换的语音增强方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

些小波基上的分解系数进行重构,得到信号的某些特征成分。
基金项目:北京市科技新星基金项目(Beijing Technology new star Foundation of China under Grant No.2006B58)。 作者简介:孙浩(1983-),男,首都师范大学信息工程学院在读研究生,主要研究领域为 FPGA 和嵌入式系统开发;袁慧梅(1967-),女,博士,副教
增强语音信号的目的。由于前文已经介绍了离散小波分解,方
法与前面的相同,这里就不再进行推导。
对于去噪门限值得选取规则,采用软阈值的选取规则。其
计算公式为:
Tsgn(d)‖d│-θ│,if│d│>θ
d′= 0,if│d│<θ
(9)
其中,d′为处理后的小波系数,d 为处理前的小波系数,θ 为阈值。
3 主客观评价方法[10]
提取低频成分
三层离散小波分解
信号重构 输出语音信号
பைடு நூலகம்
图 2 算法流程图
根据 Mallat 算法可知,当尺度函数 Φ(t)和小波函数 Ψ(t) 以确定时,要想得到 (f t)在尺度 j 下的细节 g(j t),只需要知道 离散细节系数{dj,k(} k∈Z)。由多尺度分析思想可知 V1=V1+W1, f(0 t)=f(1 t)+g(1 t)。关于 Φ(t)对双尺度方程为:
T
(P)
Rx =
TTTR(x 1)
T
R(x 0)

T
T
TTTR(x P) R(x P-1) …
R(x P)
T T
T
R(x P-1)TTT
T
T
T
R(x 0)
T T T
Σ R(x i)= S(x n)S(x n+i) n
4 仿真实验与分析 4.1 系统仿真实验
为了验证提出的算法的有效性,此次实验中所使用的带噪 语音采集自真实的某次会议现场。而非采用传统的先制造纯净 的语音,再人为地加入噪声的方法制造带噪语音信号。图 3 为 本次实验所使用的语音信号的时域图和频谱图。通过对语音信 号的分析,可以看出,信号的背景噪声十分复杂,含有许多强噪 声(包括周期性噪声,冲击噪声和宽带噪声)。语音信号的采样
论是提高级次(level)还是改变小波基,均不能到达理想的效 果。于是,在对带噪语音信号进行了频谱分析的基础上,提出了 一种对带噪语音信号进行多次离散小波变换去噪的算法。
2 理论基础 2.1 小波变换
小波变换[9]是一种信号的时间-尺度分析方法。小波中的 “小”指的是它的衰减性“,波”是指它的波动性。小波变换的实
n
(1)
(j)
(j)
式中:j 为尺度因子,k 为位置因子,d (k)与 c (k)是信号在分
解水平 j 下的离散细节系数与离散逼近系数;h(0 n)和 g(1 n)分 别是低通滤波器系数与高通滤波器系数,且有:
g(1 n)=(-1)-nh(0 N-n)
(2)
其中 N 是滤波器长度,信号的重构是分解的逆过程,可以对某
板仓(Itakura)距离测试法比较的是 2 个信号的功率谱的
相似度,与人的主观听觉有很强的关联性,是评价语音质量的
重要标准。其定义如下:
设有 2 帧加窗语音信号为 Sx 和 Sy,分别对它们做 P 阶 LPC 分析,可以得到 2 个特征矢量:
A(x P)=(α赞 (x0P)α赞 (x1P)…α赞 (xPP))
ΣΣd(m n)
m=1 n=1
MN
ΣΣs(m n)
rout=10lg M
m=1 n=1 N
ΣΣ[s赞(m n)-s(m n)]
m=1 n=1
(10) (11)
其中:sm(n)表示纯净加窗语音信号,s赞 m(n)表示去噪语音信号; d(m n)表示高斯白噪声信号;N 和 M 分别表示帧长和帧的总数。
3.2 主观评价方法
x(k)
2
1
0 2 4 6 8 10 12 14 16
k
×104
图 3 带噪声的语音信号
实验中对信号的小波分解均采用正交的 Daubechies 小波 db8。阈值的选取参照公式(9)。图 4 为使用 Daubechies 小波 db8 一层分解后提取的离散逼近系数(即低频系数)和离散细 节系数。实验只保留此次分解后得到的低频部分信号做进一步 的处理。图 5 和图 6 则分别为对提取信号进行 Daubechies 小 波 db8 三层分解后重构的离散逼近信号和离散细节信号。最 后,经过阈值处理后,对处理后的信号进行合并,等到最终的去
(P) (P) (P) (P)
Ay =(αy0 αy1 …αyP ) 则这 2 个语音信号的板仓距离为:
(12) (13)
T T (P) (P) (P) T
(P) (P)
D(I Ax ,Ay )=ln
Ay Rx (Ay )
(P) (P) (P) T
Ax Rx (Ax )
其中:
(14)
… … …
TTR(x 0) R(x 1) …
质是将信号向一系列小波基上进行投影。具有多分辨率的特 点,而且在时频两域都具有表征信号局部特征的能力。对于一 实信号 c(t),可采用 Mallat 算法进行小波分解和重构,如图 1 所示,根据 MRA 和滤波器组理论,可由下式进行分解:
Σ (j)
(j)
d (k)= g1(n-2k)c (n),(j≥0,j∈Z)
Computer Engineering and Applications 计算机工程与应用
2009,45(31) 125
二次离散小波变换的语音增强方法
孙 浩,袁慧梅 SUN Hao,YUAN Hui-mei
首都师范大学 信息工程学院,北京 100037 Information Engineering School of Capital Normal University,Beijing 100037,China E-Mail:sh_1983@
分解,离散逼近系数(即低频系数)
Σ c1,k=〈(f t),Φ1,(k t)〉=〈f(0 t),Φ1,(k t)〉= c0,〈k Φ0,(n t),Φ1,(k t)〉(7) n∈Z
将式(6)带入式(7),得到
Σ Σ = c0,〈k Φ(t-n),hn-2kΦ(t-m)〉= c0,khn-2k,k∈Z0
摘 要:提出了一种基于二次离散小波变换(DWT)的语音增强算法。该算法首先对带噪语音信号进行离散小波变换,提取离散细 节信号,并对其进行第二次离散小波变换。再按照不同的规则选取阈值,对信号进行去噪处理。最后再对出来后的语音信号进行合 并。对比实验结果表明,该方法具有良好的消除噪声的效果,提高了语音的清晰度和可懂度。 关键词:语音增强;离散小波变换;噪声估计 DOI:10.3778/j.issn.1002-8331.2009.31.037 文章编号:1002-8331(2009)31-0125-03 文献标识码:A 中图分类号:TN912
n∈Z
n∈Z
(8)
在过采样的情况下,式(8)中的 c0,k 一般取为 (f k△t)(对其
进行时间归一化后取为 (f k))。
n
n
令信号函数 fj(t)∈Uj ,考虑到语音信号的特点,对 (f t)进
行 1 层小波分解后,在对细节信号 g(1 t)进行 3 层(level)离散小
波分解,同时采用不同的阈值选取规则,可达到更好的去噪和
1 引言
人们在语音通信过程中不可避免地会受到来自周围环境、 传输媒介引入的噪声、通信设备内部电噪声、乃至其他讲话者 的干扰。语音增强就是对带噪语音进行处理,以改善语音质量, 提高语音的清晰度、可懂度和舒适度,使人易于接受或提高语 音处理系统的性能。在一般情况下干扰信号是随机信号,要完 全排除噪声是不现实的。所以语音增强的目标对收听人而言主 要是减少疲劳,改善语音质量,提高语音可懂度;对语音处理系 统(识别器、声码器、手机)而言主要是提高系统的识别率和抗 干扰能力。目前某些语音增强算法[1]已证明是有效的,它们大体 上可分为四类:噪声对消法、谐波增强法、基于参数估计的语音 再合成法和基于语音短时谱估计的语音增强算法,但是上述算 法都各有限制[2]。
(b)重构过程
图 1 Mallat 分解与重构
其算法为:
Σ Σ j-1
(j)
(j)
c (n)= h0(n-2k)c (k)+ g1(n-2k)d (k)
k
k
(3)
由上述小波分解与重构算法可以对任意平稳或非平稳信
号进行处理。
2.2 算法描述
图 2 给出了该算法的原理框图。
原始语音信号 一层离散小波分解
3.1 客观评价方法
信噪比 SNR(Signal Noise Ratio)是衡量信号中所含噪声
能量大小的重要标准。根据定义,用输入信噪比(rin)和输出信 噪比(rou)t 分别表示输入带噪语音的信噪比和输出增强语音的 信噪比,它们分别定义如下:
MN
ΣΣs(m n)
rin=10lg
m=1 M
n=1 N
SUN Hao,YUAN Hui-mei.Method for speech enhancement based on twice discrete wavelet puter Engi- neering and Applications,2009,45(31):125-127.
授,主要研究领域为 FPGA 和嵌入式系统开发。 收稿日期:2008-06-12 修回日期:2008-10-10
126 2009,45(31)
Computer Engineering and Applications 计算机工程与应用
G
Dj+1 ↓2
G
↑2
Cj H
Cj+1
↓2
H
↑2
Cj
(a)分解过程
Abstract:An algorithm based on twice discrete wavelet transform for speech enhancement is presented.DWT is used to process the noisy speech.DWT is employed again for the discrete detail coefficients.The thresholds are selected to de-noise the signals using various rules.The de -noised signals are reconstructed.The experiment results show that this method can obtain a well performance and also can enhance the definition and understanding of the speech. Key words:speech enhancement;Discrete Wavelet Transform(DWT);noise estimation
噪后的语音信号。图 7 为最终信号的时域波形图。 实验的结果使用客观评价方法,即信噪比(SNR)和主观评
价的方法,即板仓(Itakura)距离测试法和主观试听的方法对增
强效果进行判断。计算得到该文方法得到的信噪比为 1.72 dB,
Σ Φ(
t 2
)=

2
hkΦ(t-k)
k∈Z

Φj,k=2-jΦ(2-jt-k) 则
(4) (5)
Σ Φl,(k t)= 1 ·姨 2 hlΦ(t-2k-l)=
姨2
l∈Z
Σhm-2kΦ(t-m),m=2k+l0
m∈Z
(6)
Σ 通常取 (f t)≈f(0 t)= c0,kΦ0,(n t)。于是,对于其 1 层小波 n∈Z
孙 浩,袁慧梅:二次离散小波变换的语音增强方法
2009,45(31) 127
频率为 8 kHz,每帧长度为 20 ms,即每帧为 160 个采样点。
带噪声语音信号的时域图 1.0
频率/dB
0.5
0
-0.5
-1.0 02 ×104 3
4 6 8 10 12 时间/ms
带噪声语音信号的频谱图
14 16 ×104
小波变换是一种多尺度的信号分析方法,是分析非平稳信 号的有力工具,克服了短时傅里叶变换固定分辨率的弱点,既 可分析信号的概貌,又可分析信号的细节。小波理论从提出至 今,经过十几年的发展,已在信号去噪上得到了越来越广泛的 应用[3-6]。常用的离散小波变换去噪方法[7-8]是利用小波多分辨率 的特性,将信号在不同的尺度下进行多分辨率分解,并对小波 分解系数精选阈值处理,以到达去噪的目的。但是,在使用中发 现,如果对带噪语音信号进行一次离散小波变换进行去噪,无
相关文档
最新文档