结点阈值小波包变换语音增强新算法
基于双正交小波包分解的自适应阈值语音增强
Absr c :Tr dto a h e h l e n ii g ag rt m n wa e e o i s efc ie o l o e ucn ta t a iin lt r s od d — o sn l o i h i v ltd man i fe t ny frr d i g whi o s . I v t n ie n e
第2 9卷
第 l O期
仪 器 仪 表 学 报
C ie eJ u n l fS in i c I sr me t h n s o r a o c e t n tu n i f
Vo12 .1 . 9 No 0 Oc .2 08 【 0
20 r1 0 8千 0门
wa e e a ke c m po ii n v l t p c tde o sto
L u e , a h n c u , o in i w i B oC agh n D uHu ig R j
(pe n u i Sg a Poes gL b Sho o l t nc n r t na dC nr n i ei , Sec adA do inl rc i a , colfEe r iI oma o n ot l gn r g h sn co f i oE e n B i g U i mt o e nl y B in 0 02 hn ) ei nv i Tc oo , ei 10 2 ,C i j n e yf h g jg a
语音增强技术及算法综述
到 (l估 ( l 此 到 H 估 ( , 的 w1 ) 并由 得 ( 的 计 w 即 , ) )
增强后的语音。因I () (): ) (, () D w I 、 wD ( 、 M w无法 w )
对不同噪声 ,采取不 同的语音增强对策。
精确得到, 所以分 别以三 者各自 的系统平 均能量ED ()J wr、
Ab t a t n t i a e ,s e c n a c me t tc n l g l b nr d c d n e e a r v ln t o s ae c mp r d s r c :I h sp p r p e h e h n e n s e h o o y wi e i t u e ,a d s v r lp e ae tmeh d r o a e l o
一
其傅 立叶变换 分别 以 ( 、 w 、 ( ) ) S ( ) D w 表示 ,于是得
当前 ,语音增强 己发展成为语音信 号数字处理 的一个重 要分 支。它的主要 应用范围是降低 听觉 噪声 ,识别 系统的预
处 理 和 线 性 预测 编 码 的 预处 理 。 语 音 增 强 是 一 门 跨 学 科 的 技
辨率分 析的语音 增强、基于语音产生模 型的线性滤 波法 、基 于小波变换的语音增强方法 1 4 ] 、梳状滤波法、 自相关法 、基于
语 音模 型 的 语音 增 强 方 法等 。
基于正交小波包分解的语音去噪增强
t r t so u n e r a e w l smu ae .I i a e , e g r h i p o o e rs e c e n ie a d e - ei i f ma a sc b e i ltd n t sp p r a n w a oi m rp s d f p e h d - o s n n sc h n l h l t s o h n e n sn r o o a v lt a k t e o o i o .I i g r h a e me t i go h g n l u t wa ee c e c mp st n n t sa oi m,t es e c sf t e o o s d i t l p d i h l t h p e h i r c mp e o mut i d s n i
谱减法等 ) 时域方法计算 量大 , , 频域 方法如谱 减法 , 虽具有
计 算 量 小 的 特 点 , 在 处 理 中存 在 音 乐 噪 声 , 但 因此 达 不 到 令
包 系数进行处理 ; 文献 [ ] 出基于节点 阅值的小波包变换 6提
增 强 算 法 。 这两 种 算 法 均 采 用 随 时 间 和 频 率 变 化 的 阈 值 处 理 小 波 系 数 , 够 在 一 定 程 度 上 降 低 噪 声 , 其 要 对 语 音 信 能 但 号 进 行 分 帧 , 分 解 的级 数 都 在 5级 以上 , 法 相 对 复 杂 , 且 算 运 算 量大 。 在 实 际 的语 音 通 信 中 , 仅 希 望 能去 除 噪 声 , 且 重 建 不 而
用小波包改进子空间的语音增强方法
1 子 空 间语 音 增 强 算 法
语 音矢 量 的 协 方差 矩 阵 有很 多 零 特 征值 , 说 这 明纯 净语 音信 号矢 量 的能量 分布 在它 对应 空 间的某 个 子 集 中 。而 语音 信 号 处 理 中, 声方 差通 常 都 假 噪 设 己知 , 且严 格 正 定 。噪 声 矢 量 存 在 于整 个 带 噪 信
噪声 情况 下 , 声 的方差 用无 声段 的方 差来 代替 , 噪 增
以认 为 由一 个信 号加 噪 声 的子 空 间和一 个 纯噪声 的 子 空 间构成 。可 以利 用信 号子 空 间处 理 技术 , 除 消
强后 的语 音 常 伴 有 一 种 具 有 一 定 节 奏 感 的残 余 噪
声 , 般 称 为 “ 乐 噪 声 ” 为 了去 除 音 乐 噪 声 , 高 一 音 。 提
小 波 包 对 噪 声 的 抑 制 功 能 , 先 对 带 噪 语 音 进 行 K L( r u e - o v a so m ) 换 , 到 带 噪 首 Ka h n n L e e Tr n f r 变 得
语 音 的 特 征 值 , 对 该 特 征 值 进 行 Da b c i s 小 波 尺 度 分 解 , 用 新 的 改 进 的 软 判 决 阈 值 函 数 去 并 u e he 8 利 除 一 部 分 噪 声 子 空 间 ; 后 再 在 子 空 间 内 用 统 计 信 息 的 方 法 实 时 跟 踪 此 时 噪 声 特 征 值 , 一 步 消 除 然 进
基于自适应阈值的小波包非接触语音增强方法研究
Me d i c a l E q u i p me n t J o u r n a I , 2 0 1 3, 3 4 ( 2 ) : 2 1 — 2 2 1
Ke y wo r d s n o n — c o n t a c t s p e e c h ; wa v e l e t p a c k e t ; t h r e s h o l d ; s p e c t r o g r a m
X U E H u i - j a n , L I S h e n g , L U G u o - h u a , Z HA N G Y a n g , J I AO T e n g , WA N G J i a n — q i , J I N G X i - j i n g
c a p a b i l i t y o f w a v e l e t p a c k e t or f a n a l y z i n g t i me - f r e q u e n c y s i g n a l , a n a l g o r i t h m o f wa v e l e t p a c k e t t h r e s h o l d w a s d e v e l o p e d b y
u s i n g h a r d t h r e s h o l d a n d s o t f t h r e s h o l d f o r d e n o i s i n g r a d a r s p e e c h . Re t ml t s C o mp a r e d w i t h s p e c t r a l s u b t r a c t i o n a n d Wi e n e r
利用声学信号处理技术实现实时语音增强
利用声学信号处理技术实现实时语音增强
在日常生活中,我们经常会遇到一些噪声干扰,比如在嘈杂的街道上交谈、在
咖啡馆里与朋友聚会等等。这些噪声会严重影响我们的语音交流质量,使得我们难以清晰地听到对方的声音。为了解决这个问题,科学家们开发了声学信号处理技术,其中包括实时语音增强技术。
实时语音增强技术是一种通过信号处理方法,对语音信号进行处理和优化的技术。它的目标是提高语音信号的质量,减少噪声干扰,使得听者能够更清晰地听到对方的声音。这项技术在通信、语音识别、语音合成等领域具有广泛的应用。
实时语音增强技术的核心是声学信号处理算法。这些算法可以根据语音信号和
噪声信号的特点,对信号进行分析和处理,从而实现语音增强的效果。常见的声学信号处理算法包括滤波、降噪、增益控制等。
首先,滤波是实时语音增强技术中常用的一种算法。滤波可以通过对语音信号
进行频率域或时域的处理,去除噪声信号中的不相关成分,从而提高语音信号的质量。常见的滤波算法包括低通滤波、高通滤波、带通滤波等。
其次,降噪是实时语音增强技术中另一个重要的算法。降噪算法可以通过对语
音信号和噪声信号进行分析,提取出噪声成分,并将其从语音信号中剔除。常见的降噪算法包括谱减法、Wiener滤波、小波变换等。
另外,增益控制也是实时语音增强技术中常用的一种算法。增益控制算法可以
根据语音信号和噪声信号的能量差异,对语音信号进行增益调整,使得语音信号的能量更加均衡,从而提高语音信号的可听性。
除了以上提到的声学信号处理算法,还有许多其他的算法可以用于实现实时语
音增强。这些算法可以根据具体的应用场景和需求进行选择和组合,以达到最佳的语音增强效果。
小波阈值滤波方法讲解与实现
小波阈值滤波方法讲解与实现
一、引言
在信号处理领域,滤波是一种常见且重要的技术,用于从混合信号中提取有用信息或去除噪声。小波变换作为一种多尺度分析方法,在信号处理中具有广泛的应用。小波阈值滤波方法是小波变换与阈值处理相结合的一种有效去噪技术。本文将详细讲解小波阈值滤波方法的基本原理、实现步骤及其在实际应用中的效果。
二、小波变换基础
小波变换是一种时间-频率分析方法,通过伸缩和平移等基本运算功能,对函数或信号进行多尺度细化分析。与傅里叶变换相比,小波变换能够更好地描述信号在非平稳、非线性条件下的局部特征。
小波变换的基本思想是将信号分解为一系列小波函数的线性组合,这些小波函数具有不同的尺度和平移参数。通过调整这些参数,可以实现对信号不同频率成分的细致分析。
三、小波阈值滤波原理
小波阈值滤波方法基于小波变换的多尺度特性,将含噪信号在不同尺度上进行分解,得到一系列小波系数。这些系数反映了信号在不同频率成分上的能量分布。噪声通常分布在所有尺度上,但其能量主要集中在较小尺度上;而有用信号则通常具有较大的能量,并分布在较大尺度上。
根据这一原理,可以通过设定一个合适的阈值,对小波系数进行筛选:保留大于阈值的小波系数(认为其主要由有用信号产生),而将小于阈值的小波系数置零(认为其主要由噪声产生)。最后,对处理后的小波系数进行逆小波变换,得到去噪后的信号。
四、小波阈值滤波实现步骤
1. 对含噪信号进行小波变换,得到一系列小波系数;
2. 根据噪声水平和小波系数的统计特性,设定合适的阈值;
3. 对小波系数进行阈值处理,保留大于阈值的小波系数,将小于阈值的小波系数置零;
音频信号处理技术在语音增强中的应用研究
音频信号处理技术在语音增强中的应用研究
一、引言
语音增强是音频信号处理领域的一个重要研究方向,其主要目
的是提高语音信号的质量和清晰度。随着科技的不断发展,音频
处理技术也得到了很大的发展,它广泛地应用于通信、语音识别、音频编辑、音乐处理、人机交互等领域。因此,在语音信号处理中,应用音频信号处理技术进行语音增强具有重要的研究价值和
应用价值。
二、研究现状
在语音信号处理中,语音增强方法可以归纳为传统的基于数字
信号处理(DSP)和机器学习(ML)的两类方法。传统的DSP方
法包括数字滤波器、谱减法、频率掩蔽法等,这些方法在去噪和
增强语音信号方面有着广泛的应用。然而,传统的DSP方法往往
会受到环境噪声、语音信号谐波、截断误差等各种因素的影响,
导致其在处理实际语音信号中的效果并不理想。
为了克服传统DSP方法的局限性,研究人员开始尝试引入机器学习的方法进行语音增强。近年来,基于稀疏表示的降噪算法在
语音增强领域中受到了广泛的关注。该方法的基本思想是将降噪
的过程看作是基于字典的稀疏表示。通过使用字典对语音信号进
行表征,可以将其分解成一组基本的特征向量,从而实现去除噪
声的目标。另外,深度学习技术也在语音增强中得到了广泛的应用。例如,使用深度卷积神经网络进行语音增强,在模拟的环境中取得了较好的成果。
三、音频信号处理技术在语音增强中的应用
在语音增强中,音频信号处理技术主要包括频域处理、时域处理、自适应滤波等方法。
1、频域处理
频域处理是语音增强中最常用的一种方法。它的基本思想是将语音信号转换到频域中进行处理,然后再将其转换回时域。在频域中,可以使用一些常见的滤波器对语音信号进行增强。例如,噪声门限谱减法(Noise Gate Spectral Subtraction)是一种常用的降噪算法。该方法通过估计信号和噪声的功率谱,从频谱中减去噪声功率,然后将其转换回时域。还可以对语音信号进行短时傅里叶变换,并使用基于滤波器的方法去除噪声。使用基于小波包和小波转换的方法,可以更加灵活地处理语音信号。
基于改进小波阈值函数的语音增强算法研究
基于改进小波阈值函数的语音增强算法研究
覃爱娜;戴亮;李飞;曹卫华
【期刊名称】《湖南大学学报(自然科学版)》
【年(卷),期】2015(042)004
【摘要】针对传统的小波阈值去噪算法中的阈值函数不足,提出一种优于非负死区阈值函数的改进的阈值函数.改进阈值函数不仅具有良好的连续性、可导性,并且克服了非负死区阈值函数没有考虑小波变换模值的衰减符合指数规律这一特点.另外在阈值的选取中,考虑了带噪语音信号的不同特性,采用谱平坦度函数修正阈值.仿真实验表明,与传统的非负死区阈值函数去噪算法相比,改进的阈值函数能更有效地消除背景噪声,在提高输出信噪比的同时,更好地保持语音质量和清晰度.
【总页数】5页(P136-140)
【作者】覃爱娜;戴亮;李飞;曹卫华
【作者单位】中南大学信息科学与工程学院,湖南长沙410083;中南大学信息科学与工程学院,湖南长沙410083;中南大学信息科学与工程学院,湖南长沙410083;中南大学信息科学与工程学院,湖南长沙410083
【正文语种】中文
【中图分类】TN912.3
【相关文献】
1.改进小波阈值函数的语音增强算法研究 [J], 刘凤山;吕钊;张超;吴小培
2.基于改进的小波阈值函数语音增强方法 [J], 董胡;谭乔来
3.基于改进阈值函数小波语音增强方法的研究 [J], 刘佳林;孙旋
4.基于改进阈值函数小波语音增强方法的研究 [J], 刘佳林;孙旋
5.改进小波阈值函数在语音增强中的应用 [J], 卢勇
因版权原因,仅展示原文概要,查看原文内容请购买
基于小波包变换和小波阈值消噪的语音特征提取
( lcrncE p r n e t ,Y nh n Unvri E eto i x ei tC ne me r a s a ies y,Qih a g a 6 0 4,C ia) t n u n d o0 6 0 hn
A bsr c : Ai n tra ii g p n c c rc e xr ci n a to g rn ie b ck r un ta t mi g a e lzn ho i haa tre ta to tsr n e o s a go d,wa ee a k tTr nso m su e v ltp c e a fr wa s d, a d n
0 前
言
1 小 波 分 析
人 耳耳 蜗 内 的基 底 膜 , 其作 用 相 当 于一 组 建 立在 薄膜 振动 基础 上 的并 行 带 通滤 波 器 , 这些 滤 波 器 的脉 冲响 应保持 常 Q系 数 , 除 在 时 间 轴 上 平 移 外 , 波 即 滤 器 的 中心频 率 与带 宽之 比近似 不变 。这 一点 与小 波 的 计 算 特性相 似 , 小波 变 换 在 各 分 析 频 段 内 的 品质 因数
Ke y wor ds:wa eetp ck tta fr ;p nc c rc e xr cin; p o c de osn v l a e rnso m ho i ha a tr e ta t o h ni n iig; wa e e hr s o d de osng v ltt e h l n ii
基于最大信息熵的小波包阈值去噪语音增强算法
语音 增 强 的 目的就 是从 带有 噪声 的语 音 信号 中提 取 尽 可 能纯 净 的 原 始 语 音 , 高 信 噪 比 , 善 语 音 质 提 改 量 。人们 已提 出 了许 多 语 音增 强 的算 法 , 由于语 音 但 信 号本 身所 具有 的复 杂 性 和 非平 稳 性 , 之 噪 声 的 多 加 样性 , 些算 法 尚不 尽 如人 意 。 这 小 波变 换是 近 年来 发展 起来 的去 噪新 方 法 。利 用 信号 和 噪声 的小 波 系 数 在 各 尺 度上 不 同 的分 布 特 性 , 采取 阈值 的方 法 , 到 去 除噪声 的 目的 , 达 特别 适合 于 处
( 兰州交通大学 电子 与信 息工程学 院, 甘肃 兰州 7 0 7 ) 30 0
摘要 : 去噪 算 法在语 音 增 强 中 占有极 为 重要 的地 位 。而 传 统 的小 波 阈值 去噪 算 法会 不 可避 免 地 造 成部
分 有 用语 音信 号 的损 失 。为 了更好 地 对含噪 语 音信 号进行 去 噪 , 用小波 包分 析 法进行 语音 分 解 , 用 选 采 种新 的阈值 函数 , 同时基 于最 大信 息熵 的原理 确 定 了阈值 和加 权 阈值 函数 中的权 因子 。仿 真 结 果表
Ba e n a i u n o m a i n Ent o s d o M x m m I f r to r py
基于感知滤波器与统计方法的语音增强新算法
wa ee c e le a e n h ma a’ p r e ta h r ceitc n Bak d man;te h nmu me n s uaee rrlgs e t la l v ltpa k tftrb s d o u n e rs ec pu lc a a trsisi r o i i h n te mii m a q r ro —o p cr mpi a —
O 引言
目前 , 用 的 语 音 增 强 方 法 有 参 数 法 和 统 计 常
短 时 对 数 谱 幅 度 估 计 语 音 MM E L A( iiu en S —S m n m m a m sur e o— gset l m lu e q ae r r o c a a pi d )增 强 算 法 对 每 个 频 r l p r t
互 挪
邹德 密
洛 艳
醇 伟
ห้องสมุดไป่ตู้
( 河北省 测试计 量技 术及仪 器重 点 实验 室 , 北 秦皇 岛 0 60 ; 北建材 职业技 术学 院信 息机 电 系 , 北 秦 皇 岛 060 ) 河 60 4 河 河 6o4
摘
要 :根据人 耳感 知特 性 , 出 了一 种小 波包感 知滤 波器 与统计 方法相 结合 的语音 增强 新算法 。小 波包 感 知滤 波器 根据 人耳 Br 提 a k
td MMS —J u e( E I A)et t ni ma efrec rq ec ru .T egi q aino ep o ei se c ob smae n os hn t s si i s d a hf un ygo p h ane u t fh h nt p e ht eet tdadn i p oei ma o o e o t c i y c
小波包分解下的多窗谱估计语音增强算法
较大方差 的周期图功率谱估计 ,使得谱 减法在 去除背景噪声 的同时,随之带来 的令人厌恶的音乐噪声 。拟采 用多窗谱估 计替代周期 图进行功率谱估计 ,能降低功率谱 估计 的方差 , 最终达到能抑制音乐噪声的产生 ,提高谱估计质量 。 谱减法是基于 S F 的单一分辨率算法 ,且功率谱估计 TT 的方差较大 ,本文针对该问题 ,提出一种小波包分解下 的多
算法。将含噪语音在小波包下分解成 不同频 段 , 不 同频段下进行多窗谱谱减运算 ,并逐一进行小波包重构 ,以得到去噪后的语音信号 。 在
仿 真结果表明 ,该算法能提高含 噪语 音的信 噪比 ,降低语言失真度 。
关健 词 :谱减法 ;多窗谱 ;小波 包分解 ;噪声 ;信噪比
S ec p e h Enh n e e t g rt m f u tp eW i d w a c m n o ih 0 li l n o Al M
[ yw r s pcrlu t cin mut l wn o pcrm; vlt ak t eo oio ; os; in l i a oS ) Ke o d set br t ; lpe id w se t I as a o i u waee ce cmp sin n i Sg aNos R t (NR p d t e e i
DOI 1 .9 9 .s.0 03 2 .0 20 .9 : 03 6 /i n10 —4 82 1.50 0 js
基于无抽样小波包变换的语音增强方法
。
二
图
的局部示意图
丹
二 二 ,泣 护
君 ,
,
二办 护心
毋
, ,
wk.baidu.com
一 “
, ,己 ,
二
, … ,
于是基于无抽样离散小波包 的临界频带滤波器
各滤波器参数 见表 。
的取值参量
表 滤波器频带 序号 对应节点
, , , , , , ,
硒 各子带参数 甲 取值
, 二 一 二 , 二 一 二 , 二
收稿 日 期 伪一
软阑值的无穷阶可导的函数进行 阑值处理 ,进一步 采用用谱减法进行二次增强 。实验表明本文方法要 明显优于小波阑值法的去噪增强效果 。
无抽样 离散小波包的滤波器组实现
利用无抽样离散小波包变换 的树型结
构可以实现近似临界频带 的非均匀 滤波器组的设 计 ,在该滤波器组中各子带存在近似临界频带的掩 蔽效应 ,文献【 」 已证明该 滤波器组具有 近乎完美 的重构特性 。 针对采样频率为 语音信号 ,本文用 个 小波包树 结点来模 拟 滤波器 组 的各子带 ,此时 的 各子带的树型结构见图 。 为了简化 图 所示 各子带的树型结构 , 首先定义卷积运算符
频率 范围
一 一 一 一 一
一 一
二 , 二 一 ,护 二 , 二 ‘ 二
,
,尹 ,护 二
小波变换在音频处理中的应用
小波变换在音频处理中的应用引言:
音频处理是指对音频信号进行处理、分析和改变的过程。在音频处理中,小波
变换是一种重要的数学工具,它可以将音频信号分解成不同频率的成分,并提取出有用的信息。本文将探讨小波变换在音频处理中的应用。
一、小波变换的基本原理
小波变换是一种时频分析方法,它将信号分解成不同频率的成分,并提供了对
信号的时域和频域特征的描述。小波变换的基本原理是通过将信号与一组称为小波基函数的函数进行卷积运算,得到信号在不同频率和时间尺度上的表示。
二、小波变换在音频压缩中的应用
音频压缩是指通过减少音频信号的数据量,以减小存储空间和传输带宽的需求。小波变换在音频压缩中的应用主要体现在两个方面:编码和解码。
1. 编码
在音频压缩中,小波变换可以将音频信号分解成不同频率的成分,并根据其重
要性进行编码。较高频率的成分可以被舍弃或以较低精度表示,从而减少数据量。同时,小波变换还可以通过量化和编码技术进一步压缩数据,提高压缩效率。
2. 解码
在音频解码中,小波变换可以将压缩后的数据进行解码和恢复。通过逆小波变换,可以将压缩后的数据重新合成为原始的音频信号。解码过程中,可以根据需要选择不同的小波基函数和分解层数,以达到不同的音质和压缩比。
三、小波变换在音频增强中的应用
音频增强是指对音频信号进行处理,以提高音质和清晰度的过程。小波变换在
音频增强中的应用主要包括降噪和音频修复。
1. 降噪
在音频降噪中,小波变换可以将音频信号分解成不同频率的成分,并根据其能
量大小进行滤波。通过去除低能量的成分,可以减少噪音的影响,提高音频的清晰度和信噪比。
如何使用Matlab进行语音增强与去噪技术实现
如何使用Matlab进行语音增强与去噪技术实
现
引言:
语音增强与去噪技术是人工智能领域的一个重要研究方向,它涉及到许多实际
应用场景,如语音通信、语音识别、语音合成等。Matlab作为一种强大的科学计
算软件,具有丰富的信号处理工具箱,可以帮助研究人员实现语音增强与去噪技术。本文将介绍如何使用Matlab进行语音增强与去噪技术的实现,旨在帮助读者了解
语音增强与去噪技术以及如何利用Matlab进行研究与开发。
一、语音增强与去噪技术概述
语音的增强与去噪是一种信号处理技术,旨在改善语音信号的质量和清晰度。
常见的噪声包括环境噪声、机器噪声、通信信道噪声等。这些噪声会影响语音的识别和理解,因此去除噪声、增强语音的清晰度对于实际应用非常重要。
常用的语音增强与去噪技术包括:频域滤波法、小波变换法、自适应滤波法等。这些技术都有各自的特点和适用范围,可以根据实际情况选择合适的方法进行处理。其中,频域滤波法是一种较为常用的语音增强与去噪方法,它通过将语音信号从时域转换到频域,利用频域特性对噪声进行滤波,从而提升语音信号的清晰度和质量。
二、Matlab在语音增强与去噪中的应用
Matlab提供了丰富的信号处理工具箱,包括音频处理、滤波器设计、小波分析
等功能模块。这些功能模块可以帮助研究人员进行语音增强与去噪的研究与开发。
1. 音频处理
Matlab提供了音频处理工具箱,可以对语音信号进行读取、采样、播放等操作。使用Matlab读取语音信号后,可以对其进行时间域和频域的分析,了解信号的时
频特性。
2. 滤波器设计
语音增强与去噪中,滤波器是非常重要的工具。Matlab提供了滤波器设计工具箱,可以根据需要设计各种类型的滤波器,如低通滤波器、高通滤波器、带通滤波器等。这些滤波器可以根据实际需求对语音信号进行滤波处理,去除噪声、增强语音的清晰度。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
仪器仪 表学 报
Chinese Journal of Scientific Instrument
VoL 28 No.5 May 2007
结点阈值小波包变换语音增强新算法
王娜,郑德忠 (燕山大学电气工程学院秦皇岛066004)
摘 要:人耳频率分辨率是非线性的,而小波包算法有灵活的时频分析能力,可较好的模拟人耳基底膜的频率分析特性。本文
package decomposition
3 结点阈值小波语音增强新算法
基于阈值的小波域语音增强算法是一种直观而有效 的去噪方法。语音信号与噪声的小波变换呈现的特性截
954
仪器仪表学报
第2 8卷
然相反,语音信号的小波变换模值随小波尺度的增加而增
加,而噪声的模值随小波尺度增加而减小。这样,连续若
干次小波变换后,噪声所对应的小波变换系数基本去除或
fO.oV,0<厂<500
z={0.oovf+1.5,500≤f<1 220
(1)
t 61n f一32.6, f≥1 220
令小波多分辨分析中的滤波器系数分别为h孟和g孟,
f咖(右)=∑h孟dp(2t—k) I_哕(右)=∑g孟dp(2t一尼)
图1 Bark尺度小波包分解结构示意图
Fig.1 Decomposition structure of Bark--scaled wavelet package transform
进行Bark尺度小波包变换,采用结点阈值法进行阈值操
作,选取参数为。
噪声为白噪声时,进行了不同信噪比下的对比实验,对
比算法为R.Martin提出的谱减法。实验结果表明,信噪比
较高时,本文算法接近谱减法,而信噪比较低时则远远优于
谱减法。图3给出了信噪比为一5 dB时的实验结果。
1 ∞
≮
赵0
1吨nⅢ}
一1 O
收稿日期 万:方20数06-据06 Received Date:2006-06
结果中存在音乐噪声,因此达不到令人满意的效果。 MMSE和维纳滤波方法计算量适中,但没有提供在语音 信号的失真和残留噪声之间进行控制的机制。
基于小波变换的信号去噪是近年来发展起来的去噪 新方法,它利用信号和噪声的小波系数在各尺度上的不 同分布特性,采取阈值的方法,达到去除噪声的目的∞J。 常用的小波变换去噪法一刮以阈值的形式虽然可以对带 噪语音去除噪声,但去噪同时也丢失了大量语音清音信 息,严重影响了重建信号的质量。小波包变换是在小波 变换基础上进一步提出的,具有很好的频带划分功能。 文献[9—10]采用小波包变换对语音信号进行增强,但这 些方法是在高斯白噪声前提下提出的,具有很大局限性,
中图分类号:TN912.35 文献标识码:A
国家标准学科分类代码:510.4040
New algorithm for speech enhancement using node threshold wavelet packet transform
Wang Na,Zheng Dezhong (Department of Instrument Science,Yanshan University,Qinhuangdao 066004,China)
enhancement uUssiinngg
nnoodOee—ttrleresshnooll d wavelet
paacckKeett ttrraannssftooFin metno.. BarDlk一—
vais
peechpacket ≥thodpaper
。
""
scaled wavelet packet。 IS used for noisy speech decoommpIosition .and thiis meethod operates threshold at sub-band of speech
度。将估计得到的盯舶代人式(4)中,即得到结点阈值。
确定出每个结点的阈值后,采用软阈值方法进行阈
值处理u 3|,即: 万方数据
THR凡(x,人)={手n(x)(1
x
l-A),lI
xX
lI三::(9)
4 实验结果与分析
采用本文算法,对不同噪声环境下的多种语音样本
进行了反复试验,噪声类型和强度均是变化的。
(2)计算结点n处的归一化谱熵
B
Entropy(711)=∑P咖log P咖
(6)
(3)估计频谱强度和噪声标准差,确定结点阈值
利用直方图估计每一结点的频谱强度,并设辅助阈:
o(n)=Entropy(n)·NUM凡·卢
(7)
于是得到噪声标准差:
吒,孟=nb×W
(8)
式中:儿6为大于o(n)的直方条数目,w为直方条的宽
Abstract:The frequency resolution of human ear has non-linear characteristics。while wavelet packet transfonll has flexi一
^
1…
‘
‘
^
‘
‘
‘
^1
—
1‘
ble
t●ime 4requencv
图中针对8 kHz的采样信号,在原1 7个频带分解基 础上,对625 Hz以下频带和3 000~4 000 Hz频带进一步 分解,使其子带中心频率相差1/2 Bark,最终得到24个 子频带。(m,儿)表示对信号进行第m级分解得到的第儿 个结点。对16 kHz采样信号可在高频带做进一步分解。 图2是对应小波包分解得到的子带中心频率与人耳实际 特性的比较图,实线代表按式(1)得到的人耳bark—Hz曲 线;水代表本文提出的24子频带bark尺度小波包分解结 构。从图2中可见,采用的小波包很好地模拟了人耳听 觉特性。
耳Bark域频率频率感知特性相似的小波包分解结构,称之 为“Bark尺度小波包分解"。常规方法是模拟人耳的24个 频率群,对于8 kHz采样的语音信号,选取1至第17个频 率群,得到的每个子带的中心频率相差1 Bark。实验证实, 如果对Bark域进行更细致的划分,对语音的描述会更加细 致,也不会导致较大的计算量u1|。因此,本文提出一种新 的小波包分解结构,如图1所示。
●
●
1●
●
●
11
1
1
●
1
●
●
1●
nOUS nOlSe con(1ltlons.esoeelaLlV UnCIer cOlor noise ano non-statlonarV nOlSe con(1ltlons.
Key words:speech enhancement;Bark-scaled wavelet packet decomposition;node threshold;spectral entropy method
与实际应用环境并不符合,因此,本文采用谱熵法帕1估计
噪声,步骤如下:
(1)用小波包分解系数直方图估计每一终端结点的
频谱密度函数(设直方图中有B个直方条)
Pn,b=蒜,¨1,2,…,B
(5)
式中:儿配m砌为在直方条b中的小波系数C舶的数目,
NUM凡为该终端结点的系数总数目,n=1,2,…,24是结
点(.7,k)的序列号,按频率大小排列。
analvsis
abilitv SO
that
●
it
can
better
simulate
the Irequencv
analvsis
characteristics
ot
human
ear.In this
pal
.a
.
new
algornittnhmm。 is pDrroposseed
ftoort spoeeeecclh3
●
signal,uses soft threshold to deal with wavelet transform coefficients with different thresholds,and spectral entropy method
。
‘
。papplliieedd to estimate thee node noise . . 一 Experiments show t1h1at this allggoorriithmm hhlas good sppeech enhancement eftftects under va一一
1引
...:L一
目
由于环境的影响,语音识别系统不可避免的受到各 种噪声的污染,系统性能下降。为此,人们提出许多语音 增强算法来从带噪语音中尽可能地提取纯净的原始 语音。
一般来说,语音增强的方法分为2大类:时域方法 (如子空间法)u剖和频域方法(如谱减法旧J、最小均方误 差(MMSE)估计M1和卡尔曼滤波法∞1等)。时域方法一 般计算量较大,而频域法计算量较小,其中,谱减法是近 年来研究较多的方法,它具有计算量小的特点,但在处理
第5期
王娜等:结点阈值小波包变换语音增强新算法
953
在有色噪声和非平稳噪声条件下效果并不理想。本文采 用Bark尺度小波包对含噪语音进行分解,并提出一种新 的结点阈值算法,在语音信号的子带层次上进行阈值操 作。实验结果表明,该算法在多种噪声环境下均有较好 的语音增强效果。
2 Bark尺度小波包分解
卜(右)=在∑厄(尼)lZn(2t一尼)
N
墨
毒
I_配2州(右)=在∑厄(尼)lZn(2t一尼)
冀 o
if-
万方数据
图2 小波包分解对人耳Bark域频率描述的模拟示意图
Fig.2 Illustration of simulating Bark field frequency
●
●
●
,I
●
perception characterlstlc o土human ear using wavelet
2 ∞ ¥
._.…▲…■L..I一-一…~.
-一11 寇0
二1£衄l
一一_r。
-2
0
0.5
1
1.5
2
t|S
(d)谱熵法增强后的语音信号
(d)Enhancing speech with spectral entropy
图3信噪比为一5 dB的含白噪声的语音信号增强结果
Fig.3
Enhancement results of speech signal containing white noise while SNR is一一1气 I dB
提出了一种新的基于结点阈值的小波包变换语音增强算法。采用Bark尺度小波包对含噪语音进行分解,在语音信号的子带层
次上进行阈值操作,并采用软阈值方法进行阈值处理。采用谱熵法估计结点噪声。实验表明,该算法在多种噪声,尤其是有色
噪声和非平稳噪声条件下均有较好的语音增强效果。
关键词:语音增强;Bark尺度小波包分解;结点阈值;谱熵法
值,Ⅳ是语音信号的长度。
这种方法采用全局阈值,没有考虑到实际噪声在不
同尺度上的差别,这种全局阈值的设计显然不够合理。
因此,Johnstone等人提出了一种基于尺度的阈值方
法u2|,对不同尺度选取不同阈值,即人i=or"以In N, 盯i=MADJO.674 5,心Di是尺度.7上的各小波系数绝对
值的中值。
幅值很小,所余系数主要由语音信号控制。因此阈值法对
小波系数设置一个门限,仅利用超过门限的那些显著的小
波系数来重构语音信号,这样可较好地去除噪声。
常规小波阈值方法是在高斯白噪声前提下提出的,
在小波包分解情况下,阈值为人=叮以ln(儿l092 N),盯=
MAD/O.674 5,MAD是第一层小波系数的绝对值取中
纯净语音样本来源于安静环境下8 kHz采样的自然
连续语音,噪声来源于噪声数据包NoiseX92,选取了白噪
声(White)、F1 6战机噪声(F1 6)、粉色噪声(Pink)、工厂
噪声(Factoryl)和汽车噪声(Car)。通过改变噪声强度,
构造不同信噪比的含噪语音。采用5阶Daubechies小波
—IJ_● L.
—__1I
O.5
一
1
1.5
t/s
_o r。
(a)原始纯净语音信号 (a)Pure speech signal
_ _
2
5 ∞ ≮
越0
1衄
-£=L
-5 O
O.5
1
1.5
2wenku.baidu.com
t/s
(b)信噪比为一5 dB的带噪语音信号
(b)Speech signal with SNR is-5 dB
t/s
(c)谱减法增强后的语音信号 (c)Enhancing speech with spectral subtraction
本文在上述研究的基础上提出了一种新的阈值选取
方法,称之为“结点阈值法",它是对每个小波包树的终
札=吒,孟痂 端结点应用不同的阈值,表示为:
(4)
式中:盯舶是小波包树终端结点(歹,k)处的噪声标准差。
这种阈值取法突破了高斯白噪声和平稳噪声的局限性。
在上述各种阈值中,都存在噪声标准差盯的估计问
题。传统的MAD估值方法是在高斯噪声前提下提出的,