一种基于最小能量统计的语音增强改进算法
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
甓
文章 编 号 :0 2 8 8 ( 02 0- 0 1 0 10 - 64 2 1 )9 04 - 3
⑥ 可嗡0U 6 @闶 @ 语技 ∽ ⑧ @⑥ 音增强改进算法 木・文 论・
翟士奇, 卢 晶 , 海 山 邹
( 南京大学
声 学研究所 , 江苏 南京
【 yw r s pehe hne etset m sm tn nn— ttn r n i Ke o d]sec n acm n;pc u et a o ;o s i a o e r i i ao y s
1 引言
语 音是人 类信 息 交 流 的 重要 载体 , 是 数字 通 也 信 领域传输 的主要 内容 。但在 实 际 的通 信 系统 使用 过程中, 语音信 号往 往会 受 到各种 噪 声 的干扰 , 包括 环境噪声 、 传输设 备 内部 电噪声 等 。严重 的噪声 干扰
p w re t t n s h me i i r v d b sn eib e n iefa ee t n meh d T ee p rme t e u t h w h t h o e s mai c e s mp o e y u i g a rl l os r me d tci t o . h x e i o a o i n s l s o st a e r t p o o e to a r c h a a in o e n ief o f c e t r p s d meh d c n t e t ev r t ft os o re in l a i o h l i y,a d la oa mp o e p e h e h n e n e ut n e d t n i rv d s e c n a c me tr s l .
经验 l 生的设置往 往不 够准 确 和灵 活。笔者 就 此 问题
会极大降低语音的清晰度及可懂度, 造成语音通信质
量 的下 降。 语音增 强 是 降 低 语 音 信 号 噪声 干 扰 的有 效 手 段, 其主要 目的就 是从带 噪语音 中提取 出较纯净 的原 始语音 , 高信 噪 比 , 噪声影 响 , 提 降低 从而提高语 音清 晰度 和可懂度 。常 用 的语 音 增强 方法 有 时域及 频 域
20 9 ) 10 3
【 摘
要】针对基 于最小能量统计的语 音增 强算法 , 可靠的噪声段检测方 法对噪声谱估计流 程进行 改进 , 用 提升 噪
声谱 幅度估计 的准确度 。实验表 明, 此方 法能有效地追踪背景噪声 的变化情况, 进而提升语音增 强的效果。
【 关键词 】语音增强; 谱估计; 非稳态噪声 【 中图分 类号 】T 92 N 1 【 文献标识码 】A
ZHAIS i i U Jn h q ,L ig,Z i a OU Has n h
An I r v d S e c h n e e tAlo ih Ba e n M i i m t tsis mp o e p e h En a c m n g rt m s d o n mu S a it c
展开研 究 , 通过引 入保守 的有音 无音 检测 ( oc c Vi A- e
t i e ci , A 算 法 ( 文 称 为 噪声 段 检 测 算 i t D t t n V D) vy e o 本 法 )准确 检测 出纯 噪声段 并利 用噪 声段 能量 统计 结 ,
两种 , 时域方法 有基 于参 数 和模 型的方 法 、 空 间 子
方法等 ; 频域方法 中应用较 多的是基于短 时谱估 计 的 语音增强 , 括谱 减法 、 包 维纳滤波 法 、 基于统计模 型 的 短时谱估计 法等 。其 中谱减法 由于算法 简单 , 算 复 计
杂度低 , 易于实时实现 , 得到 了较 为广泛 的应用 。
增强语音 带来 额外 的音 乐 噪声 。 由 Y r p rm 和 ai E ha v i
Dv l ai Ma h提 出 的 最 小 均 方 误 差 ( nm m M a d a Miiu en
Sur r rM E 语音增 强方法 , 音 短时谱 qaeEr , MS ) o 对语 分布提 出一种假设 的概率分 布模型 , 并针对特 定 的失 真准则 和后验概率不敏 感特性 , 最终估计 出纯 净语音 短 时谱 。最小均方 误差 语音 增强 可 以有效 地 降低音 乐 噪声 的影 响 , 用 信 噪 比范 围较 广 , 计 算 量 较 适 但 大 _ 。Mat 出的一 种基 于最 优 平 滑和 最小 能量 3 j rn提 i 统计 的噪声 估计 方 法 得 到广 泛 认 可 , 方 法 核 心 该 原理是基 于最优平 滑算 法在 一段 时 间 内搜 索 带噪语 音频谱最 小值 , 从而得到 噪声谱 估计值 。这种 方法在 有音无 音段均可 以更新 估计噪声谱数据 , 适用 于非 并 平稳 噪声 情况 以及较 低信 噪 比环境 。但 由于 搜索 频 带所得 到 的频谱最小值 要小于实 际噪声谱 , 以需 要 所 设定一个 偏差补偿 系数 来使其接近实 际噪声 , 但这 种
(ntu f cut s N nigU i r t, aj g 10 3 C ia Istt o A osc , aj n esy N ni 0 9 , hn ) ie i n v i n2
【 btat nipoe pehehn e n lo tm bsdo nm m s t tsi pooe i pprT eni A s c】A rvdsec nacmet grh ae nmi u t ii s r sdi t s ae. h os r m a i i asc p nh e
文章 编 号 :0 2 8 8 ( 02 0- 0 1 0 10 - 64 2 1 )9 04 - 3
⑥ 可嗡0U 6 @闶 @ 语技 ∽ ⑧ @⑥ 音增强改进算法 木・文 论・
翟士奇, 卢 晶 , 海 山 邹
( 南京大学
声 学研究所 , 江苏 南京
【 yw r s pehe hne etset m sm tn nn— ttn r n i Ke o d]sec n acm n;pc u et a o ;o s i a o e r i i ao y s
1 引言
语 音是人 类信 息 交 流 的 重要 载体 , 是 数字 通 也 信 领域传输 的主要 内容 。但在 实 际 的通 信 系统 使用 过程中, 语音信 号往 往会 受 到各种 噪 声 的干扰 , 包括 环境噪声 、 传输设 备 内部 电噪声 等 。严重 的噪声 干扰
p w re t t n s h me i i r v d b sn eib e n iefa ee t n meh d T ee p rme t e u t h w h t h o e s mai c e s mp o e y u i g a rl l os r me d tci t o . h x e i o a o i n s l s o st a e r t p o o e to a r c h a a in o e n ief o f c e t r p s d meh d c n t e t ev r t ft os o re in l a i o h l i y,a d la oa mp o e p e h e h n e n e ut n e d t n i rv d s e c n a c me tr s l .
经验 l 生的设置往 往不 够准 确 和灵 活。笔者 就 此 问题
会极大降低语音的清晰度及可懂度, 造成语音通信质
量 的下 降。 语音增 强 是 降 低 语 音 信 号 噪声 干 扰 的有 效 手 段, 其主要 目的就 是从带 噪语音 中提取 出较纯净 的原 始语音 , 高信 噪 比 , 噪声影 响 , 提 降低 从而提高语 音清 晰度 和可懂度 。常 用 的语 音 增强 方法 有 时域及 频 域
20 9 ) 10 3
【 摘
要】针对基 于最小能量统计的语 音增 强算法 , 可靠的噪声段检测方 法对噪声谱估计流 程进行 改进 , 用 提升 噪
声谱 幅度估计 的准确度 。实验表 明, 此方 法能有效地追踪背景噪声 的变化情况, 进而提升语音增 强的效果。
【 关键词 】语音增强; 谱估计; 非稳态噪声 【 中图分 类号 】T 92 N 1 【 文献标识码 】A
ZHAIS i i U Jn h q ,L ig,Z i a OU Has n h
An I r v d S e c h n e e tAlo ih Ba e n M i i m t tsis mp o e p e h En a c m n g rt m s d o n mu S a it c
展开研 究 , 通过引 入保守 的有音 无音 检测 ( oc c Vi A- e
t i e ci , A 算 法 ( 文 称 为 噪声 段 检 测 算 i t D t t n V D) vy e o 本 法 )准确 检测 出纯 噪声段 并利 用噪 声段 能量 统计 结 ,
两种 , 时域方法 有基 于参 数 和模 型的方 法 、 空 间 子
方法等 ; 频域方法 中应用较 多的是基于短 时谱估 计 的 语音增强 , 括谱 减法 、 包 维纳滤波 法 、 基于统计模 型 的 短时谱估计 法等 。其 中谱减法 由于算法 简单 , 算 复 计
杂度低 , 易于实时实现 , 得到 了较 为广泛 的应用 。
增强语音 带来 额外 的音 乐 噪声 。 由 Y r p rm 和 ai E ha v i
Dv l ai Ma h提 出 的 最 小 均 方 误 差 ( nm m M a d a Miiu en
Sur r rM E 语音增 强方法 , 音 短时谱 qaeEr , MS ) o 对语 分布提 出一种假设 的概率分 布模型 , 并针对特 定 的失 真准则 和后验概率不敏 感特性 , 最终估计 出纯 净语音 短 时谱 。最小均方 误差 语音 增强 可 以有效 地 降低音 乐 噪声 的影 响 , 用 信 噪 比范 围较 广 , 计 算 量 较 适 但 大 _ 。Mat 出的一 种基 于最 优 平 滑和 最小 能量 3 j rn提 i 统计 的噪声 估计 方 法 得 到广 泛 认 可 , 方 法 核 心 该 原理是基 于最优平 滑算 法在 一段 时 间 内搜 索 带噪语 音频谱最 小值 , 从而得到 噪声谱 估计值 。这种 方法在 有音无 音段均可 以更新 估计噪声谱数据 , 适用 于非 并 平稳 噪声 情况 以及较 低信 噪 比环境 。但 由于 搜索 频 带所得 到 的频谱最小值 要小于实 际噪声谱 , 以需 要 所 设定一个 偏差补偿 系数 来使其接近实 际噪声 , 但这 种
(ntu f cut s N nigU i r t, aj g 10 3 C ia Istt o A osc , aj n esy N ni 0 9 , hn ) ie i n v i n2
【 btat nipoe pehehn e n lo tm bsdo nm m s t tsi pooe i pprT eni A s c】A rvdsec nacmet grh ae nmi u t ii s r sdi t s ae. h os r m a i i asc p nh e