第八章 语音增强

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2. 人耳掩蔽效应:产生一个声音由于另外一个声音的出 现而导致该声音能被感知的阈值提高的现象。
语音增强的最终效果度量是人耳的主观感觉,所以在语 音增强中可以利用人耳感知特性来减少运算代价。
6
三、 噪声特性
1. 加性噪声:冲激噪声、周期噪声、宽带噪声、语音 干扰噪声等
2. 非加性噪声:残响及传输网络的电路噪声(非加性 噪声往往可以通过某种变换转为加性噪声)
|S'(ejw)|
ejarg(X(jw))
原始语音谱幅度的估值
IDFT
s'(n)
13
1.减谱法的基本原理描述
将含噪语音信号和有声/无声判别得到的纯 噪声信号进行DFT变化,从含噪语音谱幅度的 平方中减去纯噪声的谱幅度的平方,然后开方, 得原始语音谱幅度的估值,再借用含噪语音的 相位,进行IDFT变化,得到增强的语音。
2
8.1 概述
二、语音增强的意义 1. 日常生活中,经常会遇到在噪声干扰下进
行语音通信的问题。例如在汽车、火车上使用 移动电话,旁人的喧闹声,马路旁和市场里的 公用电话等。
2. 军事通信中,指挥员的作战命令和战斗员 的战情汇报都需要用语音来表达,由于战斗环 境中的声环境恶劣,特别是炸弹产生的冲击性 噪声,使有用信号完全淹没在噪声中。
14
蓝色为原始含噪语音 黄色为减谱法处理的结果
15
3、时频语音增强技术
为了达到更好的消噪效果,可将自适应消噪 技术和谱相减结合起来。
主输入信号 自 适
参考信号



谱 相 增强语音 减 消 噪
16
原始含 噪语音
基本自适 应抗噪输 出结果
自适应 抗噪与谱 相减相结 合后的输 出结果
0.6 0.4 0.2
8
噪声源和噪声环境 声压/Pa 声压级/dB
飞机附近
200
பைடு நூலகம்140
织布车间
20
100
地铁
0.63
90
繁华街道
0.063 70
普通谈话
0.02
60
安静房间
0.002 40
耳语
0.00063 30
树叶沙沙声
0.0002 20
农村静夜
0.000063 10
听阈
0.00002 0
9
通过语音增强技术来改善语音质量的过程如下图所示
IDFT
增强 语音
11
2 自适应滤波器 自适应滤波器能有效地在未知环境中跟踪时变的
输入信号。使输出信号达到最优,所以可以用来构 成自适应的噪声消除器。
12
二、减谱法语音增强技术
含噪 语音
DFT |X(ejw)|
x(n)=s(n)+d(n)
2+
- 平方
纯噪 DFT 声
|D'(ejw)|
d'(n)
插入 相位
0 -0.2 -0.4 -0.6 -0.8
0
0 .5
1
1.5
2
2 .5
3
3.5
4
x 10
17
看,浊音(包括元音)具有明显的准周期性和 较强的振幅,清音类似白噪声并有较弱的振幅。 3. 语音信号短时谱的统计特性在语音增强中有着 举足轻重的作用。(据中心极限定理,语音的 短时谱的统计特性服从高斯分布。)
5
二、 人耳感知特性
1. 对于声波频率高低的感觉与实际频率的高低不呈线性 关系,而近似为对数关系;对频率的分辨能力受声强 的影响;对语音信号的幅度谱较为敏感,对相位不敏 感。
3
(3)窃听技术中需要语音增强 (4)语音识别技术需要语音增强
在实际生活中,语音信号无时无地不受各种噪声 干扰。人们正常的生活环境就是一个声级为60dB左 右的噪声环境。被强噪声污染的场合,噪声达 120dB以上。
4
8.2语音特性、人耳感知特性及噪声特性
一、 语音特性
1. 语音信号的短时平稳特性。 2. 语音包含元音和辅音两种音素:从时域波形上
第八章 语音增强
8.1 概述 8.2 语音特性、人耳感知特性及噪声特性 8.3 语音增强的原理和方法
1
第八章 语音增强
8.1 概述 一、语音增强的定义
语音增强是指当语音信号被各种各样的噪声干 扰、甚至淹没后,从噪声背景中提取有用的语音 信号,抑制、降低噪声干扰的技术。一句话,从 含噪语音中提取尽可能纯净的原始语音。
7
四、噪声的度量
声压、声强和声功率 (1)声压级(SPL):Lp=20lg(P/P0) P0=20uPa 声压就是有声波存在时,在单位面积上大气压的变化 部分 ,最弱的声音声压为0.00002 Pa,最强的声音 的声压为20 Pa。 (2)声强级:LI=20lg(I/I0) I0=1012W/m2 声强是指单位面积上通过多少瓦的声能,单位是 W/m2(瓦/平方米)。 (3)声功率级:Lw=20lg(W/W0) W0=1012W 声功率是指声源在单位时间内向外辐射出的总声能
滤波法 自相关抗噪法 非线性处理法 减谱法 Weiner滤波法
10
8.3 语音增强的原理和方法
一、滤波法语音增强技术 1 陷波器法
对于周期噪声采用陷波器是比较简便和有效的方 法,设计的陷波器的幅频曲线的凹处对应于周期噪声 的基频和各次谐波,并使这些频率处的限波宽度足够 窄。
带噪
语音
DFT
频谱整形器
相关文档
最新文档