ch12语音增强.ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
X (e j ) 2 D(e j ) 2
D(e j )
DF d (n) 纯T噪声
e j arg( X (e j ))
X (e j ) 2 D(e j ) 2 S(e j )
原始语音谱幅度的估值
原始语音的频谱的估值 S(e j ) e jarg(X (ej )) IDFT
s(n)
谱相减法的基本原理(文字描述)
将含噪语音信号和有声/无声判别得到的纯 噪声信号进行DFT变化,从含噪语音幅度谱的 平方中减去纯噪声的幅度谱的平方,然后开方, 得原始语音谱幅度的估值,再借用含噪语音的 相位,进行IDFT变化,得到增强的语音。
2. 谱相减法的数学推导
首先假设语音和噪声信号是线性叠加的,且语 音和噪声是平稳的,噪声与语音信号不相关。
Original speech
compression
Fading Channel degraded speech
Enhancement restored speech
二、语音增强的意义
保证通信的正常进行,需要语音增强。
1.日常生活中,经常会遇到在噪声干扰下进行 语音通信的问题。例如在汽车、火车上使用移 动电话,马路旁和市场里的公用电话等。
三、噪声的分类
1.噪声是扣除被测信号真实值后的各种测量值, 可能来自外界环境、物理系统、操作人员等。广 义将噪声称为干扰。
2.按性质分为:脉冲噪声(爆炸、撞击和放电);周 期性噪声(如交流电的干扰); 平稳噪声(如白噪 声)和非平稳噪声(如色噪声);按噪声和信号相 关的性质分为加性噪声和乘性噪声。
Background Noise
speec s(n) nhoise d (n)
x(n)
noisy speech Speech
enhancemen t
x(n) s(n) d(n)
Estimate the noise component from the noisy speech
Multi-Speaker:
0
-0. 2
-0. 4
-0. 6
-0. 8 0
1
2
3
4
5
6
7
8
9
x
10 4
10
0. 5
0. 4
asfradio.wav
0. 3 0. 2 0. 1
0
-0. 1
-0. 2
-0. 3
-0. 4 0
1
2
3
4
5
6
7
x
8 4 10
0. 8
0. 6
0. 4
asfsportscar.wav
0. 2 0
-0. 2
-0. 4
我们研究的噪声是声音的一种,它具有声波的一 切特性,称之为声噪声。
Impulsive noise
white noise
pink noise
brown noise
White noise1
White noise2 White noise1White noise2
0. 6
aeciphone.wav
0. 4 0. 2
-0. 6
-0. 8 0
2
4
6
8
10
x
12 4
10
0. 5
0. 4
rnfmusic.wav
0. 3 0. 2 0. 1
0
-0. 1
-0. 2
-0. 3
-0. 4
-0. 5 0
0. 6
asfalarm.wav
0. 4 0. 2
0
-0. 2
-0. 4
-0. 6
-0. 8 0
1 0. 8
rnfwailsiren.wav 0.6 0. 4 0. 2 0 -0. 2 -0Biblioteka Baidu 4 -0. 6 -0. 8 0
x(n) s(n) d (n) X (e j ) S (e j ) D(e j )
X (e j )gX * (e j ) S (e j ) D(e j )gS (e j ) D(e j )* X (e j ) 2 S (e j )gS*(e j ) S (e j )gD*(e j ) D(e j )gS*(e j ) D(e j )gD*(e j ) X (e j ) 2 S (e j ) 2 D(e j ) 2 S (e j )gD*(e j ) D(e j )gS *(e j )
cocktail party effect
y(n) s1(n) s2 (n) s3(n)
Speaker 1 Speaker 2 Speaker 3
Blind source separation: Separate one speech source from another
Channel Impairment
第12章 语音增强技术 (Speech Ehancement )
§12.1 语音增强技术的基本知识 §12.2 语音增强的原理和方法
§12.1 语音增强技术的基本知识
一、语音增强的定义 二、语音增强的意义 三、噪声的分类
一、语音增强的定义
语音增强是指当语音信号被各种各样的噪声干 扰、甚至淹没后,从噪声背景中提取有用的语音 信号,抑制、降低噪声干扰的技术。一句话,从 含噪语音中提取尽可能纯净的原始语音。
1
2
3
4
5
6
x
7 104
2
4
6
8
10
x
12 4
10
1
2
3
4
5
6
7
x
8 4 10
§12.2 语音增强的原理和方法
一、频域语音增强技术 二、时域语音增强技术 三、时频语音增强技术 四、麦克风阵列语音降噪技术
一、频域语音增强技术(宽带噪声)
是语音信号中的一种重要技术,由于其原理简单所 以被广泛使用,如手机中的降噪处理就是采用的此方 法,其中谱相减法是频域语音增强技术的常用方法。
2. 军事通信中,指挥员的作战命令和战斗员的 战情汇报都需要用语言来表达,由于战斗环境 恶劣,特别是炸弹产生的冲击性噪声,使有用 信号完全淹没在噪声中。
(3)侦听技术中需要语音增强
(4)语音识别技术需要语音增强
在实际生活中,语音信号无时无地不受各种噪声 干扰。人们正常的生活环境就是一个声级为60dB左 右的噪声环境。被强噪声污染的场合,噪声达 120dB以上。
1. 谱相减法(Spectral Subtraction)的基本原理 2. 谱相减法的数学推导 3. 谱相减法的特点 4. 改进的谱相减算法
1. 谱相减法的基本原理(流程图描述)
x(n) s(n) d(n)
x(n) DFT X (ej )
+
X (e j ) 2
- D(e j ) 2
含噪 语音
插入相位
对上式两边取数学期望有:
E
X
(e
j
)
2
E
S (e
j
)
2
E
D(e
j
)
2
E S(e j )gD*(e j ) E D(e j )gS*(e j )