ch12语音增强.ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0
-0. 2
-0. 4
-0. 6
-0. 8 0
1
2
3
4
5
6
7
8
9
x
10 4
10
0. 5
0. 4
asfradio.wav
0. 3 0. 2 0. 1
0
-0. 1
-0. 2
-0. 3
-0. 4 0
1
2
3
4
5
6
7
x
8 4 10
0. 8
0. 6
0. 4
asfsportscar.wav
0. 2 0
-0. 2
-0. 4
X (e j ) 2 D(e j ) 2
D(e j )
DF d (n) 纯T噪声
e j arg( X (e j ))
X (e j ) 2 D(e j ) 2 S(e j )
原始语音谱幅度的估值
原始语音的频谱的估值 S(e j ) e jarg(X (ej )) IDFT
s(n)
谱相减法的基本原理(文字描述)
2. 军事通信中,指挥员的作战命令和战斗员的 战情汇报都需要用语言来表达,由于战斗环境 恶劣,特别是炸弹产生的冲击性噪声,使有用 信号完全淹没在噪声中。
(3)侦听技术中需要语音增强
(4)语音识别技术需要语音。人们正常的生活环境就是一个声级为60dB左 右的噪声环境。被强噪声污染的场合,噪声达 120dB以上。
-0. 6
-0. 8 0
2
4
6
8
10
x
12 4
10
0. 5
0. 4
rnfmusic.wav
0. 3 0. 2 0. 1
0
-0. 1
-0. 2
-0. 3
-0. 4
-0. 5 0
0. 6
asfalarm.wav
0. 4 0. 2
0
-0. 2
-0. 4
-0. 6
-0. 8 0
1 0. 8
rnfwailsiren.wav 0.6 0. 4 0. 2 0 -0. 2 -0. 4 -0. 6 -0. 8 0
1. 谱相减法(Spectral Subtraction)的基本原理 2. 谱相减法的数学推导 3. 谱相减法的特点 4. 改进的谱相减算法
1. 谱相减法的基本原理(流程图描述)
x(n) s(n) d(n)
x(n) DFT X (ej )
+
X (e j ) 2
- D(e j ) 2
含噪 语音
插入相位
cocktail party effect
y(n) s1(n) s2 (n) s3(n)
Speaker 1 Speaker 2 Speaker 3
Blind source separation: Separate one speech source from another
Channel Impairment
1
2
3
4
5
6
x
7 104
2
4
6
8
10
x
12 4
10
1
2
3
4
5
6
7
x
8 4 10
§12.2 语音增强的原理和方法
一、频域语音增强技术 二、时域语音增强技术 三、时频语音增强技术 四、麦克风阵列语音降噪技术
一、频域语音增强技术(宽带噪声)
是语音信号中的一种重要技术,由于其原理简单所 以被广泛使用,如手机中的降噪处理就是采用的此方 法,其中谱相减法是频域语音增强技术的常用方法。
对上式两边取数学期望有:
E
X
(e
j
)
2
E
S (e
j
)
2
E
D(e
j
)
2
E S(e j )gD*(e j ) E D(e j )gS*(e j )
第12章 语音增强技术 (Speech Ehancement )
§12.1 语音增强技术的基本知识 §12.2 语音增强的原理和方法
§12.1 语音增强技术的基本知识
一、语音增强的定义 二、语音增强的意义 三、噪声的分类
一、语音增强的定义
语音增强是指当语音信号被各种各样的噪声干 扰、甚至淹没后,从噪声背景中提取有用的语音 信号,抑制、降低噪声干扰的技术。一句话,从 含噪语音中提取尽可能纯净的原始语音。
三、噪声的分类
1.噪声是扣除被测信号真实值后的各种测量值, 可能来自外界环境、物理系统、操作人员等。广 义将噪声称为干扰。
2.按性质分为:脉冲噪声(爆炸、撞击和放电);周 期性噪声(如交流电的干扰); 平稳噪声(如白噪 声)和非平稳噪声(如色噪声);按噪声和信号相 关的性质分为加性噪声和乘性噪声。
x(n) s(n) d (n) X (e j ) S (e j ) D(e j )
X (e j )gX * (e j ) S (e j ) D(e j )gS (e j ) D(e j )* X (e j ) 2 S (e j )gS*(e j ) S (e j )gD*(e j ) D(e j )gS*(e j ) D(e j )gD*(e j ) X (e j ) 2 S (e j ) 2 D(e j ) 2 S (e j )gD*(e j ) D(e j )gS *(e j )
Original speech
compression
Fading Channel degraded speech
Enhancement restored speech
二、语音增强的意义
保证通信的正常进行,需要语音增强。
1.日常生活中,经常会遇到在噪声干扰下进行 语音通信的问题。例如在汽车、火车上使用移 动电话,马路旁和市场里的公用电话等。
Background Noise
speec s(n) nhoise d (n)
x(n)
noisy speech Speech
enhancemen t
x(n) s(n) d(n)
Estimate the noise component from the noisy speech
Multi-Speaker:
将含噪语音信号和有声/无声判别得到的纯 噪声信号进行DFT变化,从含噪语音幅度谱的 平方中减去纯噪声的幅度谱的平方,然后开方, 得原始语音谱幅度的估值,再借用含噪语音的 相位,进行IDFT变化,得到增强的语音。
2. 谱相减法的数学推导
首先假设语音和噪声信号是线性叠加的,且语 音和噪声是平稳的,噪声与语音信号不相关。
我们研究的噪声是声音的一种,它具有声波的一 切特性,称之为声噪声。
Impulsive noise
white noise
pink noise
brown noise
White noise1
White noise2 White noise1White noise2
0. 6
aeciphone.wav
0. 4 0. 2