语音信号特征提取技术
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.共振峰估计
共振峰:共振峰是指在声音的频谱中能量相对集中的一些区域,共振峰 不但是音质的决定因素,而且反映了声道(共振腔)的物理特征。声音 在经过共振腔时,受到腔体的滤波作用,使得频域中不同频率的能量重 新分配,一部分因为共振腔的共振作用得到强化,另一部分则受到衰减, 得到强化的那些频率在时频分析的语图上表现为浓重的黑色条纹。由于 能量分布不均匀,强的部分犹如山峰一般,故而称之为共振峰。 频带宽度:简称为“带宽”,有时称必要带宽,是传送模拟信号时的 信号最高频率与最低频率之差。
4.比例法
在噪声情况下,信号的短时能量和短时过零率会发生变化,严重时会影响端点 检测性能。
实验表明,在语音中,说话区间能量的数值大,而过零率数值低;在噪声区间能 量的数值小,而过零率数值大; 所以,把能量值除以过零率的值,则可以更突出说话区间,从而更容易检测出语 音端点;
2.基音周期估计
基音:一般的声音都是由发声体发出的一系列频率、振幅各不相同的振动复合 而成的。这些振动中有一个频率最低的振动,由它发出的音就是基音,其余为 泛音; 基音周期:声带振动频率的倒数; 由于汉语是一种有调语言,基音的变化模式称为声调,它携带着非常重要的具 有辨意作用的信息,有区别意义的功能,所以,基音的提取和估计对汉语更是 一个十分重要的问题。
基音提取与估计方法:
1.自相关法 2.平均幅度差函数法 3.倒谱法 4.基音检测的后处理
1.自相关法
语音信号是非平稳的信号,所以对信号的处理都使用短时自相关函数; 短时自相关函数是在信号的第N个样本点附近用短时窗截取一段信号,做自相关 计算所得的结果:
m表示窗函数是从第m点开始进入
由第四章分析可知: 浊音信号的自相关函数在基音周期的整数倍位置上出现峰值, 而清音的自相关函数没有明显的峰值出现; 因此检验是否有峰值就可以判断是清音或浊音; 检测峰值的位置就可以提取基音周期值。
共振峰参数包括共振峰频率和频带宽度,它是区分不同 韵母的重要参数。 精确的共振峰估值是很困难的(原因:虚假峰值、共振 峰合并、高音调语音),为提高估值精度,常用的解决 方法有:1.带通滤波器组法 2.倒谱法 3.线性预测编码 法……
thanks
3.谱熵法
熵:信息的有序程度; 谱熵语音端点检测方法是通过检测谱的平坦程度,从而达到语音端点检测的 目的; 实验中发现语音的熵与噪音的熵存在较大差异,语音信号的谱熵值一般都低 于噪声的谱熵值
谱熵函数绘制的噪音谱(左)和语音谱(右):
谱熵函数可以很方便的描述谱的平坦特性。噪声谱较为平坦, 谱熵较大;语音谱与之相反,谱熵大的为噪声,小的为语音;
3.倒谱法
倒频谱:倒频谱,就是对功率谱的对数值进行傅立叶逆变换,将复杂的卷积关系 变为简单的线性叠加,从而在其倒频谱上可以较容易地识别信号的频率组成分量, 便于提取所关心的频率成分,较准确地反映故障特性。 声门激励信号:是肺部气流冲击声带产生的,是语音的源信号。直接使用音源对 信号做进一步的处理,可以不受声带共振峰的影响,其处理的结果可以更准确的
反映语音的本质特性。
倒谱法是传统的基音周期检测算法之一,它利用语音信号的倒频 谱特征,检测出表征声门激励周期的基音信息。
浊音语音的复倒谱中存在峰值,其出现时间等于基音周期; 而清音语音段的复倒谱则不出现这种峰值。利用这一性质可以进 行清/浊音判断并估计浊音的基音周期。
4.基音检测的后处理
无论采用哪一种基音检测算法都可能产生基音检测错误,使求得的基音 周期轨迹中有一个或几个基音周期估值偏离了正常轨迹,为了去除这些 偏离点,可以采用各种平滑算法,其中最常用的是中值平滑算法和线性 平滑算法。
2.平均幅度差函数法 语音信号的短时Fra Baidu bibliotek均幅度差函数定义为:
与短时自相关函数一样,对周期性的浊音语音,Fn(k)也呈现与浊音 语音周期相一致的周期特性,因而可以通过Fn(k)的计算同样可以来 确定基音周期,但对于清音语音信号,却没有这种周期特性。利用这种 特性,可以判断一段语音是浊音还是清音,并估计浊音语音的基音周期.
它可以用来区分静音和清音;
将两种检测结合起来,就可以检测出语音段(清音与 浊音)与静音段,从而识别出语音信号的端点。
2.自相关法
语音信号xn(m)短时自相关函数Rn(k)的计算公式:
含噪语音和纯噪声语音的自相关函数的波形图:
根据噪音情况,设置两个阈值T1和T2,当相关函数最大值大于T2时,判定为 语音;当相关函数最大值大于或小于T1时,判定为语音信号的端点。
语音信号特征提取技术
王忠臣 2017.12.19
端点检测
1.定义: 指从一段语音信号中准确的找出语音信号的起始点与结束点; 2.目的: 使有效的语音信号和无用的噪音信号分离; 3.应用范围: 语音识别、语音增强、语音编码、回声抵消……
(2)短时过零率
短时过零率表示一帧语音中语音信号波形穿过横轴(零电平)的次数。