基音周期估计-共振峰估计-小结
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
语音的多级小波变换
• 在基音检测中应用的小波一般采用二进小波变换; • 可以采用Gaussian函数作为小波函数。
一帧语音的多级小波变换示例
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
3 LPC法估计
• 从线性预测导出的声道滤波器是频谱包络估计器的最新 形式,线性预测提供了一个优良的声道模型(条件是语音 不含噪声)。尽管线性预测法的频率灵敏度和人耳不相匹 配,但它仍是最廉价、最优良的行之有效的方法。 • • 求根法:计算全极点模型分母多项式A(z)的根; DFT法:求A(z)的离散频率响应A(k)的谷点来得到共振
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
带通滤波器组法提取共振峰
带通滤波器组法估计共振峰系统结构示意图。
滤波器组 检测与平滑
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
2 倒谱法
虽然可以直接对语音信号求离散傅里叶变换(DFT),然 后用DFT谱来提取语音信号的共振峰参数。但是,直接DFT 的谱要受基频谐波的影响,最大值只能出现在谐波频率上, 因而共振峰测定误差较大。 为了消除基频谐波的影响,可以采用同态解卷技术,经 过同态滤波后得到平滑的谱,这样简单地检测峰值就可以直 接提取共振峰参数,因而这种方法更为有效和精确。
语音信号的短时平均幅度差函数(AMDF)Fn(k)定义为:
Fn (k ) =
N − k −1 m=0
∑
S n ( m + k ) − S n ( m)
Fn(k)在周期的各个整数倍点上具有谷值特性,类似 于短时自相关函数的峰值特性,因而通过Fn(k)的计算同
样可以来确定基音周期。 由于AMDF的计算无需乘法运算,因而其算法复杂度 较小。另外在基音周期点处AMDF的谷点锐度比AFC的峰 点锐度更尖锐,因此估值精度更高。但是,AMDF对语音 信号幅度的快速变化比较敏感,它影响估计的精度。
一、基音周期估计
• 基音周期是指声带振动频率的倒数,是语言信号最重 要的参数之一,在语音识别、说话人识别、语音分析、 语音编码中都有应用。 • 基音周期估计比较困难,目前还没有十分完善的方法 可以对于各类人群、各类应用都能获得满意的结果。 • 基音的检测和提取包括:自相关函数法ACF、峰值提取 算法PPA、平均幅度差函数法AMDF、并行处理技术、倒 谱法、SIFT、谱图法、小波法等。
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
3 并行处理技术(PPROC)方法
• 图示检测六个语音测度的并行处理实现框图; • 六个独立的基音检测器,得到六个基音周期估值,最终 进行服从多数的基音判决。
原始语音信号 C-AMDF LV-AMDFFn ( k ) =
N − k −1 m=0
基本AMDF W-AMDF
∑
S n ( m + k ) − S n ( m)
LP-AMDF
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
1 带通滤波器法
带通滤波器法类似于语谱仪,是共振峰提取的最早形 式,通过滤波器组的设计可以使估计的共振峰频率同人耳 的灵敏度相匹配。 滤波器的中心频率有两种分布方法:均匀分布,所有 带通滤波器的带宽相同;非均匀分布,如低频端间距小, 高频端间距大(带宽增加);
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
中心削波方法
• 设中心削波器的输入信号为x(n),输出信号为y(n)=C[x(n)] ; • 一种中心削波器和削波输出结果如下图:
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
数字语音处理
基音周期估计-共振峰估计
小结
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
平均幅度差函数法改进
对短时平均幅度差函数AMDF进行改进,有对基本 AMDF函数进行线性加权的方法W- AMDF、采用变长度 的AMDF(LV- AMDF)、经过LPC预测分析获得预测残差 后再计算残差信号的AMDF函数(LP- AMDF)等方法。
及自相关函数
• 中心削波后的信号
以及自相关函数
• 三电平削波后的信
号以及自相关函数
削波后的信号
削波后的信号的自相关函数
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
2 平均幅度差函数法(AMDF)
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
倒谱法
• 采用倒谱法求取语音频谱包络的原理图。
•
实验表明,倒谱法因为其频谱曲线的波动比较小,所以估
计共振峰参数的效果是比较好的,缺点是计算量太大。
• 因为削波后的信号取值只有0,1,-1三种情况,自相关 函数计算很简单。不需做乘法运算,只需组合逻辑运算。
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
中心削波举例
• 不削波的原信号以
3 并行处理技术(PPROC)方法
• PPROC基本思想是:对经过预处理的语音信号实施一 系列的基音初步检测,或分别对原始信号和经处理后的 信号实施系列检测,然后根据系列检测的初步结果,综 合判定基音周期。 • PPROC是时域估计方法,优点是运算简单、硬件容易 实现; • 即可估计出基音周期,还可以确定峰点位置。
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
二、共振峰估计
• 声道可以看成是一根具有非均匀截面的声管,在发声时 起共鸣器作用。 • 当准周期脉冲激励进入声道时会引起共振特性,产生一 组共振频率,称为共振峰频率或简称共振峰。 • 共振峰参数包括共振峰频率和频带宽度,它是区别不同 韵母的重要参数。 • 共振峰信息包含在语音频谱包络中,因此共振峰参数提 取的关键是估计自然音频包络,并认为谱包络中的最大 值就是共振峰。
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
并行处理技术(PPROC)方法
原始信号 峰值 峰值- 前谷值
• 基音周期计算比较 估计值,出现次数 最多的值就是该时 刻的基音周期;4 • 浊音可估计出基音 周期,清音各个估 计值不一致,可判 断为清音。
式中e(n)是声门激励,v(n)是声道响应;倒谱为加法运算, 即倒谱域中基音信息与声道信息是相互分离的。 • 采用简单的倒谱滤波方法可以分离出e(n)和v(n),根据 激励e(n)及其倒谱的特征,可以求出基音周期。 • 在过渡音或含噪语音中,倒谱峰会变得不清晰,方法 需要采用LPC分析进行改进(略)。
峰的位置;若p不大,影响精度,可以采用抛物线插值技 术解决分辨率较低时的共振峰频率值的求取。
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
5 简化逆滤波法 SIFT
• 简化逆滤波法SIFT是进行基音提取的一种新方法。 • 基本思想:首先进行LPC分析和拟滤波,得到预测残 差;然后通过自相关滤波器滤波,峰值检测,获得基音 周期。 • 与倒谱法类似,需有一个有声/无声检测器,以减少运 算量。 • 在基音提取中,采用低通滤波对提高基音提取精度是很 重要的。
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
6 小波变换法
• 语音的产生过程实际上是气流通过声门在经声道响应后 变成声音。对于浊音语音,它是由气流冲击声门,使声 门发生周期性的开启或闭合,这种周期性的气流经声道 响应就形成了浊音。声门的这种开启与闭合,在语音信 号中引起一个锐变。对语音信号作小波变换,则其极值 点对应于声门的开启或闭合点,相邻极值点的距离就对 应着基音周期。因而,采用语音信号的小波变换可以检 测基音周期。 • 一个信号的小波变换具有这样的性质:信号经过小波变 换的极值点对应于信号的锐变点或不连续点。
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
源自文库
1 自相关函数法ACF
语音信号的短时自相关函数 • 浊音信号的自相关函数在基音周期的整数倍位置上出现 峰值,清音信号的自相关函数没有明显的峰值出现; • 检测是否有峰值就可判断是清音还是浊音; • 检测峰值的位置就可提取基音周期值; • 方法:采用矩形窗,窗长至少应大于两个基音周期; • 消除声道特性影响的方法:(声道共振峰特性造成的干 扰会带来检测误差)采用60-900Hz的带通滤波器对语音 信号进行滤波;对语音信号进行非线性变换后再求自相 关函数(如中心削波);
峰值-前峰值 谷值 谷值+ 峰值 峰值-前谷值
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
4 倒谱方法
• 倒谱法是传统的基音周期检测算法之一。语音s(n)
ˆ ˆ ˆ s (n) = e(n) ∗ v(n); s (n) = e(n) + v(n)
中心削波函数: CL削波电平 只保留超过削波电平的部分
中心削波器的输出
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
三电平中心削波方法
• 三电平中心削波器的方法采用如下的削波函数 ;