一种基音周期估计的改进CAMDF算法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
从式 (2) 可以看出计算 D1 ( m ) 的差值项是不 同的 ,随着 m 值的增加 ,求和的差值项数将逐渐减
少 ,结果导致 D1 ( m ) 峰值幅度随着滞后时间 m 的
增加而逐渐下降. 为了克服基本 AMDF 算法的峰
值幅度随着滞后时间的增加而逐渐下降所造成的
估计出的基音周期加倍的现象 , 在基本 AMDF 算
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
第4期
杨莎等 :一种基音周期估计的改进 CAMDF 算法
775
3. 2 改进 CAMDF 算法 在 CAMDF 算法的基础上 ,为了更好的简化算
语音信号的基音周期信息主要蕴藏在包络中 ,
对语音信号进行中心削波处理会丢失一定的信息 ,
如共振峰等 ,但对基音周期的估计没有影响 ,这是
因为语音信号的低幅部分包含大量的共振峰信息 ,
而高幅部分包含着基音信息 ,经过这种非线性处理
可以更好地进行基音周期的提取. 用改进 CAMDF 算法估计基音周期时 ,我们采
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
774
四川大学学报 (自然科学版)
第 45 卷
期提取的算法 ,比较了各种方法的优劣性. 同时提 出了一种改进 CAMDF 算法 ,其计算量比其他方法 小 ,在基音周期估计过程中取得了良好的效果. 将 该算法应用于基于计算声场景分析的语音分离中 , 在很大程度上改善了语音分离效果 ,证明了其良好 的实用性能.
其函数定义如下 :
N- 1
∑ D ( m ) = | sw ( mod ( n + m , N ) ) n =0 sw ( n) | , m = 0 , 1 , …, N - 1 (5)
此函数有如下性质 : ( T 为 s ( n) 的周期) 性质 1 : D (0) = 0 ; 性质 2 :在定义域内 , D ( k) 关于 k = N / 2 对 称 ,即 D ( k) = D ( N2k) ; 性质 3 : D ( a T) < D ( a T + b) , 其中 0 ≤ a T + b ≤ N / 2 , 0 < b < T , a = 0 ,1 ,2 , …; 性质 4 : k = a T 是 D ( k) 的局部最小点 ,其中 0 ≤ a T ≤ N / 2 , a = 0 ,1 ,2 , …; 性质 5 : D ( a T) ≤ D ( a T + T) ,其中 0 ≤ a T < a T + T ≤ N / 2 , a = 0 ,1 ,2 , …. 与 AMDF 函数不同的是 ,在计算式 (5) 所定义 的幅度差函数 D ( m ) 时 , 当前加窗语音帧内的每 个样本点都被使用且仅被使用一次 ,求和的差值项 数也相同[4 ] . 其直接结果是克服了基本 AMDF 函 数不同的 m 值之间因求和项数不同而造成的函数 峰值幅度逐渐下降的趋势. 利用 CAMDF 函数的对 称性和谷值点的函数值依次递增的性质 ,还可以克 服基音周期加倍的问题[5 ,6 ] .
∑ R n ( m ) =
S n ( n + m) S n ( n)
(1)
n =0
2. 2 平均幅度差算法( AMDF 算法)
由于自相关函数本身的乘加运算 ,所以计算量
不会有突破性的减少. 为了减小计算量 , 优化基音
周期算法 ,有人提出了 AMDF 算法 ,该算法有一些
周期出现的局部最小值 ,同样也可以用来进行基音
周期检测[2 ] . 基本 AMDF 算法 :AMDF 即平均幅度差函数
(Average Magnit ude Difference)
其定义为 :Βιβλιοθήκη Baidu
N- m- 1
∑ D1 ( m ) =
| sw ( n + m) - sw ( n) | ,
n =0
m = 0 ,1 , …, N - 1
(2)
其中 :
sw ( n) = s ( n) w ( n)
2008 年 8 月 第 45 卷第 4 期
四川大学学报 (自然科学版) Journal of Sichuan University (Nat ural Science Edition)
文章编号 : 049026756 (2008) 0420773206
Aug. 2008 Vol. 45 No. 4
x ( n) (| x ( n) | > CL )
0
(| x ( n) | ≤ CL )
(6)
三电平中心削波法 :
y ( n) = C[ x ( n) ] =
1 (| x ( n) | > CL )
0 (| x ( n) | ≤ CL )
(7)
- 1 ( x ( n) < CL ) CL 为削波电平 ,由语音信号的峰值幅度来确定. 它 是语音段最大幅度的一个固定的百分比 , 一般取 30 % 到 40 % 之间.
2 传统基音周期估计算法
2. 1 自相关法( ACF 算法) 对大多数浊音来说 ,语音信号的自相关函数有
一些周期出现的局部最大值 ,第一个局部最大值与 起点之间的距离即为基音周期[1 ] . 语音信号经加 窗后的信号为 S n ( n) , S n ( n) 的短时自相关函数 为:
N- m- 1
(4)
3 CAMDF 基音检测算法及其改进 算法
3. 1 循环 AMDF 函数及其性质 由于传统的 AMDF 、修正的 AMDF 算法本身
不能保证第一个全局最小值与起点之间的距离为 基音周期 ,所以容易导致估计的基音周期加倍. 于 是 ,有人提出了一种新的基音周期估计算法函数 , 即循环 AMDF (CircularAMDF ,CAMDF) 函数[3 ] .
本文利用 MA TLAB 软件仿真了几种基音周
收稿日期 : 2007201215 ; 修回日期 : 2008203224 作者简介 : 杨莎 (1982 - ) ,女 ,2005 级硕士研究生. 研究方向为语音信号处理. E2mail :yangsha0506 @163. com 通讯作者 : 夏秀渝. E2mail : xiaxxy @163. com
Abstract : The aut hors int roduce t he t raditional met hods for speech pitch determination , including ACF algo2 rit hm and AMDF algorit hm. For AMDF algorit hm is easy to make t he estimated pitch double , and increase t he error , we improve t he CAMDF algorit hm to solve t he problem. At t he end of t his paper , t he aut hors compare t hese kinds of met hods for pitch determination. The experimentations indicate t hat t he improved CAMDF algorit hm has better performance t han t he ot hers. The improved CAMDF algorit hm can reduce t he calculation wit hout affecting effectiveness for speech pitch determination. Key words : ACF ,AMDF , W2AMDF ,M2AMDF ,CAMDF , pitch detection
由于人声道的易变性及声道特征的因人而异 ,所以 精确测量基音周期是一件非常困难的事情. 语音信 号具有非平稳性 ,所以语音信号处理中通常采取短 时处理技术. 最常用的短时基音周期估计方法有 : 自相关法 、AMDF 算法等.
基音周期作为语音信号的重要参数之一 ,是基 于计算声场景分析的语音分离中的一个重要依据 , 基音周期估计的准确程度直接制约着基于计算声 场景分析的语音分离效果.
法 ,减少计算量 ,我们提出改进 CAMDF 算法 ,即在
用 CAMDF 算法进行基音周期估计之前 ,先进行降
比特处理 (一种非线性变换) . 主要的方法有 :中心
削波和三电平中心削波法.
令输入信号为 x ( n) , 非线性变换后语音信号
为 y ( n) . 中心削波 :
y ( n) = C[ x ( n) ] =
1 引 言
语音是人类的自然属性之一 ,对人类有着非常 重要的意义. 语音信号中的基音是指发浊音时声带 振动所引起的周期性 ,而基音周期是指声带振动频 率的倒数. 基音周期作为语音信号的重要参数之 一 ,在语音编码 、说话人辨识和语音识别等方面有 着广泛的应用.
基音 周 期 有 其 较 宽 的 范 围 , 从 老 年 男 性 的 50 Hz 到儿童和妇女的 450 Hz ,接近三个倍频程 ,又
Speech pitch determination based on the improved circular AMDF
YA N G S ha , X IA Xi u2Y u , Z HA N G Y u2S heng , TA N G B ang2You
(College of Electronics Information , Sichuan University , Chengdu 610064 ,China)
用三电平中心削波 ,削波后的信号的取值只有 1 , 0 , - 1 三种情况 ,所以只是需要简单的组合逻辑就 可以实现其算法了[7 ] . 改进 CAMDF 算法在一定程 度上降低了对处理器件复杂度和精度方面要求.
该法对传统 AMDF 和基本 CAMDF 算法有极
大改进. 其优势在于 : (1) 由 CAMDF 函数的性质 2
法的基础上人们又提出许多新的算法 ,其中最具有
代表性的算法是 W2AMDF 算法.
W2AMDF 算法是对基本 AMDF 函数进行线性
加权的方法 ,其定义如下 :
N - n+1
∑ D2 ( m )
=
1 N+m-
1
n =1
|
sw ( n + m -
1)
- sw ( n) | , m = 0 , 1 , …, N - 1
一种基音周期估计的改进 CAMDF 算法
杨 莎 , 夏秀渝 , 张余生 , 唐邦友
(四川大学电子信息学院 , 成都 610064)
摘 要 : 本文首先介绍了传统基音周期估计算法 :ACF 算法和 AMDF 算法. 为了克服 AMDF 算法容易导致估计出的基音周期加倍的缺陷 ,本文重点阐述了 CAMDF 基音周期估计算法 ,并 提出了改进 CAMDF 算法. 该法是在 CAMDF 算法之前 ,对语音信号进行降比特处理. 实验表 明 ,改进 CAMDF 算法在降低对处理器件复杂度和精度方面要求的同时并不会影响基音周期 的估计效果. 最后 ,本文进行了各种基音检测算法的仿真比较 ,实验表明改进 CAMDF 算法在 基音估计效果上具有很好的准确性和稳定性. 关键词 : ACF ;AMDF ; W2AMDF ;M2AMDF ;CAMDF ;基音检测 中图分类号 : TP207. 7 文献标识码 : A
1 , n = 0 , …, N - 1
w ( n) = 0 ,其他
(3)
对周期性的浊音语音 , D1 ( m) 呈现出与浊音
语音周期相一致的周期特性 , 不同之处是 D1 ( m )
在周期的各个整数倍点上具有谷值特性而不是峰
值特性 ,因而可以同样通过 D1 ( m ) 的计算来确定 基音周期. 对于清音语音信号 , D1 ( m ) 却没有这种 周期特性 ,所以利用 D1 ( m ) 的这种特性来判定一 段语音是浊音还是清音 ,并估计出浊音语音的基音 周期.
少 ,结果导致 D1 ( m ) 峰值幅度随着滞后时间 m 的
增加而逐渐下降. 为了克服基本 AMDF 算法的峰
值幅度随着滞后时间的增加而逐渐下降所造成的
估计出的基音周期加倍的现象 , 在基本 AMDF 算
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
第4期
杨莎等 :一种基音周期估计的改进 CAMDF 算法
775
3. 2 改进 CAMDF 算法 在 CAMDF 算法的基础上 ,为了更好的简化算
语音信号的基音周期信息主要蕴藏在包络中 ,
对语音信号进行中心削波处理会丢失一定的信息 ,
如共振峰等 ,但对基音周期的估计没有影响 ,这是
因为语音信号的低幅部分包含大量的共振峰信息 ,
而高幅部分包含着基音信息 ,经过这种非线性处理
可以更好地进行基音周期的提取. 用改进 CAMDF 算法估计基音周期时 ,我们采
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
774
四川大学学报 (自然科学版)
第 45 卷
期提取的算法 ,比较了各种方法的优劣性. 同时提 出了一种改进 CAMDF 算法 ,其计算量比其他方法 小 ,在基音周期估计过程中取得了良好的效果. 将 该算法应用于基于计算声场景分析的语音分离中 , 在很大程度上改善了语音分离效果 ,证明了其良好 的实用性能.
其函数定义如下 :
N- 1
∑ D ( m ) = | sw ( mod ( n + m , N ) ) n =0 sw ( n) | , m = 0 , 1 , …, N - 1 (5)
此函数有如下性质 : ( T 为 s ( n) 的周期) 性质 1 : D (0) = 0 ; 性质 2 :在定义域内 , D ( k) 关于 k = N / 2 对 称 ,即 D ( k) = D ( N2k) ; 性质 3 : D ( a T) < D ( a T + b) , 其中 0 ≤ a T + b ≤ N / 2 , 0 < b < T , a = 0 ,1 ,2 , …; 性质 4 : k = a T 是 D ( k) 的局部最小点 ,其中 0 ≤ a T ≤ N / 2 , a = 0 ,1 ,2 , …; 性质 5 : D ( a T) ≤ D ( a T + T) ,其中 0 ≤ a T < a T + T ≤ N / 2 , a = 0 ,1 ,2 , …. 与 AMDF 函数不同的是 ,在计算式 (5) 所定义 的幅度差函数 D ( m ) 时 , 当前加窗语音帧内的每 个样本点都被使用且仅被使用一次 ,求和的差值项 数也相同[4 ] . 其直接结果是克服了基本 AMDF 函 数不同的 m 值之间因求和项数不同而造成的函数 峰值幅度逐渐下降的趋势. 利用 CAMDF 函数的对 称性和谷值点的函数值依次递增的性质 ,还可以克 服基音周期加倍的问题[5 ,6 ] .
∑ R n ( m ) =
S n ( n + m) S n ( n)
(1)
n =0
2. 2 平均幅度差算法( AMDF 算法)
由于自相关函数本身的乘加运算 ,所以计算量
不会有突破性的减少. 为了减小计算量 , 优化基音
周期算法 ,有人提出了 AMDF 算法 ,该算法有一些
周期出现的局部最小值 ,同样也可以用来进行基音
周期检测[2 ] . 基本 AMDF 算法 :AMDF 即平均幅度差函数
(Average Magnit ude Difference)
其定义为 :Βιβλιοθήκη Baidu
N- m- 1
∑ D1 ( m ) =
| sw ( n + m) - sw ( n) | ,
n =0
m = 0 ,1 , …, N - 1
(2)
其中 :
sw ( n) = s ( n) w ( n)
2008 年 8 月 第 45 卷第 4 期
四川大学学报 (自然科学版) Journal of Sichuan University (Nat ural Science Edition)
文章编号 : 049026756 (2008) 0420773206
Aug. 2008 Vol. 45 No. 4
x ( n) (| x ( n) | > CL )
0
(| x ( n) | ≤ CL )
(6)
三电平中心削波法 :
y ( n) = C[ x ( n) ] =
1 (| x ( n) | > CL )
0 (| x ( n) | ≤ CL )
(7)
- 1 ( x ( n) < CL ) CL 为削波电平 ,由语音信号的峰值幅度来确定. 它 是语音段最大幅度的一个固定的百分比 , 一般取 30 % 到 40 % 之间.
2 传统基音周期估计算法
2. 1 自相关法( ACF 算法) 对大多数浊音来说 ,语音信号的自相关函数有
一些周期出现的局部最大值 ,第一个局部最大值与 起点之间的距离即为基音周期[1 ] . 语音信号经加 窗后的信号为 S n ( n) , S n ( n) 的短时自相关函数 为:
N- m- 1
(4)
3 CAMDF 基音检测算法及其改进 算法
3. 1 循环 AMDF 函数及其性质 由于传统的 AMDF 、修正的 AMDF 算法本身
不能保证第一个全局最小值与起点之间的距离为 基音周期 ,所以容易导致估计的基音周期加倍. 于 是 ,有人提出了一种新的基音周期估计算法函数 , 即循环 AMDF (CircularAMDF ,CAMDF) 函数[3 ] .
本文利用 MA TLAB 软件仿真了几种基音周
收稿日期 : 2007201215 ; 修回日期 : 2008203224 作者简介 : 杨莎 (1982 - ) ,女 ,2005 级硕士研究生. 研究方向为语音信号处理. E2mail :yangsha0506 @163. com 通讯作者 : 夏秀渝. E2mail : xiaxxy @163. com
Abstract : The aut hors int roduce t he t raditional met hods for speech pitch determination , including ACF algo2 rit hm and AMDF algorit hm. For AMDF algorit hm is easy to make t he estimated pitch double , and increase t he error , we improve t he CAMDF algorit hm to solve t he problem. At t he end of t his paper , t he aut hors compare t hese kinds of met hods for pitch determination. The experimentations indicate t hat t he improved CAMDF algorit hm has better performance t han t he ot hers. The improved CAMDF algorit hm can reduce t he calculation wit hout affecting effectiveness for speech pitch determination. Key words : ACF ,AMDF , W2AMDF ,M2AMDF ,CAMDF , pitch detection
由于人声道的易变性及声道特征的因人而异 ,所以 精确测量基音周期是一件非常困难的事情. 语音信 号具有非平稳性 ,所以语音信号处理中通常采取短 时处理技术. 最常用的短时基音周期估计方法有 : 自相关法 、AMDF 算法等.
基音周期作为语音信号的重要参数之一 ,是基 于计算声场景分析的语音分离中的一个重要依据 , 基音周期估计的准确程度直接制约着基于计算声 场景分析的语音分离效果.
法 ,减少计算量 ,我们提出改进 CAMDF 算法 ,即在
用 CAMDF 算法进行基音周期估计之前 ,先进行降
比特处理 (一种非线性变换) . 主要的方法有 :中心
削波和三电平中心削波法.
令输入信号为 x ( n) , 非线性变换后语音信号
为 y ( n) . 中心削波 :
y ( n) = C[ x ( n) ] =
1 引 言
语音是人类的自然属性之一 ,对人类有着非常 重要的意义. 语音信号中的基音是指发浊音时声带 振动所引起的周期性 ,而基音周期是指声带振动频 率的倒数. 基音周期作为语音信号的重要参数之 一 ,在语音编码 、说话人辨识和语音识别等方面有 着广泛的应用.
基音 周 期 有 其 较 宽 的 范 围 , 从 老 年 男 性 的 50 Hz 到儿童和妇女的 450 Hz ,接近三个倍频程 ,又
Speech pitch determination based on the improved circular AMDF
YA N G S ha , X IA Xi u2Y u , Z HA N G Y u2S heng , TA N G B ang2You
(College of Electronics Information , Sichuan University , Chengdu 610064 ,China)
用三电平中心削波 ,削波后的信号的取值只有 1 , 0 , - 1 三种情况 ,所以只是需要简单的组合逻辑就 可以实现其算法了[7 ] . 改进 CAMDF 算法在一定程 度上降低了对处理器件复杂度和精度方面要求.
该法对传统 AMDF 和基本 CAMDF 算法有极
大改进. 其优势在于 : (1) 由 CAMDF 函数的性质 2
法的基础上人们又提出许多新的算法 ,其中最具有
代表性的算法是 W2AMDF 算法.
W2AMDF 算法是对基本 AMDF 函数进行线性
加权的方法 ,其定义如下 :
N - n+1
∑ D2 ( m )
=
1 N+m-
1
n =1
|
sw ( n + m -
1)
- sw ( n) | , m = 0 , 1 , …, N - 1
一种基音周期估计的改进 CAMDF 算法
杨 莎 , 夏秀渝 , 张余生 , 唐邦友
(四川大学电子信息学院 , 成都 610064)
摘 要 : 本文首先介绍了传统基音周期估计算法 :ACF 算法和 AMDF 算法. 为了克服 AMDF 算法容易导致估计出的基音周期加倍的缺陷 ,本文重点阐述了 CAMDF 基音周期估计算法 ,并 提出了改进 CAMDF 算法. 该法是在 CAMDF 算法之前 ,对语音信号进行降比特处理. 实验表 明 ,改进 CAMDF 算法在降低对处理器件复杂度和精度方面要求的同时并不会影响基音周期 的估计效果. 最后 ,本文进行了各种基音检测算法的仿真比较 ,实验表明改进 CAMDF 算法在 基音估计效果上具有很好的准确性和稳定性. 关键词 : ACF ;AMDF ; W2AMDF ;M2AMDF ;CAMDF ;基音检测 中图分类号 : TP207. 7 文献标识码 : A
1 , n = 0 , …, N - 1
w ( n) = 0 ,其他
(3)
对周期性的浊音语音 , D1 ( m) 呈现出与浊音
语音周期相一致的周期特性 , 不同之处是 D1 ( m )
在周期的各个整数倍点上具有谷值特性而不是峰
值特性 ,因而可以同样通过 D1 ( m ) 的计算来确定 基音周期. 对于清音语音信号 , D1 ( m ) 却没有这种 周期特性 ,所以利用 D1 ( m ) 的这种特性来判定一 段语音是浊音还是清音 ,并估计出浊音语音的基音 周期.