基于ACF和AMDF的基音检测改进算法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【Abstract】 The Auto Correlation Function ( ACF ) and the Average Magnitude Difference Function ( AMDF ) are
two commonly used method of pitch detection . They have independent and similar statistical characteristics .
有突破性的减少。 为了减小计算量,优化基音周期算
法,有人提出了平均幅度差函数法(Average Magnitude
Difference Function,AMDF)[6],其定义为
N-1
Σ Fn(k)=
1 R
0
s(n+m)w1(m)-s(n+m+k)w2(m+k)
(3)
式中:R 是信号 x(n)的平均值。
与短时自相关函数一样,对周期性的浊音语音,
Fn(k)也 呈 现 与 浊 音 语 音 周 期 相 一 致 的 周 期 特 性 ,不 同
的是 Fn(k)在周期的各个整数倍点上具有谷值特性而
不 是 峰 值 特 性 ,因 而 通 过 Fn(k)的 计 算 同 样 可 以 确 定
浊 音 的 基 音 周 期[7],而 对 于 清 音 信 号 ,Fn (k) 却 没 有 这 种
∞
Σ P(k)=lim 1
x(m)x(m+k)
N→∞ 2N+1 -∞
(2)
清音信号没有周期性, 它的自相关函数也没有周
期 性 规 律 ,所 以 没 有 明 显 的 峰 值 出 现[5],P(k)会 随 着 k
语音技术
Y Voice Technolog
的增大迅速衰减;浊音信号具有准周期性,它的自相 关函数 P(k)具有与 k 相同的周期,自相关函数在基音 周期的整数倍位置上出现峰值。 根据这个性质可以判 断一个语音信号是清音还是浊音,还可以判断浊音的 基音周期。 自相关法基音检测正是利用 P(k)的这一性 质对语音信号进行基音检测的。
【文献标识码】 A
Improved Method of Speech Pitch Detection Based on ACF and AMDF
LI Zhijun, YIN Xia
(Information Engineering College, Yangzhou University, Yangzhou Jiangsu 225009, China)
2 传统时域基音周期检测算法
2.1 ACF 法
Baidu Nhomakorabea
传 统 的 自 相 关 函 数 法 (Auto Correlation Function,
ACF)[4]是 Ross 等人于 1977 年提出的一种 基于语音时
域分析理论的检测算法, 自相关函数法基音周期检测
的原理是: 周期信号的自相关函数将在时延等于函数
3.1 传统基音周期估计算法的缺点 自 相 关 函 数 法 (ACF)是 利 用 峰 值 检 测 基 音 周 期 ,
平均幅度差函数法(AMDF)是利用谷值来估计。 自相关 函数方法适合于噪声环境下, 但单独使用时经常发生 基频估计结果为其实际基音频率的二次倍频或二次分 频的情况, 平均幅度差函数法在静音环境下或噪声较 小时可以取得较好的检测结果,但在语音环境较恶劣、 信噪 比较低时 ,检测结果的准确程度下降 较 快[9],难 以 让人满意。 图 3 为含噪语音信号的波形及 ACF、AMDF 函数曲线,可以看出 ACF 的峰点或 AMDF 的谷点并不 明显,依此进行基音周期估计比较困难。 3.2 预处理
为了减少声道共振峰特性造成的干扰, 提高相关 法和平均幅度差函数法检测基音周期的可靠性, 可以 采用 2 种方法对原始信号进行预处理[10]。
带通滤波:用一个通带为 900 Hz 的线性相位低通 滤波器滤除高次谐波分量, 滤波器可以放在对语音信 号采样前,也可以放在采样后,这样处理以后的信号基 本上只含有共振峰以下的基波和谐波分量[11]。 利 用滤
仿真实验所用的原始语音是男声普通话, 采样 频 率 为 16 kHz,单 声 道 录 音 ,精 度 为 16 bit,采 用 汉 明 窗。 图 1(a)为原始语音信号波形,检测结果如图 1(b) 所示。
因此错判率相对较小,稳健性更高。 但是当语音信号的 幅度快速变化时,函数的谷值深度会减小,从而影响基 音估计的精度[8]。
輩輯讂 2011年 第 35 卷 第 01期
语音技术
Voice Technology
真结果如图 6 所 示 ,可 以 明 显 看 出 ,无 论 ACF 的 峰 值 还是 AMDF 的谷值都不太明显,但得到的 ACF/AMDF 的曲线峰值非常明显,因此只要求出它们的商值曲线, 就很容易进行基音周期估算。
究[J]. 电声技术,2008,32(8):37-40.
[4] 李英 ,汪 航. FIR 自 适 应 滤波 的 语 音增 强 算 法[J]. 电 声 技
基音周期检测算法主要有两类:时域法和频域法。 时域法的特点是比较直观且运算量小, 缺点是抗噪声 性能差,容易产生倍频和半频现象,主要方法有自相关 函数法、平均幅度差函数法等。频域法的特点是抗噪声 的性能较好,但是算法比较复杂,运算量较大,主要方
輩輮讂
2011年 第 35 卷 第 01 期
法有普通频域算法和倒谱法等[3]。
图 2 为采用平均幅度差函数法进行基音周期检测 的仿真结果,这里仍采用上例所示的男声语音材料,从 实验结果可以看出, 由于重叠的波形越来越短,AMDF 曲线的值也越来越小, 可以将 AMDF 的值除以重叠的 点数来改善这种变化,这里不再详述。
2.2 AMDF 法
由于自相关函数本身的乘加运算,所以计算不会
5 小结
自适应语音增强模块利用比较先进的 DSP 技术, 使用自适应算法,能够在高斯白噪声中增强语音信号。 该模块使用方便,体积小,适用范围比较广泛。 基于自 相关的自适应算法,结构简单,实时性强,能满足目前 应用的需求。
参考文献
[1] AHMED N, VIJAYENDRA S.An algorithm for line enhan-
(下转第 55 页)
语音技术
Y Voice Technolog
4 应用实例
利用上述语音自适应增强器进行了试验,图 3(a) 表示采集的语音信号,图 3(b)表示在噪声环境下的语 音信号,图 3(c)表示自适应增强后的语音信号。
强后的语音信号基本保持了原信号的时域特征, 能听 清说话内容。
试验结果表明: 基于自相关的自适应语音增强算 法可以抑制高斯白噪声,在实际使用中效果比较明显。
基音检测改进算法如图 5 所示。
预处理
ACF AMDF
ACF/AMDF
图 5 基音检测改进算法原理
同样还使用上面的含噪声语音样本进行测试,仿
輩輰讂
2011年 第 35 卷 第 01 期
理 论 上 ,求 取 AMDF/ACF 的 商 值 ,应 该 在 基 音 周 期处也可以看到明显的谷值, 但由于对应于基音周期 处的极小值相对于其他谷值不太明显, 仿真结果也证 明 AMDF/ACF 的商值不适于基音检测。
4 小结
取语音信 号 的 浊 音 段 利 用 Matlab 软 件 仿 真 了 几 种基音周期提取的算法, 比较了不同算法函数的波 形 峰(谷)点特性。 ACF 算法本身的计算复杂度较 大, AMDF 算法只涉及加减运算,减小了计算复杂度,但由 于浊音语音段的周期性和平稳性都不太好, 若以全局 最低谷点作为基音周期计算点就会出现估计的基音周 期加倍的检测错误[12]。 提出利用 ACF/AMDF 函数进行 基音检测的方案,并通过仿真实验表明,该算法简单可 行,性能优于一般传统时域基音周期估计算法。同时对
基于自相关函数和平均幅度差函数的算法是基音 周期估计的 2 种常用方法。 两者具有独立且相似的统 计特性,即自相关函数在基音周期处表现为峰值,而平 均幅度差函数表现为波谷,因此可以同时运用 ACF 和 AMDF 的特点, 求取 ACF/AMDF 或 AMDF/ACF 的商, 对应基音周期处应出现更明显的峰值或谷值, 从而提 高基音检测的准确程度。
detection algorithm . Simulation results show that the algorithm has strong antinoise ability .
【Key words】 pitch detection; ACF; AMDF
1 引言
人类发音过程有三类不同的激励方式,因而能产 生三类声音:浊音、清音和爆破音。 当气流通过声门使 声带产生张弛振荡式振动,产生一股准周期空气脉冲, 这些空气脉冲激励声道,便会产生浊音[1]。 这种声带振 动的频率称为基频,相应的周期称为基音周期。语音信 号的基音周期是描述激励源的重要特征参数之一,准 确的检测语音信号的基音周期对高质量的语音分析与 合成、语音压缩编码、语音识别等都具有重要意义。 但 由于声道的易变性及声道特征因人而异, 而基音的范 围又很宽, 即使是同一个人在不同情态下发音的基音 周期也不同, 加之基音周期还受到单词发音音调的影 响, 因而基音周期的精确检测实际上是一件比较困难 的 事 情 [2]。
波后信号的自相关函数进行基音估计, 结果有明显的 改善。
中心削波处理:使用如图 4 所示的中心削波函数 进行处理。
C(x)
-CL
CL
O
x
图 4 中心削波函数
削波电平门限的选择往往很难确定, 如果选择不 好会使基音周期的估计出现很大的偏差。 其中削波电 平 CL取最大信号幅度的 68% ,中心削波 后,再用自相 关法检出基音频率,误判为倍频或分频的情况就可大 大减少。为了减少自相关计算中的乘法运算,中心削波 以后的信号 y(n)的自相关用 2 个信号的互相关代替。 3.3 算法原理与实现
周期处产生一个极大值, 因此通过计算语音信号的自
相关函数,找到极大值位置,就可以估计信号的基音周
期。 这种算法的优点是算法简单,提取出的基音周期较
为精确。
对 于 离 散 的 数 字 语 音 信 号 序 列 x(n)如 果 具 有 周
期性,即
x(n)=x(n+NP)
(1)
则其自相关函数也是同周期的周期函数,即
Based on the discussion of traditional pitch detection algorithm , a comprehensive application with ACF and
AMDF is given . The method is simple and practicable . It ′s better than traditional time - domain pitch
在讨论了传统基音周期检测算法及其缺点后,提出了综合应用 ACF 和 AMDF 函数进行基音检测的算法。 该算法简
单可行,性能优于一般传统时域基音周期检测算法。 从仿真结果可以看出,对于含噪语音信号,该算法具有较强的
抗噪能力。
【关键词】 基音检测; 自相关函数; 平均幅度差函数
【中图分类号】 TN912.3
语音技术
Voice Technology
文 章 编 号 :1002-8684(2011)01-0050-03
基于 ACF 和 AMDF 的基音检测改进算法 ·论文·
李志军,尹 霞 (扬州大学 信息工程学院,江苏 扬州 225009)
【摘 要】 自相关函数法和平均幅度差函数法是基音周期检测的两种常用方法,两者具有独立且相似的统计特性。
cement[J]. Proc. IEEE,1982,70(12):1459-1460.
[2] 李 波 ,赵 光. 基 于 DSP 的 视 频 图 像 处 理 系 统 的 研 究 [J].
沈 阳 工 程 学 院 学 报 :自 然 科 学 版 ,2009,5(3):272-274.
[3] 杨 鹏 ,周 胜 ,苑 秉 成 ,等. 水 中 目 标 辐 射 噪 声 模 拟 技 术 研
周期特性。 利用 Fn(k)的这种特性可以判定一段语音
是浊音还是清音,并估计出浊音语音的基音周期。 由
于计算 AMDF 函数只需要加、 减和取绝对值运算,运
算量与求短时自相关函数相比下降很多。 同时,函数
在基音周期点的谷值比自相关函数的峰值更加尖锐,
3 基 于 ACF 和 AMDF 的 基 音 检 测 改 进算法