基于ACF的基音检测算法
数模-一种基于线性预测和极大似然估计的基音检测算法
第28卷第6期声学技术Vo l.28,No.6 2009年12月 Technical Acoustics Dec., 2009一种基于线性预测和极大似然估计的基音检测算法张永亮1,鲁宇明2,张先庭1,杨焱 1(1. 南昌航空大学电子信息工程学院,南昌 330063;2. 南京航空航天大学自动化学院,南京 210016)摘要:用线性预测的方法求出语音信号的LPC(Linear Predictive Coding)谱,然后根据候选的声门激励与LPC谱卷积重构语音信号的短时频谱,当重构频谱与原始语音频谱之间的畸变最小时,声门激励之间的间隔为基音周期。
为了提高计算效率,采用频域动态搜索的方法搜索基音周期的候选值。
数值实验表明,采用线性预测和极大似燃估计(Maximum Likelihood, ML)的基音检测算法可保留更多的基音信息,并能有效地减少基音检测的错误,并且该算法比传统的ML法有更强的鲁棒性。
关键词:基音检测;线性预测;极大似然估计法中图分类号:TN192.3 文献标识码:A 文章编号:1000-3630(2009)-06-0768-05DOI编码:10.3969/j.issn1000-3630.2009.06.017A pitch detection algorithm based on linearpredictive and ML methodZHANG Yong-liang1, LU Yu-ming2, ZHANG Xian-ting1, YANG Yan1(1. Nanchang Hang Kong University, Nanchang, 330063, China;2. Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China)Abstract:A robust pitch detection algorithm based on LPC spectrum and ML method is proposed in the paper. Firstly, the LPC spectrum is obtained, and then the short time frequency spectrum is reconstructed based on the convolution of glottis and the LPC spectrum. When the aberration between the reconstructed spectrum and the original frequency spectrum reaches minimum, the interval between excitations of the glottis is the pitch. In order to improve the compu-tational efficiency, the dynamic seeking algorithm is adopted to ensure the probable pitch values. Numerical experiment indicates that the proposed method of pitch detection is effective, more information of pitch is remained and the pitch detection error is reduced effectively. In addition, the method is more robust than the traditional method of ML.Key words: pitch detection; linear predictive; maximum likelihood method1 引言基音是语音的一个重要的特征参数,对汉语更是如此。
基于FFT-ACF和候选值估计的基音周期提取方法
基于FFT-ACF和候选值估计的基音周期提取方法
徐明;陈知困;黄云森
【期刊名称】《深圳大学学报(理工版)》
【年(卷),期】2007(024)004
【摘要】利用FFT-ACF算法进行基音周期候选值估计,减少在语音基音周期提取中常见的倍频和半频错误,提出针对候选值的多重后处理算法.后处理过程:首先运用峰值筛选法进行初选,接着利用一次均值法将语音分为不同的音高段,再使用二次均值法为每个音高段确定合适的频率范围,最后精确提取出基音周期.实验结果表明,基音周期后处理算法有效,在音乐哼唱识别应用中收到良好效果.
【总页数】5页(P388-392)
【作者】徐明;陈知困;黄云森
【作者单位】深圳大学信息中心,深圳,518060;深圳大学信息中心,深圳,518060;深圳大学信息工程学院,深圳,518060;深圳大学信息中心,深圳,518060
【正文语种】中文
【中图分类】TP391;TN912
【相关文献】
1.一种基于基音周期估计的音频水印算法 [J], 付永庆;孙滢
2.基于MBE模型的基音周期估计算法改进 [J], 唐斌;樊桂花
3.基于随机共振的基音周期估计方法 [J], 何朝霞;刘凯
4.基于随机共振的基音周期估计方法 [J], 何朝霞; 刘凯
5.基于FPGA的实时基音周期估计系统 [J], 李辉;王欣;戴蓓倩;陆伟
因版权原因,仅展示原文概要,查看原文内容请购买。
基于EMD的ACF基音检测改进算法
基于正交变换的基音检测算法
基于正交变换的基音检测算法刘宇驰;杜秀娟【期刊名称】《电脑知识与技术》【年(卷),期】2015(000)036【摘要】针对随机背景噪声下的基音周期检测,提出了一种基于正交变换的基音检测算法。
该算法通过正交变换对含噪的语音进行消噪,再求消噪后语音的自相关函数(ACF)和平均幅度差函数(AMDF),对其求出比值(ACF/AMDF)的平方以突显基音周期的峰值,以便获取较准确的基音周期参数。
实验结果表明,与单一的自相关法和平均幅度差函数法相比,该算法获取的基音周期有较高的准确性和对噪声有较强的鲁棒性。
%Aiming at pitch period detection under random background noise,a kind of pitch detection algorithm based on orthogo-nal transform is put forward. Noisy speech signal was first preprocessed by orthogonal transform, the autocorrelation func-tion (ACF) and the average magnitude difference function (AMDF) for speech signal were obtained. The square of the ratio for ACF and AMDF had been applied to emphasize the peak of the true pitch period. This algorithm can get the exact pitch of the speech signal in strong noisy environment. Experimental results indicate that, compared with single autocorrelation and average magnitude difference method, the proposed algorithm has better robustness and higher accuracy.【总页数】3页(P126-128)【作者】刘宇驰;杜秀娟【作者单位】青海师范大学计算机学院,青海西宁810008;青海师范大学计算机学院,青海西宁810008【正文语种】中文【中图分类】TN911【相关文献】1.基于列正交变换实现串行干扰消除的MIMO检测算法 [J], 王赟;汪晋宽;解志斌2.一种基于小波包变换加权自相关的基音检测算法 [J], 孙婷婷;章小兵3.基于小波变换与平均幅度差函数倒数的基音周期检测算法 [J], 武良丹;4.基于多分类支持向量机和主体延伸法的基音检测算法 [J], 冯起斌; 李鸿燕5.基于优化能量值门限和增强倍频效应的抗噪基音检测算法 [J], 杨贵福;夏一鸣;冉华;冯永平;孙慧因版权原因,仅展示原文概要,查看原文内容请购买。
基于线性预测技术的语音基音检测
文章编 号: 1 0 0 3 — 5 8 5 0 ( 2 0 1 5) 0 3 — 0 0 7 4 — 0 3
2 0 1 5年第 3 期
基于线性预测技术的语音基音检测
王 琛, 姜 占才
( 青海师范大学计算机学 院, 西宁 8 1 0 0 0 1 )
摘 要 : 针对语音基音检测易受加性背景噪声和共振峰干扰的问题 , 提 出了一种基于线性 预测 技术 的语音信号基 音检测算法。该算法在维纳滤波基础上 , 利用线性预测( L P c ) 技术得到预测残差信号 , 再对其做 自相关( A C F ) N I 平均 幅度 差( A MD F ) , 得到基音的检测结果 。其检测效果 比单一 自相关 函数法和平均幅度差 函数法有明显 的改善。
大 。针对 这些 问题 , 本文 提 出了一种基 于线 性预 测技 术 的语 音 基音 检测 算法 。该 算法 在 噪 声环 境 中 能够 有 效地 提取基 音周期 , 并 减少倍 频和 半频 的错误 。
基音周期检测带来 了极大 困难。准确的基音周期提
取 成 为 语 音 信 号处 理 领 域 最 具 挑 战 性 的任者 、 不 同环 境和不 同应 用领
域 的基 音检测算 法 尚未 出现 。迄 今 为止 , 基 音提 取 的
关键词 : 语音信号 , 基音周期 , 线性预测 , 白相关 , 循环平均幅度差 中图分类号 : T N 9 1 2 . 3 文献标识码 : A
Pi t c h De t e c t i o n o f S p e e c h Ba s e d o n Li n e a r Pr e d i c t i o n a n d En d p o i n t
结合EMD与DWT-ACF的语音基音周期检测改进算法
结合EMD与DWT-ACF的语音基音周期检测改进算法
张涛;章小兵;朱明星
【期刊名称】《噪声与振动控制》
【年(卷),期】2018(038)002
【摘要】针对传统小波-自相关算法在噪声环境下检测语音的基音周期会出现偏差和漏报的情况,提出一种经验模式分解下的小波-自相关的基音周期检测改进算法.该算法首先利用经验模式分解去除含噪语音趋势项并减噪,再利用改进的小波-自相关法突出每个基音周期的峰值点,提高了基音周期检测的精度.实验结果表明,该改进方法可有效改善加噪语音在基音提取上出现的偏差误报情况以及避免部分倍频和半频错误,提高基音周期检测速率及准确率.
【总页数】7页(P173-178,192)
【作者】张涛;章小兵;朱明星
【作者单位】安徽工业大学电气与信息工程学院,安徽马鞍山243002;安徽工业大学电气与信息工程学院,安徽马鞍山243002;安徽工业大学电气与信息工程学院,安徽马鞍山243002
【正文语种】中文
【中图分类】TN912.3
【相关文献】
1.基于改进小波变换的语音基音周期检测 [J], 吴兴铨;周金治
2.一种基于线性预测与自相关函数法的语音基音周期检测新算法 [J], 柏静;韦岗
3.一种改进的正弦语音模型基音周期检测算法 [J], 孙华山
4.基于小波变换的语音基音周期实时检测算法 [J], 沈江峰;张刚
5.基于线性预测和小波变换的语音基音周期检测新算法 [J], 马霓;应益荣
因版权原因,仅展示原文概要,查看原文内容请购买。
基于EMD的ACF基音检测改进算法
基于EMD的ACF基音检测改进算法宗源;李平;曾毓敏;胡政权;李梦超【摘要】针对传统的自相关函数基音检测算法容易出现倍频错误的问题,本文提出了一种基于经验模式分解的ACF基音检测改进算法.该改进算法利用EMD将一帧语音信号的ACF分解成多个本征模式函数和残余分量,同时根据IMF的累积能量分布情况找出含有基音信息的IMF,最后通过该IMF准确地估计出该语音帧的基音.仿真实验结果表明:本文所提算法性能明显优于传统ACF算法;相比较于检测效果较好的WAC算法,本文所提算法的性能依然有了一定的提升.【期刊名称】《南京师大学报(自然科学版)》【年(卷),期】2013(036)003【总页数】6页(P42-47)【关键词】基音;经验模式分解;自相关函数;本征模式函数【作者】宗源;李平;曾毓敏;胡政权;李梦超【作者单位】南京师范大学物理科学与技术学院,江苏南京210023;泰州职业技术学院信息工程学院,江苏泰州225300;南京师范大学物理科学与技术学院,江苏南京210023;南京师范大学物理科学与技术学院,江苏南京210023;南京师范大学物理科学与技术学院,江苏南京210023【正文语种】中文【中图分类】TN912人在发浊音时,气流通过声门使声带发生张弛振荡式的振动,这种声带振动的频率称为基音(基音也可指基音周期).基音是语音信号中非常重要的特征参数之一,广泛地应用于语音编码、语音合成、语音增强以及语音识别等方面.因此,准确地检测基音具有非常重要的意义.尽管人们已经提出了许多基音检测算法,但是准确而且可信的基音检测仍然是一个具有挑战性的工作[1].目前比较经典的算法有自相关函数(Autocorrelation Function,ACF)法[2]、平均幅度差函数(Average Magnitude Difference Function,AMDF)法[3]、倒谱法[4]、小波变换法[5]等.在这些算法中,ACF算法以其方法简单、计算复杂度低和对噪声的鲁棒性好等优点而得到了广泛的应用.该算法的原理是,周期信号的自相关函数将在时延等于信号周期的地方产生一个极大值.语音信号由于具有准周期性,因此可以通过计算短时窗内语音信号的ACF,并根据ACF的最大峰值点估计出语音信号的基音.但是,该最大峰值点的选择受到了很多因素干扰,例如:复杂的声道共振峰结构、语音信号并不严格的准周期性、语音帧的大小、以及窗函数的选择等[6].因此ACF在实际应用中经常会出现倍频的检测错误.针对ACF法所存在的问题,研究人员提出了一些基于ACF的改进算法.Shimamura提出了WAC ,该算法利用AMDF加权ACF从而使ACF的基音峰值点更加突出,WAC能够避免部分倍频错误,但是由于AMDF存在均值下降趋势,易导致较后的非基音峰值点反而拥有较大的加权系数,因此效果有时并不是十分理想.文献[7]检测出语音信号的主谐波频率后,通过增强语音信号的主谐波频率成分进行语音信号的重构,利用NACF对重构后的语音信号进行基音检测,得到了较好的效果.此方法虽然具有很好的鲁棒性,但是对共振峰等所引起的ACF 的倍频错误并没有得到很好的抑制.本文提出了一种基于经验模式分解(EmpiricalMode Decomposition,EMD)的ACF的基音检测改进算法,该算法首先利用EMD将一帧语音信号的ACF分解为一系列的本征模式函数(Intrinsic Mode Function,IMF)和残余分量;接着筛选出含有基音信息的IMF;最后利用筛选出的IMF检测出该语音帧的基音.仿真实验结果表明:与传统的ACF以及其改进算法WAC相比,本文所提算法能够有效地克服ACF的倍频错误,更加准确地检测出语音的基音.1 经验模式分解EMD是Norden E.Huang等人于1998年提出的一种新的信号分解方法[8].EMD的本质是通过信号本身的特征尺度来将信号分解成IMF,它一方面具有小波变换多分辨率的优点,另一方面又克服了小波变换中选择合适的小波基的困难.因此,EMD可以有效地处理非平稳信号,且具有良好的自适应性.IMF分量必须满足以下2个条件:(1)整个信号中极值点的个数与过零点的个数相等或最多相差1;(2)信号上的任意点处,由所有局部极大值点确定的上包络和所有局部极小值所确定的下包络的均值为零,即上下包络线对称于零均线.EMD 的具体算法[10]如下:(1)令g1(t)=s(t);(s(t)为待分解信号)(2)找出g1(t)所有的极值点(包括极大值和极小值);(3)利用3次样条插值分别将所有极大值点和极小值点拟合成上包络h(t)和下包络l(t);(4)利用上包络和下包络算出局部均值:(5)从g1(t)中减去u1(t):g(t)=g(t)-μ1(t);(6)根据上文所提的IMF必须满足的两个条件判断g1(t)是否为IMF;(7)重复(2)到(6)直到g1(t)满足IMF的条件.C1(t)=g1(t)即为第一个IMF,记为IMF1,利用上述算法对残余分量进行处理提取出第二个IMF,如此循环,直至最后一个IMF即Cn(t)被提取出来.最后的残余分量rN(t)通常为一常数或者趋势项并且不可以再分解.各个IMF和残余分量可以重构信号s(t):EMD将信号分解成若干个频率从高至低的IMF,整个过程体现了多尺度的自适应滤波特性.根据这一特点,我们可以根据信号的要求,有效地对某一频率范围内的信号进行处理[11].此外,由于EMD是根据信号的局部时间尺度进行分解的,其基函数的选择来自于信号本身,因此减少了主观因素的影响.2 算法原理语音信号的短时自相关函数R(τ)定义为:其中s(n)为加矩形窗并且窗长为N的浊音语音帧,τ为延迟.R(τ)呈现出与浊音语音周期相一致的周期特性,并在τ=Fs/Fp的地方出现最大峰值点(Fs为采样频率,Fp为基音频率),因而通过计算R(τ)并找出它的除零点以外的最大峰值点就能够检测出该浊音语音帧的基音频率.但是,如引言所述,实际的最大峰值点的筛选受到多种因素影响,因此ACF在实际检测过程中经常会发生倍频错误.如图1所示,图1(a)为一帧浊音语音,图1(b)为该语音帧的ACF,可以看到ACF的实际基音峰值点应为第106采样点,但是除零点以外的第一最大峰值点出现在第46采样点,此时ACF出现了倍频检测错误.根据上文对EMD的分析我们知道,EMD可以将信号分解成若干个频率从高至低的IMF,因此我们可以利用EMD将ACF的基音信息分解到某一个IMF中.图1(c)至图1(g)是图1(b)的ACF经过EMD处理后得到的各个IMF和残余分量,可以看出IMF2包含了这一帧语音的基音信息,所以通过IMF2就可以很方便地估计出这一帧语音的基音.此外,由于理论上每一个IMF只含有单一的频率信息,因此利用IMF检测基音不会受到其他因素(如共振峰和噪声等)的影响.综上所述,如何筛选出含有基音信息的IMF是本文算法的关键.人的基音频率范围一般为50~500 Hz,我们可以在基音检测之前将语音信号通过50~500 Hz的带通滤波器,去除大部分共振峰和噪声影响,保留基音信息.由人的发音机理可以知道语音信号的能量是以基音和与其邻近的几个高次谐波的能量为主,因此含有基音以及它的邻近高次谐波信息的IMF重构组成的信号的能量理论上应接近于原始语音信号的ACF的能量.基于此,本文提出了一种基于累积能量分布的IMF选择方法,具体步骤如下:(1)定义累加信号图1 一帧浊音语音的ACF的经验模式分解Fig.1 The decomposition of ACF ofa voiced speech frame by using EMD由EMD的原理可知,ACF可以记为式(6)中resi为残余分量.(2)计算所有SUM和ACF的短时能量,记为Energy(1),Energy(2),…,Energy(n),Energy(ACF);同时定义各累加信号SUMi与ACF的短时能量差,记为并将所有的Δi归一化.(3)选定阈值Thr1,若则判定IMF1为含有基音信息的IMF;否则,转入步骤(4).(4)选定一个阈值Thr2,则含有基音信息的IMF即为图2为基于图1(b)中的ACF计算所得的Δi的折线图.如图所示,从Δ1至Δ4,它们的数值越来越小,同时Δ2至Δ4均小于Thr2=0.1(本例中设定的阈值),这说明重构信号SUMi随着IMF的累加,能量越来越接近于原始信号ACF的能量;此外,当SUMi累加至IMF2时,重构信号的能量开始首次接近于原始信号的能量,在图中表现为Δi首次小于我们设定的阈值Thr2=0.1.因此由式(9)可以判定IMF2即为包含基音信息的IMF,实际上IMF2确实包含了基音信息(由图1(d)可以看出).经过我们初步研究发现,阈值Thr1和Thr2的选择是经验性的,所以并无确切的值,一般情况下的基音检测可以设定根据以上的分析,基于EMD的ACF的基音检测改进算法的具体步骤如下(算法流程如图3所示):图2 基于图1(b)中ACF的Δi折线图Fig2 The line chart of Δi based on the ACF in Fig.1(b)图3 基于EMD的ACF的基音检测改进算法Fig.3 A modified ACF pitch detection algorithm based on EMD(1)对语音信号s(n)进行50~500 Hz的预滤波,去除大量共振峰以及各种噪声影响,得到滤波后的语音信号sf(n);(2)对滤波后的语音信号sf(n)进行分帧处理;(3)对每一帧语音进行清浊音判断,清音帧和静音帧的基音记为0;(4)求浊音帧的自相关函数ACF;(5)利用EMD对ACF进行分解,利用上文所提方法选取含有基音信息的IMF;(6)利用含有基音信息的IMF检测出浊音帧的基音,最后输出基音轨迹P(n).3 仿真实验实验所用语音为实验室录制的一名成年男子朗读“树上的落叶掉光了”的纯净语音,语音以11 025 Hz采样率,16 bit采样精度.实验中对语音分帧帧长设为40 ms,帧移为20 ms.图4为分别使用传统ACF、WAC和本文所提算法对该段语音进行基音检测的结果,图中横坐标为帧,纵坐标为基音频率(单位Hz).图4(a)、(b)和(c)分别为ACF、WAC和本文所提算法的检测结果,从它们的基音轨迹可以看出,传统ACF基音检测算法在多处出现明显的倍频错误,这是由于以共振峰为主的多种原因的影响导致ACF除零点之外的第一最大峰值点并不是真实的基音点,因此检测结果并不理想.WAC相较于ACF克服了多处倍频错误,但是由于AMDF的均值下降趋势导致倍频错误依然存在.而本文算法检测所得的基音曲线光滑规整,有效地修正了传统ACF算法中的多处倍频错误.图4 ACF、WAC和本文所提算法检测一段语音的基音Fig.4 Pitch detection of a speech signal by using ACF,WAC and the proposed algorithm为了进一步评价本文所提算法,仿真实验使用基尔基音检测参考数据库(the Keele Pitch Extraction Reference Database)[10]来测试各个算法的性能.基尔基音检测参考数据库中所有语句均以20 000 Hz采样,16 bits量化,数据库中提供以512点为帧长、200点为帧移的所有浊音帧的参考基音信息.实验选用了数据库中两位男性(M2-M3)和两位女性(F1-F2)的每人1段语句,共计4段语句进行基音检测.根据Rabiner[2]的定义,检测结果(以基音周期计算)与参考基音的误差大于或等于1 ms则定义为基音粗差(Gross Pitch Error,GPE),实验中以%GPE作为比较参量评价各个方法的性能.此外,为了更好的比较3种算法的性能,本次实验均不对检测结果做任何后期处理(如基音曲线平滑等).表1给出了3种算法在无噪声环境下的检测结果.从表中可以看出本文所提算法在4个样本F1-F2-M2-M3中均有相对较低的%GPE,相比于WAC能够更好地克服ACF检测过程中的倍频错误.表2给出了ACF和本文所提算法在无噪声环境下和高斯白噪声(SNR=10,5,0,-5,-10 dB)环境下的检测结果(由于AMDF对白噪声没有鲁棒性,白噪声环境下语音信号如无其他预处理,WAC的检测结果会明显不如ACF,所以噪声环境下的对比试验仅仅对比ACF和本文所提算法).由表2可以看出,本文所提算法在噪声环境下仍然能够较好地克服ACF的倍频错误,取得不错的%GPE.此外由于EMD的多频分辨特性,本文所提算法筛选出的含有基音信息的IMF不受其他频率分量影响,能够避免噪声等因素的干扰,因此即使在信噪比低至-10 dB时,本文所提算法的检测效果依然较好.表1 纯净语音的3种算法的检测结果比较Table 1 Comparison of three methods using clean speechACF WAC EMDACF F1 9.41 8.56 6.11 F2 6.41 5.58 4.63 M2 23.01 21.84 9.23 M3 9.45 7.86 6.07表2 不同信噪比下ACF和本文所提算法的检测结果的比较Table 2 Comparison of ACF and the proposed algorithm at different SNRF1 ACF EMDACF 41.99 28.38 F2 ACF EMDACF 9.41 6.11 11.95 7.81 13.39 10.15 17.37 11.23 25.08 15.31 41.22 25.89 M2 ACF EMDACF 6.41 4.63 8.31 6.23 10.73 8.77 13.83 10.87 23.24 15.56 56.37 41.03 M3 ACF MACF 23.01 9.23 25.18 10.04 9.45 6.07 11.70 10.60 27.21 11.76 31.69 16.86 43.05 25.94 13.48 11.92 20.05 18.31 33.05 20.87 58.73 35.934 结论本文首先介绍了EMD以及它的自适应多频分辨率的性质并且给出了EMD的分解算法;然后分析了ACF基音检测算法并指出了它的不足之处,即共振峰等因素导致ACF算法在实际应用中易出现倍频检测错误;接着针对ACF基音检测算法的不足之处给出了基于EMD的改进算法,并提出了一种如何有效选取含有基音信息的IMF 的方法;最后进行了仿真对比实验.仿真实验结果表明:本文所提算法能够有效地克服ACF算法的倍频错误,同时其性能优于传统ACF以及它的改进算法WAC.[参考文献][1] Shimamura T,Kobayashi H.Weighted autocorrelation for pitch extraction of noisy speech[J].IEEE Transactions on Speech and Audio Processing,2001,9(7):727 -730.[2] Rabiner L R,Cheng M J,McGonegal C A.A comparative performance study of several pitch detection algorithms[J].IEEE Transactions on Acoustics,Speech and Signal Processing,1976,24(5):399 -417.[3] Ross M,Shaffer H,Freudberg R,et al.Average magnitude difference function pitch extractor[J].IEEE Transactions on A-coustics,Speech and Signal Processing,1974,22(5):353 -362.[4] Ahmadi S,Spanias A S.Cepsrum-based pitch detection using a new statistical V/UV classification algorithm[J].IEEE Transactions on Speech and Audio Processing,1999,7(3):333 -338.[5] Kadame S,Broudreaux-Bartels G F.Application of the wavelet transform for pitch detection of speech signals[J].IEEE Transactions on Information Theory,1992,38(2):917 -924.[6] Amado G.Pitch detection algorithms based on zero-cross rate and autocorrelation function for musical notes[C]//Proceedings of ICALIP.Shanghai:IEEE,2008:449 -454.[7] Hasan M K,Hussain S,Setu M T H,et al.Signal reshaping usingdominant harmonic for pitch estimation of noisy speech[J].Signal Processing,2005,86(5):1 010 -1 018.[8] Huang N E,Zheng S,Long S R,et al.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[C]//Proceedings of Royal Society A.London:Royal Society,1998:903 -995.[9] Molla M,Khademul I,Hirose K,et al.Pitch estimation of noisy speech signals using empirical mode decomposition[C]//Proceedings of InterSpeech.Antwerp:ISCA,2007:2 117 -2 180.[10] Meyer G,Plante F,Ainsworth W A.A pitch extraction reference database[C]//Proceedings of EUROSPEECH.Madrid:ISCA,1995:827 -840.。
基于FFT-ACF和候选值估计的基音周期提取方法
由于语音 信号 是非平 稳 的时 变 信号 ,只有其 中
的浊 音部分能 够看 作是 准周 期 的 ,所 以在 语 音信 号 的基 音周期提 取 中通 常 采取 短时 处 理技 术 ,即对语
音信 号加窗 ( 矩形 窗 、汉 宁窗等 )分 帧 ,然 后 针对
期实 际值 ,即倍 频 错误 ) . 因此 为 准 确 提 取基 音 J 周期 ,对基音 周 期 候 选 值 的 后处 理 是 必 不 可 少 的.
存在 同样 的问题 :从 波形 上来 看 ,两 者都 随着 Ⅳ 的 增 加 ,幅度逐 渐 降低 ,呈 现 一种 减 弱 的趋 势 .而基 音 周期候 选值 通 常是用极 值 点来 估 计 的 ,这 种 减弱 的趋势 就为基 音周 期候 选值 的估 计 带来 了困难 ,导
1 基音周 期候选值估 计 函数
最 为传统 的基 音周期 候选 值估计 函数 是 A F和 C
A F MD .这两 个 函 数 的时 间复 杂 度 都 比较 高 ,设 要
A F 、幅 度 差 平 方 和 函 数 、混 合 幅 度 差 函 C
数 J A D _ 和 L A D 等 .但 在 实 际 应 用 、C M F4 V M F 中,这 些基 音 周 期 估 计 函数 往 往 要 发 生 偏 长 错 误
C MD A F的时 间复杂度 为 , N ) L A F的时 间复 J 2 ; V MD (
收 稿 日期 :2 0 -4 0 0 70 -4;修 回 日期 :2 0 6 1 0 7 0 1 基金项 目:深圳市科技计划资助项 目 ( K 0 6 1 Q 2 00 ) 作者简介 :徐 明 ( 97 ) 16 . ,男 ( 汉族 ) ,湖南省怀化市人 ,深圳大学 高级工程师
基音周期检测ACF算法及MATLAB仿真
语音信号 ( ) n 的某帧信号的短时平均能量 的 定义为 :
收稿 日期 : 1 2 0—1 0 2—2 5
自相关 函数中产生一个 峰值 , 而当该 峰值又可以 同基 音频率的峰值相 比拟时 , 从而会 给基音值检测带来误
.
8 . 6
E = [ m x + ] ( ) ( m) =∑ ( ) m
一
就被称为一“ 。 帧” 一般要采用交叠分段 的方法 , 这是 为了使帧与帧之间平滑过渡 , 保持其连续性。前一帧
段具体的语音信号进行滤波、 采样、 分帧、 求短时 自
窗口长度的选择非常重要 , 窗长过短会使得分析窗内
相关函数 , 较准确地得到浊音语音信号的基音周期。
2 基 于 自相关 函数 的基音周 期 检测原 理
变化轨迹 曲线 , 或者是尽量相吻合 的轨迹 曲线。因为 它的重要性 , 基音的检测提取一直是一个研究 的课题。 为此提出了各种各样的基音检测算法 , 自相关 函数 如
工频的干扰 ; 高端截止频率设 为 90 z 0H 既可除去大部
能保留其一二次谐波。 2 2 分帧 .
分共振峰影响 , 又可 以当基音最高频率为 40 z 5 H 时仍
6 — 0 H 的带通滤波器对语音信号进行滤波 , 0 90 z 并利
用滤波后的 自相关函数来进行基音估计。将滤波器低
端截止频率设为 6 H , 0 z这是 因为可 以抑制 5 H 电源 0z
基音周期检测也称为基频检测 ( ihD t tn , P c e co ) t ei 它的目标是找出和声带振动频率完全一致 的基音周期
.
() 1
tm 0m 其 值 o ) ,:它 ( i
f ,m= 1 0一( 一1 Ⅳ )
基于短时自相关函数法的基音周期检测
ixb=vseg(i).begin;
ixe=vseg(i).end;
ixd=ixe-ixb+1;% 求取一段有话段的帧数
for k=1 : ixd % 对该段有话段数据处理
u=y(:,k+ixb-1); % 取来一帧数据
ru= xcorr(u, 'coeff'); % 计算归一化自相关函数
ru = ru(wlen:end);% 取延迟量为正值的部分
[tmax,tloc]=max(ru(lmin:lmax)); % 在基音频率范围内寻找最大值
period(k+ixb-1)=lmin+tloc-1; % 给出对应最大值的延迟量
end
end
4.2.4实验结果
图4端点检测的语音信号
图5有话段的基音周期
图2图中实线代表语音起始点,虚线代表语音终点
2.2.5结果分析
基音周期是语音信号的重要参数之一,它描述了语音激励源的一个重要特征。语音的头、尾部并不能具有声带振动那样的周期性,也就是检测不到相应的基音周期。如果要进行基音周期的计算,首要的必然是检测语音端点,将有话段从整段语音中分离出来,才能开始对语音的基音周期进行计算.
Esum(i) = sum(Sp.*Sp); % 计算能量值 (能量放入Esum里)
prob = Sp/(sum(Sp));% 计算概率
H(i) = -sum(prob.*log(prob+eps)); % 求谱熵值(eps表示很小的数,避免为零)(谱熵放入H里)
end
hindex=find(H<0.1);%(find返回非零元素,hindex放入,即谱熵值小于0.1的索引)
基于ACF和AMDF的基音检测改进算法
【 s at T e uo or ao F n t n A F ad h A eae Abt c】 h A t r C r lt n u co ( C ) n te vrg Mantd D frn e uci A F) ae e i i gi e ieec F nt n( MD u o r
t c mm o l u e meho o pt h d tc in. The ha e i e en e a d smia sa itc l c a a trsi . wo o ny s d t d f ic ee to y v nd p d nt n i lr ttsia h r ce t i cs
B s d n h d s u so o ta i o a a e o t e i si n f rd t n l i h ee t n lo i m , a o r h n ie p l ai n c i p t d t ci a g rt c o h c mp e e s a p i t wi ACF n v c o t h a d AMDF s ie i gv n. Te h me h d i s l a d r cia l . to s i e n p a t b e mp c I S etr ta t d t n l t t b t h n r i o a i e a i me— o i p th d man i c
d tc in loi m . S mu ain e u t h w h t h ag r h ee t ag r h o t i l t r s l s o t a t e l o t m h s t n a t os a i t . o s i a sr g n i i o n e b l y i
基于ACF和AMDF的基音检测改进算法
周期处产生一个极大值, 因此通过计算语音信号的自
相关函数,找到极大值位置,就可以估计信号的基音周
期。 这种算法的优点是算法简单,提取出的基音周期较
为精确。
对 于 离 散 的 数 字 语 音 信 号 序 列 x(n)如 果 具 有 周
期性,即
x(n)=x(n+NP)
(1)
则其自相关函数也是同周期的周期函数,即
基音周期检测算法主要有两类:时域法和频域法。 时域法的特点是比较直观且运算量小, 缺点是抗噪声 性能差,容易产生倍频和半频现象,主要方法有自相关 函数法、平均幅度差函数法等。频域法的特点是抗噪声 的性能较好,但是算法比较复杂,运算量较大,主要方
輩輮讂
2011年 第 35 卷 第 01 期
法有普通频域算法和倒谱法等[3]。
【Abstract】 The Auto Correlation Function ( ACF ) and the Average Magnitude Difference Function ( AMDF ) are
two commonly used method of pitch detection . They have independent and similar statistical characteristics .
图 2 为采用平均幅度差函数法进行基音周期检测 的仿真结果,这里仍采用上例所示的男声语音材料,从 实验结果可以看出, 由于重叠的波形越来越短,AMDF 曲线的值也越来越小, 可以将 AMDF 的值除以重叠的 点数来改善这种变化,这里不再详述。
2.2 AMDF 法
由于自相关函数本身的乘加运算,所以计算不会
基于自相关函数和平均幅度差函数的算法是基音 周期估计的 2 种常用方法。 两者具有独立且相似的统 计特性,即自相关函数在基音周期处表现为峰值,而平 均幅度差函数表现为波谷,因此可以同时运用 ACF 和 AMDF 的特点, 求取 ACF/AMDF 或 AMDF/ACF 的商, 对应基音周期处应出现更明显的峰值或谷值, 从而提 高基音检测的准确程度。
基于去噪的ACF-CEP基音检测算法
设 s (t )为纯净 语 音信 号
,
(t )为噪 声信 ( t ) 为带噪 声语 音信号 则 有 :
,
n
删
=
% 譬 篡∥
、
p
烈w ’
㈥
,
期
。
y (t )
=
s
(t )+ n (t )
,
一
(5 ) 则可 以 得下 式
:
对输 入 语音 进 行 L P C 分 析 获 得 预 测 系 数 c 【 并 由此 构 成 逆 滤 波 器 A (Z )
。
8k H
,
。
. 、
,
,
,
本 实 验 所 用 语 音 样本 用 计 算机 声卡 以 采 样 率 16 b i t 量 化 在 办 公 室 环 境 下采集 测 试所 用 的语 句 为 : 毕业 论
“ 。
=
文
”
,
共
1
.
64538
秒
,
,
13 16 4
个样 点
,
,
将
。
、
,
语 音信 号 加 窗 分 帧 窗长 3 0 m s 动 1 0 m s 得 到 基 音频 率轨 迹 图
,
,
。
“
”
一
~
,
.
.
,
,
.
,
,
,
。
原 始语 音 时 域 图 ( 单 声 道 ) 室 内 微 量 噪声 8 K H z 采样 1 6 b i t 量化
,
,
,
。
,
以 下 加 入 高 斯 白噪 声
。
,
信噪 比为
残差域加权ACF基音周期检测算法
残差域加权ACF 基音周期检测算法X肖 强1,王 亚1,陈 亮2(1.解放军理工大学通信工程学院研究生4队,江苏南京210007;2.解放军理工大学通信工程学院电子信息工程系)摘 要:针对传统自相关(A CF )基音周期检测算法存在较多的倍频和半频错误,文章提出一种基于线性预测残差域加权A CF 基音周期检测方法。
首先对语音信号中心削波,减小共振峰的影响;而后进行线性预测分析获得残差信号,对其求自相关值和循环幅度差(CA M DF )值,以CAM DF 的倒数值为权重加权A CF 进行基音周期检测;最后通过基音平滑算法对提取的基音轨迹进行后处理。
仿真实验表明,该算法可降低基音提取的倍频和半频错误,提高估计精度。
关键词:基音周期检测;自相关函数;线性预测误差;语音信号处理中图分类号:T N 912.3文献标识码:A 文章编号:CN 32-1289(2011)01-0033-04Weighted ACF Pitch Detection Algorithm Based onLinear Prediction ResidualX I AO Qiang 1,W AN G Ya 1,CH E N L iang 2(1.P ostg raduate T ea m 4ICE,P L A U ST ,Nanjing 210007,China ;2.Depar tment o f Electr onic Info rmat ion Engineer ing ICE ,P LA U ST )Abstract :A modified v ersion of the ACF pitch detectio n alg orithm is proposed in this paper .Firstly ,linear predictiv e coding analysis is performed o n the clipped speech sig nal .Then the seg-mented speech is filtered by the inverse filter to get the linear predictio n error ,the ACF and CAMDF value of the err or signal are calculated.Finally,as the CAMDF has similar characteris-tics w ith the ACF,the ACF is w eighted by the reciprocal of the CAMDF.Simulatio n results show that the pr opo sed algor ithm leads to hig her accuracy o f the estimated pitch than traditional ACF method .Key words :pitch detection ;ACF ;linear prediction error ;speech signal processing 基音周期是语音的一个非常重要的特征参数,广泛应用于低速语音编码、说话人识别、语音识别等领域。
低复杂度的基音检测算法
低复杂度的基音检测算法李会雅;苑林;门晋喜;韩晓霞【摘要】在确保语音信号基音检测算法准确度和稳健性的前提下,降低其复杂度,增强实时性.首先给出了基音周期提取过程的实现框图,而后结合流程图详细阐述了提出的新算法,最后通过对仿真实验结果的分析,表明新算法在噪声环境下,仍能精确地提取基音周期.【期刊名称】《河北大学学报(自然科学版)》【年(卷),期】2013(033)005【总页数】6页(P548-553)【关键词】基音检测;低复杂度;短时自相关;短时平均幅度差【作者】李会雅;苑林;门晋喜;韩晓霞【作者单位】河北大学电子信息工程学院,河北保定071002;河北大学工商学院,河北保定071000;95866部队无线电导航教研室,河北保定071051;河北大学电子信息工程学院,河北保定071002【正文语种】中文【中图分类】TN911.7基音周期是描述浊音激励源的一个基本特征,其倒数称为基音频率.基音频率的不同轨迹就是声调,在汉语中声调承担着构字辩意的作用,因此基音检测是汉语语言处理的关键环节.自相关函数法(ACF)[1]和平均幅度差函数法(AMDF)[2]是基音检测的经典算法,但准确性不高,容易产生倍、半基音,在平滑过程中不仅增加了处理时间和算法复杂度,还可能引入新的误差[3-4].小波变换是近年来的研究热点,具有良好的时频局部分析能力,但受声道响应的影响较大,计算量大.文献[5]给出了降低复杂度的自相关函数法,但准确率不很理想.文献[6-7]中的平均幅度差加权自相关法(AWAC)和文献[8]中的自相关能量函数及幅度差能量函数相结合的算法,对于随信噪比减小而越来越大的谐波峰值点起到了一定的抑制作用,突出了基音周期的峰值点.但文献[8]中的算法,含有大量的平方运算,计算复杂度高.为了进一步降低其计算量,增强实时性,提高基音检测算法的鲁棒性,在研究ACF法和AMDF法的基础上,提出了一种基于ACEF和MDEF的新算法,既保留了算法简单、计算量小的优点,又提高了准确度,有效杜绝了新误差的出现.1 基音检测基础1.1 短时自相关函数(ACF)对于确定性信号序列x(k),自相关函数定义为由于浊音的波形序列具有准周期性,而且其R(τ)的周期与浊音的周期相同,因此可利用R(τ)第1个峰值的位置来估计基音周期.设含噪语音信号s(k)由纯净语音信号x(k)及噪声信号n(k)组成,可表示为[8]若用来选择语音段的窗函数为矩形窗,则定义含噪语音信号s(k)的短时自相关函数为其中,N 为帧长,τ为位移,Rxx(τ)为x(k)的自相关函数,Rxn(τ)为x(k)与n(k)的互相关函数,Rnx(τ)为n(k)与x(k)的互相关函数,Rnn (τ)为n(k)的自相关函数.一般地,语音信号x(k)与噪声信号n(k)无关,则Rxn(τ)=0,Rnx(τ)=0,式(3)可表示为当τ≠0时,n(k)互不相关,则Rnn(τ)=0,则Rss(τ)可以表示为由式(5)易知,当τ≠0时,含噪语音信号的自相关函数Rss(τ)与噪声n(k)无关,完全等于Rxx(τ).1.2 平均幅度差函数(AMDF)对于完全的周期信号m(k),在其周期NP整数倍的样点上幅值相同,可表示为实际浊音信号的d(k)会在基音周期的整数倍位置出现不为零的极小值.若用来选择语音段的窗函数为矩形窗,则定义语音信号s(k)的短时平均幅度差函数为其中,N为帧长,τ为位移.若语音信号s(k)在窗函数取值范围内具有周期性,则Fss(τ)将在τ=0,±NP,±2 NP,…处出现极小值.比较式(7)与式(3)可知,Fss(τ)的运算过程较Rss(τ)简单,易于硬件实现.1.3 三电平中心削波为了消除声道共振峰和语音谐波对基音周期检测的影响,对语音信号进行预处理[11].本文采用三电平中心削波的方法,对输入的语音信号进行处理,其输入输出函数其中,y(k)为三电平中心削波器的输出信号,s(k)为三电平中心削波器的输入信号,±CL为削波电平.由式(8)可知,当削波器的输入s(k)>CL时,削波器的输出为1;当削波器的输入s(k)<-CL时,削波器的输出为-1;当削波器的输入为其他情况时,削波器输出全为零.语音信号经过三电平削波后,其中大多数次要的峰值被滤除掉了,仅保留下明显显示周期性的峰值.之后采用自相关法进行基音检测时,可大大减少错判为倍频或半频的情况.2 基音检测算法2.1 基音检测过程框图基音检测过程分为3个阶段:预处理、基音检测、后处理,具体过程如图1所示. 图1 基音检测实现过程Fig.1 Realization process of pitch detection in this paper在预处理阶段,由录音设备采集的语音信号首先通过带通滤波器,以抑制50Hz的电源干扰和大部分共振峰的影响,之后存入循环缓冲区.为确保语音信号基音检测的连续性,在取帧时,帧移与帧长的比值一般取为,前一帧与后一帧相交叠部分的数据长度,称为帧移.将每帧数据通过削波函数,削去和声道有关的波动.在基音周期估计阶段,采用Matlab仿真软件,记录下本文算法得到的仿真波形中相邻2个峰值横坐标之间的距离,即相隔的采样点数.在后处理阶段,去大野点模块去除峰值横坐标相隔采样点数的错误估值,之后采用试探平滑处理算法[10],进而得到语音信号的基音周期.2.2 自相关能量函数及幅度差能量函数相结合的算法由于ACEF会在语音信号基音周期整数倍的位置上呈现峰值,而相应处的MDEF 则会呈现出谷值的特性.因此,采用本文算法得到的仿真曲线中,基音周期整数倍处呈现峰值的特性将更加突出,有利于基音周期的提取.而且算法仅涉及到1和0的相乘和相加运算.由此可见,新算法的计算复杂度较低,而且运算量也得到了大幅度的降低.3 仿真实验及结果分析本实验采用的测试语音信号是在实验室的噪声环境下录制的,其采样频率fs为16kHz,每个采样点为16bit量化,含噪测试语音信号波形如图2所示.仿真实验过程中采用的带通滤波器通带为60~90Hz,通过调用语音信号处理工具箱中的分帧函数,实现对语音信号流的分帧处理,其中窗函数为矩形窗.帧移与帧长N的比值取为基于语音信号的短时平稳性,以下仿真过程均是逐次对每帧语音信号进行相应的处理.三电平中心削波处理过程中,首先分别找出该帧前个语音信号采样值中的最大值,然后比较这2个最大值,取其中较小值的65%作为门限电平.将偏离采用本文算法的仿真曲线中相邻2个峰值横坐标之间相隔采样点数平均值以上的数值设为大野点,中值平滑的滑动窗口宽度为3,精度为中值的,将不在平滑范围内的点置为0,从而纠正个别估值的错误,最后得到语音信号的基音周期的平均值. 设采用本文算法的仿真波形中相邻2个峰值横坐标之间相隔的采样点数为NT,则基音周期T=NT/fs,其中fs为采集语音信号时的采样频率,单位为kHz.图2 含噪测试语音信号波形Fig.2 Waveform of Noisy test speech signal由图2可见,测试语音信号波形的幅度处于[-0.1,0.1]内,其持续时间为0.12s,波形带有锯齿状的毛刺,说明测试语音信号的录制环境含有噪声.应用语音信号处理Praat软件对测试语音信号进行基音频率提取的仿真图形,如图3所示.图3 Praat处理测试语音信号的仿真图形Fig.3 Simulation graphics of the test speech signal using Praat由图3可见,Praat软件得到的测试语音信号基音频率为229.49Hz,则该测试语音信号的基音周期为以该测试语音信号的第6帧数据为例,此帧语音信号的一般自相关函数和幅度差函数结合的(ACFMDF)的仿真示意图如图4所示;基于自相关能量函数和幅度差能量函数(ACEF-MDEF)的仿真示意图如图5所示.图4 第6帧语音信号采用ACF-MDF函数的仿真示意Fig.4 Simulation graphics of the Sixth frame test speech signal using the ACF-MDF function图5 第6帧信号采用ACEF-MDEF函数的仿真示意Fig.5 Simulation graphics of the Sixth frame test speech signal using the ACEF-MDEF function由图4可见,在使用ACF-MDF函数法得到的第6帧测试语音信号的仿真示意图中,在采样点数为70的位置上出现了波形的峰值,但由于此处的峰值较小,在强噪声环境下会出现峰值提取的困难,甚至峰值会完全淹没在噪声信号中,以致无法提取出语音信号的基音周期.由图5可见,在使用ACEF-MDEF函数法得到的第6帧测试语音信号的仿真示意图中,采样点数为70位置上出现了波形的峰值,峰值尖锐明显,去除了一些对提取基音周期影响较大的谐波峰值点,使峰值点更加突出,有利于语音信号基音周期的提取,具有一定的抗噪声性能.综上所述,该帧语音信号的基音周期为,与Praat软件得到的基音周期存在0.018ms的差距.经去大野点和中值平滑处理后得到的基音周期为4.356 3ms,与Praat软件得到的基音周期只有0.000 7ms的差距,表明新算法在噪声环境下仍具有很高的准确性.4 结论基于ACEF-MDEF的基音检测算法克服了自相关函数计算量大和幅度差函数易受噪声影响的缺点,比ACF和AMDF直接结合的方法更准确,更稳定.新算法涉及到的运算简单,降低了时间和空间复杂度,适合应用于手持语音识别终端上.与此同时,基音检测的准确性和鲁棒性也有了很大提高.但由于语音信号产生过程的复杂性和不可预测性,以及基音周期本身固有的特性,到目前为止,还没有能适应任何人、任何环境的基音检测算法.因此,如何从语音信号中仅取出与声带振动有关的信息,去除声道的影响,是下一步需要解决的问题.参考文献:[1]RABINER L R.On the use of autocorrelation analysis for pitch detection[J].IEEE Trans on Acoustics Speech and Signal Proc,1977,ASSP-26(1):24-33.[2]ROSS M J,SHAFFER H L,COHEN A,et al.Average magnitude difference function pitch extractor[J].IEEE Trans on Acoustics Speechand Signal Proc,1974,22(5):353-362.[3]DUANPEI WU,TANAKA M,CHEN R,et al.A robust speech detection algorithm for speech activated hands-free application[Z].1999IEEE International Conference on Acoustics,Speech,and Signal Processing,Phoenix,1999.[4]BERITELLI F,CASALE S,SERRANO S.Adaptive V/UV speech detection based on acoustic noise estimation and classification[J].Electronics Letters,2007,43(4),249-251.[5]马祥杰,孟相如,张百生.一种自相关基音检测算法[J].通信技术,2003(5):9-11.MA Xiangjie,MENG Xiangru,ZHANG Baisheng.An autocorrelation algorithm for pitch detection[J].Communications Technology,2003(5):9-11.[6]刘建,郑方,邓答,等.基于混合幅度差函数的基音提取算法[J].电子学报,2006,34(10):1925-1928.LIU Jian,ZHENG Fang,DENG Da,et bined magnitude difference function based pitch tracking algorithm.[J].Chinese Journal of Electronics,2006,34(10):1925-1928.[7]陶维青,徐士林,仁静.汉语语音的基音快速提取算法[J].合肥工业大学学报:自然科学版,1996,19(3):31-36.TAO Weiqing,XU Shilin,REN Jing.Algorithm of Chinese Speech Pitch Extraction[J].Journal of Hefei University of Technology:Natural Science Edition,1996,19(3):31-36.[8]李娟.基音周期检测算法研究及在语音合成中的应用[D].太原:太原理工大学,2008.LI Juan.Study of speech pitch detection algorithm and application in speech synthesis system[D].Taiyuan:Taiyuan U-niversity of Technology,2008.[9]朱建伟,孙水发.一种基于段的基音检测算法[J].三峡大学学报:自然科学版,2008,30(3):80-82.ZHU Jianwei,SUN Shuifa.Pitch detection of speech segment[J].Journal of China Gorges Univercity:Natural Science Edition,2008,30(3):80-82.[10]朱小燕,王昱,刘俊.汉语声调识别中的基音平滑新方法[J].中文信息学报,2000,15(2):45-50.ZHU Xiaoyan,WANG Yu,LIU Jun.An approach of fundamental frequencies smoothing for Chinese Tone Recognition[J].Journal of Chinese Information Processing,2000,15(2):45-50.[11]胡航.语音信号处理[M].4版.哈尔滨:哈尔滨工业大学出版社,2009.。
一种改进的自相关基音检测算法
一种改进的自相关基音检测算法
胡瑛;陈宁;夏旭
【期刊名称】《电子科技》
【年(卷),期】2007(000)002
【摘要】提出了一种改进的ACF基音检测算法.检测前在小波域上用Teager能量算子对语音信号进行清浊音判决,在基音检测过程的前端和末端加入了有效的预处理和后处理技术.实验结果表明,该算法比传统的自相关算法具有更高的准确性,在低信噪比下,基音周期提取和清浊判决具有令人满意的效果.
【总页数】4页(P25-28)
【作者】胡瑛;陈宁;夏旭
【作者单位】中南大学,信息科学与工程学院,湖南,长沙,410083;中南大学,信息科学与工程学院,湖南,长沙,410083;中南大学,信息科学与工程学院,湖南,长沙,410083【正文语种】中文
【中图分类】TN91
【相关文献】
1.一种改进的汉语语音基音检测算法 [J], 李平;胡慧之
2.一种改进的正弦语音模型基音周期检测算法 [J], 孙华山
3.一种改进的强噪声背景下基音检测算法 [J], 胡连锋;夏秀渝;张佩;李志昌
4.一种改进的自相关函数基音检测算法 [J], 杨森斌;陈砚圃;李真
5.一种改进的抗噪基音周期检测算法 [J], 李娟;张雪英
因版权原因,仅展示原文概要,查看原文内容请购买。
基于归一化互相关函数的基音检测算法
技术报告T echn ical R epo rts基于归一化互相关函数的基音检测算法Ξ鲍长春樊昌信(北京工业大学电子工程系 北京100022) (西安电子科技大学信息科学研究所 西安710071)摘 要 本文提出了一种归一化互相关函数基音检测算法(N CCFPDA ——N o rm alized C ro ss 2Co rrelati on Functi on P itch D etecti on A lgo rithm ),该算法在基音检测主过程的前端和末端加入了有效的预处理和后处理技术,实验分析表明,该方法在一般噪声环境下,基音周期提取和清浊判决具有令人满意的效果。
关键词 语音处理 基音检测 相关函数P itch D etection A lgor ith m Based on NormalizedCross -Correlation FunctionB ao Changchun(D ep t .of E lectronic Engineering ,Beijing Po lytechnic U niversity ,Beijing 100022)Fan Changx in(Info rm ati on Science Institute,X idian U niversity,X i’an 710071)Abstract A no rm alized cro ss 2co rrelati on functi on p itch detecti on algo rithm (N CCFPDA )is p ro 2po sed in th is paper .T he efficien t p re 2p rocessing and po st 2p rocessing techno logies are in troducedbefo re and after the m ain p itch determ inati on p rocesses .T he experi m en tal analysis show the per 2fo rm ance is very satisfacto ry fo r p itch ex tracti on and unvo iced vo iced decisi on w ith th is m ethod under the general background no ise .Key words speech p rocessing ,p itch detecti on ,co rrelati on functi on1 引言 基音检测是语音处理中一个非常重要的问题,迄今为止,找到一个完善的适用于不同的讲话者、不同要求和环境、准确和可靠地检测语音信号基频的方法还是极其困难的。
基于短时能量的循环AMDF基音检测算法
基于短时能量的循环AMDF基音检测算法
马莎莎;戴曙光;穆平安
【期刊名称】《计算机仿真》
【年(卷),期】2014(031)007
【摘要】在语音识别优化问题的研究中,基音周期是语音信号的重要特征参数,准确提取十分困难.传统自相关函数(ACF)、平均幅度差函数(AMDF)等基音检测算法在基音周期提取中容易出现估计结果减半或者加倍的情况,导致检测结果准确率降低.针对上述问题,提出了短时平均能量和循环平均幅度差函数(CAMDF)相结合的基音周期检测方法.实验结果表明,改进方法在有效分离清浊音的基础上,加强了浊音基音周期所处采样点的谷值特性,减少了估计结果的半倍频错误,提高了基音周期估计精度,性能优于传统算法.
【总页数】5页(P278-282)
【作者】马莎莎;戴曙光;穆平安
【作者单位】上海理工大学光电与计算机工程学院,上海200093;上海理工大学光电与计算机工程学院,上海200093;上海理工大学光电与计算机工程学院,上海200093
【正文语种】中文
【中图分类】TP391.9
【相关文献】
1.循环AMDF及其语音基音周期估计算法 [J], 张文耀;许刚;王裕国
2.幅值补偿的AMDF基音周期检测算法 [J], 康广玉;郭世泽;孙圣和
3.基于线性预测编码与AMDF的高精度基音检测算法 [J], 王恩成;苏腾芳;袁开国;伍淳华
4.基于LV-AMDF的自适应基音检测算法 [J], 张康杰;赵欢;饶居华
5.一种基于多项式拟合的AMDF基音检测改进算法 [J], 郑婉璐;宗源;郑文明;胡斌;赵力
因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信号的处理中具有重要作用.
目前 常 用 的 基 音 频 率 检 测 方 法 大 致 分 为 3 类 , 即波形估 计法 、 关 处 理 法 和变 换 法 . 中波 相 其 形 估计 法实 现原 理简 单 , 是 往 往 会 引入 较 大 的误 但 差; 变换 法算 法较 为 复 杂 , 增 加 实 际运 算 的难 度 ; 会 相 关处 理法 算 法 实 现 简 单 、 测 精 度 高 , 此 成 为 检 因 常用 的基音 周 期 的 检 测 方 法 . 于 此 , 文 拟 采 用 鉴 本
表征 了浊 音激 励 的本 质 特 征 , 还包 含 了汉 语 音 节 的
收稿 日期 :0 1 0 2 1 — 6—1 4
种基音 检测 算法 .
1 相关处 理法的原理实现
由于 自相 关 函数 抗 噪性 能较 强 , 别 适 于 噪 声 特
作者简介 : 郭淑婷 ( 92 ) 女 , 18 一 , 河南省新 乡市人 , 州轻 工业学院助教 , 郑 硕士 , 主要研 究方向为信 号与信 息处理
第2 6卷 第 5期 21年 1 01 0月
郑 州 轻 工 业 学 院 学 报 (自 然 科 学 版 )
JU N L F H N Z O NV R IYO IH D S R N ta Si c ) O R A E G H UU IE S F G T N U T Y( a r c ne OZ T L I ul e
p th d tci n o o a te ctto pe c ina a e c mp ee fe t ey. ic ee t fs n n x iai n s e h sg lc n b o ltd efc i l o v Ke r s: t h dee to ACF; r — r c s i g; o tp o e sn y wo d pi t cin; c p e p o e sn p s— r c s i g
相 同 的周期 性特 征. 常将 浊 音 的声 带 振 动基 本 频 通 率 称 为基音 频 率 , 倒 数 则 称 为 基 音 周 期 . 音 估 其 基
计是指采用短时分析方法对语音信 号的基音频率
或基音周期进行分析估计 , 又称作基音 检测. 基音 频率作为描述语音信号基本特性 的重要参数 , 不仅
0 引 言
语音 信 号 是 声 道 响 应 声 门 的 激 励 作 用 而 产 生 的输 出信 号 . 据 声 带 的不 同状 态 , 以将 声 门 产 根 可
声调信息 . J 因此 , 基音检测作 为语 音信号分 析处
理 中 的基 本组 成部 分 , 涉 及 的 理论 和方 法 在 语 音 其
通过结合相应的预处理、 后处理技术, 可以有效地实现浊音和清音激励语音信号的 区分 以及 浊音激
励语 音信 号 的基音 周期检 测 . 关键 词 : 基音检 测 ; 时 自相 关 函数 ; 处理 ; 处理 短 预 后
中图分 类号 :N 1 T 92
文献标 志码 : A
Pic e e to l o ih a e o t h d t ci n a g rt m b s d n ACF
第 5期
郭淑婷 , : 等 基于 A F的基音检测算法 C
GUO h t S u—i ZHAO n - u ng, Mi o E g ,hnzo nvo ih Id, hnzo 50 2 C ia C lg e r n fr n .Z eghuU i fLg t n.Z eghu4 0 0 , h ) e fE c . n . . n
V0 . 6 No 5 12 .
0c . 2 t 011
文章编号 :0 4— 4 8 2 1 )5— 0 4— 4 10 17 ( 0 1 0 0 3 0
基 于 A F的基 音检 测 算 法 C
郭淑 婷 , 赵 明辉
( 州轻工 业 学院 电气信 息 工程 学院 ,河 南 郑 州 400 ) 郑 50 2 摘 要 : 出 了基 于短 时 自相 关函数 ( C ) 提 A F 的基 音检 测 算 法 , 利 用修 正 的 A F对 此算 法进 行 改进 , 并 C
c s ig a d p s— r c s i g tc n q e t e d s rmi ai n o o a ta d s r x i t n s e c in la d e s n o t o e s e h i u ,h ic n p n i n t n s n n n u d e ct i p e h sg a n o ao
Abta tA pt eet n a o tm b sdo uocr lt nfnt n( C src : i h d t i l rh ae n at—or a o u c o A F)w spo oe n m- c c o gi e i i a rpsd ad i
prv me tc n be a hiv d b h s ft e mo i e o e n a c e e y t e u e o h d f d ACF. c r i o ACF i c mb nain wi r p o i Ac o dngt n o i to t p e- r — h
相 关处 理 法 , 于短 时 自相 关 函数 ( C ) 提 出一 基 AF ,
生的激励信号分 为清音激励和浊音激励. 中, 其 不 是通过声带振动产生 的输入信号是清音激励 , 而浊
音 激励 是通 过声 带 的周 期 性 振 动产 生 的输 入 信 号 .
因此 , 由浊音激励产生的语音信号与声带振动具有