基于ACF和AMDF的基音检测改进算法
基于FFT-ACF和候选值估计的基音周期提取方法
基于FFT-ACF和候选值估计的基音周期提取方法
徐明;陈知困;黄云森
【期刊名称】《深圳大学学报(理工版)》
【年(卷),期】2007(024)004
【摘要】利用FFT-ACF算法进行基音周期候选值估计,减少在语音基音周期提取中常见的倍频和半频错误,提出针对候选值的多重后处理算法.后处理过程:首先运用峰值筛选法进行初选,接着利用一次均值法将语音分为不同的音高段,再使用二次均值法为每个音高段确定合适的频率范围,最后精确提取出基音周期.实验结果表明,基音周期后处理算法有效,在音乐哼唱识别应用中收到良好效果.
【总页数】5页(P388-392)
【作者】徐明;陈知困;黄云森
【作者单位】深圳大学信息中心,深圳,518060;深圳大学信息中心,深圳,518060;深圳大学信息工程学院,深圳,518060;深圳大学信息中心,深圳,518060
【正文语种】中文
【中图分类】TP391;TN912
【相关文献】
1.一种基于基音周期估计的音频水印算法 [J], 付永庆;孙滢
2.基于MBE模型的基音周期估计算法改进 [J], 唐斌;樊桂花
3.基于随机共振的基音周期估计方法 [J], 何朝霞;刘凯
4.基于随机共振的基音周期估计方法 [J], 何朝霞; 刘凯
5.基于FPGA的实时基音周期估计系统 [J], 李辉;王欣;戴蓓倩;陆伟
因版权原因,仅展示原文概要,查看原文内容请购买。
基于EMD的ACF基音检测改进算法
基于正交变换的基音检测算法
基于正交变换的基音检测算法刘宇驰;杜秀娟【期刊名称】《电脑知识与技术》【年(卷),期】2015(000)036【摘要】针对随机背景噪声下的基音周期检测,提出了一种基于正交变换的基音检测算法。
该算法通过正交变换对含噪的语音进行消噪,再求消噪后语音的自相关函数(ACF)和平均幅度差函数(AMDF),对其求出比值(ACF/AMDF)的平方以突显基音周期的峰值,以便获取较准确的基音周期参数。
实验结果表明,与单一的自相关法和平均幅度差函数法相比,该算法获取的基音周期有较高的准确性和对噪声有较强的鲁棒性。
%Aiming at pitch period detection under random background noise,a kind of pitch detection algorithm based on orthogo-nal transform is put forward. Noisy speech signal was first preprocessed by orthogonal transform, the autocorrelation func-tion (ACF) and the average magnitude difference function (AMDF) for speech signal were obtained. The square of the ratio for ACF and AMDF had been applied to emphasize the peak of the true pitch period. This algorithm can get the exact pitch of the speech signal in strong noisy environment. Experimental results indicate that, compared with single autocorrelation and average magnitude difference method, the proposed algorithm has better robustness and higher accuracy.【总页数】3页(P126-128)【作者】刘宇驰;杜秀娟【作者单位】青海师范大学计算机学院,青海西宁810008;青海师范大学计算机学院,青海西宁810008【正文语种】中文【中图分类】TN911【相关文献】1.基于列正交变换实现串行干扰消除的MIMO检测算法 [J], 王赟;汪晋宽;解志斌2.一种基于小波包变换加权自相关的基音检测算法 [J], 孙婷婷;章小兵3.基于小波变换与平均幅度差函数倒数的基音周期检测算法 [J], 武良丹;4.基于多分类支持向量机和主体延伸法的基音检测算法 [J], 冯起斌; 李鸿燕5.基于优化能量值门限和增强倍频效应的抗噪基音检测算法 [J], 杨贵福;夏一鸣;冉华;冯永平;孙慧因版权原因,仅展示原文概要,查看原文内容请购买。
改进的基音检测方法及在音乐检索中的应用
a. mp e gn e i g a d Ap l a in ,0 1, 7 6 : 2 -3 . 1 Co utr En i e rn n p i t s 2 1 4 ( ) 1 7 1 0 c o
Ab t a t T e p th d tc in i a l se t l t c n l g i u i a ay i n o tn a e sc er v l i i o n ain i s r c : h i ee t s l c o e s n i e h o o y n a do n l ss a d c n e t b s d mu i a rti a _t S f u d t n e o
C m ue E gn ei n A piain 计算机 工程 与应 用 o p t n ier ga d p l t s r n c o
2 1 ,7 6 01Байду номын сангаас()
17 2
@数 据 库 、 号 与信 息处 理 @ 信
改进 的基音 检测 方法及在音 乐检索 中的应用
李 鹏 周 明全 。夏小 亮 黎 南杉 , , ,
进 的 自相 关函g a tcr lt n fn t n A F 方 法进行基 音检测 。从对音频信 号进行 去噪预处 理 、  ̄(uo or a o u c o , C ) e i i 清浊音判 断及 后处理 等方
面对 A F进行 改进 , 之能 够生成规 整 的音 高变化 曲线 。在 音 乐检 索的 实现 中, 出一种有 限长度 的最 长公共 子序 列( oa C 使 提 L cl L n etC mmo tn , L S 方法, ogs o n Sr g L C ) i 该方 法可有 效解决传统方 法存 在的误 检 问题。开发 实现 了一个通过哼唱/ 唱进行歌 曲检 歌
改进LVAMDF及综合多因素基音检测算法
(SchoolofComputerScienceandTechnology,SouthwestUniversityofScienceandTechnology, Mianyang 621010,China)
犃犫狊狋狉犪犮狋:Onthebasisofthemethodologythatcategorizesspeechsignalintothreetypes,silence,voicelesssound,voicedsound,in viewoftherandomdistributionofobviousperiodicpropertyspeech,theimprovedalgorithm oflengthvariedaveragemagnitudedifference function (LVAMDF)andcomprehensivemultifactorforpitchfrequencydetectionisputforwardtocategorizevoicedsoundintotwotypes, oneisobviousperiodicpropertyspeech,theotheroneisunobviousperiodicpropertyspeech.Atthesametime,thestartingandending pointsofallaccuratepitchperiodintheobviousperiodicpropertyspeechisachieved.Forafewpitchperiodsdividedintofrequencydoubling orhalffrequency,therecognitionandcorrection methodisproposedwhichhasahighrecognitionandcorrectionrate.Finally,inalargea mountoftherealspeechprocessingexperiments,themethodcandetectthepitchperiodintheobviousperiodicpropertyspeechaccurately, andthereishardlyfrequencydoublingandhalffrequency.Theresultsshowthattheproposedalgorithmperformsmuchbetteronpitchdetec tioncomparedwithAMDFandACF.
基于MATLAB的语音信号的基音周期检测
基于MATLAB的语音信号的基音周期检测摘要:MATLAB是一种科学计算软件,专门以矩阵的形式处理数据。
MATLAB将要性能的数值计算和可视化集成在一起,并提供了大量的内置函数,从而被广泛的应用于科学计算、控制系统和信息处理等领域的分析、仿真和设计工作。
MATLAB在信号与系统中的应用主要包括符号运算和数值计算仿真分析。
由于信号与系统课程的许多内容都是基于公式演算,而MATLAB 借助符号数学工具箱提供的符号运算功能,基本满足设计需要。
例如:解微分方程、傅里叶正反变换、拉普拉斯正反变换和Z正反变换等。
MATLAB在信号与系统中的另一主要应用是数值计算与仿真分析,主要包括函数波形绘制、函数运算、冲击响应仿真分析、信号的时域分析、信号的频谱分析、系统的S域分析和零极点图绘制等内容。
本次课程设计为语音信号的基音周期检测,采集语音信号,对语音信号进行处理,区分清音浊音,并通过对采样值进行滤波、分帧、求短时自相关函数,得到浊音的基音周期。
关键字:清音、浊音、基音周期、基音检测、自相关函数目录1 概述 (1)2 AMDF算法原理及实现 (1)2.1 AMDF算法源程序 (2)3 ACF算法原理及实现 (4)3.1 用短时平均能量进行清/浊音的判断 (4)3.2 自相关函数基音检测的原理 (6)3.3 算法实现及相关程序 (6)3.3.1 带通滤波 (7)3.3.2 取样与分帧 (7)3.3.3 短时能量分析 (8)3.3.4 自相关函数分析 (11)4 总结与心得体会 (13)参考文献 (13)1 概述基音周期检测也称为基频检测(Pitch Detection) ,它的目标是找出和声带振动频率完全一致的基音周期变化轨迹曲线,或者是尽量相吻合的轨迹曲线。
基音周期检测在语音信号的各个处理领域中,如语音分析与合成、有调语音的辨意、低速率语音压缩编码、说话人识别等都是至关重要的,它的准确性及实时性对系统起着非常关键的作用,影响着整个系统的性能。
基于线性预测编码与AMDF的高精度基音检测算法
基于线性预测编码与AMDF的高精度基音检测算法摘要:根据语音信号产生原理,结合线性预测编码(lpc)与平均幅度差函数法(amdf),提出了一种高精度的基音检测算法。
该算法首先利用线性预测分析提取残差信号;然后采用累积平均归一化差分函数与差分信号修正,使基音周期的谷值点更加尖锐;最后利用二次函数拟合与基音周期的倍数检查筛选候选值,得到了准确的基音周期。
实验结果表明,与传统方法相比, 该算法的基音检测效果有了明显改善,减少了基音检测中的半频错误,在高信噪比下具有良好的准确性和鲁棒性。
关键词:语音信号;基音周期;线性预测编码;平均幅度差函数;自相关函数super resolution pitch detection based on lpc and amdfwang en.cheng1, su teng.fang1*, yuan kai.guo2, wu chun.hua 21. school of information engineering, north china university of technology, beijing 100144, china;2. school of computer, beijing university of posts and telecommunications, beijing 100876, chinaabstract:according to the mechanism of speech signal, a super resolution pitch detection algorithm which combined linear predictive coding (lpc) with average magnitude difference function (amdf) was proposed. firstly, residual of lpc was extracted by linear predictive analysis. then, cumulative mean normalized difference function and difference signal revision were used to make pitch valley sharper. at last, parabolic interpolation and pitch multiple check were taken to select real pitch period. experimental results indicate that the pitch detection effect of the algorithm is superior to that of the conventional algorithms. the proposed algorithm conquers half frequency errors, and has good accuracy and robustness under the condition of high snr. according to the mechanism of speech signal, a super resolution pitch detection algorithm, which combined linear predictive coding (lpc) with average magnitude difference function (amdf), was proposed. firstly, residual of lpc was extracted by linear predictive analysis. then, cumulative mean normalized difference function and difference signal revision were used to make pitch valley sharper. at last,parabolic interpolation and pitch multiple check were taken to select real pitch period. the experimental results indicate that the pitch detection effect of the algorithm is superior to that of the conventional algorithms. the proposed algorithm conquers half frequency errors, and has good accuracy and robustness under the condition of high signal.to.noise ratio (snr).key words:speech signal; pitch period; linear predictive coding (lpc); average magnitude difference function (amdf); auto correlation function (acf)0 引言人在发浊音时,气流通过声门使声带产生张驰振荡式振动,形成一股准周期脉冲气流,这种声带振动的频率称为基音频率,相应的周期称为基音周期。
基于ACF的基音检测算法
信号的处理中具有重要作用.
目前 常 用 的 基 音 频 率 检 测 方 法 大 致 分 为 3 类 , 即波形估 计法 、 关 处 理 法 和变 换 法 . 中波 相 其 形 估计 法实 现原 理简 单 , 是 往 往 会 引入 较 大 的误 但 差; 变换 法算 法较 为 复 杂 , 增 加 实 际运 算 的难 度 ; 会 相 关处 理法 算 法 实 现 简 单 、 测 精 度 高 , 此 成 为 检 因 常用 的基音 周 期 的 检 测 方 法 . 于 此 , 文 拟 采 用 鉴 本
表征 了浊 音激 励 的本 质 特 征 , 还包 含 了汉 语 音 节 的
收稿 日期 :0 1 0 2 1 — 6—1 4
种基音 检测 算法 .
1 相关处 理法的原理实现
由于 自相 关 函数 抗 噪性 能较 强 , 别 适 于 噪 声 特
作者简介 : 郭淑婷 ( 92 ) 女 , 18 一 , 河南省新 乡市人 , 州轻 工业学院助教 , 郑 硕士 , 主要研 究方向为信 号与信 息处理
第2 6卷 第 5期 21年 1 01 0月
郑 州 轻 工 业 学 院 学 报 (自 然 科 学 版 )
JU N L F H N Z O NV R IYO IH D S R N ta Si c ) O R A E G H UU IE S F G T N U T Y( a r c ne OZ T L I ul e
p th d tci n o o a te ctto pe c ina a e c mp ee fe t ey. ic ee t fs n n x iai n s e h sg lc n b o ltd efc i l o v Ke r s: t h dee to ACF; r — r c s i g; o tp o e sn y wo d pi t cin; c p e p o e sn p s— r c s i g
基于EMD的AMDF基音检测改进算法
第 l 3卷 第 1 期( 2 0 1 3年 )
C A MD F法 , 其检 测效 果也有 了显著 的提 升.
1 经验模 式分解
E MD是 N o r d e n E Hu a n g 等 人于 1 9 9 8年提 出的一种 新 的信号 分解方 法 1 2 ] . E MD的本质 是通 过信 号本 身 的特征 尺度 来将 信号 分解成 本 征模 式 函数 ( I n t r i n s i c Mo d e F u n c t i o n , I MF ) , 它 一 方 面具 有小 波 变换 多 分
( 1 )
c ( t ) =g 。 ( t ) 即为第 一个 I MF , 记为 I MF 1 , 利用 上述 算法 对残余 分量
r ( t ) =s ( t ) 一 C ( t ) ( 2 )
进 行 处理 , 提取 出第 二个 I MF , 如 此循 环 , 直 至最 后一个 I M F即 C ( t ) 被提 取 出来 . 最后 的残余分 量 ( t ) 通
通过对 E M D的分析可知 , 信号经过 E M D处理后 , 最后一项残余分量为常数项或趋势项 , 因此可利用 E MD去 除 A MD F的均值 下 降趋势 . 图 1为一浊 音语 音 帧的 A MD F经过 E MD处 理之后 的分解 结 果 , 通过 观
一
63 —
南京师范大学学报 ( 工程技术版 )
宗
源, 等: 基于 E MD 的 A MD F基 音 检 测 改 进 算 法
针对 A MD F存在 的这 种 问题 , 本 文提 出一 种 基 于经 验模 式 分解 ( E m p i r i c a l Mo d e D e c o m p o s i t i o n , E MD) 的A MD F基 音检 测改 进算 法 , 该 算法 对每 帧浊 音语 音 的 A MD F进 行 E MD处理 , 而后 去 除表 示 A MD F均值
改进的基音检测算法
摘
要 : 出了一种改进 的基 音检 测算 法。利用 L 提 MS自适应 滤波器对带噪语 音信 号进行语 音增强 , 求语音信 号的 自相 关函数 再 ( AMD , AC 峰值 和 AMD F)对 F F谷值进 行分析 , 提取 改进 的AC / FAMD F加权 平方特征进 行基音检 测。
1 引言
基音是 指发 浊音 时声带振 动 的周期 , 音周 期的估 计 称 基
较敏感 时 , 音检 测精度 明显下降 。针对这些 问题 , 出一种 基 提 改进 的基于 L MS自适 应滤 波和 A FA C / MDF J权平 方特征 的 ]1 [ 基 音检 测算 法 。实 验结果 表 明 , 出的算法检 测效 果 明显 优 提
o F AM DF i x rce o d t c e s e c i hE p r n a s l d c t a e p o o e i h d tcin ag r h i U fAC / s e ta td t ee t t p e h pt . x e me tl r ut i ia e t t t r p s d p t ee t o i m s S — h c i e sn h h c o l t
2山东大学 软 件学院 , . 济南 2 0 6 50 1
1Co l g f Elc rc I f r t n E g n e i g, n n I t r a i n l c n mi s Un v r i Ch n s a 4 0 0 , i a . l e o e t n o ma i n i e r e i o n Hu a n e n t a E o o c o i e st y, a g h 1 2 5 Ch n 2 Co l g f S f r S a d n i e st Jn n 2 0 61 Ch n . l e o o t e, h n o g Un v ri e wa y, i a 5 0 , i a
基于表面肌电信号的汉语单元音声调识别
在低频部分获得更高的分辨率。
MRMR(Max-Relevance and Min-Redundancy)
1.2 短时时域特征与 Mel 倒谱系数(MFCC)特征 参数的融合
在 MFCC 特征的提取过程中会丢失时域信息,然而
算法是在原始特征集合中,找到与最终结果相关性最大 且特征间相关性最小的一组特征。通过 MRMR 算法对 特征进行筛选,将筛选后的特征与 MFCC 特征参数融
对汉语的声调识别在语义理解、语音识别、语音合 成以及其他应用领域有着重要意义。汉语的“阴平”“阳 平”“上声”“去声”和“轻声”五个声调具有区别词义 的作用,利用声调可以大大减少拼音发音的候选字。
在难以采集语音信号的场景下,仍有方法维持人们 习惯的语音交互方式。例如视觉语言识别研究中使用摄 像头获取说话者嘴唇运动的视觉信息,通过计算机视觉 与模式识别的方法获取语言信息 [1]。基于超声的无声语 音识别研究中使用超声成像技术通过放置在下巴下方的 超声探测器采集舌头运动情况。然而,这些方式采集到 的信号是缺乏音调信息的,识别率有进一步提高的空间。 汉语的声调信息是改善识别率的一种可能的途径。
在 sEMG 的识别中时域特征也能够反映信号在时间维度 合 , 其流程图如图 1 所示。
2 Copyright©博看网. All Rights Reserved.
杜月山 彭佩瑶 韦峻峰:基于表面肌电信号的汉语单元音声调识别
2023 年第 8 期
1.3 声调识别分类器 对表面肌电信号,采用针对时间序列的分类器效果 较好,1DCNN-BiLSTM 可以很好地完成对时间序列的 分类处理。 卷 积 神 经 网 络(CNN) 是 一 种 前 馈 神 经 网 络, 在 深度学习领域中作为特征提取网络被广泛应用。传统的 CNN 采用二维卷积核对二维数据进行特征提取,对于时 序数据效果不佳,因此采用一维卷积网络(1DCNN)对 实验数据进行处理。 长短时记忆网络(LSTM)可以根据当前时刻之前的 信息来进行判别,而有的时候对当前时刻地判别需要之 前和之后的信息共同来决定,因此 Schuster M 等人在长 短时记忆网络(LSTM)的基础上提出了双向长短时记 忆网络(BiLSTM)。 通过构建了 1DCNN-BiLSTM 对数据进行分类,首 先采用 1DCNN 处理时序序列,对序列进行局部特征提 取,再通过 BiLSTM 网络进行分类识别,模型的结构如 图 4 所示。 2 实验方案 2.1 数据准备
基于EMD的ACF基音检测改进算法
基于EMD的ACF基音检测改进算法宗源;李平;曾毓敏;胡政权;李梦超【摘要】针对传统的自相关函数基音检测算法容易出现倍频错误的问题,本文提出了一种基于经验模式分解的ACF基音检测改进算法.该改进算法利用EMD将一帧语音信号的ACF分解成多个本征模式函数和残余分量,同时根据IMF的累积能量分布情况找出含有基音信息的IMF,最后通过该IMF准确地估计出该语音帧的基音.仿真实验结果表明:本文所提算法性能明显优于传统ACF算法;相比较于检测效果较好的WAC算法,本文所提算法的性能依然有了一定的提升.【期刊名称】《南京师大学报(自然科学版)》【年(卷),期】2013(036)003【总页数】6页(P42-47)【关键词】基音;经验模式分解;自相关函数;本征模式函数【作者】宗源;李平;曾毓敏;胡政权;李梦超【作者单位】南京师范大学物理科学与技术学院,江苏南京210023;泰州职业技术学院信息工程学院,江苏泰州225300;南京师范大学物理科学与技术学院,江苏南京210023;南京师范大学物理科学与技术学院,江苏南京210023;南京师范大学物理科学与技术学院,江苏南京210023【正文语种】中文【中图分类】TN912人在发浊音时,气流通过声门使声带发生张弛振荡式的振动,这种声带振动的频率称为基音(基音也可指基音周期).基音是语音信号中非常重要的特征参数之一,广泛地应用于语音编码、语音合成、语音增强以及语音识别等方面.因此,准确地检测基音具有非常重要的意义.尽管人们已经提出了许多基音检测算法,但是准确而且可信的基音检测仍然是一个具有挑战性的工作[1].目前比较经典的算法有自相关函数(Autocorrelation Function,ACF)法[2]、平均幅度差函数(Average Magnitude Difference Function,AMDF)法[3]、倒谱法[4]、小波变换法[5]等.在这些算法中,ACF算法以其方法简单、计算复杂度低和对噪声的鲁棒性好等优点而得到了广泛的应用.该算法的原理是,周期信号的自相关函数将在时延等于信号周期的地方产生一个极大值.语音信号由于具有准周期性,因此可以通过计算短时窗内语音信号的ACF,并根据ACF的最大峰值点估计出语音信号的基音.但是,该最大峰值点的选择受到了很多因素干扰,例如:复杂的声道共振峰结构、语音信号并不严格的准周期性、语音帧的大小、以及窗函数的选择等[6].因此ACF在实际应用中经常会出现倍频的检测错误.针对ACF法所存在的问题,研究人员提出了一些基于ACF的改进算法.Shimamura提出了WAC ,该算法利用AMDF加权ACF从而使ACF的基音峰值点更加突出,WAC能够避免部分倍频错误,但是由于AMDF存在均值下降趋势,易导致较后的非基音峰值点反而拥有较大的加权系数,因此效果有时并不是十分理想.文献[7]检测出语音信号的主谐波频率后,通过增强语音信号的主谐波频率成分进行语音信号的重构,利用NACF对重构后的语音信号进行基音检测,得到了较好的效果.此方法虽然具有很好的鲁棒性,但是对共振峰等所引起的ACF 的倍频错误并没有得到很好的抑制.本文提出了一种基于经验模式分解(EmpiricalMode Decomposition,EMD)的ACF的基音检测改进算法,该算法首先利用EMD将一帧语音信号的ACF分解为一系列的本征模式函数(Intrinsic Mode Function,IMF)和残余分量;接着筛选出含有基音信息的IMF;最后利用筛选出的IMF检测出该语音帧的基音.仿真实验结果表明:与传统的ACF以及其改进算法WAC相比,本文所提算法能够有效地克服ACF的倍频错误,更加准确地检测出语音的基音.1 经验模式分解EMD是Norden E.Huang等人于1998年提出的一种新的信号分解方法[8].EMD的本质是通过信号本身的特征尺度来将信号分解成IMF,它一方面具有小波变换多分辨率的优点,另一方面又克服了小波变换中选择合适的小波基的困难.因此,EMD可以有效地处理非平稳信号,且具有良好的自适应性.IMF分量必须满足以下2个条件:(1)整个信号中极值点的个数与过零点的个数相等或最多相差1;(2)信号上的任意点处,由所有局部极大值点确定的上包络和所有局部极小值所确定的下包络的均值为零,即上下包络线对称于零均线.EMD 的具体算法[10]如下:(1)令g1(t)=s(t);(s(t)为待分解信号)(2)找出g1(t)所有的极值点(包括极大值和极小值);(3)利用3次样条插值分别将所有极大值点和极小值点拟合成上包络h(t)和下包络l(t);(4)利用上包络和下包络算出局部均值:(5)从g1(t)中减去u1(t):g(t)=g(t)-μ1(t);(6)根据上文所提的IMF必须满足的两个条件判断g1(t)是否为IMF;(7)重复(2)到(6)直到g1(t)满足IMF的条件.C1(t)=g1(t)即为第一个IMF,记为IMF1,利用上述算法对残余分量进行处理提取出第二个IMF,如此循环,直至最后一个IMF即Cn(t)被提取出来.最后的残余分量rN(t)通常为一常数或者趋势项并且不可以再分解.各个IMF和残余分量可以重构信号s(t):EMD将信号分解成若干个频率从高至低的IMF,整个过程体现了多尺度的自适应滤波特性.根据这一特点,我们可以根据信号的要求,有效地对某一频率范围内的信号进行处理[11].此外,由于EMD是根据信号的局部时间尺度进行分解的,其基函数的选择来自于信号本身,因此减少了主观因素的影响.2 算法原理语音信号的短时自相关函数R(τ)定义为:其中s(n)为加矩形窗并且窗长为N的浊音语音帧,τ为延迟.R(τ)呈现出与浊音语音周期相一致的周期特性,并在τ=Fs/Fp的地方出现最大峰值点(Fs为采样频率,Fp为基音频率),因而通过计算R(τ)并找出它的除零点以外的最大峰值点就能够检测出该浊音语音帧的基音频率.但是,如引言所述,实际的最大峰值点的筛选受到多种因素影响,因此ACF在实际检测过程中经常会发生倍频错误.如图1所示,图1(a)为一帧浊音语音,图1(b)为该语音帧的ACF,可以看到ACF的实际基音峰值点应为第106采样点,但是除零点以外的第一最大峰值点出现在第46采样点,此时ACF出现了倍频检测错误.根据上文对EMD的分析我们知道,EMD可以将信号分解成若干个频率从高至低的IMF,因此我们可以利用EMD将ACF的基音信息分解到某一个IMF中.图1(c)至图1(g)是图1(b)的ACF经过EMD处理后得到的各个IMF和残余分量,可以看出IMF2包含了这一帧语音的基音信息,所以通过IMF2就可以很方便地估计出这一帧语音的基音.此外,由于理论上每一个IMF只含有单一的频率信息,因此利用IMF检测基音不会受到其他因素(如共振峰和噪声等)的影响.综上所述,如何筛选出含有基音信息的IMF是本文算法的关键.人的基音频率范围一般为50~500 Hz,我们可以在基音检测之前将语音信号通过50~500 Hz的带通滤波器,去除大部分共振峰和噪声影响,保留基音信息.由人的发音机理可以知道语音信号的能量是以基音和与其邻近的几个高次谐波的能量为主,因此含有基音以及它的邻近高次谐波信息的IMF重构组成的信号的能量理论上应接近于原始语音信号的ACF的能量.基于此,本文提出了一种基于累积能量分布的IMF选择方法,具体步骤如下:(1)定义累加信号图1 一帧浊音语音的ACF的经验模式分解Fig.1 The decomposition of ACF ofa voiced speech frame by using EMD由EMD的原理可知,ACF可以记为式(6)中resi为残余分量.(2)计算所有SUM和ACF的短时能量,记为Energy(1),Energy(2),…,Energy(n),Energy(ACF);同时定义各累加信号SUMi与ACF的短时能量差,记为并将所有的Δi归一化.(3)选定阈值Thr1,若则判定IMF1为含有基音信息的IMF;否则,转入步骤(4).(4)选定一个阈值Thr2,则含有基音信息的IMF即为图2为基于图1(b)中的ACF计算所得的Δi的折线图.如图所示,从Δ1至Δ4,它们的数值越来越小,同时Δ2至Δ4均小于Thr2=0.1(本例中设定的阈值),这说明重构信号SUMi随着IMF的累加,能量越来越接近于原始信号ACF的能量;此外,当SUMi累加至IMF2时,重构信号的能量开始首次接近于原始信号的能量,在图中表现为Δi首次小于我们设定的阈值Thr2=0.1.因此由式(9)可以判定IMF2即为包含基音信息的IMF,实际上IMF2确实包含了基音信息(由图1(d)可以看出).经过我们初步研究发现,阈值Thr1和Thr2的选择是经验性的,所以并无确切的值,一般情况下的基音检测可以设定根据以上的分析,基于EMD的ACF的基音检测改进算法的具体步骤如下(算法流程如图3所示):图2 基于图1(b)中ACF的Δi折线图Fig2 The line chart of Δi based on the ACF in Fig.1(b)图3 基于EMD的ACF的基音检测改进算法Fig.3 A modified ACF pitch detection algorithm based on EMD(1)对语音信号s(n)进行50~500 Hz的预滤波,去除大量共振峰以及各种噪声影响,得到滤波后的语音信号sf(n);(2)对滤波后的语音信号sf(n)进行分帧处理;(3)对每一帧语音进行清浊音判断,清音帧和静音帧的基音记为0;(4)求浊音帧的自相关函数ACF;(5)利用EMD对ACF进行分解,利用上文所提方法选取含有基音信息的IMF;(6)利用含有基音信息的IMF检测出浊音帧的基音,最后输出基音轨迹P(n).3 仿真实验实验所用语音为实验室录制的一名成年男子朗读“树上的落叶掉光了”的纯净语音,语音以11 025 Hz采样率,16 bit采样精度.实验中对语音分帧帧长设为40 ms,帧移为20 ms.图4为分别使用传统ACF、WAC和本文所提算法对该段语音进行基音检测的结果,图中横坐标为帧,纵坐标为基音频率(单位Hz).图4(a)、(b)和(c)分别为ACF、WAC和本文所提算法的检测结果,从它们的基音轨迹可以看出,传统ACF基音检测算法在多处出现明显的倍频错误,这是由于以共振峰为主的多种原因的影响导致ACF除零点之外的第一最大峰值点并不是真实的基音点,因此检测结果并不理想.WAC相较于ACF克服了多处倍频错误,但是由于AMDF的均值下降趋势导致倍频错误依然存在.而本文算法检测所得的基音曲线光滑规整,有效地修正了传统ACF算法中的多处倍频错误.图4 ACF、WAC和本文所提算法检测一段语音的基音Fig.4 Pitch detection of a speech signal by using ACF,WAC and the proposed algorithm为了进一步评价本文所提算法,仿真实验使用基尔基音检测参考数据库(the Keele Pitch Extraction Reference Database)[10]来测试各个算法的性能.基尔基音检测参考数据库中所有语句均以20 000 Hz采样,16 bits量化,数据库中提供以512点为帧长、200点为帧移的所有浊音帧的参考基音信息.实验选用了数据库中两位男性(M2-M3)和两位女性(F1-F2)的每人1段语句,共计4段语句进行基音检测.根据Rabiner[2]的定义,检测结果(以基音周期计算)与参考基音的误差大于或等于1 ms则定义为基音粗差(Gross Pitch Error,GPE),实验中以%GPE作为比较参量评价各个方法的性能.此外,为了更好的比较3种算法的性能,本次实验均不对检测结果做任何后期处理(如基音曲线平滑等).表1给出了3种算法在无噪声环境下的检测结果.从表中可以看出本文所提算法在4个样本F1-F2-M2-M3中均有相对较低的%GPE,相比于WAC能够更好地克服ACF检测过程中的倍频错误.表2给出了ACF和本文所提算法在无噪声环境下和高斯白噪声(SNR=10,5,0,-5,-10 dB)环境下的检测结果(由于AMDF对白噪声没有鲁棒性,白噪声环境下语音信号如无其他预处理,WAC的检测结果会明显不如ACF,所以噪声环境下的对比试验仅仅对比ACF和本文所提算法).由表2可以看出,本文所提算法在噪声环境下仍然能够较好地克服ACF的倍频错误,取得不错的%GPE.此外由于EMD的多频分辨特性,本文所提算法筛选出的含有基音信息的IMF不受其他频率分量影响,能够避免噪声等因素的干扰,因此即使在信噪比低至-10 dB时,本文所提算法的检测效果依然较好.表1 纯净语音的3种算法的检测结果比较Table 1 Comparison of three methods using clean speechACF WAC EMDACF F1 9.41 8.56 6.11 F2 6.41 5.58 4.63 M2 23.01 21.84 9.23 M3 9.45 7.86 6.07表2 不同信噪比下ACF和本文所提算法的检测结果的比较Table 2 Comparison of ACF and the proposed algorithm at different SNRF1 ACF EMDACF 41.99 28.38 F2 ACF EMDACF 9.41 6.11 11.95 7.81 13.39 10.15 17.37 11.23 25.08 15.31 41.22 25.89 M2 ACF EMDACF 6.41 4.63 8.31 6.23 10.73 8.77 13.83 10.87 23.24 15.56 56.37 41.03 M3 ACF MACF 23.01 9.23 25.18 10.04 9.45 6.07 11.70 10.60 27.21 11.76 31.69 16.86 43.05 25.94 13.48 11.92 20.05 18.31 33.05 20.87 58.73 35.934 结论本文首先介绍了EMD以及它的自适应多频分辨率的性质并且给出了EMD的分解算法;然后分析了ACF基音检测算法并指出了它的不足之处,即共振峰等因素导致ACF算法在实际应用中易出现倍频检测错误;接着针对ACF基音检测算法的不足之处给出了基于EMD的改进算法,并提出了一种如何有效选取含有基音信息的IMF 的方法;最后进行了仿真对比实验.仿真实验结果表明:本文所提算法能够有效地克服ACF算法的倍频错误,同时其性能优于传统ACF以及它的改进算法WAC.[参考文献][1] Shimamura T,Kobayashi H.Weighted autocorrelation for pitch extraction of noisy speech[J].IEEE Transactions on Speech and Audio Processing,2001,9(7):727 -730.[2] Rabiner L R,Cheng M J,McGonegal C A.A comparative performance study of several pitch detection algorithms[J].IEEE Transactions on Acoustics,Speech and Signal Processing,1976,24(5):399 -417.[3] Ross M,Shaffer H,Freudberg R,et al.Average magnitude difference function pitch extractor[J].IEEE Transactions on A-coustics,Speech and Signal Processing,1974,22(5):353 -362.[4] Ahmadi S,Spanias A S.Cepsrum-based pitch detection using a new statistical V/UV classification algorithm[J].IEEE Transactions on Speech and Audio Processing,1999,7(3):333 -338.[5] Kadame S,Broudreaux-Bartels G F.Application of the wavelet transform for pitch detection of speech signals[J].IEEE Transactions on Information Theory,1992,38(2):917 -924.[6] Amado G.Pitch detection algorithms based on zero-cross rate and autocorrelation function for musical notes[C]//Proceedings of ICALIP.Shanghai:IEEE,2008:449 -454.[7] Hasan M K,Hussain S,Setu M T H,et al.Signal reshaping usingdominant harmonic for pitch estimation of noisy speech[J].Signal Processing,2005,86(5):1 010 -1 018.[8] Huang N E,Zheng S,Long S R,et al.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[C]//Proceedings of Royal Society A.London:Royal Society,1998:903 -995.[9] Molla M,Khademul I,Hirose K,et al.Pitch estimation of noisy speech signals using empirical mode decomposition[C]//Proceedings of InterSpeech.Antwerp:ISCA,2007:2 117 -2 180.[10] Meyer G,Plante F,Ainsworth W A.A pitch extraction reference database[C]//Proceedings of EUROSPEECH.Madrid:ISCA,1995:827 -840.。
改进的基音检测算法
n = -¥
å
¥
S w (n)S w (n + k ) =
N-k-1 n=0
å
S w (n)S w (n + k )
(5)
归一化幅度
N 为语音分析帧的长度, k 为延迟度。语音信号的自相 式中, 关函数 R w (k ) 在基音频率整数倍处将出现峰值特性, 通常根据
第一峰值点 ( R w (0) 除外) 来估计基音。 平均幅度差函数 (AMDF) 的思想是: 如果信号是一个标准 的周期函数, 那么不同周期段的对应信号之差为 0[8]。 S w (n) 的平均幅度差函数 (AMDF)D w (k ) 为:
118
2011, 47 (3)
Computer Engineering and Applications 计算机工程与应用 如果 R w (k ) 的第一峰值越尖锐或 D w (k ) 的全局谷值点的锐度 越突出, 则基音周期的估计将越精确 [9]。因此, 结合 ACF 和 AMDF 的优点, 提出一种改进的 ACF/AMDF 加权平方特征进 行基音周期估计, 新的特征参数表达式如下:
2.1 LMS 自适应滤波原理
LMS 算法是一种简单有效的估计梯度方法, 其依据为最 小均方误差准则。LMS 自适应滤波器是一类具有反馈性能的 自适应系统, 它通过对前一时刻获得的滤波器参数来自动调 节现时刻的滤波器参数, 使得滤波器输出信号与期望信号之 间的误差均方值最小, 从而达到最佳滤波的效果。其自适应 滤波原理如图 2 所示。
0.5 0 -0.5 幅度 一帧纯净语音信号波形 50 100 150 200 250 300 采样点数 350 400 450 500
2.2 改进的 ACF/AMDF 加权平方特征
基于ACF和AMDF的基音检测改进算法
【 s at T e uo or ao F n t n A F ad h A eae Abt c】 h A t r C r lt n u co ( C ) n te vrg Mantd D frn e uci A F) ae e i i gi e ieec F nt n( MD u o r
t c mm o l u e meho o pt h d tc in. The ha e i e en e a d smia sa itc l c a a trsi . wo o ny s d t d f ic ee to y v nd p d nt n i lr ttsia h r ce t i cs
B s d n h d s u so o ta i o a a e o t e i si n f rd t n l i h ee t n lo i m , a o r h n ie p l ai n c i p t d t ci a g rt c o h c mp e e s a p i t wi ACF n v c o t h a d AMDF s ie i gv n. Te h me h d i s l a d r cia l . to s i e n p a t b e mp c I S etr ta t d t n l t t b t h n r i o a i e a i me— o i p th d man i c
d tc in loi m . S mu ain e u t h w h t h ag r h ee t ag r h o t i l t r s l s o t a t e l o t m h s t n a t os a i t . o s i a sr g n i i o n e b l y i
改进的AMDF算法在OFDM同步中的实现
改进的AMDF算法在OFDM同步中的实现聂伟;毕金鑫;董少杰【摘要】提出一种改进的、基于平均幅度差函数(average magnitude difference function, AMDF)的正交频分复用(orthogonal frequency division multiplexing, OFDM)帧定时同步算法,并完成了在FPGA(field programmable gate array)平台下的硬件实现.仿真及测试结果表明,在AWGN(additive white Gaussian noise)信道环境下,该算法不但继承了AMDF算法的优点,而且具有易于FPGA实现、占用硬件资源少、同步性能良好等特点.【期刊名称】《实验技术与管理》【年(卷),期】2010(027)011【总页数】5页(P114-117,129)【关键词】OFDM;AMDF;帧定时同步;FPGA【作者】聂伟;毕金鑫;董少杰【作者单位】北京化工大学,计算机系统与通信实验中心,北京,100029;北京化工大学,计算机系统与通信实验中心,北京,100029;北京化工大学,计算机系统与通信实验中心,北京,100029【正文语种】中文【中图分类】TN919.6正交频分复用(orthogonal frequency division multiplexing,OFDM)是一种特殊的多载波调制方式,由于它频谱利用率高,抗多径衰落能力强,基于FFT算法的硬件实现比较简单等原因,使它广泛应用于无线局域网、DAB、DVB-T、WiMax等系统中,并有可能成为第4代移动通信的关键技术之一[1]。
OFDM对时偏和频偏非常敏感,在系统接收端,为了得到正确的解调信号,必须找到符号的起始位置,因此必须进行定时估计,否则,就可能引起严重的码间干扰(inter channel interference, ICI)。
由于频偏估计是在定时估计之后进行,因此,如果定时估计不准确,也会影响频偏的估计性能,从而导致整个OFDM系统性能下降[2]。
基于趋势分析的AMDF基音检测改进算法
基于趋势分析的AMDF基音检测改进算法宗源;曾毓敏;张梦;李鹏程【摘要】A modified algorithm framework was presented based on eliminating falling trend for improving the average magnitude difference function (AMDF)pitch detection algorithm in speech signal processing to conquer the defect of generating error pitch in conventional AMDFs.In the framework,a linear polynomial was employed to represent the falling trend of AMDF.Then a modified AMDF algorithm based on least square (LS ) method within the proposed framework was provided.LS method was performed to fit the linear polynomial and the modified AMDF called LSAMDF was achieved by subtracting the falling trend,namely,the linear polynomial from the AMDF for pitch detection.The simulated results show that the performance of LSAMDF is much better than that of many improved AMDFs and the correctness of the proposed framework and the rationality of linear polynomial based falling trend representation are validated.%针对语音信号处理中传统AMDF基音检测算法存在下降趋势易出现检测错误问题,提出基于去均值下降趋势的AMDF算法改进框架,并以线性多项式表示AMDF均值下降趋势,给出基于最小二乘法的AMDF改进算法。
基于ACF和AMDF的基音检测改进算法
周期处产生一个极大值, 因此通过计算语音信号的自
相关函数,找到极大值位置,就可以估计信号的基音周
期。 这种算法的优点是算法简单,提取出的基音周期较
为精确。
对 于 离 散 的 数 字 语 音 信 号 序 列 x(n)如 果 具 有 周
期性,即
x(n)=x(n+NP)
(1)
则其自相关函数也是同周期的周期函数,即
基音周期检测算法主要有两类:时域法和频域法。 时域法的特点是比较直观且运算量小, 缺点是抗噪声 性能差,容易产生倍频和半频现象,主要方法有自相关 函数法、平均幅度差函数法等。频域法的特点是抗噪声 的性能较好,但是算法比较复杂,运算量较大,主要方
輩輮讂
2011年 第 35 卷 第 01 期
法有普通频域算法和倒谱法等[3]。
【Abstract】 The Auto Correlation Function ( ACF ) and the Average Magnitude Difference Function ( AMDF ) are
two commonly used method of pitch detection . They have independent and similar statistical characteristics .
图 2 为采用平均幅度差函数法进行基音周期检测 的仿真结果,这里仍采用上例所示的男声语音材料,从 实验结果可以看出, 由于重叠的波形越来越短,AMDF 曲线的值也越来越小, 可以将 AMDF 的值除以重叠的 点数来改善这种变化,这里不再详述。
2.2 AMDF 法
由于自相关函数本身的乘加运算,所以计算不会
基于自相关函数和平均幅度差函数的算法是基音 周期估计的 2 种常用方法。 两者具有独立且相似的统 计特性,即自相关函数在基音周期处表现为峰值,而平 均幅度差函数表现为波谷,因此可以同时运用 ACF 和 AMDF 的特点, 求取 ACF/AMDF 或 AMDF/ACF 的商, 对应基音周期处应出现更明显的峰值或谷值, 从而提 高基音检测的准确程度。
基于去噪的ACF-CEP基音检测算法
设 s (t )为纯净 语 音信 号
,
(t )为噪 声信 ( t ) 为带噪 声语 音信号 则 有 :
,
n
删
=
% 譬 篡∥
、
p
烈w ’
㈥
,
期
。
y (t )
=
s
(t )+ n (t )
,
一
(5 ) 则可 以 得下 式
:
对输 入 语音 进 行 L P C 分 析 获 得 预 测 系 数 c 【 并 由此 构 成 逆 滤 波 器 A (Z )
。
8k H
,
。
. 、
,
,
,
本 实 验 所 用 语 音 样本 用 计 算机 声卡 以 采 样 率 16 b i t 量 化 在 办 公 室 环 境 下采集 测 试所 用 的语 句 为 : 毕业 论
“ 。
=
文
”
,
共
1
.
64538
秒
,
,
13 16 4
个样 点
,
,
将
。
、
,
语 音信 号 加 窗 分 帧 窗长 3 0 m s 动 1 0 m s 得 到 基 音频 率轨 迹 图
,
,
。
“
”
一
~
,
.
.
,
,
.
,
,
,
。
原 始语 音 时 域 图 ( 单 声 道 ) 室 内 微 量 噪声 8 K H z 采样 1 6 b i t 量化
,
,
,
。
,
以 下 加 入 高 斯 白噪 声
。
,
信噪 比为
一种基音周期估计的改进CAMDF算法
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved.
第4期
杨莎等 :一种基音周期估计的改进 CAMDF 算法
775
3. 2 改进 CAMDF 算法 在 CAMDF 算法的基础上 ,为了更好的简化算
Speech pitch determination based on the improved circular AMDF
YA N G S ha , X IA Xi u2Y u , Z HA N G Y u2S heng , TA N G B ang2You
(College of Electronics Information , Sichuan University , Chengdu 610064 ,China)
一种基音周期估计的改进 CAMDF 算法
杨 莎 , 夏秀渝 , 张余生 , 唐邦友
(四川大学电子信息学院 , 成都 610064)
摘 要 : 本文首先介绍了传统基音周期估计算法 :ACF 算法和 AMDF 算法. 为了克服 AMDF 算法容易导致估计出的基音周期加倍的缺陷 ,本文重点阐述了 CAMDF 基音周期估计算法 ,并 提出了改进 CAMDF 算法. 该法是在 CAMDF 算法之前 ,对语音信号进行降比特处理. 实验表 明 ,改进 CAMDF 算法在降低对处理器件复杂度和精度方面要求的同时并不会影响基音周期 的估计效果. 最后 ,本文进行了各种基音检测算法的仿真比较 ,实验表明改进 CAMDF 算法在 基音估计效果上具有很好的准确性和稳定性. 关键词 : ACF ;AMDF ; W2AMDF ;M2AMDF ;CAMDF ;基音检测 中图分类号 : TP207. 7 文献标识码 : A
基于ACF和AMDF的基音检测改进算法
基于ACF和AMDF的基音检测改进算法
李志军;尹霞
【期刊名称】《电声技术》
【年(卷),期】2011(35)1
【摘要】自相关函数法和平均幅度差函数法是基音周期检测的两种常用方法,两者具有独立且相似的统计特性.在讨论了传统基音周期检测算法及其缺点后,提出了综合应用ACF和AMDF函数进行基音检测的算法.该算法简单可行,性能优于一般传统时域基音周期检测算法.从仿真结果可以看出,对于含噪语音信号,该算法具有较强的抗噪能力.
【总页数】4页(P50-52,55)
【作者】李志军;尹霞
【作者单位】扬州大学,信息工程学院,江苏,扬州,225009;扬州大学,信息工程学院,江苏,扬州,225009
【正文语种】中文
【中图分类】TN912.3
【相关文献】
1.基于DWT的AMDF基音检测改进算法 [J], 郑瑞;李平;曾毓敏;高闻;李梦超
2.基于EMD的AMDF基音检测改进算法 [J], 宗源;曾毓敏;孙永熙;郑瑞
3.基于趋势分析的AMDF基音检测改进算法 [J], 宗源;曾毓敏;张梦;李鹏程
4.基于ACF的基音检测改进算法 [J], 韩芳;王学春;靳宗信
5.一种基于多项式拟合的AMDF基音检测改进算法 [J], 郑婉璐;宗源;郑文明;胡斌;赵力
因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
∞
Σ P(k)=lim 1
x(m)x(m+k)
N→∞ 2N+1 -∞
(2)
清音信号没有周期性, 它的自相关函数也没有周
期 性 规 律 ,所 以 没 有 明 显 的 峰 值 出 现[5],P(k)会 随 着 k
语音技术
Y Voice Technolog
的增大迅速衰减;浊音信号具有准周期性,它的自相 关函数 P(k)具有与 k 相同的周期,自相关函数在基音 周期的整数倍位置上出现峰值。 根据这个性质可以判 断一个语音信号是清音还是浊音,还可以判断浊音的 基音周期。 自相关法基音检测正是利用 P(k)的这一性 质对语音信号进行基音检测的。
究[J]. 电声技术,2008,32(8):37-40.
[4] 李英 ,汪 航. FIR 自 适 应 滤波 的 语 音增 强 算 法[J]. 电 声 技
5 小结
自适应语音增强模块利用比较先进的 DSP 技术, 使用自适应算法,能够在高斯白噪声中增强语音信号。 该模块使用方便,体积小,适用范围比较广泛。 基于自 相关的自适应算法,结构简单,实时性强,能满足目前 应用的需求。
参考文献
[1] AHMED N, VIJAYENDRA S.An algorithm for line enhan-
为了减少声道共振峰特性造成的干扰, 提高相关 法和平均幅度差函数法检测基音周期的可靠性, 可以 采用 2 种方法对原始信号进行预处理[10]。
带通滤波:用一个通带为 900 Hz 的线性相位低通 滤波器滤除高次谐波分量, 滤波器可以放在对语音信 号采样前,也可以放在采样后,这样处理以后的信号基 本上只含有共振峰以下的基波和谐波分量[11]。 利 用滤
4 小结
取语音信 号 的 浊 音 段 利 用 Matlab 软 件 仿 真 了 几 种基音周期提取的算法, 比较了不同算法函数的波 形 峰(谷)点特பைடு நூலகம்。 ACF 算法本身的计算复杂度较 大, AMDF 算法只涉及加减运算,减小了计算复杂度,但由 于浊音语音段的周期性和平稳性都不太好, 若以全局 最低谷点作为基音周期计算点就会出现估计的基音周 期加倍的检测错误[12]。 提出利用 ACF/AMDF 函数进行 基音检测的方案,并通过仿真实验表明,该算法简单可 行,性能优于一般传统时域基音周期估计算法。同时对
在讨论了传统基音周期检测算法及其缺点后,提出了综合应用 ACF 和 AMDF 函数进行基音检测的算法。 该算法简
单可行,性能优于一般传统时域基音周期检测算法。 从仿真结果可以看出,对于含噪语音信号,该算法具有较强的
抗噪能力。
【关键词】 基音检测; 自相关函数; 平均幅度差函数
【中图分类号】 TN912.3
(下转第 55 页)
语音技术
Y Voice Technolog
4 应用实例
利用上述语音自适应增强器进行了试验,图 3(a) 表示采集的语音信号,图 3(b)表示在噪声环境下的语 音信号,图 3(c)表示自适应增强后的语音信号。
强后的语音信号基本保持了原信号的时域特征, 能听 清说话内容。
试验结果表明: 基于自相关的自适应语音增强算 法可以抑制高斯白噪声,在实际使用中效果比较明显。
波后信号的自相关函数进行基音估计, 结果有明显的 改善。
中心削波处理:使用如图 4 所示的中心削波函数 进行处理。
C(x)
-CL
CL
O
x
图 4 中心削波函数
削波电平门限的选择往往很难确定, 如果选择不 好会使基音周期的估计出现很大的偏差。 其中削波电 平 CL取最大信号幅度的 68% ,中心削波 后,再用自相 关法检出基音频率,误判为倍频或分频的情况就可大 大减少。为了减少自相关计算中的乘法运算,中心削波 以后的信号 y(n)的自相关用 2 个信号的互相关代替。 3.3 算法原理与实现
基音检测改进算法如图 5 所示。
预处理
ACF AMDF
ACF/AMDF
图 5 基音检测改进算法原理
同样还使用上面的含噪声语音样本进行测试,仿
輩輰讂
2011年 第 35 卷 第 01 期
理 论 上 ,求 取 AMDF/ACF 的 商 值 ,应 该 在 基 音 周 期处也可以看到明显的谷值, 但由于对应于基音周期 处的极小值相对于其他谷值不太明显, 仿真结果也证 明 AMDF/ACF 的商值不适于基音检测。
2 传统时域基音周期检测算法
2.1 ACF 法
传 统 的 自 相 关 函 数 法 (Auto Correlation Function,
ACF)[4]是 Ross 等人于 1977 年提出的一种 基于语音时
域分析理论的检测算法, 自相关函数法基音周期检测
的原理是: 周期信号的自相关函数将在时延等于函数
图 2 为采用平均幅度差函数法进行基音周期检测 的仿真结果,这里仍采用上例所示的男声语音材料,从 实验结果可以看出, 由于重叠的波形越来越短,AMDF 曲线的值也越来越小, 可以将 AMDF 的值除以重叠的 点数来改善这种变化,这里不再详述。
2.2 AMDF 法
由于自相关函数本身的乘加运算,所以计算不会
语音技术
Voice Technology
文 章 编 号 :1002-8684(2011)01-0050-03
基于 ACF 和 AMDF 的基音检测改进算法 ·论文·
李志军,尹 霞 (扬州大学 信息工程学院,江苏 扬州 225009)
【摘 要】 自相关函数法和平均幅度差函数法是基音周期检测的两种常用方法,两者具有独立且相似的统计特性。
周期特性。 利用 Fn(k)的这种特性可以判定一段语音
是浊音还是清音,并估计出浊音语音的基音周期。 由
于计算 AMDF 函数只需要加、 减和取绝对值运算,运
算量与求短时自相关函数相比下降很多。 同时,函数
在基音周期点的谷值比自相关函数的峰值更加尖锐,
3 基 于 ACF 和 AMDF 的 基 音 检 测 改 进算法
【Abstract】 The Auto Correlation Function ( ACF ) and the Average Magnitude Difference Function ( AMDF ) are
two commonly used method of pitch detection . They have independent and similar statistical characteristics .
基于自相关函数和平均幅度差函数的算法是基音 周期估计的 2 种常用方法。 两者具有独立且相似的统 计特性,即自相关函数在基音周期处表现为峰值,而平 均幅度差函数表现为波谷,因此可以同时运用 ACF 和 AMDF 的特点, 求取 ACF/AMDF 或 AMDF/ACF 的商, 对应基音周期处应出现更明显的峰值或谷值, 从而提 高基音检测的准确程度。
周期处产生一个极大值, 因此通过计算语音信号的自
相关函数,找到极大值位置,就可以估计信号的基音周
期。 这种算法的优点是算法简单,提取出的基音周期较
为精确。
对 于 离 散 的 数 字 语 音 信 号 序 列 x(n)如 果 具 有 周
期性,即
x(n)=x(n+NP)
(1)
则其自相关函数也是同周期的周期函数,即
基音周期检测算法主要有两类:时域法和频域法。 时域法的特点是比较直观且运算量小, 缺点是抗噪声 性能差,容易产生倍频和半频现象,主要方法有自相关 函数法、平均幅度差函数法等。频域法的特点是抗噪声 的性能较好,但是算法比较复杂,运算量较大,主要方
輩輮讂
2011年 第 35 卷 第 01 期
法有普通频域算法和倒谱法等[3]。
Based on the discussion of traditional pitch detection algorithm , a comprehensive application with ACF and
AMDF is given . The method is simple and practicable . It ′s better than traditional time - domain pitch
輩輯讂 2011年 第 35 卷 第 01期
语音技术
Voice Technology
真结果如图 6 所 示 ,可 以 明 显 看 出 ,无 论 ACF 的 峰 值 还是 AMDF 的谷值都不太明显,但得到的 ACF/AMDF 的曲线峰值非常明显,因此只要求出它们的商值曲线, 就很容易进行基音周期估算。
3.1 传统基音周期估计算法的缺点 自 相 关 函 数 法 (ACF)是 利 用 峰 值 检 测 基 音 周 期 ,
平均幅度差函数法(AMDF)是利用谷值来估计。 自相关 函数方法适合于噪声环境下, 但单独使用时经常发生 基频估计结果为其实际基音频率的二次倍频或二次分 频的情况, 平均幅度差函数法在静音环境下或噪声较 小时可以取得较好的检测结果,但在语音环境较恶劣、 信噪 比较低时 ,检测结果的准确程度下降 较 快[9],难 以 让人满意。 图 3 为含噪语音信号的波形及 ACF、AMDF 函数曲线,可以看出 ACF 的峰点或 AMDF 的谷点并不 明显,依此进行基音周期估计比较困难。 3.2 预处理
与短时自相关函数一样,对周期性的浊音语音,
Fn(k)也 呈 现 与 浊 音 语 音 周 期 相 一 致 的 周 期 特 性 ,不 同
的是 Fn(k)在周期的各个整数倍点上具有谷值特性而
不 是 峰 值 特 性 ,因 而 通 过 Fn(k)的 计 算 同 样 可 以 确 定
浊 音 的 基 音 周 期[7],而 对 于 清 音 信 号 ,Fn (k) 却 没 有 这 种
detection algorithm . Simulation results show that the algorithm has strong antinoise ability .