一种改进的MBE基音跟踪算法

合集下载

改进型ViBe算法及其在运动目标提取中的应用

改进型ViBe算法及其在运动目标提取中的应用

改进型ViBe算法及其在运动目标提取中的应用杨青;张著洪【摘要】提出一种基于阈值半径自适应更新及阴影与鬼影检测的改进型ViBe算法,解决运动场景下ViBe算法的目标提取效果易受背景高频扰动、摄像机抖动、阴影、鬼影的影响问题.算法设计中,依据当前帧的像素点梯度与背景图序列对应像素点的灰度均方差设计阈值自适应更新策略;依据背景图在HSV空间中的像素值设计阴影去除规则;利用前景-邻域直方图的相似度匹配规则设计鬼影清除规则.实验结果表明,改进型ViBe算法在保留原有的高效性的同时,能够较好地消除视频图像中隐含的阴影和鬼影,以及抖动对目标提取的影响.【期刊名称】《贵州大学学报(自然科学版)》【年(卷),期】2019(036)002【总页数】5页(P74-78)【关键词】ViBe算法;鬼影检测;阴影消除;阈值半径自适应更新【作者】杨青;张著洪【作者单位】贵州大学大数据与信息工程学院,贵州贵阳550025;贵州大学大数据与信息工程学院,贵州贵阳550025【正文语种】中文【中图分类】TP391运动目标检测与跟踪是动态场景下运动目标行为分析的关键问题,也是视频分析的重要环节,对有效提取运动目标和正确分析目标的运动行为具有重要的现实意义。

已有的背景建模法种类繁多,如帧间差分法[1]、基于关键点的建模法[2]、光流法[3]、混合高斯算法[4]、ViBe算法[5]等。

ViBe算法是一种被较为广泛采纳的背景建模方法,由于其不考虑目标运动速度对目标提取效果的影响,因此相较于帧间差分法和基于关键点的建模法,获得的噪声模型更能恰当反映实时场景的背景状况;与此同时,相较于光流法和混合高斯算法,ViBe算法的设计思想简单、计算量小,能满足实时目标检测的要求。

可是,该方法的随机更新策略也导致目标提取的效果受到鬼影、阴影、背景高频扰动和摄像机抖动的影响。

鬼影是因视频初始帧存在运动目标而产生,其对后续目标的检测会造成较大影响;已有研究成果中[6-8],胡小冉[6]利用视频帧前n帧构建初始背景,进而此背景进行背景建模。

一种改进的高超声速目标跟踪算法

一种改进的高超声速目标跟踪算法

空军工程大学学报( 自然科学版 )
21 0 2年
应算 法 , 假设 不 同模 型之 间 的转移服从 已知转 移概 率 的有 限态 马尔 可夫 链 , 虑多 个 模 型 的交 互作 用 , 它 考 以
此得出 目标的状态估计 , 这种算法是 目前公认的比较实用的机动 目标跟踪算法之一 , 其主要算法过程见文献
=/ , : 2 则
O( l )= / I k k 互 k k一1 I 2 ( / )一 ( / ) () 1 Q I =2e" k q (} c ) j ) o( () 2
从 式 ( ) 以看 出 , 1可 目标 没有 发生 机 动 时 , d相 对 较 小 , △ 即 ( 较 小 ; 目标 发 生 机 动 时 , d急 剧 增 ) 当 △

种 改进 的高超 声 速 目标 跟踪 算 法
李 昌玺 毕红葵 张 , , 兵 肖 松 ,
(. 1空军预警学 院 研 究 生管 理 大 队, 湖北 武 汉 , 30 9 2 空 军 预警 学 院陆 基 预 警 监视 装 备 系 , 401 ;. 湖北 武 汉 ,
40 1 ) 3 09
摘要 根据 临近空间高超声速 目标运动特点, 建立 了临近 空间高超声速 目标运动模 型; 针对机
动 目标跟踪 问题 , “ 在 当前 ” 计 ( urn SasclM dlc ) 型基 础 上 , 统 C r t tiia oe, s 模 e tt 引入 一 种利 用 位 置 估 计值 与加 速度 之 间 的 函数 关 系 自适 应调 整 加 速 度 方 差 的 方 法 ( dpieo iac sma A at f s neEt t v Dt i e
令 曼 kk 表示 k (/ ) 时刻位置分量 的测量值 ,(/ —1 表示 时刻位置分量的估计值 , A =l(/ ) 互 kk ) 则 d kk 一 (/ kk一1 I其 中 A ), d表示 在一 个采 样周 期 内 由于机 动而 引起 的机 动 目标 位置变 化 量 。

AMBE算法及其实现方式

AMBE算法及其实现方式

AMBE算法及其实现方式AMBEA算法及其实现方式在数字移动通信系统中, 语音编码部分是很重要的一个环节, 它的性能直接关系到整个移动通信系统的工作质量。

首先综述在以数字集群为代表的移动通信系统开发的背景下, 语音编码的概念、分类和发展情况, 并介绍目前世界上常见移动通信系统所用的语音编码方案, 从而明确语音编码算法的比较对象。

今天我就自己手头了解的一些知识对AMBE算法进行初步的概括:1.MBE算法的概念AMBE是基于MBE技术的低比特率、高质量的改进语音压缩算法, 该技术在低比特率压缩系统中能提供极优的语音质量, 却对指令执行速度和存储器容量的要求大大降低, 在背景噪声和信道误码方面也有极强的鲁棒性, 比基于线性预测编码的CELP、RELP、VESLP、LPC-10等要优越。

那么了解AMBE之前我们先来了解下MBE算法:MBE编码算法是用基音谐波处的谱抽样来表示短时谱,并且在谐波间隔频段上分别进行清/浊音判决。

合成端用一组正弦波合成谱,用噪声谱的傅立叶反变换来合成清音谱。

这种算法提出了一种由正弦模型引出的频域模型—多带激励模型。

MBE模型如图1所示。

首先按基音各谐波频率, 将一帧语音的频谱分成若干个谐波带,再以若干个谐波带为一组进行分带, 分别对各带进行清浊(V/U)判决, 总的激励信号由各带激励信号相加构成。

对于浊音带, 用以基音周期为周期的脉冲序列谱作为激励信号谱对于清音带, 则使用白噪声谱作为激励信号谱。

时变数字滤波器的作用是确定各谐波带的相对幅度和相位, 起到了将这种混合的激励信号谱映射成语音谱的作用。

这种模型使合成语音谱同原语音谱在细致结构上能够拟合得很好, 其合成端的语音质量必然较高。

2.AMBE算法实现形式2.1AMBE编码的基本方式AMBE 编码的基本方法为:首先将输入的每帧 160 个数字话音取样点分成交叠的段,经模型分析后得出该帧的模型参数。

编码器量化这些模型参数,加上纠错码,然后以4.8kbps 的数据流发送。

一种改进的基音检测算法

一种改进的基音检测算法

一种改进的基音检测算法
胡剑凌;徐盛;陈健
【期刊名称】《上海交通大学学报》
【年(卷),期】2000(34)6
【摘要】提出了一种改进的基音检测算法 ,通过最小化重建谐振峰与原始谐振峰之间的误差得到最佳的基音估计 .在基音估计中引入误差控制因子以得到无偏的误差函数 ,同时对基音轨迹跟踪技术作了改进 ,以保证基音轨迹的正确演变 .实验结果表明 ,与 IMBE标准中的基音检测算法相比 ,该方法能提供更正确且平滑的基音轨迹 ,尤其在过渡段能有效地跟踪快速基音变化。

【总页数】3页(P827-829)
【关键词】基音检测;语音编码;正弦编码;算法;基音估计
【作者】胡剑凌;徐盛;陈健
【作者单位】上海交通大学电子工程系
【正文语种】中文
【中图分类】TN912.3
【相关文献】
1.一种改进的小波变换基音检测算法 [J], 王民;曹绘;要趁红
2.一种基于倒谱法的基音周期检测改进算法 [J], 张景扩;彭龑
3.一种改进的汉语语音基音检测算法 [J], 李平;胡慧之
4.一种改进的正弦语音模型基音周期检测算法 [J], 孙华山
5.一种基于多项式拟合的AMDF基音检测改进算法 [J], 郑婉璐;宗源;郑文明;胡斌;赵力
因版权原因,仅展示原文概要,查看原文内容请购买。

一种基于数学形态学的语音基音轨迹平滑的改进算法

一种基于数学形态学的语音基音轨迹平滑的改进算法

一种基于数学形态学的语音基音轨迹平滑的改进算法成新民;蒋天发;李祖欣【摘要】利用了形态学的概念和方法对语音基音轨迹进行平滑滤波,在结构元素的选取方面进行了研究,并针对形态学滤波的特点提出了改进,使算法的精确性进一步提高,复杂性大大降低.实验结果表明,提出的方法对语音基音轨迹进行平滑滤波,在强制性平滑滤波的情况下,能够有效保留语音信号中的某些固有突变和破坏信号的细节特征,更好地达到平滑滤波的效果.【期刊名称】《武汉理工大学学报(交通科学与工程版)》【年(卷),期】2010(034)005【总页数】4页(P1065-1068)【关键词】基音轨迹平滑;形态学滤波;结构元素;基音轨迹;语音【作者】成新民;蒋天发;李祖欣【作者单位】湖州师范学院信息与工程学院,湖州,313000;中南民族大学计算机科学学院,武汉,430073;湖州师范学院信息与工程学院,湖州,313000【正文语种】中文【中图分类】TP391.42基音的检测提取一直是一个被广泛研究的课题,并提出了各种各样的基音检测算法.然而由于浊音信号的周期性表征极其复杂,无论采用哪一种基音检测算法都可能产生基音检测错误,加之噪音干扰,使求得的基音周期轨迹中有一个或几个基音周期估值偏离了正常轨迹(通常是偏离到正常值的2倍或1/2),这种偏离点称为“野点”.这些脉冲噪声类似于图像中的椒盐噪声,故可以采取平滑技术加以纠正. 目前比较常用的基音平滑方法主要有中值滤波算法和线性平滑算法以及它们的组合.它们有一个共同的缺点是在纠正输入信号中不平滑处样点值的同时,也使附近各样点的值做了修改,从而使信号产生了失真.形态学滤波器作为一种非线性滤波器近年来在数字信号处理领域获得了广泛应用,它基于信号的几何特征,利用预先定义的结构元素(相当于滤波窗)对信号进行匹配,以达到提取信号,抑制噪声的目的.形态学滤波在图像处理领域已经获得了很好的效果.由于基音周期轨迹中的野点类似于图像中的椒盐噪声,并联想到形态学滤波能在有效抑制脉冲噪声的同时较好地保持信号的细节,因此将形态学方法用于基音周期轨迹的平滑是可行的[1-2].本文就是利用了形态学的概念和方法对基音轨迹进行平滑滤波,在滤波窗口的选取方面进行了一些研究,并针对形态学滤波的特点提出了改进,使算法的精确性进一步提高,复杂性大大降低.1 形态学运算数学形态学是以集合论为基础的一种研究方法,它是一种非线性变换.其基本思想是:利用一个称为结构元素的“探针”的移动来收集对象的信息.采用不同的结构元素,可以提取出不同的形状特征,所有的形态学处理都是基于填放结构元素的概念.形态变换一般分为二值形态变换和多值(灰度)形态变换.本文只限于讨论一维离散情况下的多值形态变换.其基本运算包括腐蚀、膨胀、形态开和形态闭.对于定义在整数集D上的离散函数f(n),它关于结构函数g(n)的基本形态变换定义为:由此不难看出,离散形式的膨胀和腐蚀运算实际上等价于离散函数在结构元素(相当于滑动滤波窗口)中的最大和最小值滤波.开运算和闭运算对信号作用产生的效果不同.开运算可以抑制信号中的峰值〔正脉冲〕噪声,而闭运算可以抑制信号中的低谷(负脉冲)噪声.为了同时去除信号正、负两种脉冲噪声,通常可以采用形态开、闭运算的级联组合形式.2 结构元素的选择结构元素的选取是形态学滤波的关键,其形状和大小直接决定了形态运算的效果.所选的结构元素必须既能够有效地抑制噪声,又不损坏信号的细节.而选择结构元素并没有确定的规则和定律,通常要根据信号的几何形态和变化特征进行选择.几种常用的结构元素如图1所示.图1 几种常用的结构元素对于直线段,无疑图1a)所示的平结构元素是最合适的,但是它对于曲线段却通常会引入一些阶梯状变化[3],破坏了原始图像的几何性状;图1b)所示的星形结构元素通常适合于曲线段,而在直线段部分则会引起一些波动;图1c)所示的圆盘形结构元素是一种折衷.考虑到语音信号的基音轨迹的特点:在短时间内变化比较缓慢,基音轨迹大部分区域比较平滑,但是在某一部分又有可能出现连续的错误点和随机误差,即出现较宽的脉冲噪声,因此本文采用了如图2所示的结构元素.图2 本文采用的结构元素3 改进的算法开运算可以抑制正脉冲,闭运算可以抑制负脉冲,开-闭,闭-开的级联形式运算虽然可以同时滤除信号的正、负脉冲噪声,但是存在统计偏移现象.这是由开运算的收缩性和闭运算的扩展性造成的,结果导致开-闭滤波器的输出幅度偏小,而闭-开滤波器的输出幅度偏大.虽然取两者的平均可以消除统计偏移现象[4-5],但是计算量和复杂性势必很大,因为对信号中的每一个样点都进行了数次开、闭运算,而且多次形态学运算的微小变形累加的结果,仍然会造成信号一定程度上的失真.本文提出的算法是对基本的形态运算加入一些改进,使得形态学的腐蚀和膨胀操作仅作用于那些“野点”,从根本上消除了统计偏移现象,并使算法的复杂性和计算量大大降低,精确性却得到提高.腐蚀和膨胀运算实际上是离散函数在滑动窗口中的极值运算,这是引起开运算的收缩性和闭运算的扩展性以及开-闭、闭-开的统计偏移的根本原因.可以做这样一种改进:将每次极值运算得到的值作为一个参考值,而不是直接取代被考察的样点的值,将样点值与这个参考值之差与一个阈值相比较,如果差值大于这个阈值,则认为被考察的样点是一个野点,用参考值取代之,否则保留样点的值不变.即对于腐蚀操作,如果则式中:阈值T可以取为对于膨胀操作,如果这样,对于一个相同的结构元素,经过一次改进的开运算,正脉冲被消除了,经过一次改进的闭运算,负脉冲被消除了,而那些不是野点的样点值被原封不动的保存了下来.于是整个基音轨迹的平滑过程简化为只需要一次开运算和一次闭运算.4 实验及结果分析实验中选择时长各约3~6s的男、女、童音三段语音,分别采用自相关函数(ACF)法、平均幅度差函数(AMDF)法和倒谱(CEP)法对三段语音进行基音检测[6-7].然后用本文提出的基音轨迹平滑算法对基音轨迹进行平滑,并与采用5点中值滤波得到的平滑结果进行比较.考虑到基音轨迹中相邻帧的频率之差一般不超过10Hz,而隔帧之间的频率差不超过20Hz,因此将本算法中的阈值取为20Hz,并采用前面提到的结构元素进行了实验.实验结果如表1所列.表1 三段语音的基音轨迹平滑前后的检测误差帧数ACF法AMDF法CEP法平滑前平滑后平滑前平滑后平滑前平滑后男音(214帧)中值滤波法56 7 75 1618 5数学形态学法56 1 75 3 18 1女音(222帧)中值滤波法58 6 90 14 25 5数学形态学法58 2 90 3 25 1童音(287帧)中值滤波法69 9 90 11 50 7数学形态学法69 3 90 2 50 2合计(723帧)中值滤波法183 22 255 41 93 17数学形态学法183****8934然后选用一段男声的汉语普通话发音作为实验材料,实验过程框图如图3所示.汉语“你知道这件事”的原始语音信号的时域波形如图4所示.先用自相关法进行基音检测得到图5所示的基音轨迹,然后用本文提出的基音轨迹平滑算法对基音轨迹进行平滑得到图6所示的实验结果,同时采用5点中值滤波得到的图7所示的平滑结果.同样地,对一段较长的汉语普通话“你们看那只新天鹅……”进行试验,得到如图8~11所示的结果.图3 实验过程框图图4 汉语“你知道这件事”原始语音信号的时域波形图5 汉语“你知道这件事”未经平滑的基音轨迹图6 汉语“你知道这件事”经过本文方法平滑的基音轨迹图7 汉语“你知道这件事”经过5点中值滤波平滑的基音轨迹图8 汉语“你们看那只新天鹅……”原始语音信号的时域波形图9 汉语“你们看那只新天鹅……”未经平滑的基音轨迹图10 汉语“你们看那只新天鹅……”经过本文方法平滑的基音轨迹通过实验得到波形,将经本文方法平滑的基音轨迹与经过5点中值滤波平滑的基音轨迹进行比较.可以看出,采用本文提出的方法能够有效地滤除倍频和半频噪声,同时还较好地保持了信号的细节,而且对于连续的错误点和随机误差点具有更好的平滑效果.图11 汉语“你们看那只新天鹅……”经过5点中值滤波平滑的基音轨迹5 结束语形态学滤波是一种非线性滤波方法,原理简单,而且其本身固有的并行性使得运算简单,速度较快.基于对象几何特征的特点决定了形态学方法对滤除脉冲噪声非常有效,无论在二维的图像处理领域还是用于处理一维信号的“野点”.通过选取不同形状和大小的结构元素,可以实现不同的平滑效果.传统的中值滤波平滑是一种强制性平滑,可能平滑掉信号中的某些固有突变,破坏信号的细节特征,形态学运算实际上是极值运算,也可能存在这个问题.而本文提出的方法则有效地解决了这个问题.参考文献[1]江太辉.一种改进的语音基频轮廓提取算法[J].五邑大学学报,2002,16(2):27-33.[2]郭景峰,申光宪,郑绳楦,等.数学形态学在数字滤波中的应用研究[J].机械工程学报,2002,38(10):144-147.[3]赵晓群,王光艳.汉语语音基音轨迹的形态学滤波和平滑[J].信号处理,2003,19(4):354-357.[4]王钧铭,赵力.一种基于数学形态学的车牌图像分割方法[J].电视技术,2007,31(10):84-86.[5]陈燕,谭玉敏,宋新山,等.基于遥感图像的地学信息单元特征提取与识别[J].武汉理工大学学报:交通科学与工程版,2008,32(6):1021-1024. [6]Yu P T,Some representation properties of stack filters[J].IEEE Transactions on Signal Processing,1992,40(9):2261-2266.[7]Gonzalo R A.Statistical threshold decomposition for recursive and norecursive median filters[J].IEEE Transactions on Information theory,1986,32(2):243-253.。

一种适于改进的LPC声码器的语音特征提取方法

一种适于改进的LPC声码器的语音特征提取方法

一种适于改进的LPC声码器的语音特征提取方法
陈雪勤
【期刊名称】《苏州大学学报(自然科学版)》
【年(卷),期】2002(018)001
【摘要】运用了一种较为有效的清、浊音判决方法以及基音平滑方法来提高基音检测的准确性.减小了基音周期不规则的不平稳语音段基音估计的误差,改善了在低速率的基础上合成语音的质量.
【总页数】5页(P55-58,64)
【作者】陈雪勤
【作者单位】苏州大学通信与电子工程系,江苏,苏州,215021
【正文语种】中文
【中图分类】TN91
【相关文献】
1.一种改进的与声码器结合的声学回声消除器 [J], 胡海军;林茫茫;张志军;李挥
2.一种改进的2.4kb/s混合激励线性预测声码器方案 [J], 马欣;刘常澍;李文元;张毓忠
3.一种改进的LPCC参数提取方法研究 [J], 王彪
4.改进型LPC声码器语音编码算法 [J], 王田;崔慧娟
5.一种采用定点DSP实现的1.8kbps MBE-LPC声码器 [J], 李永明;陈弘毅;朱益厅
因版权原因,仅展示原文概要,查看原文内容请购买。

M-AMDF基音提取算法

M-AMDF基音提取算法

)
X
尹(
n
)


AMD F
( k )二

}(
e )一
(
n
寿)
K


。 l (。 十
( ) 一 (`
n
。+


,;

、)

。 ( ” 十 。)
-

p
(n ) 是 周期序 列
,
那 么 当 k二 。 T 时
通 A MD F
关键 词
1
.
语 音分 析 ; 基 音 检 测 ; 基音提 取



语 音的基 音是 指发 浊 音 时 声 带 作 周 期性 振 动 的 周 期
泛 的应 用
,
语音 的 基 音 提 取 在 很多领 域 都 有广

如 语音分 析

语音 识 别
,

说 话人 识 别
,

语 音合成 等

L PC
声 码器 中
,
基音提
。 。
语音 的产 生 由 激 励 源
,

增益

声 道 滤 波等 部分 组 成
, ,
,
其 中增 益
,

L P C
声 码器 中
把 同 一 帧语 音 的 增 益 看作 是 固 定 的
,
但 实际 上 增 益 是 随

忽略 增益 随 时 间 的变 化 对 于 稳 态 浊音 的 影 响并 不 大
G
因 为 它 的 增 益 基 本不 变
,
取完成 了分 析 端的激 励 源参 数 提 取 工 作 响极大

一种改进的基音周期检测方法

一种改进的基音周期检测方法
加窗来分 帧 , 窗长 度一般 应大于基音周期 的两倍 , 以 所

般 选 择 10 2 0 ( 0 z 1~ 0T ) 2 — 4 点 80 0H ,5 3 I 。 IS
Ma a 上进行仿真 , tb l 实验证 明, 准确性得到提高 。
短 时能量分析 : 语音 信号 的大部分能量 集 中在浊
T e i n l s r t a e b b n — a s f tr n e t r lp i g o r d c t e f c s o e o d a mo i.T e h sg a i p er t d y a d p s l ,a d n e s i p n t e e d t at r l p n i a a fe ci i g s s d h l c lu a i g h a tc re ai n o f ce t n t e e r e f h c mp e i p u e w i e ac lt t e u o o r l t c e in a d h d g e o t e o l x s n o i r d c d g e t .T e s o h n t o i ti s t e se f p th a d mo t i h e u e al r y h mo t i g meh d man a n tp o i n s oh p t . h c c
语音 技术 ⑨@ @ 响 ⑨⑨ 6@ @ 润 0 U
文章 编号 :0 2 8 8 (0 1 0 — 0 3 0 1 0 — 6 4 2 1 )4 0 5 — 3

种改进 的基音周期检测 方法
曾树 华

论文 ・
( 南铁路科技职 业技 术学院, 湖 湖南 株 洲 4 20 ) 10 3

一种改进ViBe算法的移动目标检测方法

一种改进ViBe算法的移动目标检测方法

一种改进ViBe算法的移动目标检测方法
闫铭;孙丽君;陈天飞
【期刊名称】《现代电子技术》
【年(卷),期】2022(45)8
【摘要】针对基本ViBe算法在进行移动目标检测时存在“鬼影”现象的问题,文中分析产生“鬼影”现象的原因,并提出一种改进ViBe算法的移动目标检测方法。

改进ViBe算法在进行初始化时,初始背景模型的建立方式由基本ViBe算法从待检测视频序列第一帧每个像素点的8邻域随机抽取N个像素样本点,改变为从待检测视频序列前4帧每帧图像像素点的24邻域随机抽取5个像素样本点。

改进后的初始化方式扩大了抽取像素样本点的范围,减轻了移动目标存在于待检测视频序列第一帧时的影响。

为检验文中改进ViBe算法的效果,在highway数据集、pedestrians数据集和Views_001数据集上进行验证。

移动目标检测结果表明,与基本ViBe算法相比,文中提出的改进算法能够加快消除“鬼影”现象的速度,移动目标检测的效果更好。

【总页数】6页(P87-92)
【作者】闫铭;孙丽君;陈天飞
【作者单位】粮食信息处理与控制教育部重点实验室;郑州市机器感知与智能系统重点实验室;河南工业大学电气工程学院;河南工业大学信息科学与工程学院
【正文语种】中文
【中图分类】TN919-34;TP311
【相关文献】
1.一种基于改进三帧差分和ViBe算法的运动目标检测算法
2.一种基于帧差法改进的VIBE运动目标检测算法
3.一种改进的ViBe运动目标检测算法
4.一种基于改进ViBe算法的运动目标检测方法
5.一种结合改进ViBe和多特征融合的运动目标检测算法
因版权原因,仅展示原文概要,查看原文内容请购买。

一种基音周期估计的改进CAMDF算法

一种基音周期估计的改进CAMDF算法

© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved.
第4期
杨莎等 :一种基音周期估计的改进 CAMDF 算法
775
3. 2 改进 CAMDF 算法 在 CAMDF 算法的基础上 ,为了更好的简化算
Speech pitch determination based on the improved circular AMDF
YA N G S ha , X IA Xi u2Y u , Z HA N G Y u2S heng , TA N G B ang2You
(College of Electronics Information , Sichuan University , Chengdu 610064 ,China)
一种基音周期估计的改进 CAMDF 算法
杨 莎 , 夏秀渝 , 张余生 , 唐邦友
(四川大学电子信息学院 , 成都 610064)
摘 要 : 本文首先介绍了传统基音周期估计算法 :ACF 算法和 AMDF 算法. 为了克服 AMDF 算法容易导致估计出的基音周期加倍的缺陷 ,本文重点阐述了 CAMDF 基音周期估计算法 ,并 提出了改进 CAMDF 算法. 该法是在 CAMDF 算法之前 ,对语音信号进行降比特处理. 实验表 明 ,改进 CAMDF 算法在降低对处理器件复杂度和精度方面要求的同时并不会影响基音周期 的估计效果. 最后 ,本文进行了各种基音检测算法的仿真比较 ,实验表明改进 CAMDF 算法在 基音估计效果上具有很好的准确性和稳定性. 关键词 : ACF ;AMDF ; W2AMDF ;M2AMDF ;CAMDF ;基音检测 中图分类号 : TP207. 7 文献标识码 : A

基于改进ViBe的自适应运动目标检测算法

基于改进ViBe的自适应运动目标检测算法

基于改进ViBe的自适应运动目标检测算法
费莉梅;田翔;郑博仑
【期刊名称】《计算机工程与设计》
【年(卷),期】2024(45)6
【摘要】针对ViBe算法无法去除动态背景,易出现鬼影及不能自适应光照变化的问题,提出一种复杂环境自适应的ViBe改进算法。

通过计算区域的复杂度、闪烁波动度,对分类半径R和更新率T进行动态调整,对样本点进行有效性权重的计算,更高效地过滤背景噪声和适应光照渐变;在检测物体状态变化时,动态调整R和T,通过融合前景点计数和帧差法优化鬼影消除;通过识别最小外接矩阵区域差异加快去除鬼影;利用帧差法实时检测光照突变,及时进行重新初始化,避免大量误检。

实验结果表明,改进ViBe算法在适应动态背景、光照变化及抑制鬼影等方面比原算法均有更好检测效果,检测精度平均提升了40.7%。

【总页数】9页(P1771-1779)
【作者】费莉梅;田翔;郑博仑
【作者单位】之江实验室智能装备研究院;浙江大学生物医学工程与仪器学院;杭州电子科技大学自动化学院
【正文语种】中文
【中图分类】TP391
【相关文献】
1.一种基于改进三帧差分和ViBe算法的运动目标检测算法
2.基于ViBe的自适应运动目标检测算法研究
3.一种基于ViBe的自适应运动目标检测算法
4.基于自适应ViBe算法的动态背景运动目标检测
5.基于自适应Lab色差阈值的ViBe运动目标检测算法
因版权原因,仅展示原文概要,查看原文内容请购买。

基于B一样条子波变换的MBE语音模型分析算法改进

基于B一样条子波变换的MBE语音模型分析算法改进

基于B一样条子波变换的MBE语音模型分析算法改进付强;易克初;张德民【期刊名称】《信号处理》【年(卷),期】2000(016)003【摘要】首先对MBE模型分析算法的复杂度进行了深入的分析,认为原算法中的双闭环基音搜索结构有很大的改进余地。

为此提出了一种基于B-样条二进离散子波变换(B-SDyWT)基音检测法的改进MBE模型分析算法。

其关键在于利用B-SDyWT基音检测原理将这种双闭环搜索算法改造成先开环后闭环的结构。

理论分析可以说明这种改造可以大幅度地降低基音搜索的复杂度,而不降低其性能。

通过仿真实验,我们对改进前、后的MBE模型基音搜索算法的复杂度、准确度以及抗噪声能力等方面作了一个全面的对比分析。

得出这样的结论:改进算法与原算法相比,各项性能均不低于原算法甚至有所改善,特别是证实了理论分析中的复杂度降rn低作用。

【总页数】5页(P230-234)【作者】付强;易克初;张德民【作者单位】西安电子科技大学ISN国家重点实验室重庆邮电学院电信工程系;西安电子科技大学ISN国家重点实验室重庆邮电学院电信工程系;西安电子科技大学ISN国家重点实验室~ 重庆邮电学院电信工程系【正文语种】中文【中图分类】TN91【相关文献】1.基于MBE模型的基音周期估计算法改进 [J], 唐斌;樊桂花2.基于小波变换的MBE模型基音估计算法改进 [J], 杨保平;唐斌3.基于听觉模型的子波变换语音处理 [J], 林宝成;黄志同4.基于统计模型的语音激活检测算法改进 [J], 张金榜;尹冬梅5.基于听觉模型的子波变换语音增强 [J], 林宝成;富煜清;黄志同因版权原因,仅展示原文概要,查看原文内容请购买。

一种改进的基于听觉掩蔽的自适应β阶MMSE语音增强算法

一种改进的基于听觉掩蔽的自适应β阶MMSE语音增强算法

一种改进的基于听觉掩蔽的自适应β阶MMSE语音增强算法陈照吉
【期刊名称】《电脑开发与应用》
【年(卷),期】2008(21)11
【摘要】提出一种改进的基于听觉掩蔽的自适应阶MMSE语音增强算法,实验表明这种改进算法比起经典的语音增强算法能更显著地提高算法的客观性能,特别在非平稳噪声和低信噪比的环境中能快速估计出变化的噪声功率谱.
【总页数】3页(P63-64,69)
【作者】陈照吉
【作者单位】中国海洋大学,青岛,266071;河南省财经学校,郑州,450012
【正文语种】中文
【中图分类】TP391
【相关文献】
1.一种改进的基于人耳听觉掩蔽效应的语音增强算法 [J], 蔡萍
2.基于听觉掩蔽的自适应β阶贝叶斯语音增强算法 [J], 王雷;徐岩;加小红
3.基于听觉掩蔽效应的MMSE语音增强算法 [J], 阔永红;陈健;杨昌方
4.试析基于听觉掩蔽效应的MMSE语音增强算法 [J], 贾丽娟
5.基于听觉掩蔽效应的■阶STSA-MMSE语音增强算法 [J], 冯宏伟;谢艳萍
因版权原因,仅展示原文概要,查看原文内容请购买。

一种综合的基音提取方法

一种综合的基音提取方法

一种综合的基音提取方法
章文义;朱杰
【期刊名称】《计算机应用与软件》
【年(卷),期】2004(021)002
【摘要】本文提出了一种综合的基音提取算法,综合运用了平均幅度差法、自相关函数法和简单逆滤波器跟踪法等多种算法对候选的基音频率点进行打分,最后再用动态搜索的算法找出一条全局最优路径.从而避免了单一方法的局限性,取得了很好的性能.
【总页数】3页(P12-13,116)
【作者】章文义;朱杰
【作者单位】上海交通大学,上海交通大学与贝尔实验室通信与网络联合实验室,上海,200030;上海交通大学,上海交通大学与贝尔实验室通信与网络联合实验室,上海,200030
【正文语种】中文
【中图分类】TN912
【相关文献】
1.一种语音信号基音周期的提取方法 [J], 张煜
2.一种实用的汉语基音提取方法 [J], 周江扬;柴佩琪
3.一种基于小波变换的混叠语音基音提取方法 [J], 张海英;赵军;潘永湘
4.一种综合机载LiDAR与高分辨率航空影像的铁路轨道提取方法 [J], 于海洋;牛峰
明;罗玲;马慧慧
5.一种多波束水体图像目标综合提取方法 [J], 丁德秋;唐秋华;陈建兵;李杰
因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一种改进的MBE基音跟踪算法黄姗姗;许钢;李远军【摘要】By studying the slow time-varying characteristics of pitch period,an improved pitch tracking algorithm based on MBE is proposed. The algorithm,which tracks only one frame data forward and backward respectively compared with the traditional one, aims to reduce calculations and upgrade the realtime performance of pitch detection. The result of simulation experiment shows that both the new algorithm and the traditional one can achieve good effect of pitch tracking. But the calculations for the new algorithm are reduced remarkably and execution speed improved a lot.%通过对基音周期慢时变特性的研究,提出了一种改进的MBE基音跟踪算法.该算法旨在减少运算量,提升基音检测的实时性,将传统的基音跟踪算法改进为前后向各跟踪一帧.仿真实验表明,改进算法与传统算法对基音跟踪均取得了良好的效果,但是新算法计算量大幅度减少,执行速度明显提升.【期刊名称】《安徽工程大学学报》【年(卷),期】2012(027)004【总页数】4页(P49-52)【关键词】MBE;基音跟踪;基音周期}初始估计【作者】黄姗姗;许钢;李远军【作者单位】安徽工程大学安徽省电气传动与控制重点实验室,安徽芜湖241000;安徽工程大学安徽省电气传动与控制重点实验室,安徽芜湖241000;安徽工程大学安徽省电气传动与控制重点实验室,安徽芜湖241000【正文语种】中文【中图分类】TN912.3在多带激励(MBE)语音编码[1-2]中,对语音信号进行初始基音估计时,计算出与各个候选基音周期对应的误差函数值后,可以选择使误差函数最小的周期作为初始基音估计值.但这样可能会导致相邻帧的基音估计值相差很大,无法保证基音周期的连续性,基音周期突然改变会降低合成语音的质量.语音基音周期具有慢时变特性,利用相邻帧的基音估计,可以提高当前帧基音估计的准确性.目前在MBE基音的初始估计中,为了加强基音周期的连续性,去除基音轨迹中的野点,常用的算法是平滑算法[3].基音平滑主要有两种方法,一种是以校正基音周期轨迹中孤立误差为基础的中值平滑技术,另一种是以基音的连续性特征为基础的动态规划技术.中值平滑技术的平滑效果不是很理想,它是强制性的基音轮廓平滑,这种方法的缺点是基音中的一些固有突变被平滑掉了;动态规划技术可以得到较好的平滑效果,但是步骤繁琐,在进行平滑之前,还需要对每一帧进行清浊音判决,运算复杂,计算量非常大.本文采用计算量相对较小的基音跟踪算法[4],将相邻帧基音周期的偏差限制在预定范围内,以保证基音周期的连续性.为了进一步降低算法的复杂度,提高跟踪的速度,因此本文将传统的基音跟踪算法改进为前后向各跟踪一帧.1 基音的初始估计采用Adobe Audition录音软件录取一段语音,采样频率为8 000Hz,量化位数为16bit,单声道.语音信号首先通过一个截止频率约10Hz的数字高通滤波器,除去信号中的直流分量,高通滤波后的语音信号表示为shp(n).再将语音信号通过一个截止频率为800Hz的五阶椭圆低通滤波器,该低通滤波器不仅可以去除大部分高频共振峰的影响,而且可以在基音频率为最高500Hz时,保留其一、二次谐波[5],低通滤波后的语音信号表示为slp(n).基音初始估计窗wI(n)选用341点的归一化三角窗.对语音信号进行分帧处理,每帧341个样点,缓存了前一帧71个样点,当前帧200个样点和后一帧70个样点.基音初始估计的框图如图1所示.1.1 定义误差函数E(P)进行基音周期的初始估计时,多次用到误差函数E(P)[4],其定义如下:图1 基音初始估计的框图自相关函数φ(t)[4]定义为:上式中t为整数,若t为非整数,则通过线性内插计算,内插计算使用式(3)[4]:经过多次实验,当j取170(即:帧缓存取341个样点),m取114(即:候选基音周期取值范围的上限为114)时基音初始估计可以取得较好的效果.1.2 基音跟踪算法改进基音跟踪算法分为两个部分:后向基音跟踪和前向基音跟踪.对每个当前帧进行后向基音跟踪得到后向估计PB,它保持当前帧与过去帧之间基音周期的连续性;对当前帧进行前向基音跟踪得到前向估计PF,它保持当前帧与将来帧之间基音周期的连续性.然后根据判决规则比较PB和PF,选择一个作为当前帧基音周期的初始估计PI.(1)后向基音跟踪.过去一帧基音周期的初始估计记为P-1,对应的误差函数值为E-1(P-1),为了保证基音周期的连续性,将当前帧的基音周期P限制在P -1附近,即要求满足以下的约束条件[4].在满足上述条件的范围内逐个选取P,并按式(1)计算相应的E(P),使E(P)最小的P就是后向估计PB,并计算后向累计误差CEB(PB),定义为[4]:后向累计误差是后向基音估计的置信度测度,将它与前向累计误差进行比较,来确定当前帧的PI.传统算法中后向累计误差的定义为[4]:改进的后向基音跟踪算法与传统算法相比,将过去第二帧对应的误差函数值略去不计,减少了计算量.(2)前向基音跟踪.将来一帧的基音周期表示为P1,E1(P1)是对应的误差函数.由于P1是将来帧,其值尚未确定,前向基音跟踪算法必须首先设法确定将来帧的基音周期值,在{21,21.5,…,113.5,114}范围内选择一个P0,然后按照下面的条件[4]选取P1.使E1(P1)最小的P1 记为1,计算前向累计误差函数CEF(P0),如下式[4]:重复进行上述过程,在限定的范围内逐个选取P0,计算对应的CEF(P0),使其取最小值的P0定义为0.传统算法中前向累计误差的定义为[4]:使E1(P1)+E2(P2)最小的P1和P2表示为1和2.改进的前向基音跟踪算法与传统算法相比,将未来第二帧对应的误差函数值略去不计,只搜索未来一帧的基音周期值,减少了在得到P1的基础上再搜索P2的时间,减少了计算量.为确保0是真正的基音周期,而不是基音周期的倍数,在得到0后,对其分数值0/n进行检验,其中n=2,3,4,5.当满足0/n时,在{21,21.5,…,113.5,114}中选择一个与其最接近的值代替0/n.然后按照下面的约束条件[4]检查是否有满足其中任何一个且为最小的(0/n)≥21,如果有,则前向基音估计PF =0/n;如果没有,则PF =0.(3)确定基音初估值.在完成上述前后向跟踪、得到前后向基音估计PF和PB之后,按以下判决规则[4]确定基音初估值PI:当CEB(PB)<0.48时,PI=PB;当CEB(PB)≤CEF(PF)时,PI =PB;若以上两个条件都不满足,则PI=PF.至此就完成了多带激励语音编码的基音初始估计,得到的初估值是{21,21.5,…,113.5,114}中的一个数,精度为1/2采样周期.2 改进算法与传统算法计算量对比由公式(1)可得,计算E(P)所需的计算量随着P的取值而变化.若P的取值在30附近,P取整数时,大概需要10 568次乘法,4 827次加法;当P取分数时,大概需要1 4018次乘法,6 908次加法.在进行后向基音跟踪时,由公式(4)可得,当前帧的基音周期P限制在P-1附近,若P-1的取值在30附近,需要进行P取整数时的搜索13次和P取分数时的搜索12次.由公式(5)可得,后向基音跟踪改进算法大概需要10 568×13+14 018×12+14 018=319 618次乘法,由公式(6)可得,后向基音跟踪传统算法大概需要10 568×13+14 018×12+14 018×2=333 636次乘法.在进行前向基音跟踪时,在{21,21.5,…,113.5,114}范围内选择一个P0,即先进行P0 取整数时的搜索94次和P0取分数时的搜索93次,然后按照公式(7)搜索P1.由公式(8)可得,前向基音跟踪改进算法大概需要的乘法次数是:(10 568×13+14 018×12)×94+(10 568×13+14 018×12)×93+10 568×94+14 018×93=59 444 266,由公式(9)和(10)可得,前向基音跟踪传统算法大概需要的乘法次数是:(10 568×13+14 018×12)×94+(10 568×13+14 018×12)×93+[(10 568×13+14 018×12)×13+(10 568×13+14 018×12)×12]×94+[(10 568×13+14 018×12)×13+(10 568×13+14 018×12)×12]×93+10 568×94+14 018×93=1 488 124 266.该算法若采用TI公司的高性能定点TMS320C6416DSP芯片,TMS320C6416DSP的最高处理速度可以达到4800MIPS,在一个指令周期内可以完成一次乘加运算,计算E(P)需要的乘法次数比加法次数多,由上述理论分析,若P的取值在30附近时,前后向跟踪传统算法大概需要的时间是310.0 954ms,前后向跟踪改进算法大概需要的时间是12.4 508ms,每帧语音的长度是25ms,改进算法比传统算法执行速度明显提升,由于改进算法的运算时间小于每帧的时间,改进算法可以做实时处理,传统算法的运算时间远远大于每帧的时间,无法实时处理.上述分析是以P的取值在30附近为例,对于不同的P值,传统算法与改进算法所需的计算量不同,对于P 在{21,21.5,…,113.5,114}之间取值时,两种算法处理一帧语音大概所需时间对比如图2所示.设T1是改进算法所需时间,T2是传统算法所需时间,从图2中可以看出,无论P取何值,T2都远远大于25ms,因此,传统算法无法实现实时处理;而T1均小于25ms,所以,改进算法对基于MBE的语音编码的实时实现提供了可能.图2 传统算法与改进算法所需运算时间对比3 实验结果及分析下面运用改进算法和传统算法分别对一段女声“语音编码”和一段男声“语音信号参数编码”的语音信号进行基音初始估计,在MATLAB中仿真实现,结果如图3所示.由图3a、图3b对比可知,用改进算法和传统算法得到的女声语音基音初始估计的结果是完全一样的,相同条件下新算法的执行速度明显提升;由图3c、图3d对比可见,男声语音共有第3,16,24,32,61,79这6帧结果不同,其中第16与24帧是浊音帧,第16帧用两种算法得到的周期与实际均有偏差,第24帧用改进算法提取的周期更准确,其他不同的4帧是清音帧,相同条件下新算法的执行速度明显提升.图3 语音信号的基音轨迹图4 结论本文将多带激励基音初始估计中的基音跟踪算法改进为前后向各跟踪一帧,在Matlab环境下用该算法对录制的多个语音段进行了处理,均得到了较为理想的实验效果.理论分析和仿真结果都表明,与传统的基音跟踪算法相比较,改进算法在较好地完成基音初始估计的同时大大减少了计算量,对基于MBE语音编码的实时实现提供了可能.【相关文献】[1]Peder rson,Simon Hu,Michael Lustig.Fast dynamic 3DMR spectroscopic imaging with compressed sensing and multiband excitation pulses for hyperpolarized13Cstudies[J].Magnetic Resonance in Medicine,2011(3):231-233.[2]Peder rson,Robert Bok,Adam B.Kerr,Michael Lustig,Simon Hu,Albert P.Chen,Sarah J.Nelson,John M.Pauly,John Kurhanewicz,DanielB.Vigneron.Investigation of Tumor Hyperpolarized [1-13C]-Pyruvate Dynamics U-sing Time-Resolved Multiband RF Excitation Echo-Planar MRSI[J].NIH public AccessAuthor Manuscript,2010:(6)713-716.[3]陈洪亮.一种基于MBE低速率语音编码的研究与DSP实现[D].西安:西安电子科技大学,2011.[4]李昌立,吴善培.数字语音-语音编码实用教程[M].北京:人民邮电出版社,2004:11. [5]鲍长春.数字语音编码原理[M].西安:西安电子科技大学出版社,2007.。

相关文档
最新文档