基于子帧参数动态规划的语音基音周期提取算法
基于CEP和LPC谱提取语音信号基音周期的方法
( 5) 对 截取 加 窗后 的 一帧 语 音信 号 AMP 进 行 CEP 和 L PC 谱分 析, 观察波 形图, 估 计基音周期。如 图 2, 图 3 所示。
LPC 谱( 左 ) 和CEP 谱 ( 右 ) 的讨论
对一帧语音信号做 CEP 谱和 L PC 谱都能准 确地 分析出语音信号的基音周期。 L P C 谱图波峰位置恰好 对应 CEP 谱图中的波谷位置 ; 波形基本上关于横轴对 称; LP C 谱估计基音周期 , 可以采用离开原点的第一个 波谷出现的样值点除以采样频率 ; 而用 CEP 谱图估计 基音周期 , 可以采用离开原点的第一个波峰出现的样点 值除以采样频率[ 7] 。 但是 , 在语音信号分析过程中窗长的选择对于语音 特征参数的选择是非常重要的 , 如果窗长很大, 当语音 信号通过时, 反映波纹细节的高频部分被阻碍, 短时能
0 引
言
1 1. 1
同态分析 同态信号处理的原理 同态信号处理也称为同态滤波, 实现将卷积关系和
语音信号的分析 , 就是提取语音产生模型的各种参 数( 语音的特征参数 ) , 应用于语音的编码、 识别和合成 等。不论是分析怎样的参数以及采用什么分析方法, 在 按帧进行语音分析, 提取语音特征参数前, 有一些经常 使用的、 共同的短时分析技术必须预先进行, 如语音信 号的数字化、 预加重、 加窗和分帧等。经过这些处理, 语 音信号就被分割成一帧一帧加过窗函数的短时信号, 然 后再把每一个短时语音帧看成平稳的随机信号, 利用数 字信号处理技术提取语音特征参数。 在进行处理时, 按帧从数据区中取出数据 , 处理完 后再取下一帧。 最后得到由每一帧参数组成的语音特征 参数的时间序列。基音周期是语音信号最重要的参数 之一 , 它描述了语音激励源的一个重要特征。因为汉语 言是一种有调语言, 基音的变化模式称为声调 , 它携带 着非常重要的具有辨意作用的信息 , 有区别意义的功 能, 所以基音周期的提取和估计对汉语言更是一个十分 重要的问题。
基音周期提取1-原理说明
基⾳周期提取1-原理说明Matlab 基⾳周期提取1-原理说明
先看语⾳“0”的整体波形:
图1
再选其中的两个局部:
图2
图3
以上三幅图为语⾳“0”以8KHz采样的波形。
可以看出,汉语语⾳具有⾮常明显的**准周期特性**。
相邻的两个周期的波形基本⼀致,随时间推移,波形规律性的**逐渐**改变。
基⾳周期提取的常⽤⽅法参数有:**短时⾃相关**、短时平均幅度差、线性预测倒谱、⼩波⾃相关函数、三电平削波的互相关函数等[2]。
这⾥对便于理解的短时⾃相关法说明如下,直接引⽤参考⽂献内容。
图4(参考⽂献[3])
公式通俗理解:
式3.13中,R(k)等于原序列x中,由负⽆穷到正⽆穷,所有间隔为k的两个样点,相乘后求和。
式3.14中,R(k)等于原序列x中,由负⽆穷到正⽆穷,所有间隔为k的两个样点,相乘后求和,再除以求和的项数,即相隔为k的样点乘积的平均值。
图5(参考⽂献[3])
参考⽂献:
1、《实⽤语⾳识别基础》王炳锡屈丹彭煊等,国防⼯业出版社 2005
2、《MATLAB在语⾳信号分析和合成中的应⽤》宋知⽤,北京航空航天⼤学出版社 2013
3、《数字语⾳处理及MATLAB仿真》张雪英,电⼦⼯业出版社 2010
4、⽹络资源。
基于CEP和LPC谱提取语音信号基音周期的方法
基于CEP和LPC谱提取语音信号基音周期的方法作者:马英,石小荣, 李海新来源:《现代电子技术》2009年第20期摘要:在语音信号分析中,只有分析出可表示语音信号本质特征的参数,才有可能利用这些参数进行高效的语音通信、语音合成和语音识别等处理。
因此对语音信号采用CEP和LPC谱提取语音信号基音周期的异同进行了研究,并采用Matlab实现了仿真分析。
从中可以看出,LPC谱估计基音周期的算法运算量较大,而CEP 谱算法更直观,且在少部分情况下基音峰会变得更突出一些, CEP谱具有更加广阔的应用前景。
关键词:同态分析;线性预测分析(LPC);基音周期;Matlab中图分类号:TP274文献标识码:A文章编号:1004-373X(2009)20-150-02Speech Signal Extraction Method of Pitch Based on CEP and LPC SpectrumMA Ying,SHI Xiaorong,LI Haixin(Qinghai Nationality College,Xining,810000,China)Abstract:In voice signal analysis,by analysing the voice signal substantive characteristics′ parameter,these parameters can be used to carry on high effective processing and voice communication,speech synthesis and speech recognition.Therefore,difference between speech signal extraction of pitch by CEP and speech signal extraction of pitch by LPC spectrum are analysed,and Matlab is used to realize the simulation analysis.LPC spectrum is used toestimate tone c ycle's algorithm which has big calculation,but the CEP spectrum algorithm is more direct-viewing,and the tone summit becomes prominent,CEP spectrum has widely application prospect.Keywords:analysis of same state;LPC;pitch;Matlab0 引言语音信号的分析,就是提取语音产生模型的各种参数(语音的特征参数),应用于语音的编码、识别和合成等。
FPGA_ASIC-基于FPGA的基音检测算法的设计与实现
3.1 DSP Builder 开发环境的确定 DSP Builder 可以帮助设计者完成基于 FPGA 的 DSP 系统设计。除了图形化的系统建模
外,DSP Builder 还可以自动完成大部分的设计过程和仿真,直至把设计文件下载到 DSP 开 发板上。利用 Matlab\DSP Builder 进行 DSP 模块设计是 SOPC 技术的一个组成部分。利用 DSP Builder 和基本 Nios CPU,用户可以根据设计项目的具体要求,随心所欲地构建自己的 DSP 处理器系统,而再也不必拘泥于其他 DSP 公司已上市的有限款式的 DSP 处理器。 3.2 系统整体分析及模块划分
考虑到背景噪声和提取结果出现跳变等问题,整个系统最终确定由下面三个部分构成: (i)端点检测模块;(ii)基音频率提取模块;(iii)平滑处理模块。其工作流程可由图 1 表示。
图 1 基音检测系统工作流图 本文选取了 32kHz 采样频率 PCM 音频格式的 wav 文件作为系统的输入数据,输出为每 帧的基音频率值。最后通过对相关参数(比如端点检测模块中所确定的双能量门限及双过零 率门限,基音检测模块中的清浊判别门限以及平滑处理模块中的滑动窗长)的不断调整,可 以很好地解决清浊误判,语音段数据漏判以及尖峰的出现等问题。
ZHUANG Lu, JIA Xi-bin, XU Xiang-zhong
Abstract: It is one of the most important applications to employ FPGA in “DSP”, which is one of the mainstream technologies in the field of digital signal processing. This thesis employs the system-oriented and algorithm-oriented ideas to implement the design of DSP-IP Core and its execution architecture for an important technology in speech signal processing——“pitch feature abstraction” according to the FPGA-based DSP solutions supposed by Altera. The performance analysis results show that DSP solutions of the algorithm make the great promotion of efficiency of the whole system. Keywords: DSP; FPGA; pitch; self-correlation method
语音识别技术中的声纹特征提取方法
语音识别技术中的声纹特征提取方法声纹识别技术是一种基于人声信号的生物识别技术,通过分析声音中独特的声纹特征,实现对个体身份的准确识别。
声纹特征提取方法是声纹识别技术中的核心环节,决定了识别性能的优劣。
本文将介绍几种常用的声纹特征提取方法,并对其原理和优缺点进行分析。
一、时域特征提取方法时域特征提取方法主要基于声音信号的时序特点,常用的特征包括基音周期、语调、能量等。
1. 基音周期:基音周期是指声音波形中基音振动周期的长度,具有很强的个体差异性。
基于基音周期的特征提取方法主要包括自相关法和互相关法。
自相关法通过计算信号与其自身在不同时间偏移下的互相关系数,来提取基音周期信息。
互相关法则是通过计算两个不同信号之间的互相关系数,来提取基音周期信息。
2. 语调:语调是指声音信号的音高。
不同个体的音高存在一定差异,可以用于声纹特征提取。
语调特征提取方法主要基于基频和基频变化率的计算。
3. 能量:能量是指声音信号的强度。
不同个体的声音在能量上也存在差异,因此能量特征可以用于声纹识别。
能量特征提取方法一般通过计算声音幅度的均方差或绝对值来得到。
二、频域特征提取方法频域特征提取方法基于声音信号在频域上的表现,常用的特征包括音谱、倒谱、Mel频谱等。
1. 音谱:音谱是指声音信号在频域上的幅度谱。
音谱特征提取方法通过对声音信号进行傅里叶变换,将其转换为频域表示,然后提取幅度谱信息。
2. 倒谱:倒谱是将音频信号的频域表示转换为倒谱表示的方法。
倒谱特征提取方法先将声音信号进行傅里叶变换得到音谱,然后进行对数变换和逆傅里叶变换得到倒谱。
3. Mel频谱:Mel频谱是一种对音频信号频域表示进行处理的方法。
Mel频谱特征提取方法通过将频谱映射到Mel频率刻度上,再进行对数变换。
三、时频域特征提取方法时频域特征提取方法是将时域特征和频域特征结合起来,综合考虑声音信号的时序和频率特征。
1. 小波变换:小波变换是一种时频分析方法,可以将声音信号分解为不同尺度和频带的子信号。
实验二语音信号的基音周期提取最终报告
实验二语音信号的基音周期提取一、实验目的1、熟练运用MATLAB软件的运用,学习通过MATLAB软件编程来进行语音信号的基因周期提取。
2、掌握语音信号的基音周期提取的方法,实现其中一种基频提取方法。
3、学会用自相关法进行语音信号的基因检测.二、实验仪器设备及软件HP D538、MATLAB三、实验原理浊音信号的自相关函数在基因周期的整数倍位置上出现峰值,而清音的自相关函数没有明显的峰值出现。
因此检测自相关函数是否有峰值就可以判断是清音还是浊音,而峰-峰值之间对应的就是基音周期。
影响从自相关函数中正确提取基音周期的最主要原因是声道响应。
当基音的周期性和共振峰的周期性混在一起时,被检测出来的峰值可能会偏离原来峰值的真实位置。
另外,在某些浊音中,第一共振频率可能会等于或低于基音频率.此时,如果其幅度很高,它就可能在自相关函数中产生一个峰值,而该峰值又可以同基音频率的峰值相比拟。
1、自相关函数对于离散的语音信号x(n),它的自相关函数定义为:R(k)=Σx(n)x(n-k),如果信号x(n))具有周期性,那么它的自相关函数也具有周期性,而且周期与信号x(n)的周期性相同。
自相关函数提供了一种获取周期信号周期的方法。
在周期信号周期的整数倍上,它的自相关函数可以达到最大值,因此可以不考虑起始时间,而从自相关函数的第一个最大值的位置估计出信号的基音周期,这使自相关函数成为信号基音周期估计的一种工具.2、短时自相关函数语音信号是非平稳的信号,所以对信号的处理都使用短时自相关函数。
短时自相关函数是在信号的第N 个样本点附近用短时窗截取一段信号,做自相关计算所得的结果Rm(k)=Σx(n)x(n-k)式中,n表示窗函数是从第n点开始加入。
3、算法通过对自相关基音检测原理的分析,考虑到检测准确度和检测速率2方面的因素,提出了算法实现方案,并对算法进行了Matlab编程实现。
算法包含6个功能模块:带通滤波、取样、分帧、短时能量分析、相关运算、基音检测。
一种综合的基音提取方法
收稿日期:2003-01-06。
本项目得到上海市科学技术委员会基础研究项目基金资助(01JC14033)。
章文义,硕士生,主研领域:语音识别,语言信号处理。
一种综合的基音提取方法章文义 朱 杰(上海交通大学 上海交通大学与贝尔实验室通信与网络联合实验室 上海200030)摘 要 本文提出了一种综合的基音提取算法,综合运用了平均幅度差法、自相关函数法和简单逆滤波器跟踪法等多种算法对候选的基音频率点进行打分,最后再用动态搜索的算法找出一条全局最优路径。
从而避免了单一方法的局限性,取得了很好的性能。
关键词 基音 平均幅度差函数 自相关函数 简单逆滤波器跟踪法A NEW COMPOSITE PITCH EXTRACTION AL G ORITH MZhang Wenyi Zhu Jie(Shanghai Jiaotong University and Bell Labs Communications and Network Joint Laboratory ,Shanghai 200030)Abstract This article proposes a composite pitch extraction alg orithm ,which integrates AM DF ,Autocorrelation Function and SIFT together ,scores the candidate pitch frequency ,then searches for a global optimized path using dynamic programming.The composite alg orithm abstains the limitation exists in single alg orithm and shows g ood performance in multi 2conditions.K eyw ords Pitch AM DF Autocorrelation function SIFT1 引 言基音提取是语音信号处理中一个重要的课题,在语音压缩编码、语音识别,尤其是汉语语音识别中有着重要意义。
语音信号处理中基于加权自相关函数的基音提取
语音信号处理中基于加权自相关函数的基音提取中文摘要在语音信号处理中,很难去确定准确的基频。
为了解决这个问题,本文提出基于自相关函数的加权基音检测法。
首先,因为平均幅度差函数的方法与自相关函数有相同的性质,根据自相关函数,我们用平均幅度差函数倒数的平方作为权重系数。
最后,我们获取一个基音提取的新算法。
此外,基音平滑处理是为了获取更好的效果。
仿真实验结果显示这个新的算法可以进行基音检测。
此外,它也提高了基音检测的精确度。
关键字——语音信号处理基音检测加权自相关函数平均幅度差函数基音是一个谐波信号中的基频。
基音段在语音处理中扮演着一个重要的角色。
一般来说,音调分类是根据基音曲线;基于波形拼接的语音合成需要对基音轨迹修改;汉语言识别系统使用基音轨迹来识别语音,这对于消除歧义来说很重要;音调周期在文本语言合成中也起着关键作用。
音调检测的目的是找到与声带振动一致地的基音段曲线。
基音段的精度和实时性在语音信号处理中是非常重要的。
为此,已经提出了许多提取语音信号基音的方法,诸如短期自相关函数,短时平均幅度差函数,谱距离法,端点检测等等。
这些基音提取方法基于语音信号短时间平稳性。
为此,准确和有效的基音提取功能,其预处理以及用于基音检测的平滑处理是精确基音检测的关键。
为了降低信噪比,[2]提出了一种ACF 来提取噪声信号的基音。
[3]提出了一种利用三个功率的振幅谱代替传统的二次幂的噪声信号的鲁棒基音检测算法,以通过带通滤波器调整语音频谱。
[4]提出了一种基于反向滤波的AR 模型,以降低噪声信号的检测误差。
[5]使用形态滤波器去除语音信号预处理中的噪声,然后通过小波变换方法检测音调频率,提高了基音检测的鲁棒性。
[6]提出了一种基于AMDF 的算法来基音检测。
[7]使用短期能量通过判断声音/无声段来检测基音主体。
大多数基音估计算法仅使用AMDF 或ACF 来检测基音周期,但是存在大量的干扰波。
考虑在AMDF 和ACF 中出现在相同时间的极值,提出了一种使用由AMDF 加权的自相关函数的新的基音提取方法。
人工智能语音识别系统的声音特征提取方法
人工智能语音识别系统的声音特征提取方法人工智能(Artificial Intelligence,简称AI)无疑是当今科技领域的热门话题,其中语音识别技术作为AI的重要分支之一,正逐渐深入人们的生活。
而在语音识别技术中,声音特征提取是其中的核心环节之一。
本文将简要介绍人工智能语音识别系统的声音特征提取方法。
声音特征提取是指从输入的声音信号中提取出能够表达语音信息的特征,被广泛应用于语音识别、语音合成等领域。
下面将介绍几种常见的声音特征提取方法。
1. 短时能量短时能量是一种基本的声音特征,其通过计算声音信号在一段时间内的能量大小来表示声音信号的强度。
短时能量的计算公式如下:E(n) = ∑[s(n)]^2其中E(n)表示第n帧的能量值,s(n)表示第n帧的声音信号。
2. 短时过零率短时过零率是指在一个时间窗口内信号过零点的次数。
过零点是指信号从正数变为负数(或从负数变为正数)的点。
短时过零率的计算公式如下:Z(n) = ∑|sign[s(n)] - sign[s(n-1)]|其中Z(n)表示第n帧的过零率,s(n)表示第n帧的声音信号。
3. 傅里叶变换傅里叶变换是一种可将时域信号转换为频域信号的数学变换方法。
在声音特征提取中,常用的傅里叶变换方法是短时傅里叶变换(Short-time Fourier Transform,STFT),其将连续的声音信号分解为频谱图。
4. 梅尔频率倒谱系数梅尔频率倒谱系数(Mel-frequency Cepstral Coefficients,MFCC)是一种常用的声音特征提取方法。
它模拟了人耳对声音的感知方式,将频率划分为若干个梅尔频率,并通过倒谱分析方法将频谱图转换为梅尔倒谱系数。
5. 线性预测编码(Linear Predictive Coding,LPC)线性预测编码是一种将声音信号分解为预测系数的方法。
LPC的基本思想是假设声音信号是由一个线性滤波器与白噪声信号进行卷积得到的。
基于动态规划的低延时基音提取算法
号的谐波结构变化范围很大; 浊音的起始与结尾点 难以判断, 且存在介于清浊音之间的过渡段; 基音 周期是时变的, 在某些语音段变化很快, 甚至出现跳 变。 为了解决这些问题, 人们提出了各种算法, 试图 利用信号时域、 频域、 或综合二者的信息对基音周期 [1] 进行检测 , 但目前各种检测算法的结果都并不令 人满意。 一个比较好的改善方法是对检测结果进行 [ 2- 3 ] 适当平滑, 如中值滤波、 动态规化等 。 传统的主动式动态规划算法可以有效利用基音 周期连续性变化信息, 有效减少基音周期提取错误, 但仍有一些不足: 在起始段和结尾段, 清音帧将对 全路径代价计算产生不利影响; 为了达到理想性 能, 该算法通常需要 2 帧以上的延时, 在延时受限的 条件下是不可接受的。 针对这些问题, 本文提出了一 种改进的低延时动态规化算法。
1588
清 华 大 学 学 报 ( 自 然 科 学 版)
2008, 48 ( 10)
峰值点位置, 第n 帧语音第1 最大峰值点位置到第16 (n ) (n ) (n ) 最大峰值点位置分别记为 p 1 , p 2 , …, p 16 。 若 ϖ i 满足式 ( 6) , 则认为第 n 帧基音周期落在第 i 峰值点 上, 记为事件 E ( i) , 否则记为事件 E ( 0) 发生。
, Σj ) =
( l) ( l) 2
) =
(n )
Σi - Σj Α m ax - ∃, 0 ( l - 1) ( l) m ax ( Σi , Σj ) 其中 Α和 ∃ 为常量。
1. 2 对清浊音段的处理
( l- 1)
, Σi ) w f (L
( n - 1)
- L
(n )
) +
语音信号基音频率的提取
E[ y1* y 2] E ( y1 ) E ( y 2 )
2 2
语音的基音周期一般在20到140,因此 小于20没有周期 i+20-1,因此pitch.m在调用这个时需要 有一句p=19+ind_pitch;
二、主程序pitch
[maxim,mxi]=max(rr);%maxim存放最大值,mxi存放最 大值位置 ind_pitch=mxi; if mxi>THR_largePitch %与限定值比较 mi=maxx(rr,THR_maxx);%实际上就是以最大值 点的t倍为界找出这个界以上的左右极值点的位置 %这个序列的第一个值是1,最后一个是序列rr的长度 %一开始看到这里的时候会觉得比较多余了,直接一次 maxim*THR_pitch分界比较就可以了 %事实上,下面的比较没有只针对极值点处理。 %maxx的作用是筛选出大于maxim*THR_maxx的极值点 出来,所以这个还是必须的 for i=1:length(mi) if rr(mi(i))>max(THR_corr,maxim*THR_pitch); ind_pitch=mi(i); break;%break说明只取第一个满足条件的 end end end p=19+ind_pitch;%rr(i)对应的是i+19 mx=rr(ind_pitch);
第一个和最后一个 if newstate==-1 & oldstate ==1 if s(i)>t*max_value j=j+1; mi(j)=i; end end
Байду номын сангаас
oldstate=newstate; end
ll=length(mi); mi(ll+1)=length(s);
两种基音周期检测方法
基音周期中两种算法常用的基音周期检测方法-自相关函数法、倒谱法、平均幅度差函数法都属于非基于事件基音检测方法,都先将语音信号分为长度一定的语音帧,然后对每一帧语音求平均基音周期,它们的优点是比较简单,主要应用于只需要平均基音周期作为参数的语音编解码,语音识别等。
自相关函数具有很好的抗噪性,但易受半频、倍频错误影响。
平均幅度差函数只需加法、减法和取绝对值等计算,算法简单;它们在无背景噪声情况下可以精确地提取的语音基音周期,但在语音环境较恶劣、信噪比较低时,检测的结果很差,难以让人满意。
2.1 基于短时自相关函数的方法能量有限的语音信号}{()s n 的短时自相关函数[10][11]定义为:10()[()()][()()]N n m R s n m w m s n m w m ττττ--==++++∑ (2.1)其中,τ为移位距离,()w m 是偶对称的窗函数。
短时自相关函数有以下重要性质:①如果}{()s n 是周期信号,周期是P ,则()R τ也是周期信号,且周期相同,即()()R R P ττ=+。
②当τ=0时,自相关函数具有最大值;当0,,2,3P P P τ=+++…处周期信号的自相关函数达到极大值。
③自相关函数是偶函数,即()()R R ττ=-。
短时自相关函数法基音检测的主要原理是利用短时自相关函数的第二条性质,通过比较原始信号和它移位后的信号之间的类似性来确定基音周期,如果移位距离等于基音周期,那么,两个信号具有最大类似性。
在实际采用短时自相关函数法进行基音检测时,使用一个窗函数,窗不动,语音信号移动,这是经典的短时自相关函数法。
窗口长度N 的选择至少要大于基音周期的两倍,N 越大,短时自相关函数波形的细节就越清楚,更有利于基音检测,但计算量较大,近年来由于高速数字信号处理器(DSP )的使用,从而使得这一算法简单有效,而不再采用结构复杂的快速傅里叶变换法、递归计算法等;N越小,误差越大,但计算量较小。
基于互相关法的语音基频提取研究
基于互相关法的语音基频提取研究
语音基频提取是语音处理中的一项重要技术,它可以用于语音合成、语音识别、语音转换等多个领域。
在语音信号中,基频是周期性振动的频率,它对于语音的音高和声调有着重要的影响。
本文将介绍一种基于互相关法的语音基频提取方法。
互相关法是一种计算信号相似度的方法,它可以用于寻找信号中的周期性结构。
在语音信号中,基频可以被视为语音周期的倒数。
因此,我们可以使用互相关法来寻找语音信号中的基频周期。
具体地,我们可以将语音信号分帧,并对每帧信号进行互相关计算。
在计算过程中,我们可以采用快速傅里叶变换(FFT)加速计算。
对于每个帧,我们可以找到具有最大相似度的延迟,这个延迟就对应着基频周期。
通过对每帧的基频周期进行平滑处理,我们可以得到整段语音信号的基频轮廓。
在实际应用中,基频提取方法需要考虑到多种因素,如语音信号的噪声、不同说话人的声音特征等。
为了提高基频提取的准确性和鲁棒性,我们可以采用多种预处理方法,如预加重、语音分割、去噪等。
此外,我们也可以将其他的特征如音谱信息、声学包络等结合起来,以提高基频提取的精度。
总之,基于互相关法的语音基频提取方法是一种简单有效的技术。
在实际应用中,我们需要综合考虑多种因素,以达到更好的基频提取效果。
基于CEP和LPC谱提取语音信号基音周期的方法
基于CEP和LPC谱提取语音信号基音周期的方法
马英;石小荣;李海新
【期刊名称】《现代电子技术》
【年(卷),期】2009(32)20
【摘要】在语音信号分析中,只有分析出可表示语音信号本质特征的参数,才有可能利用这些参数进行高效的语音通信、语音合成和语音识别等处理.因此对语音信号采用CEP和LPC谱提取语音信号基音周期的异同进行了研究,并采用Matlab实现了仿真分析.从中可以看出,LPC谱估计基音周期的算法运算量较大,而CEP谱算法更直观,且在少部分情况下基音峰会变得更突出一些,CEP谱具有更加广阔的应用前景.
【总页数】3页(P150-151,154)
【作者】马英;石小荣;李海新
【作者单位】青海民族学院,电信系,青海,西宁,810000;青海民族学院,电信系,青海,西宁,810000;青海民族学院,电信系,青海,西宁,810000
【正文语种】中文
【中图分类】TP274
【相关文献】
1.Mel频率下基于LPC的语音信号深度特征提取算法 [J], 罗元;吴承军;张毅;黎小松;席兵
2.基于LPC的语音信号特征参数提取算法研究 [J], 李亚文
3.基于压缩感知观测序列的语音信号基音周期提取 [J], 曹杨
4.LPC方法提取语音信号共振峰的分析 [J], 郁伯康;郁梅
5.一种语音信号基音周期的提取方法 [J], 张煜
因版权原因,仅展示原文概要,查看原文内容请购买。
基于基音周期的语音MFCC参数提取
基于基音周期的语音MFCC参数提取
陈迪;龚卫国;杨利平
【期刊名称】《计算机应用》
【年(卷),期】2007(27)5
【摘要】提出了一种可用于改善说话人识别效果的基于基音周期的可变窗长语音MFCC参数提取方法.基本原理是将原始的语音分解为当前基音周期整数倍长度以内部分及其以外部分,并保留前者舍去后者,以减小训练语音与测试语音的频谱失真.通过文本无关的说话人确认实验,验证了该方法能有效提高说话人确认的识别率,并能提高短时语音的稳定性.
【总页数】3页(P1217-1219)
【作者】陈迪;龚卫国;杨利平
【作者单位】重庆大学,光电技术及系统教育部重点实验室,重庆,400044;重庆大学,光电技术及系统教育部重点实验室,重庆,400044;重庆大学,光电技术及系统教育部重点实验室,重庆,400044
【正文语种】中文
【中图分类】TP192.3
【相关文献】
1.藏语语音处理中对MFCC参数提取的研究 [J], 张金溪;徐慧;李照耀
2.基于MFCCs滤波的电话语音识别的通道补偿方法 [J], 韩纪庆;高文
3.基于FPGA的语音MFCC参数提取 [J], 张文希;胡志刚
4.基于Matlab的藏语语音MFCC参数提取研究 [J], 卓嘎;姜军;边巴旺堆
5.基于改进MFCC的说话人特征参数提取算法 [J], 高铭;孙仁诚
因版权原因,仅展示原文概要,查看原文内容请购买。
汉语语音的基音快速提取算法
汉语语音的基音快速提取算法
陶维青;徐士林
【期刊名称】《合肥工业大学学报:自然科学版》
【年(卷),期】1996(019)003
【摘要】根据汉语语音信号的特点,该文提出一种简化的自相关基音提取的方法,算法具有简便、快速、准确和易于实现等特点。
此方法不仅可用于弧立字,更适用于提取二字词的声词。
实验表明,所得到的15种二字词声调的基本模式和轻声变调等都与已有的研究报导相符。
含有清声线音节时,二字词声调能提供音节分割和声韵分离的准确信号。
基音提取功率高于90%。
【总页数】6页(P31-36)
【作者】陶维青;徐士林
【作者单位】合肥工业大学计算机所;合肥工业大学计算机所
【正文语种】中文
【中图分类】TN912.3
【相关文献】
1.一种有效的语音基音周期提取算法 [J], 王秀君;和应民;木建一
2.含噪语音的基音周期提取算法 [J], 俞翠华;行鸿彦;李鹏
3.一种改进的汉语语音基音检测算法 [J], 李平;胡慧之
4.基于语音波形外观的基音提取算法 [J], 王兵;苏恩泽
5.基于子帧参数动态规划的语音基音周期提取算法 [J], 曾理
因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
GUO. r ul r Ci c a AM DF nd a Pic e t— t h s i— Id x n el 为最 佳路 径 序 号 , ( 为 累计 代 ci J) main b sd o tJ. t lcr nc t ae n i[】Aca E eto i o 价 , d x 为最 小 代价 对应 的 基音 值 。 为 i e2 n d. Sn c , 0 3 3 ( )8 6~8 0 iia 2 0 , l6 : 8 9. 基 音 动态 子 , . , i a 为动 念规 划 所 取0 2 P t n c 2 2分 数基 音 计 算 . 得基音参考 值。 []张 康 杰 , 欢 , 居 华 . 千 L AM DF 3 赵 饶 基 V— 利 用 内 插 公 式 提 高 输 入基 音 值的 精 确 荇 当 前 为 过 渡 帧 , 该 基 音 值 与 经 典 将 的 自 适 应 基 音 检 测 算 法 【】 计 算 机 应 J. 度 。 个 值 先 含 人 为 最接 近 的 整 数 值 , 为 达 设 方法 所 得P t与后 两 帧 基音 P t、 i 比 较 : 用 ,0 7; 77 : 6 4~ 1 7 . 2 0 2 ()1 7 6 6 i 。 i Pt 取 样 。 算 出 ( , ~1 【 T , +】 计 O 丁 )_ ( 丁 ) I 0 C []刘 建 , 方 , 文 虎 . 于 幅 度 差平 方 和 4 郑 吴 基 Pi a k Pi , t ) 【 t n ( t Pi“ >0 c 的 值 并 进 行 比较 。 函 数 的基 音 周期 提 取 算法 … . 清华 大 学 或 k Pi a , t) L ( t n Pi <0, c Pic th 学 报 , 0 6; 6 1 : 4~7 . 2 0 4 () 7 7 Pt kPt P t > i ( i, i ) “ 。 () [】魏 旋 , 晓 妍 , 7 5 3子帧参数动态规划 党 崔慧 娟 , 昆 . 十 动 态 唐 基 语 音 具 有 短 时 平 稳 性 , 邻 信 号 的 特 柑 H k Pi . t <0 ( t Pi c 规 划的 低延 时 慕 音提 取 算 法 … . 华 大 清 征参 数 变 化 不 大 。 当遇 上 过 渡 帧 时 , 但 该帧 学学 报 . 0 8, 8 1 )8 2 0 4 ( 0 : 6~8 . 8 若 当 前 帧 为 浊 音 帧 , 将 该 基 音 值 与 则 与 下 一 帧 的 基 音 变化 则 鞍 为 剧 烈 。 以 窗 经 典 方 法 计 算 所 得 当 前 帧P t与 前一 帧 基 若 i。
早 期 基 音 检 = 方 法 仃 短 时 自相 关 函 数 : 贝 J l ( F 法 、 时 平 均 幅 度差 函数 ( AC ) 短 AMDF 法 ) 等 。 此基础上 , 存 提 了 倒 谱 解 卷 积 法 、 循 环 Ac 和 循 环 AM D 法 。 优 化 窗 长 方 F F ]存 面, 提 了可 变 长 平 均幅 度 差 函 数法 ( V— L AMDF)】随 着 研 究 深入 , 出 了 幅 度 差平 _。 3 提 方 和 函数 法( MD F [、 态 规划 算 法 , S S ) 动 减 少 了半 / 频 错 误 。 文住 传 统 算 法 基 础上 倍 本 提 出 了基 丁 连 续 了 帧 参 数 联 合 动态 规 划的 基音平滑算法 。
= ,
£ 一
1
() 8
尼日6= - l 口6>。 (, l b ) a
I a d, 1 x{ D} 1
() 4仿真结果 2
如 图 l 。
米 用 ( ) 计 算 干 帧 A CF, 留 最 大 M 1式 保
1预处理
文 中语 音 采样 率 为8 Hz 窗 长 为 1 0 k , 8 样 点。 为减 少 直 流 噪 声 、 三 、 共 振 峰 及 高 第 四 频 噪 声 的 影 响 , 语 音 通 过6 H 高 通 滤 波 将 i 对应 的 基 音p , 价 函 数 路 径 5结束 语 0代 为: 提 } 了 一 新 的 基 音 检 测 算 法 , 过 f { 种 通 了 帧 参 数 计算 代 价 函 数 得 到 最 优 平 滑 路 径 , 一 提 高 最 终 基 音 期 的 准 确 度 和 进 步 平 滑 度 。 果表 明 , 算法 是 ・ 准 确 有 效 结 该 种 ag ai r r n ~ } a + ]q 纠 r , >; t f, 州 的 i 基 音 周期 检测 算 法 。 五音
‘ 自相 关 函 化
4)
递推 得 到 当前 帧 C () oi :
i e2 ag i{”f n x = r m nc( } d )
0 ≤M ~ ≤f 1
f1
ag rt lo i hmsJ .E Trn a to s n [】I EE a s c in O
Ao tc , e c nd S g lPr c s ig, usis Sp e h a i na o esn
2 1 N0 4 0 0 0 S c en and i ce T ec hn0I Ogy n l nov i Her l at on ad
T 技 术
基于子帧参数动态规划的语音基音周期提取算法
曾 理 ( 解放 军理工大 学通信 工程学 院 江苏 南京 2 0 7 0 ) 1 0 摘 要: 基音 周期是 语音参 数编码 中的重要参数 。 用语 音短时 平稳性 , 出 了基于 子帧参数 动态规 划的算法 : 帧提取 两组参数 , 利 提 每 帧间 动 态 规 划 。 真 表 明 : 比 传 统 算 法 , 方 案 更 加 准 确 ; 于 清 浊 音 过 渡 帧 的 检 测 和 基 音 倍 频 /半 频 错 误 有 较 好 的 改 进 作 用 。 仿 对 本 对 关键词 : 音周期 子帧参数 动态规 划 基 中图分类号 : TN91 2 文 献标 识码 :A 文章编 号 : 7 -0 x( o ) 2 a-0 0 —0 1 4 8 2 1 0 ( ) 0 9 1 6 9 o
:
』 ∽ 了 f 鹕 盛.
() 3
定 义 代 价 函数 为 :
c 1 0× 0 (一
—
参考文献
+1
f ~ ・ } p ,4 l i _
【 Ra ie C e g M , sn eg A 1 J bn rL R, h n J Roe b r
∑ ()( ” + )
’ J I 1 1
1 7 2 ( ) 3 9~41 . 6, 4 5 :9 9 7
P ta i n=P ( d x 、 c “i e2 n
( 【】Z a g We —Ya , n Wa g Yu 6 j 2 hn n o Xu Ga g, n
移 为 帧 长 的 ・ , 帧 提 取 2 参 数 , 参 音 值 P t 比较 , 行基 音 平 滑 。 半 每 组 则 i 相 进 数 2 以起 剑 过 渡 作 用 。 连 续 浊 音 帧 情 况 n 征 最 后 , F发 生 频 /牛频 错 误 的 基 音 , 对
下 , n作 为 平 滑 的 依 据 。 也 定 义 变化 率 度 量 函数 : 采 取直线拟 合 : ’ 刚
E . e a . t 1 A c m pa a i e o r tv pe f r a e ro m nc s udy of s ve al pi c det c i t e r th e t on
2单帧周 期提 取
2 1 数 基 音计 算 .整 整数 基音 值P 等 丁使 数 r) 最大 的 f值 :