语音信号基音检测算法研究
论文正文-语音信号的基音频率提取算法研究

前言语音信号的基音频率提取算法研究1前言基音是指发浊音时声带振动所引起的周期性,而声带振动频率的倒数就是基音周期。
基音周期具有时变性和准周期性,它的大小与个人声带的长短、厚薄、韧性和发音习惯有关,还与发音者的性别、年龄、发音时的力度及情感有关,是语音信号处理中的重要参数之一,它描述了语音激励源的一个重要特征。
基音周期的估计称为基音检测(Pitch Detection),基音检测的最终目标是找出和声带振动频率完全一致的基音周期变化轨迹曲线,如不可能则找出尽量相吻合的轨迹曲线。
然而由于人的声道的易变性及其声道特征的因人而异,而基音周期的范围又很宽,且同一个人在不同情态下发音的基音周期也不同,加之基音周期还受到单词发音音调的影响,故实际中的基音周期的精确检测是一件比较困难的事情。
然而,尽管语音信号的基音检测有许多困难但由于它在语音信号处理中的重要作用,促使广大学者争相涉足该领域,提出了各种各样的基音检测算法。
2选题背景2.1基音检测技术的研究进展早在70年代,L.R.R等人就进行了自相关函数法检测语音信号的基音周期的研究工作,它是一种时域上的基音检测算法,算法的精确性高,计算量不大,是目前各种应用中最为常用的基音检测算法。
1967年,A.M.Noll提出用倒谱法(Cepstrum)检测语音信号的基音周期。
这是一个频域上的检测算法,这种方法检测基音周期精确度很高,抗噪性能好,主要的缺陷是计算量太大,要用到傅立叶变换和对数运算,不利于实现。
1972 年,J.D等提出简单逆滤波追踪法(SIFT)检测语音信号的基音周期,这是一种时域和频域相结合的算法,是一种精确度和计算量较为折中的算法,它利用逆滤波去除声道共振峰的影响,使基音信息更为突出。
1974 年,M.J.Ross等人提出平均幅度差函数法检测语音信号的基音周期,这是一种时域上的算法,也是最简单的基音检测算法,它只需在时域上进行简单的加减和少量的除法运算,运算量很小,但是很容易产生半基音和倍基音,目前还有很多人在语音信号的基音频率提取算法研究不断的提出改进的AMDF算法。
语音信号的自相关基音周期检测

语音信号的自相关基音周期检测语音信号是一种人类最基本的交流方式,它包含人声的频率、强度和时间三个方面的信息。
语音信号的自相关和基音周期是语音信号分析中的重要技术,对于语音信号分析、识别、合成等应用有着积极的作用。
一、语音信号的自相关语音信号的自相关是指语音信号的样本与样本之间的相关性。
在语音信号中,相邻的样本之间一般都具有相关性,该相关性可以通过计算信号的自相关函数获得。
自相关函数描述了语音信号在不同延迟情况下的相似程度,也就是说,自相关函数可以反映语音信号的周期特征和基音周期。
二、语音信号的基音周期检测语音信号的基音周期是指人语中相邻两个基音周期之间的时间长度。
基音周期检测是一项关键的语音信号分析技术,在音素识别、语音合成、语音编码等领域应用广泛。
基音周期检测方法主要有三种:自相关法、FFT法和LP法。
自相关法是指通过计算信号与自身在不同延迟下的相似度,判断语音信号的基音周期。
具体来说,自相关法首先将语音信号进行预加重和分帧处理,然后计算每一帧的自相关函数,最后采用模板匹配的方法找到最强的周期峰值,从而得到基音周期。
FFT法则是将分帧后的语音信号进行傅里叶变换,提取频谱信息,并通过在频域滑动一个窗口,检测周期性的能量最大值,确定基音周期数。
LP法是通过线性预测,将语音信号分解成具有不同频率的谐波分量,然后利用实验数据验证模型,得到基音周期。
总的来说,不同的基音周期检测方法有其各自的优缺点。
自相关法较为简单但在噪声环境下准确度不高,FFT法可以检测到非周期性的基音,但精度不如自相关法,LP法精度较高但计算复杂度较大。
作为一门复杂的反演问题,语音信号的自相关和基音周期检测一直是语音处理研究中的重要问题,目前的研究主要集中在解决语音信号分析和识别中的实际问题和应用,为提高语音合成、语音编码等方面的应用水平提供技术支持。
语音基频检测及其频模型的研究

山东大学硕士学位论文语音基频检测及其频模型的研究姓名:***申请学位级别:硕士专业:信号与信息处理指导教师:***20070522(c)图2.7。
ji2”的时域波形图2。
3.2频谱特性语音信号的时域波形虽然直观,但是对于复杂的语音信号,其一些特性需要在频域中才能体现出来;如声道传输函数的共振峰特性、人类听觉器官的频率响应特征,这些都是表征语音信号基本的频谱参数。
其中,对于元音而言一般有着3-5个共振峰,它们决定了信号频谱的总体轮廓或谱包络,是—个非常重要的频域参数。
在语音发音过程中,声道的形状随时间而发生变化,但是同声带的振动相比,其变化要缓慢得多。
因此,在对语音信号进行频域分析时,一般都假定语音信号是短时平稳的信号,即在lO-30ms内其特性是基本不变或者变化很缓慢的,然后对每一个时刻,用该时刻附近的一段语音信号分析得到一个频谱,来表征对应的频率特征.对语音信号“直zhi2”,我们利用Cooledit软件,先对语音信号进行汉明窗加权处理,再进行频谱分析。
图2.8和2.9分别为其元音部分“i”和清音部分“曲”的频谱特性,横轴为频率,纵轴为幅度。
从频谱图上可以明显地看出浊音信号的18基频及其谐波(共振峰)频率.第一个频谱的峰值点对应信号的基频,其他的峰值对应共振峰频率,相邻峰值之间的间隔基本一致.对于清音,其幅度中不存在很大的峰值,且频谱峰点的间隔是随机的,没有周期性。
图2.8元音。
i”的频谱示意图图2.9清音“zh”的频谱示意图2.4.汉语语音的组成结构及韵律特征2.4.1组成结构“音节”(Syllable)是语音流中音素结合而成的最小单位,同时也是发声的最小单位.在汉语中,最小的发声单元是一个。
字”,一个字即为一个“音节”.字构成词,词又可构成短语,他们结合起来就构成了语句,因此,汉语发音比较简单,这是汉语的一大特点。
一般而言,一个音节由元音(Vowel)和辅音(ConsonanO组成。
其中,元音为一个音节的主干,无论从时间长度还是能量角度来看,元音在音节中都占主要部分,所有的元音都是浊音。
《语音信号处理》实验2-基音周期估计

华南理工大学《语音信号处理》实验报告实验名称:基音周期估计姓名:学号:班级:10级电信5班日期:2013年5 月15日1.实验目的本次试验的目的是通过matlab编程,验证课本中基音周期估计的方法,本实验采用的方法是自相关法。
2. 实验原理1、基音周期基音是发浊音时声带震动所引起的周期性,而基音周期是指声带震动频率的倒数。
基音周期是语音信号的重要的参数之一,它描述语音激励源的一个重要特征,基音周期信息在多个领域有着广泛的应用,如语音识别、说话人识别、语音分析与综合以及低码率语音编码,发音系统疾病诊断、听觉残障者的语音指导等。
因为汉语是一种有调语言,基音的变化模式称为声调,它携带着非常重要的具有辨意作用的信息,有区别意义的功能,所以,基音的提取和估计对汉语更是一个十分重要的问题。
由于人的声道的易变性及其声道持征的因人而异,而基音周期的范围又很宽,而同—个人在不同情态下发音的基音周期也不同,加之基音周期还受到单词发音音调的影响,因而基音周期的精确检测实际上是一件比较困难的事情。
基音提取的主要困难反映在:①声门激励信号并不是一个完全周期的序列,在语音的头、尾部并不具有声带振动那样的周期性,有些清音和浊音的过渡帧是很难准确地判断是周期性还是非周期性的。
②声道共振峰有时会严重影响激励信号的谐波结构,所以,从语音信号中直接取出仅和声带振动有关的激励信号的信息并不容易。
③语音信号本身是准周期性的(即音调是有变化的),而且其波形的峰值点或过零点受共振峰的结构、噪声等的影响。
④基音周期变化范围大,从老年男性的50Hz到儿童和女性的450Hz,接近三个倍频程,给基音检测带来了一定的困难。
由于这些困难,所以迄今为止尚未找到一个完善的方法可以对于各类人群(包括男、女、儿童及不向语种)、各类应用领域和各种环境条件情况下都能获得满意的检测结果。
尽管基音检测有许多困难,但因为它的重要性,基音的检测提取一直是一个研究的课题,为此提出了各种各样的基音检测算法,如自相关函数(ACF)法、峰值提取算法(PPA)、平均幅度差函数(AMDF)法、并行处理技术、倒谱法、SIFT、谱图法、小波法等等。
基于MATLAB的语音信号的基音周期检测

基于MATLAB的语音信号的基音周期检测摘要:MATLAB是一种科学计算软件,专门以矩阵的形式处理数据。
MATLAB将要性能的数值计算和可视化集成在一起,并提供了大量的内置函数,从而被广泛的应用于科学计算、控制系统和信息处理等领域的分析、仿真和设计工作。
MATLAB在信号与系统中的应用主要包括符号运算和数值计算仿真分析。
由于信号与系统课程的许多内容都是基于公式演算,而MATLAB 借助符号数学工具箱提供的符号运算功能,基本满足设计需要。
例如:解微分方程、傅里叶正反变换、拉普拉斯正反变换和Z正反变换等。
MATLAB在信号与系统中的另一主要应用是数值计算与仿真分析,主要包括函数波形绘制、函数运算、冲击响应仿真分析、信号的时域分析、信号的频谱分析、系统的S域分析和零极点图绘制等内容。
本次课程设计为语音信号的基音周期检测,采集语音信号,对语音信号进行处理,区分清音浊音,并通过对采样值进行滤波、分帧、求短时自相关函数,得到浊音的基音周期。
关键字:清音、浊音、基音周期、基音检测、自相关函数目录1 概述 (1)2 AMDF算法原理及实现 (1)2.1 AMDF算法源程序 (2)3 ACF算法原理及实现 (4)3.1 用短时平均能量进行清/浊音的判断 (4)3.2 自相关函数基音检测的原理 (6)3.3 算法实现及相关程序 (6)3.3.1 带通滤波 (7)3.3.2 取样与分帧 (7)3.3.3 短时能量分析 (8)3.3.4 自相关函数分析 (11)4 总结与心得体会 (13)参考文献 (13)1 概述基音周期检测也称为基频检测(Pitch Detection) ,它的目标是找出和声带振动频率完全一致的基音周期变化轨迹曲线,或者是尽量相吻合的轨迹曲线。
基音周期检测在语音信号的各个处理领域中,如语音分析与合成、有调语音的辨意、低速率语音压缩编码、说话人识别等都是至关重要的,它的准确性及实时性对系统起着非常关键的作用,影响着整个系统的性能。
基于线性预测编码与AMDF的高精度基音检测算法

基于线性预测编码与AMDF的高精度基音检测算法摘要:根据语音信号产生原理,结合线性预测编码(lpc)与平均幅度差函数法(amdf),提出了一种高精度的基音检测算法。
该算法首先利用线性预测分析提取残差信号;然后采用累积平均归一化差分函数与差分信号修正,使基音周期的谷值点更加尖锐;最后利用二次函数拟合与基音周期的倍数检查筛选候选值,得到了准确的基音周期。
实验结果表明,与传统方法相比, 该算法的基音检测效果有了明显改善,减少了基音检测中的半频错误,在高信噪比下具有良好的准确性和鲁棒性。
关键词:语音信号;基音周期;线性预测编码;平均幅度差函数;自相关函数super resolution pitch detection based on lpc and amdfwang en.cheng1, su teng.fang1*, yuan kai.guo2, wu chun.hua 21. school of information engineering, north china university of technology, beijing 100144, china;2. school of computer, beijing university of posts and telecommunications, beijing 100876, chinaabstract:according to the mechanism of speech signal, a super resolution pitch detection algorithm which combined linear predictive coding (lpc) with average magnitude difference function (amdf) was proposed. firstly, residual of lpc was extracted by linear predictive analysis. then, cumulative mean normalized difference function and difference signal revision were used to make pitch valley sharper. at last, parabolic interpolation and pitch multiple check were taken to select real pitch period. experimental results indicate that the pitch detection effect of the algorithm is superior to that of the conventional algorithms. the proposed algorithm conquers half frequency errors, and has good accuracy and robustness under the condition of high snr. according to the mechanism of speech signal, a super resolution pitch detection algorithm, which combined linear predictive coding (lpc) with average magnitude difference function (amdf), was proposed. firstly, residual of lpc was extracted by linear predictive analysis. then, cumulative mean normalized difference function and difference signal revision were used to make pitch valley sharper. at last,parabolic interpolation and pitch multiple check were taken to select real pitch period. the experimental results indicate that the pitch detection effect of the algorithm is superior to that of the conventional algorithms. the proposed algorithm conquers half frequency errors, and has good accuracy and robustness under the condition of high signal.to.noise ratio (snr).key words:speech signal; pitch period; linear predictive coding (lpc); average magnitude difference function (amdf); auto correlation function (acf)0 引言人在发浊音时,气流通过声门使声带产生张驰振荡式振动,形成一股准周期脉冲气流,这种声带振动的频率称为基音频率,相应的周期称为基音周期。
基于Matlab的藏语语音基音检测算法研究

基于Matlab的藏语语音基音检测算法研究卓嘎;边巴旺堆【期刊名称】《现代电子技术》【年(卷),期】2015(000)010【摘要】Very little research on Tibetan speech pitch detection has been published. Tibetan speech pitch detection is im⁃portant part of Tibetan speech processing,whose accuracy affects system performance directly. The center clip algorithm,algo⁃rithm principle of autocorrelation function and pitch detection algorithm are introduced. The procedure of Tibetan speech pitch detection was designed. The programming and simulation are executed with Matlab software. The result shows that the algorithm has simple structure,accurate result and small amount of calculation. It can be applied to detecting Tibetan speech pitch period in low SNR environment.%目前藏语语音基音检测算法相关研究较少,藏语语音基音检测是藏语语音处理过程中的重要环节,其准确性直接影响到系统的性能。
介绍中心消波和自相关函数的算法原理及基音检测算法,设计藏语语音基音检测流程,利用Mat⁃lab进行编程和仿真。
基音检测算法研究及其在方言辨识中的应用的开题报告

基音检测算法研究及其在方言辨识中的应用的开题报告一、选题背景:方言作为语言的一种,是一种地域文化的体现,也是汉语的重要组成部分,但由于各地方言语音差异较大,使得方言的学习和辨识成为了一项具有挑战性的任务。
因此如何进行方言的自动辨识,一直是计算机语音处理领域的一个重要研究方向,对于一些需要进行方言识别的领域如语音纠错、语音转写等具有重要意义。
基音是声音中最基础的音素之一,它对语言的声调说法和抑扬顿挫的表达有着非常重要的作用,同时也是方言中的一个重要音素之一。
因此利用基音信息进行方言辨识也是一个有前途的研究方向。
二、研究内容:本论文主要研究如何利用基音信息进行方言辨识,并重点研究基音检测算法的设计和实现。
首先,我们将通过对各地方言的音频样本进行采集,建立一个方言基音库,并利用该库作为训练集来训练基音模型。
其次,我们将研究基音检测算法的设计。
基音检测是一种识别音频信号周期性的过程,可通过串联一系列预处理、变换、差分、平滑等操作实现。
我们将对这些操作进行详细研究,并设计实现一种高效准确的基音检测算法。
最后,我们将利用基音检测算法进行方言辨识实验,并分析实验结果,以验证我们所提出的方案的有效性和可行性。
三、研究意义:本论文的研究内容将有助于解决方言的自动辨识问题,对于一些需要进行方言识别的领域如语音纠错、语音转写等具有重要意义。
同时,本论文的研究成果也可为日后基于基音信息的语音处理技术提供参考。
四、研究方法:本论文主要采用以下研究方法:1.音频采集: 收集各地方言音频样本作为训练集和测试集。
2.基音模型建立: 利用训练集建立基音模型。
3.基音检测算法设计: 对基音检测算法进行详细研究,设计实现高效准确的基音检测算法。
4.方言辨识实验:实现方言辨识实验,并对实验结果进行分析。
五、预期结果:通过本论文的研究,我们预期可以实现利用基音信息进行方言辨识,并取得一定的识别准确度,为语音处理领域的研究提供新的思路和方法。
基于MATLAB语音信号基频估计方法研究

基于MATLAB 语音信号基频估计方法研究南京工业大学 王静来源:微计算机信息摘 要:不同的语音分析和综合方法就有不同的基音估计的方法,本文就简单的自相关基音估计入手分析讨论,并讨论了倒谱法,小波分析的基音估计。
借助MATLAB 语音工具箱VOICEBOX 对种不同分析综合方法的基音估计的频域图做了分析比较。
关键词:语音信号 基音估计 MATLAB0.引言语音是人们交流思想和进行社会活动的最基本手段,我们要对语音信号进行测定并将其转变为另一种形式,以提高我们的通信能力。
基音是语音信号的一个重要特征参数,基音周期估计的准确度对合成语音的质量有决定性作用。
不同的语音分析和综合方法就毁有不同的基音估计的方法,在同太分析中,倒谱中的倒谱峰位置提供了基音估计。
线性预测误差中基本峰值之间的间隔导出另一种基音周期估计。
我们将就自相关和倒谱法对基音估计做分析比较。
1.自相关的基音估计法考虑一离散时间短序列,由下式给定:][][][m n w m s m s n −=其中][n w 是长度为w N 的分析窗。
短时自相关函数)(τn r 定义为::∑+∞∞−+=−∗=][][][][][ττττm s m s s s r n n n n n当][m s 是周期性的,周期为P ,则][τn r 在基音周期P 或附近包含峰值。
相关基音估计的获得可以通过可能的基音周期)0(>P 范围内对误差最小化,误差准则为:∑∞−∞=+−=m n n P m s m s P E 2])[][(][][P E 相对于P 最小化得到:⎟⎠⎞⎜⎝⎛+=∑∞−∞=m n n P P m s m s P ][][max ˆ 其中ε>P ,即P 离零足够远。
自相关函数是测量“自相似性”的尺度,所以我们期望对周期性序列的自相关函数在P 附近出现峰值。
周期波形的短时自相关函数的包络随着P 的增大而大致线性的减小。
2.倒谱基音估计的基本概念和原理2.1卷积同太系统:若一系统的系统函数为()H z ,输入序列1()x n 和2()x n 对应输出序列1()y n 和2()y n 有:121212[()][()()][()][()]()()()H x n H x n x n H x n H x n y n y n y n =∗=∗=∗=如果一个系统具有上式所表示的性质,则称之为“卷积同太系统”。
小波分析在语音信号基音检测中的应用研究

摘
要
在语音信号数字处理的各个领域里, 无论是语音分析与合成、 语音压缩编码, 还是语音识别和说话者确认等, 准确可靠地检测语音信号的基音周期都是至关重
要的任务,将直接影响到整个系统的性能。
本文旨 在寻找一种鲁棒的基音周期检测算法. 首先, 在现代语音学取得的成 果上, 对语音的生成、声学特征, 听觉功能进行分析,以把握语音信号波形的特 点。 其次, 对较典型的几种语音基音检测方法, 较系统的分析、 作了 探讨和比较。 接着, 较为详细地阐述了小波分析的基本理论, 着重在小波函数、 小波变换、 多 分辨分析和 Mla 算法的研讨上。最后,将小波变换与归一化自 alt 相关、动态规 划平滑等技术相结合, 得到了一种新的基音周期检测算法。 新算法的基本思想是: 先对原始语音信号进行多级小波变换, 将较高几个层次上的逼近信号进行加权求 和处理, 利用小波变换的带通性和去噪性, 得到含丰富基音信息、 周期性较强的 合成信号 ( 这一结果对含不同基音周期的任意语音段具有普适性) ;接着将该合 成信号作为待处理信号, 采用归一化自 相关法检测基音周期, 并对结果进行动态 规划平滑处理。 用 MTA 在计算机上完成算法程序设计, ALB 进行仿真实验。实验结果表明, 新算法估计基音准确性高, 运算速度较快, 稳定性好, 对噪声具有较好的鲁棒性, 充分吸收了自 相关算法和小波变换算法的优点, 有效地克服了自 相关算法的分频
( th eto , P c Dtci ) 基音检测的 i e n 最终目 标是找出 和声带振动 频率完全一致的 基
N r aatcr l i , om l or a o u o e tn
D nmi po rmmig ya c ga n r
西北工业大学硕士学位论绪论
基于自相关的语音基音周期检测方法研究

为信号 xn和 Y() () n的互相关函数 。如果 Y()x()则互相关 函 n = n, 数 变 成 了 自相 关 函数 :
R( Ⅱ m)
X() n m) nx(+
式 中 , 为 信 号 的延 迟 点 数 。 m 自相 关 函 数反 映 了信 号 xf 和 自身 n 1 作 了一 段 延 迟之 后 的 x( m) 似 程 度 。 n 的相 + 自相 关 函 数 具 有 以下 的 性 质 : 果 序 列 xn 具 有 周 期 N , 如 () 。 则 其 自相关 函数 也 是 同 周期 的周 期 函 数 。 : x 】 ( 即 若 ( =xn+N1 n n , 则 R =Rm + 。 ㈤ ( 清 音 信 号 没 有 周期 性 ,它 的 自相 关 函 数 也 没 有 周 期 , ㈤ R 会 随着 1 的增 大 迅 速 衰 减 。浊 音 信 号 具 有 准 周 期 性 . 的 自相 1 1 它 关 函数 R 具 有 与 xn 同 的周 期 。浊 音 信 号 的 自相 关 函数 在 ㈤ (1 相 基 音 周 期 的 整数 倍 位 置 上 出现 峰 值 .而 清 音 信 号 的 自相 关 函数 没 有 明显 的 峰值 。 自相 关法 基 音 检 测 就 是 利用 R m 的这 一 性 质 f) 对 语 音 信 号 进行 基 音 检 测 的 。 于 浊音 信 号 。 要检 测 到 N 的位 对 只 置 , 可 以估 计 语音 信 号 的基 音周 期 值 。 就
福
建
电
脑
2 0 年 第 1 期 08 1
基 于 自相 关 的语 音 基 音 周 期检 测 方 法研 究
汉语语音基频检测与提取算法

汉语语音基频检测与提取算法
汉语语音的基频检测与提取算法是语音信号处理领域的一个重
要研究课题。
基频,也称为声音的基音频率或者声音的基本频率,
是指语音信号中重复出现的基本频率成分。
基频检测与提取算法的
目标是从语音信号中准确地提取出基频信息,以便后续的语音分析、合成和识别等应用。
一种常用的基频检测与提取算法是基于自相关函数的方法。
该
方法首先计算语音信号的自相关函数,然后通过分析自相关函数的
峰值来确定基频。
另一种常见的方法是基于短时傅里叶变换(STFT)的算法,它将语音信号分解成多个时域上重叠的窗口,并对每个窗
口进行傅里叶变换,然后通过分析频谱信息来提取基频。
除了以上提到的方法,还有很多其他基频检测与提取算法,比
如基于互相关函数、线性预测编码(LPC)、自适应滤波器等。
这些
算法在实际应用中各有优劣,需要根据具体的情况选择合适的算法。
另外,需要注意的是,基频检测与提取算法在面对不同说话人、不同语音情感状态、不同噪声环境等情况下的稳定性和鲁棒性也是
一个重要的研究方向。
研究人员还在不断探索新的算法和技术,以
提高基频检测与提取的准确性和鲁棒性。
总的来说,基频检测与提取算法是语音信号处理领域的一个复杂而重要的问题,需要综合考虑信号处理、数学建模、机器学习等多个领域的知识,以实现对语音信号中基频信息的准确提取。
语音信号处理中基于加权自相关函数的基音提取

语音信号处理中基于加权自相关函数的基音提取中文摘要在语音信号处理中,很难去确定准确的基频。
为了解决这个问题,本文提出基于自相关函数的加权基音检测法。
首先,因为平均幅度差函数的方法与自相关函数有相同的性质,根据自相关函数,我们用平均幅度差函数倒数的平方作为权重系数。
最后,我们获取一个基音提取的新算法。
此外,基音平滑处理是为了获取更好的效果。
仿真实验结果显示这个新的算法可以进行基音检测。
此外,它也提高了基音检测的精确度。
关键字——语音信号处理基音检测加权自相关函数平均幅度差函数基音是一个谐波信号中的基频。
基音段在语音处理中扮演着一个重要的角色。
一般来说,音调分类是根据基音曲线;基于波形拼接的语音合成需要对基音轨迹修改;汉语言识别系统使用基音轨迹来识别语音,这对于消除歧义来说很重要;音调周期在文本语言合成中也起着关键作用。
音调检测的目的是找到与声带振动一致地的基音段曲线。
基音段的精度和实时性在语音信号处理中是非常重要的。
为此,已经提出了许多提取语音信号基音的方法,诸如短期自相关函数,短时平均幅度差函数,谱距离法,端点检测等等。
这些基音提取方法基于语音信号短时间平稳性。
为此,准确和有效的基音提取功能,其预处理以及用于基音检测的平滑处理是精确基音检测的关键。
为了降低信噪比,[2]提出了一种ACF 来提取噪声信号的基音。
[3]提出了一种利用三个功率的振幅谱代替传统的二次幂的噪声信号的鲁棒基音检测算法,以通过带通滤波器调整语音频谱。
[4]提出了一种基于反向滤波的AR 模型,以降低噪声信号的检测误差。
[5]使用形态滤波器去除语音信号预处理中的噪声,然后通过小波变换方法检测音调频率,提高了基音检测的鲁棒性。
[6]提出了一种基于AMDF 的算法来基音检测。
[7]使用短期能量通过判断声音/无声段来检测基音主体。
大多数基音估计算法仅使用AMDF 或ACF 来检测基音周期,但是存在大量的干扰波。
考虑在AMDF 和ACF 中出现在相同时间的极值,提出了一种使用由AMDF 加权的自相关函数的新的基音提取方法。
语音信号的基音周期提取方法研究

语音信号的基音周期提取方法研究摘要自从人类发明了语言以后,它便成为了人们交流思想和沟通感情最便捷和有效的工具。
当下,人类已经进入了一个电子信息化的时代,用更加现代化的手段来处理和研究语音,能够使人们更有效率的生成、传递、储存、获得和运用语音信息,这一点对与促进时代的进步与科技的发展具有十分重要的意义。
语音信号的频率域特征分析是语音识别的基础,其中基音周期则是最重要的特征参数,基音周期是指人们发出浊音时声带振动的周期,基音周期是语音信号研究的基础,也是语音信号处理的第一步。
本文对基音周期的提取方法进行了研究,同时也对频率参数和倒谱的用途以及提取方法进行详细的介绍。
用Microsoft Visual Studio2012设计了一个绘制语音波形、计算频谱和倒谱并能显示频谱图和倒谱图的程序,实验结果表明倒谱法能很好的提取语信号的基音周期。
关键词语音信号频率域特征分析基音周期倒谱法AbstractTitleStudy on the extraction method of pitch of speech signalAbstractSince man invented the language, it has become the most convenient and effective tool for people to exchange ideas and communicate feelings. Today, mankind has entered the era of electronic information, with more modern means to process and study of speech, can make people more efficient generation, transfer, storage, access, and use of voice information, this to have and to promote the progress of science and technology in the era of the development of a very important significance.Frequency domain characteristics of the speech signal analysis is the basis of speech recognition, the pitch is the most important characteristic parameters, the pitch is refers to the people a voiced sound when the vocal fold vibration cycle, and Chinese pitch changes of different patterns of tone. Cepstrum extraction method is the most effective method of pitch. In this paper, several frequency domain parameters and their uses are described in detail. With VS 2012 designed a rendering speech waveform, calculate the spectrum and display spectrum and calculation of Cepstrum and display the cepstrum program. Experimental results show that the pitch period of the cepstrum method of extraction of speech signals.Keywords: Speech signalFrequency domain featureanalysisperiodCepstrum method1绪论1.1 语音信号处理研究历史及现状早在一两千年之前,人们就已经开始了研究语音信号的行为。
基于音频信号的人声检测算法研究

基于音频信号的人声检测算法研究随着人工智能和机器学习技术的不断发展,基于音频信号的人声检测算法也得到了大力推广和应用。
人声检测算法的重要性不言而喻,这是因为人声信号所包含的语音信息在很多领域都有着广泛的应用,如智能语音交互、声音识别、情感计算等。
因此,对于基于音频信号的人声检测算法的研究和探讨就至关重要了。
本文将通过以下几个方面,详细阐述基于音频信号的人声检测算法研究的意义、目前所面临的挑战以及应用前景等。
1.人声检测算法的意义与现状人声检测算法是指通过音频信号分析技术和模型构建技术,将音频信号中的语音信号与噪声信号分离开来,从而实现对人声信号的有效检测和提取。
目前,在语音识别、智能语音交互等领域中,人声检测算法已经得到了广泛的应用,并取得了一定程度的成果。
但是,现在的人声检测算法仍然面临着很多挑战。
一方面,受制于人工干扰、环境噪声等因素,其准确性和稳定性有待提高;另一方面随着算法复杂度的增加,算法执行时间也越来越长。
因此,如何在不牺牲准确性的情况下优化计算效率,是当前人声检测算法的一个亟待解决的问题。
2.基于音频信号的人声检测算法研究进展目前,关于基于音频信号的人声检测算法研究存在多种方法,常见的方法有基于时域、基于频域、基于时频域等。
以基于时频域为例,其核心思想是将音频信号分解为许多短时傅里叶变换(STFT),并通过对各种时频域特征的挖掘和提取,实现对人声信号的准确分离。
在实际应用中,还可以利用神经网络等深度学习技术优化人声检测算法的准确性和稳定性,以期在实际应用场景中取得更好的效果。
3.基于音频信号的人声检测算法应用前景随着社会的发展,智能化与人工智能技术的应用越来越广泛。
人的语音信号作为最直接、最直观的传递方式,并且携带了更为丰富的信息,将在智能化应用中扮演越来越重要的角色。
基于音频信号的人声检测算法,正是为了在这种背景下提供更加高效、精准的人声识别服务。
以智能语音交互为例,其应用场景极广,早在十年前,就已经涉及到了汽车、家电等行业。
改进的基音检测算法

n = -¥
å
¥
S w (n)S w (n + k ) =
N-k-1 n=0
å
S w (n)S w (n + k )
(5)
归一化幅度
N 为语音分析帧的长度, k 为延迟度。语音信号的自相 式中, 关函数 R w (k ) 在基音频率整数倍处将出现峰值特性, 通常根据
第一峰值点 ( R w (0) 除外) 来估计基音。 平均幅度差函数 (AMDF) 的思想是: 如果信号是一个标准 的周期函数, 那么不同周期段的对应信号之差为 0[8]。 S w (n) 的平均幅度差函数 (AMDF)D w (k ) 为:
118
2011, 47 (3)
Computer Engineering and Applications 计算机工程与应用 如果 R w (k ) 的第一峰值越尖锐或 D w (k ) 的全局谷值点的锐度 越突出, 则基音周期的估计将越精确 [9]。因此, 结合 ACF 和 AMDF 的优点, 提出一种改进的 ACF/AMDF 加权平方特征进 行基音周期估计, 新的特征参数表达式如下:
2.1 LMS 自适应滤波原理
LMS 算法是一种简单有效的估计梯度方法, 其依据为最 小均方误差准则。LMS 自适应滤波器是一类具有反馈性能的 自适应系统, 它通过对前一时刻获得的滤波器参数来自动调 节现时刻的滤波器参数, 使得滤波器输出信号与期望信号之 间的误差均方值最小, 从而达到最佳滤波的效果。其自适应 滤波原理如图 2 所示。
0.5 0 -0.5 幅度 一帧纯净语音信号波形 50 100 150 200 250 300 采样点数 350 400 450 500
2.2 改进的 ACF/AMDF 加权平方特征
基于倒谱修正模型的语音基音检测算法pdf

谱主瓣宽度
ω w
≤2ωp
的范围内
,
可以求得
+∞
∑ ^vr ( n) =D ( n)· ^v ( n + k·Np ) k =- ∞
( 10 )
式中 : D ( n)为
总第 155期
曾毓敏 吴镇扬 基于倒谱修正模型的语音基音检测算法
1 算法原理
语音信号 s ( n)可看作是由声门脉冲激励 e ( n)
经声道响应 v ( n)滤波而得 ,即
s ( n) = e ( n) 3 v ( n)
(1)Biblioteka v ( n)在短时内可以认为是基本不变的 。一个信
号的倒谱定义为其频谱的绝对值取对数后的逆傅
里叶变换 。设三者的倒谱分别为 ^s ( n ) 、^e ( n ) 及
Abstract: An imp roved speech p itch detection algorithm based on modified cep strum model is p ro2 posed. In the p roposed algorithm , a ten2order LPC ( linear p redictive coding) analysis is performed on a segmented speech, and the segmented speech is filtered by the inverse filter to give the LPC p redic2 tive residual. The cep strum of the p redictive residual is calculated with the simp le method of the high frequency spectral components of DFT being set to zero. The p itch period of the voiced speech is ex2 tracted from the cep strum of p redictive residual. The simulated p itch detection results show that the p itch extraction error of the p roposed algorithm is significantly lower than that of the conventional cep2 strum based algorithm both for clean speech and different noisy speech. The performance of the p ro2 posed algorithm is also much better than that of the average magnitude difference function based p itch detection algorithm and slightly better than that of the basic autocorrelation function based algorithm. Key words: p itch; cep strum; linear p redictive coding; p redictive pesidual
语音信号中基频提取方法研究与综述

频 就成 为一 个重 要 的课题 。
x ( t ) = ( 1 + 0 . 3 s i n ( 2 1 T l 4 0 t ) ) s i n ( 2 1 T 2 8 0 t ) 则该语音信号 的基频是 1 4 0 H z 。在 2 8 0 H z 的时候 会 产生 一个 共振 峰 。
1 时域 方 法
1 . 1 时域上事件发生率检测法 该方法基于这样 的理论 ,音频波形在时域上的表 现是周期性的,在一定时间段 中重复发生的事件次数 也是可以统计的 , 统计出每秒钟这些事件所发生的次 数就能估算 出基频值 。
基 于 时 间 一事 件上 的方 法有 : 过 零 率方 法 ( z c g) ,
第2 2卷 第 2期
2 0 1 4年 4月
电
脑
与
信
息
技
术
Vo 1 . 2 2 No . 2
Apr .2 01 4
Co mp u t e r a n d I n f o r ma t i o n Te c h n o l o  ̄
文章编号 : 1 0 0 5 — 1 2 2 8 ( 2 0 1 4) 0 2 — 0 0 0 8 — 0 3
Ab s t r a c t : T h e f u n d a me n t a l r f e q u e n c y ( a l s o c a l l e d p i t c h o r F O ) a n d i t s c h a n g e ml e i s n a i mp o r t a n t f e a t u r e o f s p e e c h s i g n a 1 . Wh e r e a s
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
语音信号基音检测算法研究
摘要:本文对倒谱法做了改进,在用倒谱法进行基音检测分析时,提出了一种功率谱二次处理的二次谱减法,该方法克服了倒谱法基音检测的抗噪能力低的弱点,在相同噪声环境下能更加精确地检测出语音信号的基音周期。
关键词:语音信号基音检测倒谱法二次谱减法
1、引言
近年来,基于线性预测和分析频谱的Mel倒谱系数在处理包含情感的语音识别中取得了很大的进步,能否把此种方法应用到相应状态下的基音检测中去,值得广大学者研究。
国外很多学者采用实时监控情感变化,并把影响修正基音的轨迹加以平滑或者动态改变窗的宽度,可以明显降低上述影响。
基音检测一直是语音信号处理的一大难题,短时自相关函数法、短时平均幅度差函数法、倒谱法、小波变换法等传统的经典基音检测方法,都有各自的用场,但同时也有其相应的不足。
其中任一种方法都不能作为通用的方法,但若在基音检测过程中,对预处理和后处理上进行一些改进,且突破传统的语音模型,并适当考虑说话人的个体特征及发音时的情感力度对基音检频带内谱包络测的影响,定能提高基音检测的准确性及健壮性。
本文以语音信号的基音检测为研究对象,着重分析自相关函数法p倒谱法的定义为,时间序列的z变换的模的对数的逆z变换,该序列的倒谱的傅里叶变换形式为。
落实到具体实现时,采用DFT来近似傅里叶变换,根据传统语音产生的模型及语音信号的短时性。
在其频域内,语音信号短时谱等于激励源的频谱与滤波器的频谱的乘积,浊音信号短时谱中包含的快变化周期性细致结构,则必会对应着周期性脉冲激励的基频以及各次谐波。
语音的倒谱是将语音的短时谱取对数后再进行IDFT来得到,所以浊音信号的周期性激励如果反映在倒谱上,便是同样周期的冲激。
藉此,我们可从得到的倒谱波形中估计出基音周期。
一般我们把倒谱波形中第二个冲激,认为是对应激励源的基频,即基音周期。
下面列举出一种倒谱法求基音周期的框图(见图1) 。
3、改进算法的基音检测
当用无噪声的语音信号时,采用倒谱法进行基音检测还是很理想的。
但是有加性噪声存在时,对数功率谱中的低电平部分会被噪声填满,从而掩盖了基音谐波的周期性。
这也意味着倒谱的输入不再是单纯的周期性成分,而导致倒谱中的基音峰值变宽,而且受到噪声的污染,最终导致倒谱检测方法的灵敏度也随之下降。
为此,本文提出了如下改进方法(图2):
此方法避p本文以语音信号的基音检测为研究对像,对短时自相关函数、倒谱法、这两种基音检测的方法的原理进行了分析。
在此基础上,深入研究了倒谱法基音检测的算法。
通过实验仿真,发现这种测量方法的不足;最后对这种算法进行了改进,在用倒谱法进行基音检测分析时,提出了一种功率谱二次处理的二次谱减法,该方法克服了倒谱法基音检测的抗噪能力低的弱点,在噪声环境相同的情况下能更加准确的检测出语音信号的基音周期,从而有效提高算法在基音检测时的准确性和抗噪性。
参考文献
[1]胡航.语音信号处理[M].哈尔滨:哈尔滨工业大学出版社,2000:116.126.
[2]韩纪庆,张磊,郑铁然.语音信号处理[M].北京:清华大学出版社,2004,lO.39.
[3]赵力.语音信号处理[M].北京:机械工业出版社,2003:24.40.
[5]陈小利含噪语音基音周期检测算法研究[D].解放军信息工程大学,2007.。