实验三语音信号的基音周期提取

合集下载

论文正文-语音信号的基音频率提取算法研究

论文正文-语音信号的基音频率提取算法研究

前言语音信号的基音频率提取算法研究1前言基音是指发浊音时声带振动所引起的周期性,而声带振动频率的倒数就是基音周期。

基音周期具有时变性和准周期性,它的大小与个人声带的长短、厚薄、韧性和发音习惯有关,还与发音者的性别、年龄、发音时的力度及情感有关,是语音信号处理中的重要参数之一,它描述了语音激励源的一个重要特征。

基音周期的估计称为基音检测(Pitch Detection),基音检测的最终目标是找出和声带振动频率完全一致的基音周期变化轨迹曲线,如不可能则找出尽量相吻合的轨迹曲线。

然而由于人的声道的易变性及其声道特征的因人而异,而基音周期的范围又很宽,且同一个人在不同情态下发音的基音周期也不同,加之基音周期还受到单词发音音调的影响,故实际中的基音周期的精确检测是一件比较困难的事情。

然而,尽管语音信号的基音检测有许多困难但由于它在语音信号处理中的重要作用,促使广大学者争相涉足该领域,提出了各种各样的基音检测算法。

2选题背景2.1基音检测技术的研究进展早在70年代,L.R.R等人就进行了自相关函数法检测语音信号的基音周期的研究工作,它是一种时域上的基音检测算法,算法的精确性高,计算量不大,是目前各种应用中最为常用的基音检测算法。

1967年,A.M.Noll提出用倒谱法(Cepstrum)检测语音信号的基音周期。

这是一个频域上的检测算法,这种方法检测基音周期精确度很高,抗噪性能好,主要的缺陷是计算量太大,要用到傅立叶变换和对数运算,不利于实现。

1972 年,J.D等提出简单逆滤波追踪法(SIFT)检测语音信号的基音周期,这是一种时域和频域相结合的算法,是一种精确度和计算量较为折中的算法,它利用逆滤波去除声道共振峰的影响,使基音信息更为突出。

1974 年,M.J.Ross等人提出平均幅度差函数法检测语音信号的基音周期,这是一种时域上的算法,也是最简单的基音检测算法,它只需在时域上进行简单的加减和少量的除法运算,运算量很小,但是很容易产生半基音和倍基音,目前还有很多人在语音信号的基音频率提取算法研究不断的提出改进的AMDF算法。

含噪语音的基音周期提取算法

含噪语音的基音周期提取算法
收 稿 日期 2 1_32 0 1 .9 O
资助项 目 江苏 省科 技创 新与 成果 转化 专项
( E 0 83 ) 江 苏 省 “ 大人 才 高峰 ” 目资 B 2 0 19 ; 六 项
主要是通过综合分析语音信号 的波形特征来进行 的, 而不是单单运 用 了语音信号的幅值信息. 文献 [ ] 出, 5指 首先要对语音信号进行相
2 一 I I + J<卢 n=2 34 )j / , , ,.
未 鏖. 学 学 自 科 版, 141:- z 报:然 学 2 2 ( 77 0 , ) 04
Jun f aj gU i rt o If m t nSi c n eh o g : a r c n e dtn 2 1 , ( ) 7 - o ra o N n n nv sy f n r a o c neadT c nl y N t a S i c i ,0 24 1 : 7 l i e i o i e o ul e E i o 04
滑, 从而 得 出最 终 的基音 周期 .
1 时域 波形 匹 配 法提 取 基 音 周 期 的原 理
通 常情况 下 , 语音信 号 总是 以时域 波 形 来描 述 和 记 录 的 , 过 人 通
眼就可 以大 致地判 断 出语 音信 号 的基 音 周 期 . 这个 估 计 的过 程 中 , 在
基 音 周 期 . 真 实验 表 明 : 传 统 的 基 音 仿 与 周 期提 取 方 法 相 比 较 , 提 方 法 在 基 音 所
周 期 提 取 的 准 确 度 方 面有 很 大 的提 高. 关 键 词 基 音 周 期 ; 噪 ; 形 信 息 ; 音 降 波 基
检 坝 4
通过利用语音信号的幅值信息或者频率信息来进行基音周期 的提取 的 , 没 有充分 利用 信号本 身 的一些 形 状 特征 . 际语 音在 产 生 的过 并 实

《语音信号处理》实验2-基音周期估计

《语音信号处理》实验2-基音周期估计

华南理工大学《语音信号处理》实验报告实验名称:基音周期估计姓名:学号:班级:10级电信5班日期:2013年5 月15日1.实验目的本次试验的目的是通过matlab编程,验证课本中基音周期估计的方法,本实验采用的方法是自相关法。

2. 实验原理1、基音周期基音是发浊音时声带震动所引起的周期性,而基音周期是指声带震动频率的倒数。

基音周期是语音信号的重要的参数之一,它描述语音激励源的一个重要特征,基音周期信息在多个领域有着广泛的应用,如语音识别、说话人识别、语音分析与综合以及低码率语音编码,发音系统疾病诊断、听觉残障者的语音指导等。

因为汉语是一种有调语言,基音的变化模式称为声调,它携带着非常重要的具有辨意作用的信息,有区别意义的功能,所以,基音的提取和估计对汉语更是一个十分重要的问题。

由于人的声道的易变性及其声道持征的因人而异,而基音周期的范围又很宽,而同—个人在不同情态下发音的基音周期也不同,加之基音周期还受到单词发音音调的影响,因而基音周期的精确检测实际上是一件比较困难的事情。

基音提取的主要困难反映在:①声门激励信号并不是一个完全周期的序列,在语音的头、尾部并不具有声带振动那样的周期性,有些清音和浊音的过渡帧是很难准确地判断是周期性还是非周期性的。

②声道共振峰有时会严重影响激励信号的谐波结构,所以,从语音信号中直接取出仅和声带振动有关的激励信号的信息并不容易。

③语音信号本身是准周期性的(即音调是有变化的),而且其波形的峰值点或过零点受共振峰的结构、噪声等的影响。

④基音周期变化范围大,从老年男性的50Hz到儿童和女性的450Hz,接近三个倍频程,给基音检测带来了一定的困难。

由于这些困难,所以迄今为止尚未找到一个完善的方法可以对于各类人群(包括男、女、儿童及不向语种)、各类应用领域和各种环境条件情况下都能获得满意的检测结果。

尽管基音检测有许多困难,但因为它的重要性,基音的检测提取一直是一个研究的课题,为此提出了各种各样的基音检测算法,如自相关函数(ACF)法、峰值提取算法(PPA)、平均幅度差函数(AMDF)法、并行处理技术、倒谱法、SIFT、谱图法、小波法等等。

Matlab基于倒谱和EMD的语音基音周期的提取

Matlab基于倒谱和EMD的语音基音周期的提取

---------------------------------------------------------------范文最新推荐------------------------------------------------------ Matlab基于倒谱和EMD的语音基音周期的提取在语音信号处理中,常用的语音特性是基于Mel频率的倒谱系数(MFCC)以及一些语音信号的固有特征,如基音周期等。

倒谱法可以较好地将语音信号中的激励信号和声道响应分离,并只需要用一些倒谱系数就能较好地描述语言信号的声道响应,在语音信号处理中占有很重要的位臵。

而倒谱解卷积法受加性噪声影响比较大,抗噪声性能不是很好。

针对这一存在问题,利用EMD 方法在理论上可以应用于任何类型的信号的分解,在处理非平稳及非线性数据上, 具有非常明显的优势这一优点。

本文中提出一种基于倒谱和EMD的语音基音周期提取的改进算法。

并在Matlab 中予以实现。

关键字:基音周期倒谱法EMD8664TitlePitch Period Extraction of Speech Signals based1 / 8on Cepstrum and EMDAbstractIn voice signal processing, MFCC and some inherent characteristics of voice signals, such as the frequency of pitch. Cepstrum can be used to separate the excitation signal and channel response, and can represent channel response with only a dozen cepstral coefficients. As a result, it has been a very important role in voice signal processing. While cepstrum deconvolution method is largely influenced by additive noise,and anti-noise performance is not very good.The EMD method can be applied to decompose any type of signals,and thus,having a very distinct advantage in handing non-stationary and non-linear data.For this problem,in this paper,an improved algorithm of pitch period extraction of speech signals based on cepstrum and EMD is proposed. Its implementation in MATLAB are described in detail.Key words:pitch periodCepstrumEMD---------------------------------------------------------------范文最新推荐------------------------------------------------------ 目次1 引言11 引言1.1 背景由于语言是人们在日常生活中的主要交流手段,因此语音信号处理在现代信息社会中占用重要地位。

基音周期估计实验报告(3篇)

基音周期估计实验报告(3篇)

第1篇一、实验目的本实验旨在通过实际操作,深入了解基音周期估计的方法及其在语音信号处理中的应用。

通过实验,我们能够掌握基音周期估计的基本原理,并能够运用自相关法、倒谱法等常用方法进行基音周期的估计。

二、实验原理基音周期估计是语音信号处理中的一个重要环节,它可以帮助我们更好地理解语音的声学特征。

基音周期是指浊音的声带振动周期,它反映了声带的振动频率。

在语音信号中,浊音部分具有明显的周期性,而清音部分则没有明显的周期性。

三、实验设备与软件1. 实验设备:计算机、麦克风、耳机。

2. 实验软件:MATLAB、OpenCV。

四、实验步骤1. 数据采集:使用麦克风采集一段语音信号,并保存为.wav格式。

2. 信号预处理:对采集到的语音信号进行预处理,包括去除噪声、提取浊音段等。

3. 基音周期估计:- 自相关法:计算语音信号的短时自相关函数,找到最大值对应的周期即为基音周期。

- 倒谱法:对语音信号进行快速傅里叶变换(FFT)得到频谱,然后将频谱转换为对数坐标,再次进行FFT得到倒谱,最后从倒谱中提取基音周期。

4. 结果分析:比较不同方法得到的基音周期,分析其优缺点。

五、实验结果1. 自相关法:通过计算短时自相关函数,我们得到了一个周期性较强的曲线。

在曲线中,第一个峰值对应的周期即为基音周期。

通过实验,我们发现自相关法对于浊音段的基音周期估计较为准确。

2. 倒谱法:通过对语音信号进行FFT和倒谱变换,我们得到了一个倒谱曲线。

在倒谱曲线上,我们可以观察到多个峰值,这些峰值对应于不同的频率成分。

通过分析这些峰值,我们可以估计出基音周期。

实验结果表明,倒谱法在浊音段的基音周期估计上同样具有较高的准确性。

六、实验讨论1. 自相关法的优点在于计算简单,易于实现。

但它的缺点是对噪声敏感,容易受到干扰。

2. 倒谱法的优点在于对噪声具有一定的鲁棒性,能够较好地估计基音周期。

但其计算过程较为复杂,需要一定的计算资源。

3. 在实际应用中,可以根据具体需求选择合适的基音周期估计方法。

基于压缩感知观测序列的语音信号基音周期提取

基于压缩感知观测序列的语音信号基音周期提取
Abs t r a c t: Vo i c e d /u n v o i c e d d e c i s i o n a n d p i t c h d e t e c t i o n t e c h n i q u e i s a n i mpo r t a n t pa t r o f s p e e c h s i g n a l
t he me a s u r e me n t ma t r i x . Th e n wa v e l e t d e c o mp o s i t i o n wi t h t h e o b s e r v a t i o n s e q u e n c e i S p e r f o r me d a n d l o w re f q ue nc y e o e f f i c i e n t s o f t h e r e s u l t i S u s e d f o r p i t c h e x t r a c t i o n t h r o u g h a u t o e o r r e l a t i o n me t ho d.S i mu l a t i o n a n d a n a l y s i s s ho w t h a t c o mpa r e d wi t h t r a d i t i o na l a u t o e o r r e l a t i o n me t h o d,t h e p i t c h de t e c t i o n a c c u r a c y o f t hi s me t h o d i S a l mo s t t he s a me a s t ha t o f t h e t r a d i t i o na l me t h o d.a n d i t r un s we l l whe n t he s p e e c h i S i n t e r .

实验三语音信号的特征提取最终实验报告

实验三语音信号的特征提取最终实验报告

实验三语音信号的特征提取一、实验目的1、熟练运用MATLAB软件进行语音信号实验。

2、熟悉短时分析原理、MFCC、LPC的原理。

3、学习运用MATLAB编程进行MFCC、LPC的提取。

4、学会利用短时分析原理提取MFCC、LPC特征序列。

二、实验仪器设备及软件HP D538、MATLAB三、实验原理1、MFCC语音识别和说话人识别中,常用的语音特征是基于Mel频率的倒谱系数(即MFCC)。

MFCC参数是将人耳的听觉感知特性和语音的产生机制相结合。

Mel频率可以用如下公式表示:)700/1log(2595ff Mel+⨯=在实际应用中,MFCC倒谱系数计算过程如下;①将信号进行分帧,预加重和加汉明窗处理,然后进行短时傅里叶变换并得到其频谱。

②求出频谱平方,即能量谱,并用M个Mel带通滤波器进行滤波;由于每一个频带中分量的作用在人耳中是叠加的。

因此将每个滤波器频带内的能量进行叠加,这时第k 个滤波器输出功率谱)('kx。

③将每个滤波器的输出取对数,得到相应频带的对数功率谱;并进行反离散余弦变换,得到L个MFCC系数,一般L取12~16个左右。

MFCC系数为∑=-=MkMnkkxCn1']/)5.0(cos[)(logπ,n=1,2,...,L④将这种直接得到的MFCC特征作为静态特征,再将这种静态特征做一阶和二阶差分,得到相应的动态特征。

2、LPC由于频率响应)(jweH反映声道的频率响应和被分析信号的谱包络,因此用|)(|log jweH 做反傅里叶变换求出的LPC 倒谱系数。

通过线性预测分析得到的合成滤波器的系统函数为)1/(1)(1∑=--=pi i i z a z H ,其冲激响应为h(n)。

h(n)的倒谱为)(^n h ,∑+∞=-=1^^)()(n nzn h z H 就是说)(^z H 的逆变换)(^n h 是存在的。

设0)0(^=h ,将式∑+∞=-=1^^)()(n nzn h z H 两边同时对1-z求导,得∑∑+∞=--=--∂∂=-∂∂1^1111)(]11log[n npi i zn h zza z得到∑∑∑∞+==-=+-+--=11111^1)(n pi ii pi i in za zia zn h n ,于是有∑∑∑+∞=+∞=+-+-=-=-1111^11)()1(n n i i n pi i zia zn h n z a 令其左右两边z 的各次幂前系数分别相等,得到)(^n h 和i a 间的递推关系⎪⎪⎪⎩⎪⎪⎪⎨⎧>--=≤≤--+==∑∑=-=p i i n i i n p n n h a n i n h pn k n h a n i a n h a h 1^^11^^1^),1()1()(1),()1()()1( ,按其可直接从预测系数{i a }求得倒谱)(^n h 。

基于压缩感知观测序列的语音信号基音周期提取

基于压缩感知观测序列的语音信号基音周期提取

基于压缩感知观测序列的语音信号基音周期提取曹杨【摘要】语音信号的清浊音辨别及基音周期的提取是语音信号处理的重要组成部分。

提出了一种基于压缩感知( CS)观测序列的语音基音周期提取方法,大大减少了基音周期提取的计算量。

首先分析不同观测矩阵下观测序列的特征,选择了行阶梯矩阵作为所提方法的观测矩阵;然后对此观测矩阵下的观测序列做小波分解,对小波分解的低频系数采用自相关方法提取基音周期。

仿真与分析表明,和传统方法比较,所提方法与传统方法基音检测准确度相当,且在语音含有高斯白噪声的条件下运行良好,但计算量仅约为传统方法的1/16。

%Voiced/unvoiced decision and pitch detection technique is an important part of speech signal processing. Based on the observation sequence of compressedsensing( CS) ,a method to detect the pitch is proposed in this paper,and the caculation amount is greatly reduced . Firstly, the characteristics of obser-vation sequences under different measurement matrixs are analyzed,and row echelon matrix is selected as the measurement matrix. Then wavelet decomposition with the observation sequence is performed and low frequency coefficients of the result is used for pitch extraction through autocorrelation method. Simulation and analysis show that compared with traditional autocorrelation method, the pitch detection accuracy of this method is almost the same as that of the traditional method, and it runs well when the speech is inter-fused with Gaussian white noise, but the calculation amount is just about 1/16 of that of the traditional method.【期刊名称】《电讯技术》【年(卷),期】2013(000)010【总页数】4页(P1327-1330)【关键词】语音信号处理;基音周期;压缩感知;非重构;自相关函数;小波变换【作者】曹杨【作者单位】南京邮电大学通信与信息工程学院,南京210003【正文语种】中文【中图分类】TN912.3压缩感知(Compressed Sensing,CS)理论是2004年由 D.Donoho、E.Candès等人提出的,它突破了传统奈奎斯特采样定理对采样率与信号带宽之间的约束关系,实现对信号的边采样边压缩,用更少的采样数据量来恢复原始信号。

(完整word版)语音信号进行倒谱分析

(完整word版)语音信号进行倒谱分析

实验三 语音信号进行倒谱分析一、 实验目的、要求1. 理解倒谱分析的作用2. 掌握倒谱分析求基音周期的方法3. 了解LPC 倒谱分析方法二、实验原理1.倒谱分析原理同态信号处理也称为同态滤波,实现将卷积关系变换为求和关系的分离处理,即解卷。

如 进行如下3步处理对于语音信号进行解卷,可将语音信号的声门激励信息及声道响应信息分离开来,从而求得声道共振特征和基音周期,用于语音编码、合成和识别。

同态信号处理的基本原理(1)第一个子系统D*[](特征系统)完成将卷积信号转化为加性信号的运算。

)(ˆ1n x 和 )(ˆ2n x信号也均是时域序列,但它们所处的离散时域显然不同于x(n)所处的离散时域,故把它称之为复倒频谱域。

)(ˆn x是x(n)的复倒频谱,简称为复倒谱,有时也称为对数复倒谱。

复倒谱具体计算公式其中倒谱计算公式为:2 线性预测原理线性预测分析的基本思想由于语音样点之间存在相关性,所以可以用过去的样点值来预测现在或未来的样点值。

通过使实际语音抽样和线性预测抽样之间的误差在某个准则下达到最小值来决定唯一的一组预测系数,而这组系数就能反映语音信号的特性,可以作为语音信号特征参数来用于语音编码、语音合成和语音识别等应用中去。

线性预测分析的基本原理每个采样值由前面的p 个采样值线性组合所构成。

记为x '(n),有:)(ˆ)(ˆ)(ˆ)](ˆ)(ˆ[)](ˆ[)3()(ˆ)(ˆ)(ˆ)(ln )(ln )(ln )2()()()()]([)1(212111212121n x n x n x z X z X Z z X Z z X z X z Xz X z X z X z X z X z X n x Z =+=+==+=+=⋅==--12()()()x n x n x n =*1ˆ()[ln (())]x n Z Z x n -=[()]()ˆ()ln ()ˆˆ()[()]jw jw jw jw DFT x n X e Xe X e xn IDFT X e ===要提高预测精度,就是要预测系数{k a }的取值使e(n)最小。

语音信号的基音周期提取方法研究

语音信号的基音周期提取方法研究

语音信号的基音周期提取方法研究摘要自从人类发明了语言以后,它便成为了人们交流思想和沟通感情最便捷和有效的工具。

当下,人类已经进入了一个电子信息化的时代,用更加现代化的手段来处理和研究语音,能够使人们更有效率的生成、传递、储存、获得和运用语音信息,这一点对与促进时代的进步与科技的发展具有十分重要的意义。

语音信号的频率域特征分析是语音识别的基础,其中基音周期则是最重要的特征参数,基音周期是指人们发出浊音时声带振动的周期,基音周期是语音信号研究的基础,也是语音信号处理的第一步。

本文对基音周期的提取方法进行了研究,同时也对频率参数和倒谱的用途以及提取方法进行详细的介绍。

用Microsoft Visual Studio2012设计了一个绘制语音波形、计算频谱和倒谱并能显示频谱图和倒谱图的程序,实验结果表明倒谱法能很好的提取语信号的基音周期。

关键词语音信号频率域特征分析基音周期倒谱法AbstractTitleStudy on the extraction method of pitch of speech signalAbstractSince man invented the language, it has become the most convenient and effective tool for people to exchange ideas and communicate feelings. Today, mankind has entered the era of electronic information, with more modern means to process and study of speech, can make people more efficient generation, transfer, storage, access, and use of voice information, this to have and to promote the progress of science and technology in the era of the development of a very important significance.Frequency domain characteristics of the speech signal analysis is the basis of speech recognition, the pitch is the most important characteristic parameters, the pitch is refers to the people a voiced sound when the vocal fold vibration cycle, and Chinese pitch changes of different patterns of tone. Cepstrum extraction method is the most effective method of pitch. In this paper, several frequency domain parameters and their uses are described in detail. With VS 2012 designed a rendering speech waveform, calculate the spectrum and display spectrum and calculation of Cepstrum and display the cepstrum program. Experimental results show that the pitch period of the cepstrum method of extraction of speech signals.Keywords: Speech signalFrequency domain featureanalysisperiodCepstrum method1绪论1.1 语音信号处理研究历史及现状早在一两千年之前,人们就已经开始了研究语音信号的行为。

基音及提取方法

基音及提取方法

syllable detection
section into 40 msec sections
(right to left)
pitch detection
T0
calculate pitch period s(n) of a voiced section
by cepstrum
(left to right)
基音及提取方法
2014.3
内容提要
❖ 概念列表 ❖ 基音(基音周期)概念 ❖ 基音周期估计的难点 ❖ 基音周期估计方法 ❖ 基音周期估计后处理
❖ 基音 ❖ 基频 ❖ 基音周期 ❖ 声调
概念列表
基音周期
❖ 基音是指发浊音时声带振动所引起的周期性 ❖ 基音周期是指声带振动频率的倒数
语音信号最重要的参数之一,描述了语音激励源的一个 重要特征
并行处理技术(PPROC)方法
❖ 基本思想:对经过预处理的语音信号实施一系列的基音初步 检测,或分别对原始信号和经处理后的信号实施系列检测, 然后根据系列检测的初步结果,综合判定基音周期。
❖ 图3-21所示的是一个并行处理法的实现框图,它是一种时域 方法,检测器找出语音波形的六个测度,而这六个测度应用 于六个独立的基音检测器。由六个检测器驱动“服从多数” 逻辑电路而进行最终的基音判决。
基音及提取方法20143内容提要?概念列表?基音基音周期概念?基音周期估计的难点?基音周期估计方法?基音周期估计后处理概念列表?基音?基频?基音周期?声调基音周期?基音是指发浊音时声带振动所引起的周期性?基音周期是指声带振动频率的倒数?语音信号最重要的参数之一描述了语音激励源的一个重要特征?应用广泛
estim ated p itch
period P pk

(完整版)语音信号进行倒谱分析

(完整版)语音信号进行倒谱分析

实验三 语音信号进行倒谱分析一、 实验目的、要求1.理解倒谱分析的作用 2. 掌握倒谱分析求基音周期的方法3. 了解LPC 倒谱分析方法二、实验原理1.倒谱分析原理同态信号处理也称为同态滤波,实现将卷积关系变换为求和关系的分离处理,即解卷。

如 进行如下3步处理)(ˆ)(ˆ)(ˆ)](ˆ)(ˆ[)](ˆ[)3()(ˆ)(ˆ)(ˆ)(ln )(ln )(ln )2()()()()]([)1(212111212121n x n x n x z X z X Z z X Z z X z X z Xz X z X z X z X z X z X n x Z =+=+==+=+=⋅==--对于语音信号进行解卷,可将语音信号的声门激励信息及声道响应信息分离开来,从而求得声道共振特征和基音周期,用于语音编码、合成和识别.同态信号处理的基本原理(1)第一个子系统D *[](特征系统)完成将卷积信号转化为加性信号的运算。

)(ˆ1n x 和 )(ˆ2n x信号也均是时域序列,但它们所处的离散时域显然不同于x(n )所处的离散时域,故把它称之为复倒频谱域。

)(ˆn x是x(n)的复倒频谱,简称为复倒谱,有时也称为对数复倒谱.复倒谱具体计算公式其中倒谱计算公式为:2 线性预测原理12()()()x n x n x n 1ˆ()[ln (())]x n Z Z x n [()]()ˆ()ln ()ˆˆ()[()]jw jw jw jw DFT x n X e X e X e x n IDFT X e线性预测分析的基本思想由于语音样点之间存在相关性,所以可以用过去的样点值来预测现在或未来的样点值。

通过使实际语音抽样和线性预测抽样之间的误差在某个准则下达到最小值来决定唯一的一组预测系数,而这组系数就能反映语音信号的特性,可以作为语音信号特征参数来用于语音编码、语音合成和语音识别等应用中去。

线性预测分析的基本原理每个采样值由前面的p 个采样值线性组合所构成。

语音信号处理实验报告

语音信号处理实验报告

实验报告一、 实验目的、要求(1)掌握语音信号采集的方法(2)掌握一种语音信号基音周期提取方法(3)掌握短时过零率计算方法(4)了解Matlab 的编程方法二、 实验原理基本概念:(a )短时过零率:短时内, 信号跨越横轴的情况, 对于连续信号, 观察语音时域波形通过横轴的情况;对于离散信号, 相邻的采样值具有不同的代数符号, 也就是样点改变符号的次数。

对于语音信号, 是宽带非平稳信号, 应考察其短时平均过零率。

其中sgn[.]为符号函数⎪⎩⎪⎨⎧<=>=0 x(n)-1sgn(x(n))0 x(n)1sgn(x(n))短时平均过零的作用1.区分清/浊音:浊音平均过零率低, 集中在低频端;清音平均过零率高, 集中在高频端。

2.从背景噪声中找出是否有语音, 以及语音的起点。

(b )基音周期基音是发浊音时声带震动所引起的周期性, 而基音周期是指声带震动频率的倒数。

基音周期是语音信号的重要的参数之一, 它描述语音激励源的一个重要特征, 基音周期信息在多个领域有着广泛的应用, 如语音识别、说话人识别、语音分析与综合以及低码率语音编码, 发音系统疾病诊断、听觉残障者的语音指导等。

因为汉语是一种有调语言, 基音的变化模式称为声调, 它携带着非常重要的具有辨意作用的信息, 有区别意义的功能, 所以, 基音的提取和估计对汉语更是一个十分重要的问题。

由于人的声道的易变性及其声道持征的因人而异, 而基音周期的范围又很宽, 而同—个人在不同情态下发音的基音周期也不同, 加之基音周期还受到单词∑--=-=10)]1(sgn[)](sgn[21N m n n n m x m x Z发音音调的影响, 因而基音周期的精确检测实际上是一件比较困难的事情。

基音提取的主要困难反映在: ①声门激励信号并不是一个完全周期的序列, 在语音的头、尾部并不具有声带振动那样的周期性, 有些清音和浊音的过渡帧是很难准确地判断是周期性还是非周期性的。

语音实验报告3

语音实验报告3

太原理工大学现代科技学院数字语音处理课程实验报告专业班级通信14-4学号**********姓名杨蓉指导教师贾海蓉太原理工大学现代科技学院实验报告 实验名称 用修正的短时自相关检测语音的基音周期 同组人 专业班级 通信14-4 学号 2014101716 姓名 杨蓉 成绩 实验三:用修正的短时自相关检测语音的基音周期 一、实验目的 1、熟悉前一个实验程序以及中心削波的意义 2、用Matlab 实现用修正的短时自相关检测语音的基音周期。

3、分析修正的短时自相关在基音周期检测中的应用。

4、能够对程序进行重新编制。

二、实验原理 如果x(n)是一个周期为P 的信号,则其自相关函数也是周期为P 的信号,且在信号周期的整数倍处,自相关函数取最大值。

语音的浊音信号具有准周期性,其自相关函数在基音周期的整数倍处取最大值。

计算两相邻最大峰值间的距离,就可以估计出基音周期。

观察浊音信号的自相关函数图,其中真正反映基音周期的只是其中少数几个峰,而其余大多数峰都是由于声道的共振特性引起的。

因此为了突出反映基音周期的信息,同时压缩其他无关信息,减小运算量,有必要对语音信号进行适当预处理后再进行自相关计算以获得基音周期。

第一种方法是先对语音信号进行低通滤波,再进行自相关计算。

因为语音信号包含十分丰富的谐波分量,基音频率的范围分布在50~500Hz 左右,即使女高音升c 调最高也不会超过1kHz ,所以采用1kHz 的低通滤波器先对语音信号进行滤波,保留基音频率;再用2kHz 采样频率进行采样;最后用2~20ms 的滞后时间计算短时自相关,帧长取10~20ms ,即可估计出基音周期。

第二种方法是先对语音信号进行中心削波处理,再进行自相关计算。

本实验采用第二种方法。

且中心削波函数如式所示: 一般削波电平L x 取本帧语音最大幅度的60%~70%。

将削波后的序列f(x)用短时自相关函数估计基音周期,在基音周期位置的峰值更加尖锐,可以有效减少倍频或半频错误。

一种语音信号基音周期的提取方法

一种语音信号基音周期的提取方法
1语音信号常根据不同的发音而发生变化这一变化降低了连续语音段的相关性特别是在清浊音的过渡段以及基音周期发生抖动过程语音波形变化更为剧烈加上无周期性的清音段语音和背景噪声的影响给基音周期的检测造成了许多障碍
维普资讯
7 0




20 0 8年第 4期

种语 音信 号 基音 周 期 的提 取方 法
2 即使 当 发 音 稳 定 的 时 候 . 于 通 过 声 门 的 脉 冲 幅度 大 小 每一 帧语 音 求平 均基 音 周期 。这 些 方 法 主要 有 : 1 自相 关法 : ) 由 ()
还 是 有 区 别 的 。 此 一 来 。 音 信 号 相 当于 被 调 幅处 理 了 , 给 ( ) 如 语 也 2 倒谱 法 ; 3 平 均 幅度 差 法 : 4 简 化逆 滤 波 器 法等 。 MD () () A F相 基音 周期 的检 测带 来 了 困 难 。
【 关键词】 :语音信号 , f ̄ , MD 基4 ) 期 A F -
1 引 言 、
和 N 后 继续 用 短 时过 零 率 Z进 行 搜 索 根据 无 声 情 况 下 短 2向
基音 周 期 是语 音 的 一个 非 常 重 要 的 特征 参数 . 语 音 编码 、 时 过 零率 Z的均 值 . 置 一个 参 数 z 。 在 设 0 如果 由 N 向前 搜 索 时 Z 1 语 音 合成 、 话人 识 别 和语 音识 别 等 方 面 有 着 广 泛 的 应 用 . 语 始 终 大 于 z 说 是 0的 3倍 。 认 为 这 些 信 号 仍 属 于 语 音段 . 至 Z突 则 直 音研 究 的 一个 重要 阶段 。 由于语 音 信 号是 非 平稳 的 时变 信 号 . 只 然 下 降到 低 于 3 O值 时 。 时 可 以 确定 语 音 的精 确 起 点 。 Z 这

实验三《语音音节提取及可视化程序设计》实验指导书

实验三《语音音节提取及可视化程序设计》实验指导书

实验三语音音节提取及可视化程序设计一、实验目的1.理解语音信号的数字模型,学习用数字信号处理方法处理语音信号。

2. 掌握语音信号的短时时域分析法。

3. 运用MATLAB,实现语音信号的音节提取及可视化。

二、实验仪器及软件PC机,Matlab三、实验设计内容和要求1. 实验方案2. 设计内容和要求1)采集:个人录制语音信号;2)预处理:针对录制的语音信号,设计技术方法和程序,完成预加重、加窗、分帧。

3)语音信号的音节提取:设计程序,首先完成基于能量和过零率的语音端点检测,再依据短时自相关分析,完成语音信号的音节提取。

4)设计可视化界面,显示语音信号处理结果。

四、实验步骤1)采集生成数字语音文件。

2)预处理预加重:对语音信号的高频部分进行补偿,比较预加重前后的信号频谱,记录波形。

加窗:比较矩形窗、汉明窗对语音信号的处理特性,记录波形。

分帧:比较帧长、帧数对语音信号的处理特性,记录波形。

3)语音端点检测计算比较不同窗函数、不同帧长下语音信号的能量和过零率参数,选定合理的窗函数、帧长,实现语音端点检测,记录波形。

4)语音信号的音节提取根据浊音是时间波形呈现一定的周期性、清音是时间波形杂乱无章的特点,计算不同窗函数、不同帧长下语音信号的短时自相关函数,分析短时自相关函数,完成浊音、清音的音节提取,记录波形。

五、实验报告及要求1. 叙述语音信号预加重的过程、语音音节浊音、清音的属性和提取方法。

2. 叙述设计帧长、帧数、能量和过零率等各项技术指标的原理和结果。

3. 记录、打印原始语音;不同帧长、帧数下的能量和过零率,短时自相关函数等有关波形图。

4. 在语音信号波形上标注浊音、清音音节。

5. 对仿真结果进行分析、总结等。

语音信号处理实验指导

语音信号处理实验指导

语音信号处理实验讲义王艳芬李剑编中国矿业大学信电学院学生实验守则一、学生进入实验室必须遵守实验室的规章制度,遵守课堂纪律,保持实验室的安静和整洁,爱护实验室的一切设施。

二、实验课前要认真预习实验指导书,写出实验预习报告,并经教师批阅后方可进行实验。

三、实验课中要遵守操作规程,不要带电连接、更改或拆除线路。

线路接好后,经指导老师检查后,方可接通电源进行实验。

对于软件上机实验,不得随意删改计算机中原有的文件。

四、学生实验前对实验所用仪器设备要了解其操作规程和使用方法,凡因不预习或不按使用方法进行操作而造成仪器设备损坏者,除书面检查外,按学校规定进行赔偿。

五、实验中主意安全,遇到事故应立即关断电源并报告教师检查处理。

六、实验完毕后要做好整理工作,实验数据必须经指导教师签阅后,才能拆除线路,并将仪器、设备、凳子等按规定放好,经同意后方可离开实验室。

七、因故缺课的学生可向实验室申请一次补做机会。

无故缺课或无故迟到(15分钟以上)的不予补做,该次实验无成绩;累计三次者,该实验课以不及格论,并不得参加该门理论课程的考试。

八、实验室仪器设备不能擅自搬动调换,更不能擅自带出实验室。

信电学院专业实验中心二零一一年九月目录实验一语音信号得基音参数提取 (1)实验二语音信号的谱分析 (7)实验三基于DTW算法的孤立字识别 (11)《语音信号处理实验讲义》是为了配合“语音信号处理”课程教学而编写的,适用于信息工程、电子科学与技术等专业。

前修课程为“数字信号处理”。

该课程总学时数为40学时,其中实验学时为8学时。

实验内容及参考学时安排如下:实验一语音信号的基音参数提取(3个学时)实验二语音信号的谱分析(3个学时)实验三基于DTW算法的孤立字识别(2个学时)实验一 语音信号的基音参数提取一、实验目的1.了解基音的基本概念以及清音与浊音的区别。

2.掌握几种基本的基音提取方法,熟悉自相关法、倒谱法和简化逆滤波法进行基音提取的matlab 编程。

语音信号基音频率的提取

语音信号基音频率的提取


E[ y1* y 2] E ( y1 ) E ( y 2 )
2 2
语音的基音周期一般在20到140,因此 小于20没有周期 i+20-1,因此pitch.m在调用这个时需要 有一句p=19+ind_pitch;
二、主程序pitch
[maxim,mxi]=max(rr);%maxim存放最大值,mxi存放最 大值位置 ind_pitch=mxi; if mxi>THR_largePitch %与限定值比较 mi=maxx(rr,THR_maxx);%实际上就是以最大值 点的t倍为界找出这个界以上的左右极值点的位置 %这个序列的第一个值是1,最后一个是序列rr的长度 %一开始看到这里的时候会觉得比较多余了,直接一次 maxim*THR_pitch分界比较就可以了 %事实上,下面的比较没有只针对极值点处理。 %maxx的作用是筛选出大于maxim*THR_maxx的极值点 出来,所以这个还是必须的 for i=1:length(mi) if rr(mi(i))>max(THR_corr,maxim*THR_pitch); ind_pitch=mi(i); break;%break说明只取第一个满足条件的 end end end p=19+ind_pitch;%rr(i)对应的是i+19 mx=rr(ind_pitch);
第一个和最后一个 if newstate==-1 & oldstate ==1 if s(i)>t*max_value j=j+1; mi(j)=i; end end
Байду номын сангаас
oldstate=newstate; end
ll=length(mi); mi(ll+1)=length(s);
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

实验三语音信号的基音周期提取
一、实验目的
1、熟练运用MATLAB软件的运用,学习通过MATLAB软件编程来进行语音信号的基因周期提取。

2、掌握语音信号的基音周期提取的方法,实现其中一种基频提取方法。

3、学会用自相关法进行语音信号的基因检测。

二、实验仪器设备及软件
MATLAB
三、实验原理
浊音信号的自相关函数在基因周期的整数倍位置上出现峰值,而清音的自相关函数没有明显的峰值出现。

因此检测自相关函数是否有峰值就可以判断是清音还是浊音,而峰-峰值之间对应的就是基音周期。

影响从自相关函数中正确提取基音周期的最主要原因是声道响应。

当基音的周期性和共振峰的周期性混在一起时,被检测出来的峰值可能会偏离原来峰值的真实位置。

另外,在某些浊音中,第一共振频率可能会等于或低于基音频率。

此时,如果其幅度很高,它就可能在自相关函数中产生一个峰值,而该峰值又可以同基音频率的峰值相比拟。

1、自相关函数
对于离散的语音信号x(n),它的自相关函数定义为:
R(k)=Σx(n)x(n-k),
如果信号x(n))具有周期性,那么它的自相关函数也具有周期性,而且周期与信号x(n) 的周期性相同。

自相关函数提供了一种获取周期信号周期的方法。

在周期信号周期的整数倍上,它的自相关函数可以达到最大值,因此可以不考虑起始时间,而从自相关函数的第一个最大值的位置估计出信号的基音周期,这使自相关函数成为信号基音周期估计的一种工具。

2、短时自相关函数
语音信号是非平稳的信号,所以对信号的处理都使用短时自相关函数。

短时自相关函数是在信号的第N个样本点附近用短时窗截取一段信号,做自相关计算所得的结果
Rm(k)=Σx(n)x(n-k)
式中,n表示窗函数是从第n点开始加入。

3、算法
通过对自相关基音检测原理的分析,考虑到检测准确度和检测速率2方面的因素,提出了算法实现方案,并对算法进行了Matlab编程实现。

算法包含6个功能模块:带通滤波、取样、分帧、短时能量分析、相关运算、基音检测。

语音信号
图2.1 基音检测框图
四、实验步骤及程序
(1)实验步骤
1、取一段录音作为音频样本。

2、对样本音频进行采样。

3、对采样后样本音频进行分帧。

4、对每一帧求短时自相关函数
5、算出对应周期。

6、进行带通滤波去除野点。

(2)语音信号基音周期提取的程序流程图:
图2.2 语音信号基音周期提取的程序流程图
(3)实验源程序
function pitch
x=wavread('1.wav');
figure(1);
stem(x,'.');
n=160;
for m=1:length(x)/n;
for k=1:n;
Rm(k)=0;
for i=(k+1):n;
Rm(k)=Rm(k)+x(i+(m-1)*n)*x(i-k+(m-1)*n);
end
end
p=Rm(10:n);
[Rmax,N(m)]=max(p);
end
N=N+10;
T=N/8;
figure(2);stem(T,'.');axis([0 length(T) 0 10]);
xlabel('帧数(n)');ylabel('周期(ms)');title('各帧基音周期');
T1= medfilt1(T,5);
figure(3);stem(T1,'.');axis([0 length(T1) 0 10]);
xlabel('帧数(n)');ylabel('周期(ms)');title('各帧基音周期');
五、实验结果与分析
图2.3 样本语音原始图像图2.4滤波前各帧基音周期
图2.5滤波后各帧基音周期
通过图像可以清楚地看出每一帧对应的基音周期,实验效果比较理想,达到了预期目标。

实验中取了16000个点进行分析,每20ms 的声音片段进行采样,然后对每一帧进行自相关分析得到对应的基音周期,但是存在)(k Rm 开始的几个点的值比第一个周期的峰值还大的情况,因此无法正确提取出第一个峰值对应的点,所以经过滤波后得到比较理想的基音周期图像。

六、实验体会
通过本次实验是我更加理解短时自相关函数法进行基音检测的原理,短时自相关函数法基音检测的主要原理是通过比较原始信号和它移位后的信号之间的类似性来确定基音周期,如果移位距离等于基音周期,那么两个信号具有最大类似性。

基于自相关函数的算法是基音周期估计的常用方法,特别适用于噪声环境下的基音提取。

自相关函数在基音周期处表现为峰值,相邻两个峰值之间的间隔即为一个基音周期。

相关文档
最新文档