基于经验模态分解结合傅氏变换与Wigner分布的Mel频率倒谱系数提取

合集下载

mfcc的提取过程

mfcc的提取过程

mfcc的提取过程MFCC(Mel频率倒谱系数)的提取过程主要包括以下步骤:预加重:将语音信号通过一个高通滤波器,提升高频部分,使信号的频谱变得平坦,保持在低频到高频的整个频带中,能用同样的信噪比求频谱。

同时,消除发生过程中声带和嘴唇的效应,来补偿语音信号受到发音系统所抑制的高频部分,也为了突出高频的共振峰。

分帧:将语音信号分成若干个短时帧,每帧通常为20-40毫秒,涵盖的时间约为20-40毫秒左右。

为了避免相邻两帧的变化过大,会让两相邻帧之间有一段重叠区域,此重叠区域包含了M个取样点,通常M的值约为N的1/2或1/3。

加窗:对每一帧信号加窗,常用的窗函数有汉明窗等。

快速傅里叶变换(FFT):将加窗后的每一帧信号进行快速傅里叶变换,将时域信号转换为频域信号。

梅尔滤波器组:将频域信号通过一组梅尔滤波器组,梅尔滤波器组的中心频率是按照对数尺度排列的,与人的听觉感知一致。

对数能量:通过每个梅尔滤波器的信号进行对数运算,将幅度谱转换为对数能量谱。

离散余弦变换(DCT):对每个梅尔滤波器的对数能量进行离散余弦变换,将其转换为倒谱系数。

归一化:对得到的倒谱系数进行归一化处理,进一步消除个体差异和设备差异。

通过以上步骤,就可以提取出语音信号的MFCC特征。

Mfcc提取过程的原理是什么?MFCC(Mel频率倒谱系数)提取过程的原理主要基于人耳的听觉感知特性。

人耳对不同频率的声波有不同的听觉敏感度,特别是在低频处,人耳更容易感知到声音。

因此,MFCC的提取过程通过模拟人耳的听觉感知特性,提取出语音信号中与人类听觉感知相关的特征,从而实现语音信号的降维和特征提取。

在MFCC提取过程中,首先将语音信号通过预加重、分帧、加窗等步骤进行处理,然后通过快速傅里叶变换将时域信号转换为频域信号。

接着,通过梅尔滤波器组对频域信号进行滤波,梅尔滤波器组的中心频率按照对数尺度排列,与人的听觉感知一致。

然后对每个梅尔滤波器的信号进行对数运算,将幅度谱转换为对数能量谱。

Mel频率倒谱系数提取及其在声纹识别中的作用

Mel频率倒谱系数提取及其在声纹识别中的作用

第22卷第2期贵州大学学报(自然科学版)Vol.22No.2 2005年 5月Journal of Guizhou University(Natural Sciences)May.2005文章编号 1000-5269(2005)02-00207-04M el频率倒谱系数提取及其在声纹识别中的作用张万里,刘 桥(贵州大学电子科学系,贵州贵阳 550025)摘 要 从说话人的语音信号中提取出说话人的个性特征是声纹识别的关键。

本文介绍了一种基于H MM的声纹识别系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数(Mel2Fre2 quency Cep stral Coefficients,MFCC)作为特征参数,取得了很好结果。

关键词 声纹识别;特征提取;MFCC中图分类号 T N91213 文献标识码 A0 引 言随着社会的发展,安全问题日趋重要,用生物特征并结合计算机技术进行安全验证是当今的热门课题,声纹识别技术是生物识别技术的一种,与其它生物识别技术相比,声纹识别具有更为简便、准确、经济及可扩展性良好等众多优势,可广泛应用于安全验证、控制等方面。

声纹识别是一项根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术。

它的基本原理是通过分析人的发声和听觉,为每个人构造一个独一无二的数学模型,由计算机对模型和实际输入的语音进行精确匹配,根据匹配结果辨认出说话人是谁。

首先对鉴别对象的声音进行采样,即输入语音信号,再对采样数据进行滤波等处理,而在声纹识别过程中最主要的两部分内容是特征提取和模式匹配。

特征提取,就是从声音中选取唯一表现说话人身份的有效且稳定可靠的特征;模式匹配就是对训练和鉴别时的特征模式做相似性匹配。

1 特征提取语音的特征提取(如图1所示)本质上是起降维作用,用较少的维数表现了说话人的特征。

常用的语音特征包括Pitch(基音)、For mant(共振峰)、MFCC(Mel频率倒谱系数)、LPCC(线性预测倒谱系数)以及LSP(线谱对系数)等等。

mel频谱倒谱系数

mel频谱倒谱系数

mel频谱倒谱系数随着科技的进步,声音处理已经成为了我们日常生活中不可或缺的一部分。

在声音处理领域中,Mel频谱倒谱系数(MFCC)扮演着至关重要的角色。

本文将深入解析Mel频谱倒谱系数,探讨其在声音处理领域中的应用和重要性。

一、Mel频谱倒谱系数的概念Mel频谱倒谱系数,简称MFCC,是一种用于语音识别和声音分类的特征。

它通过将语音信号转换为倒谱系数(cepstral coefficients),能够有效地描述语音信号的特性。

在语音处理中,倒谱系数是一种将频域信号转换为时域信号的方法,而MFCC则是在倒谱系数的基础上,进一步考虑了人耳对声音的感知特性。

二、Mel频谱倒谱系数的提取过程提取MFCC的过程主要包括预加重、分帧、加窗、快速傅里叶变换(FFT)、梅尔滤波器组、对数压缩、离散余弦变换(DCT)等步骤。

下面将简要介绍每个步骤:1.预加重:通过一个一阶高通滤波器对语音信号进行预处理,以突出语音信号的高频部分。

2.分帧:将语音信号分成若干个短时帧,每帧通常为20-40毫秒。

3.加窗:对每个帧应用窗函数,以减少帧边缘的突变。

4.快速傅里叶变换(FFT):将加窗后的帧从时域转换到频域。

5.梅尔滤波器组:将频域信号通过一组梅尔滤波器,模拟人耳对不同频率的感知特性。

6.对数压缩:将梅尔滤波器的输出进行对数压缩,以突出语音信号中的关键信息。

7.离散余弦变换(DCT):对压缩后的梅尔频谱进行离散余弦变换,得到倒谱系数。

三、Mel频谱倒谱系数在声音处理中的应用MFCC在声音处理领域中有着广泛的应用,主要包括以下几个方面:1.语音识别:MFCC能够有效地描述语音信号的特性,因此在语音识别中发挥着重要的作用。

通过提取语音信号的MFCC特征,可以实现对语音的自动识别和分类。

2.声音分类:MFCC可以用于声音分类任务,例如动物声音分类、乐器声音分类等。

通过提取声音信号的MFCC特征,可以实现对不同声音类型的自动分类和识别。

经验模态分解和魏格纳-维利分布在往复泵泵阀振动信号特征提取中的应用

经验模态分解和魏格纳-维利分布在往复泵泵阀振动信号特征提取中的应用
sg lo e i o a i m p v l e i na f r c pr c tng pu av s
XU C a gh n I ifi h n .a g ,L U J— ,CHE Gu — ig ,XI ig e N or n u E Jn 。 (. ol efEe rm ca i l n zer gi hn nvrt o e o u D nyn 5 0 1 hn ; 1C lg l t eh n a gnei C i U i sy fP t l m, og i 2 76 ,C i e o co c E n n a e i re g a
t o f rfau e e t cin f m ir t n d t ftilx p mp v l e .F rt o l o e t r x r t o vb a i aa o p e u av s i l a o r o r s y,vb ain d t r e o o e n o s v rli — i r t aa a e d c mp s d i t e ea n o
tm e,fe e c nd a i r qu n y a mpltde d m an ft e o ii a ina a x rc e iu o is o h rg n lsg lc n bee ta t d. By c mb n n l W VDso MFs,t VD— o i i g al fI he W ba e i e・ e ue c itiut nso he o ii a i r to ina t n efc ie u r s in o h r s ・e m ntree c s d tm ・ q n y d srb i ft rg n lv b ai n sg lwih a fe tv s pp e so ft e c o str i e fr n e r f o ・

一种基于经验模态分解提取信号微多普勒调制分量的方法[发明专利]

一种基于经验模态分解提取信号微多普勒调制分量的方法[发明专利]

专利名称:一种基于经验模态分解提取信号微多普勒调制分量的方法
专利类型:发明专利
发明人:王宝帅,刘江洪,宋泉
申请号:CN202010217506.3
申请日:20200325
公开号:CN111537989A
公开日:
20200814
专利内容由知识产权出版社提供
摘要:本发明涉及信号处理技术领域,公开了一种基于经验模态分解提取信号微多普勒调制分量的方法,首先利用经验模态分解方法将回波中的杂波分量自适应的抑制,然后利用循环移位算法将回波中的平动分量移到多普勒频率为零处,最后再次利用经验模态分解算法将平动分量和微多普勒调制分量自动区分,本发明对微多普勒调制的提取不需要人工参与并且能够保持回波中的多普勒结构信息,从而提升依据微多普勒调制特性进行目标分类识别的正确率。

申请人:中国电子科技集团公司第二十九研究所
地址:610036 四川省成都市金牛区营康西路496号
国籍:CN
代理机构:成都九鼎天元知识产权代理有限公司
代理人:夏琴
更多信息请下载全文后查看。

经验模态分解和希伯尔特变换进行信号的频率、幅值和相位

经验模态分解和希伯尔特变换进行信号的频率、幅值和相位

经验模态分解和希伯尔特变换进行信号的频率、幅值和相位(实用版)目录1.信号处理的需求与目的2.经验模态分解与希伯尔特变换的原理和方法3.频率、幅值和相位的提取与应用4.总结与展望正文一、信号处理的需求与目的在现代科学研究和工程技术中,信号处理是一项重要的技术手段。

信号处理主要是对信号进行分析、处理和识别,从而提取有用的信息。

信号处理的核心任务之一就是提取信号的频率、幅值和相位信息。

这些信息对于信号的识别、分析和应用具有重要的意义。

二、经验模态分解与希伯尔特变换的原理和方法1.经验模态分解(EMD)经验模态分解是一种自适应的信号处理方法,可以有效地将信号分解为不同频率的成分。

EMD 主要通过迭代过程来寻找信号中的内在频率,并将信号分解为不同频率的模态函数。

这种分解方法可以避免传统傅里叶变换中频率截断和泄漏等问题,使得信号的频率成分更加精确。

2.希伯尔特变换(Hilbert Transform)希伯尔特变换是一种广泛应用于信号处理的数学工具,可以提取信号的频率、幅值和相位信息。

希伯尔特变换的基本思想是将信号的时域表示转换为其频域表示。

通过希伯尔特变换,可以得到信号的频谱,从而提取信号的频率、幅值和相位信息。

三、频率、幅值和相位的提取与应用1.频率提取通过经验模态分解和希伯尔特变换,可以提取信号的频率信息。

这些频率信息对于信号的识别和分析具有重要意义。

例如,在机械振动信号处理中,通过提取信号的频率信息,可以判断机械的故障类型和原因。

2.幅值提取信号的幅值信息反映了信号的能量大小。

通过经验模态分解和希伯尔特变换,可以提取信号的幅值信息。

在实际应用中,幅值信息可以用于评估信号的质量和性能。

3.相位提取信号的相位信息反映了信号在不同时间点的相对位置。

通过希伯尔特变换,可以提取信号的相位信息。

在实际应用中,相位信息可以用于分析信号的传播特性和时变性。

四、总结与展望经验模态分解和希伯尔特变换为信号的频率、幅值和相位提取提供了有效的方法。

基于经验模态分解的多普勒信号提取

基于经验模态分解的多普勒信号提取
第 3 卷 第 3期 1 21 0 0年 9月
制 导 与 引 信
GUI DANCE & F UZ E
V oI31 N o . .3
Se .2 0 p 01
文 章 编 号 : 6 10 7 (0 0 0 - 0 10 1 7 —5 6 2 1 ) 30 0 —5
基 于 经 验 模 态 分 解 的 多 普 勒 信 号 提 取
s g a s b mp rc l d e o p st n ( i n l y e iia mo e d c m o ii o EM D)i i v s i a e o o tn o s wa eDo p e s n e tg t d f rc n i u u v p l r
第3 1卷
至 多相差一 个 ;
0 引 言
在恶 劣 的战场 电磁 干 扰环 境 中, 准确 提 取 有
b )在 任意 点 ,由局 部极 大 值 构 成 的上 包 络 线 和局部极 小值 构成 的下包络 线 的平 均值 为零 。 I MF反 映了信 号 内在 的 波动 性 。E MD 已在
Em p r c lM o e De o p sto iia d c m o ii n
Y ANG a —i~. DEN G a h o Y nl Ji — a
( .Nain l y La o a o y o c a r ncEn i e rn & Co to ,B i n n tt t f 1 t a o Ke b r t r fMe h to i gn e i g n r l ej g I siu eo i Te h oo y,B i n 0 0 1 .S h o fI f r to n o c n lg ej g 1 0 8 ;2 c o l n o main a d C mmu ia in i o n c to

基于Fisher比的梅尔倒谱系数混合特征提取方法_鲜晓东

基于Fisher比的梅尔倒谱系数混合特征提取方法_鲜晓东
Key words: recognition accuracy; Mel Frequency Cepstral Coefficient ( MFCC) ; Inverted MFCC ( IMFCC ) ; Midfrequency MFCC ( MidMFCC) ; Fisher criterion
在 MFCC 参数中,滤波器组主要分布于低频部分,注重于
语音的低频频谱,对于中高频的频谱信息计算精度较差,造成
最终提取的参数不能最大限度地表征语音的特征。为了提高 中高频的计算精度,先后提出了逆梅尔倒谱参数( IMFCC) [5] 和中频梅尔倒谱参数( MidMFCC) [6]。这两种参数与经典的
MFCC 的不同主要在 Mel 刻度与 Hz 刻度的转换上,IMel 刻度
关键词: 识别精度; 梅尔倒谱系数; 逆梅尔倒谱系数; 中频梅尔倒谱系数; Fisher 准则 中图分类号: TP391 文献标志码: A
Parameter extraction method for Mel frequency cepstral coefficients based on Fisher criterion
评价特征参数中不同分量对识别的贡献一般有两种方 法,通过各个分量的 Fisher 比得到各分量的区分能量,或者通 过增减分量的 方 法 判 断 每 个 特 征 分 量 的 贡 献[8]。 甄 斌 等[9] 采用增减特征分量的方法研究了 MFCC 各维倒谱分量对说话 人识别和语音识别的贡献,但是通过增减特征分量的方法计 算量较大,同 时 受 环 境 及 语 音 识 别 的 影 响 较 大,因 此 利 用 Fisher 准则来分析特征向量,确定特征分量的可分离性是一 种常用的特征选择方法。张芸等[10]利用 Fisher 准则对 LPCC

mel频率倒谱系数

mel频率倒谱系数

mel频率倒谱系数Mel频率倒谱系数(MFCC)是语音信号处理中广泛应用的一种特征提取方法。

MFCC是根据人类听觉特征对频域图像进行处理的一种技术,以此来降低计算量并减少音频数据中的冗余信息。

在自然语音识别、语音合成、语音识别等领域得到了广泛的应用。

在本文中,我们将介绍一些关于MFCC的背景知识以及它的重要性。

1.背景知识Mel频率倒谱系数起源于生物医学领域,其取名就是源于人耳的听觉特性的单位。

Mel频率是一种非线性租的单位,其基础是人类听觉在不同频率下的感知差异,它是基于梅尔频率刻划的一种音高感知的度量标准,具有在语音信号的特征分析以及模式识别中发挥重要作用的一类参数。

梅尔是20世纪40年代由美国心理学家A. L. Mel提出来的标准,早期是针对人类听觉特性而考虑到的。

在语音信号处理中,MFCC是从时域信号得出的一组数值,包括:Mel-frequency (梅尔频率)、 Logarithmic (对数转换)、cosine transform (正余弦变换)。

2. 重要性MFCC是语音信号处理中一种非常重要的技术,并且拥有很多应用。

MFCC技术利用在听觉系统内难以感知的波形信息,将其转变为各种特定的音频采样和频率变化等参数,然后利用这些参数来提取语音中的特征。

与传统方法相比,MFCC具有如下的优点:(1)对于高低音的扭曲问题相对不敏感,更适合于对口吃、口音、噪声等非理想环境条件下的语音识别。

(2)在时域的长窗口FFT中,只需取前20-30个MFCC系数,而不必像全波形法一样取所有频率成分,大大减少了数据量,并且保留了主要信息,从而大大节省了处理时间。

(3)MFCC技术能够很好地描述语音信号的频率和能量特征,从而有效地区分人声和背景噪声,并在信号处理和语音识别应用中得到广泛应用。

3. MFCC的应用MFCC广泛应用于语音信号的处理和分类,如:自然语言处理、声音识别、语音合成、噪声抑制、语音压缩等多个方面。

基于多窗频谱估计和平滑幅度谱包络的Mel频率倒谱系数(MFCC)改进算法

基于多窗频谱估计和平滑幅度谱包络的Mel频率倒谱系数(MFCC)改进算法

基于多窗频谱估计和平滑幅度谱包络的Mel频率倒谱系数(MFCC)改进算法张怡然;白静;王力【摘要】语音的特征提取是说话人识别系统中的关键问题.在传统的Mel频率倒谱系数(MFCC)参数的基础上,提出一种改进的MFCC特征提取算法.该算法着眼于语音的前端处理,在预处理阶段,利用SWCE窗函数,对信号进行多窗频谱估计.并对得到的频谱进行平滑处理,得到信号的谱包络.然后对信号的谱包络进行计算,得到改进的MFCC参数.实验表明,在不同噪声环境下,与传统的MFCC算法相比,改进的算法识别率提高四个百分点以上.【期刊名称】《科学技术与工程》【年(卷),期】2014(014)019【总页数】5页(P253-256,274)【关键词】Mel频率倒谱系数;多窗频谱估计;滑动平均滤波;谱包络;说话人识别【作者】张怡然;白静;王力【作者单位】太原理工大学信息工程学院,太原030024;太原理工大学信息工程学院,太原030024;太原理工大学信息工程学院,太原030024【正文语种】中文【中图分类】TN912.3说话人识别是语音识别的一种,属于语音信号处理的范畴。

它利用说话人的声纹特征进行识别。

它先将说话人的语音训练成一个模板,然后从说话人的待测语音中提取说话人的个性特征信息,并对这些特征信息与训练好的模板进行比较,最终对说话人的身份做出正确判断。

说话人识别的原理框图如图1所示。

根据识别目标的不同,说话人识别可分为说话人辨认和说话人确认两种。

前者是在若干个参考模板中判别出待识别语音是谁所说。

后者是要判定待识别语音是否是所声明的人所说。

本文研究的是与文本无关的说话人确认系统。

图1 说话人识别的原理框图Fig.1 The block diagram of speaker recognition2014年1月23日收到国家自然科学基金资助项目(61072087)、山西省科技攻关项目(20120313013-6)、山西省青年科技研究基金(2013021016-1)资助第一作者简介:张怡然(1987—),女,硕士研究生。

经验模态分解和希伯尔特变换进行信号的频率、幅值和相位

经验模态分解和希伯尔特变换进行信号的频率、幅值和相位

经验模态分解和希伯尔特变换进行信号的频率、幅值和相位经验模态分解(Empirical Mode Decomposition,EMD)和希尔伯特变换(Hilbert Transform)是两种常用于信号频率分析和时频分析的方法。

它们可以通过将信号分解为多个本征模态函数(Intrinsic Mode Functions,简称IMF)和通过希尔伯特变换得到信号的相位进行信号的频率、幅值和相位的分析。

首先,我们来介绍经验模态分解(EMD)。

EMD是一种自适应数据分解方法,通过将信号分解为一系列具有特定频率和时频特性的IMF。

EMD的基本思想是将信号分解为一系列满足两个条件的IMF:1)在整个信号的局部频率带宽内,IMF的频率变化不大;2)IMF的频率与信号的本构频率紧密匹配。

EMD的主要步骤包括以下几个步骤:(1)找到信号中的极值点(局部极大值和极小值),(2)通过对极值点进行插值找到信号中的局部极值包络线,(3)求得局部极值包络线的平均值作为信号的第一IMF,(4)将第一IMF从原始信号中减去得到一次内禀模态函数。

重复以上步骤,可以得到一系列IMF,直到剩余信号成为一个单调函数(或和常数),即得到信号的最后一个IMF。

通过EMD 分解得到的IMF可以表示信号在不同频率上的时频特性。

接下来,我们来介绍希尔伯特变换(Hilbert Transform)。

希尔伯特变换是一种将时域信号转换为频域信号,并且同时得到信号的幅值和相位信息的方法。

希尔伯特变换通过对时域信号进行频谱变换得到信号的复数频谱,然后利用频谱的幅度和相位信息还原信号的幅值和相位。

希尔伯特变换的具体公式为:H[x(t)] = F^(-1)[j*sign(w)*F[x(t)]]其中,H[x(t)]表示希尔伯特变换后的信号,F表示傅里叶变换,F^(-1)表示反傅里叶变换,sign(w)表示频率的符号。

希尔伯特变换的主要思想是通过添加一个相位差为90度的虚拟谐波分量,将实数信号转换为复信号,从而同时获取信号的幅值和相位信息。

基于经验模态分解及自相关分析的微弱信号提取方法

基于经验模态分解及自相关分析的微弱信号提取方法

大庆石油学院学报第31卷第5期2007年10月J OU RNAL OF DAQ IN G PETROL EUM INSTITU TE Vol.31No.5Oct.2007收稿日期:2006-10-10;审稿人:邹龙庆;编辑:任志平 基金项目:黑龙江省博士后资助项目(LB H -Z05068) 作者简介:刘树林(1963-),男,博士后,教授,博士生导师,主要从事设备故障诊断方面的研究.基于经验模态分解及自相关分析的微弱信号提取方法刘树林1,2,赵海峰2,齐 波3,王 辉2(1.哈尔滨工业大学航天学院,黑龙江哈尔滨 150001; 2.大庆石油学院机械科学与工程学院,黑龙江大庆 163318; 3.大庆石化公司化工一厂,黑龙江大庆 163714) 摘 要:为提取机械设备故障诊断中的某些微弱信号,给出一种新的提取强背景噪声中微弱周期信号的方法.首先对原始信号进行经验模态分解,得到理论意义上的固有模态函数;然后对各分解层做自相关分析,依据自相关图像,对可能含有周期成分的分解层进行频谱分析;最后可提取微弱周期信号的频率及幅值信息.通过仿真分析,证实该方法能够有效提取淹没于背景噪声中的微弱周期信号.关 键 词:经验模态分解;微弱信号;背景噪声;特征提取;自相关分析中图分类号:T H17;TP306 文献标识码:A 文章编号:1000-1891(2007)05-0080-050 引言微弱信号检测的目的是从强背景噪声中提取有用信号[1].在旋转机械故障诊断中,正常运行的机组状态比较平稳,一般时域波形是以工频为主的周期信号,当出现故障,特别是早期故障时,就会产生微弱的周期性激励.传统方法很难有效地提取微弱的周期信号.经验模态分解法(Empirical Mode Decomposi 2tion ,EMD )作为一种既适于线性、平稳信号,又适于非线性、非平稳信号的信号处理方法,已在许多领域得到应用[2].该方法是依据信号时域波形极值的自适应性分解,因此有学者将其作为不同频带的自适应滤波器.虽然在提取较强信号波形及频率方面取得较好的效果,但是较难提取强背景噪声中的微弱周期信号频率.自相关函数法可以提取混有噪音的周期信号,前提条件是信噪比较高,否则效果不理想.笔者首先采用经验模态分解法将原始信号中的强背景噪声分解至各个固有模态函数(Int rinsic Mode Function ,IM F ),达到降低噪声的作用;然后进行自相关分析,判别每层IM F 中是否含有淹没于背景噪声中的微弱周期信号;最后通过频谱图,提取该微弱信号的频率,以有效地提取微弱周期信号的频率和幅值.1 经验模态分解EMD 的本质是对信号进行自适应分解,得到满足条件的固有模态函数:(1)在整个数据序列上,极值点数与过零点数必须相等或者至多相差一个;(2)在任一时间点,由局部极大值确定的包络线与由局部极小值确定的包络线的均值为0.经验模态分解步骤[3]:(1)初始化:r 0(t )=x (t ),i =1.(2)提取第i 个固有模态函数(IM F ):(a )初始化:h 0(t )=r i (t ),k =1;(b )提取h k -1(t )的局部极大值与局部极小值;(c )采用三次样条对局部极大值与局部极小值插值,分别形成h k -1(t )的上包络线与下包络线;(d )计算h k -1(t )的上、下包络线的均值m k -1(t );(e )确定h k (t )=h k -1(t )-m k -1(t );(f )如果满足固有模态函数(IM F )准则,则令I M F i (t )=h k (t ),否则,转到(b ),并且k =k +1.(3)定义:r i (t )=r i -1(t )-I M F i (t ).(4)如果r i (t )仍然具有至少2个极值,则转到步骤(2),并且令i =i +1;否则,分解过程完成,r i (t )是x (t )的“残余量”.利用EMD 分解原始信号,得到理论意义上仅含有单组分频率成分的各固有模态函数,有利于各分解层信号的后续处理.利用经验模态分解的自适应性,将宽带白噪声分解至每层固有模态函数中,一定程度上可提高微弱信号所在层的信噪比;但是在分解过程中存在无法准确确定端点的极值及包络方法的选择等问题,得到的每层固有模态函数可能会出现虚假模态(出现含有虚假频率成分的IM F ).对于一个未知频率的信号,单从频谱图中无法辨识.为判别各层固有模态函数中是否含有微弱周期信号,以及准确提取该信号的频率及幅值带来困难,需要采用自相关分析进一步处理.2 自相关分析由EMD 得到各固有模态函数I M F i ,其自相关函数R i (τ)为R i (τ)=lim T →∞1T ∫T 0IM F i (t )IM F i (t +τ)d t ,(1)将式(1)离散化为R i (n Δt )=6N -ni =0IM F i (t i )IM F i (t i +nΔt )N -n ,(2)式(1,2)中:N 为采样点数(样本长度);n 为时延数;i 为时序号;τ为延迟时间;T 为周期.由于原始信号经EMD 分解后得到的固有模态函数中仍含有噪声信号,令IM F i (t )=s i (t )+n i (t ),(3)式中:s i (t )为周期信号;n i (t )为噪声信号.式(1)变为R i (τ)=lim T →∞1T ∫T0[s i (t )+n i (t )]・[s i (t +τ)+n i (t +τ)]d t =R si (τ)+R sni (τ)+R nsi (τ)+R ni (τ),(4)式中:R si (τ)为周期信号的自相关函数;R sni (τ)为信号与噪声的互相关函数;R nsi (τ)为噪声与信号的互相关函数;R ni (τ)为噪声的自相关函数.依据自相关函数及互相关函数性质[4],当τ不为0且较大时,R sni (τ),R nsi (τ)及R ni (τ)均趋于0,则式(4)变为R i (τ)≈R si (τ).(5)3 仿真分析设原始信号为x =x 1+x 2+noise ,(6)式中,x 1=sin (100πt );x 2=2sin (200πt );noise 为信噪比等于-15dB 时的高斯白噪声.该信号的采样频率为1024Hz ,采样时间为2s .采用文献[5]中的方法计算信噪比S N R 为第5期 刘树林等:基于经验模态分解及自相关分析的微弱信号提取方法S N R =lg6(X 0(k )-q 0)26(N m(k )-E m )2,(7)式中:X 0(k )为希望提取的有用信号;q 0为该信号的均方根值;N m (k )为剩余背景噪声信号;E m 为该信号的均方根值.当提取一个正弦信号的频率时,另一个正弦信号及高斯白噪声可看作剩余背景噪声信号.经计算,式(6)中x 1的信噪比变为-18dB ,x 2的信噪比变为-12dB ,说明正弦信号x 1更加微弱.该原始信号的时域波形及频谱见图1和图2.由图1可见,正弦信号x 1及x 2的波形均淹没在强高斯白噪声中,分辨不出周期信号的波形.由图2可见,频谱图仅清楚显示较强正弦信号x 2的频率100Hz (幅值最大),而未将较微弱正弦信号x 1的频率50Hz 清晰地辨识出来(幅值不突出).图1 原始信号时域波形图2 原始信号频谱 原始信号经过经验模态分解得到的各层固有模态函数及残余项见图3.该仿真信号共分解为9层固有模态函数及一个残余项.由I M F 1~I M F 9的时域图中,难以分辨出分解层是否含有周期信号.各分解层I M F 及残余项的自相关函数见图4,分别用符号R i (i =1~9,r )表示其自相关函数.R 1,R 2及R 3的局部放大图见图5(其中仅截取延迟时间τ为0.10~0.35段).由R 1可知,在τ稍偏离0时,自相关函数由幅值20大幅度衰减至0附近,并且当τ较大时,其波形无周期性,可以判断I M F 1主要为宽带随机噪声[4].R 2也是在τ稍偏离0时迅速衰减,但衰减的幅度比R 1小得多,在τ较大时,不再衰减,并且自相关函数的波形含有一定成分的正弦波信号,由此可以判断I M F 2为宽带随机噪声与正弦信号的混和信号.在R 3与R 4中,当τ较大时自相关函数均不衰减,并且有明显的正弦波形,依据自相关函数性质可以判断I M F 3与I M F 4均含有正弦信号成分.由图5中R 3可知,该周期信号的幅值为2[4].在图4的R 5~R 7中,随着τ的增大,自相关函数缓慢衰减,并在τ较大时趋于0,这是窄带随机噪声的自相关特性.在图3的I M F 8,I M F 9的时域波形中,可以看出信号具有衰减性,对I M F 8及I M F 9作自相关函数,并且τ很大时,发现其也缓慢衰减,并最终趋于0,从而可以判断该2层不含周期正弦信号.对I M F 2,I M F 3及I M F 4做频谱,确定所含正弦信号的频率成分,见图6~8.由图6~8可以看出,I M F 2,I M F 3中含有的正弦信号的频率为100Hz ,证实I M F 2中含有正弦信号,该层固有模态函数也含有宽带随机噪声,与由图4中的R 2得出的判断一致.I M F 4中含有正弦信号的频率为50Hz .由图4~8可以确定,原始信号中不仅含有频率为100,50Hz 的2个正弦微弱信号,并且频率为100Hz 的正弦信号的幅值近似为2.与原始信号中2个正弦信号相同,说明该方法能较为有效地提取淹没于背景噪声中的微弱信号.大 庆 石 油 学 院 学 报 第31卷 2007年图3 原始信号的经验模态分解图4 自相关函数图5 I M F 1~I M F 3自相关函数的局部放大图6 I M F 2的频谱图7 I M F 3的频谱图8 I M F 4的频谱第5期 刘树林等:基于经验模态分解及自相关分析的微弱信号提取方法大 庆 石 油 学 院 学 报 第31卷 2007年4 结束语在针对机械设备故障诊断中某些微弱正弦信号难以提取的情况下,提出基于EMD的自适应滤波降噪功能与自相关函数分析相结合的方法.通过仿真证实,该方法可以在较低信噪比的情况下提取出淹没于背景噪声中的微弱周期信号,从而为机械设备早期微弱故障信号的提取提供了一种新方法.参考文献:[1] 胡茑庆.随机共振原理在强噪声背景信号检测中的应用[J].国防科技大学学报,2001,23(4):40-44.[2] HUAN G N E,SH EN Z,LON G S R,et al.The empirical mode decomposition and t he Hilbert spectrum for nonlinear and non2sta2tionary time series analysis[J].Proc.R.Soc.London A,1998,454:903-995.[3] SCHL U RMANN T.Spectral frequency analysis of nonlinear water waves derived from t he Hilbert2Huang transformation[J].Journalof Off shore Mechanics and Arctic Engineering(J OMA E),2002,124(1):22-27.[4] 黄长艺,严普强.机械工程测试技术基础[M].2版.北京:机械工业出版社,2001:134-137.[5] 祝开艳,王树勋.一类混沌背景中正弦信号的提取[J].吉林大学学报:工学版,2005,35(2):157-162.(上接第79页)由表1和表2可以看出:①轴向变形最大误差为8.4%,能够满足工程需要,说明该方法能够模拟注水管柱在多级封隔器作用下的变形状态.②注水管柱受到注水压力作用时,发生收缩,注水压力越大,管柱收缩量越大.③封隔器间各段油管的收缩量与油管长度为非线性,说明多级封隔器中各封隔器对注水管柱引起变形的作用不同.4 结论(1)在考虑注水管柱初始几何缺陷条件下,根据有限变形理论,采用有限元法综合分析多级封隔器管柱的柱塞效应、螺旋弯曲效应,以及非均匀内外压差下的轴向变形,计算与测试的最大误差率为8.4%,满足工程需要.(2)在分层注水工艺管柱长度设计中,采用文中方法计算得到的封隔器位移补偿量,可提高分层注水管柱的配注合格率.(3)多级封隔器中每一封隔器对油管轴向变形的贡献不同,不能按照线性关系简单迭加.参考文献:[1] 孙利民.注水管柱应力与轴向变形分析[J].石油机械,1999,27(7):38-39.[2] 孙爱军,徐英娜,李洪,等.注水管柱的受力分析及理论计算[J].钻采工艺,2003,26(3):55-57.[3] 曲占庆,董长银,张琪.影响高压注气管柱变形的主要因素及计算方法[J].石油钻采工艺,1999,22(1):53-55.[4] 王国正,周思柱.分层注水管柱中的封隔器位移分析[J].湖北工业大学学报,2005,20(3):222-223.[5] 江汉石油管理局采油工艺研究所,江汉石油学院采油研究所.封隔器理论基础与应用[M].北京:石油工业出版社:145-181.[6] 王勖成,邵敏.有限单元法基本原理和数值方法[M].北京:清华大学出版社,2002:460-475.Abstract s Journal of Daqing Pet roleum Instit ute Vol.31 No.5 Oct.2007 Approach to w eak signal extraction based on empirical mode decomposition and autocorrelation analysis/ 2007,31(5):80-84L IU Shu2lin1,2,ZHAO Hai2feng2,Q I Bo3,WAN G Hui2(1.College of A st ronautics,H arbi n I nstit ute of Technolog y,H arbi n,Heilong j i ang150001,Chi na;2.Mechanical S cience and Engi neeri ng College,D aqi n g Pet roleum I nstit ute,D aqi ng,Heilong j i ang 163318,Chi na;3.Chemical Pl ant N o.1,D aqi ng Pet roleum&Chemical Cor poration,D aqi n g,Hei2 long j i ang163714,Chi na)Abstract:A new approach to extract weak periodic signal from st rong noise is proposed to pick up some weak signals in t he fault diagnosis of mechanical equip ment.Original signal is firstly decomposed by em2 pirical mode deco mposition met hod,and t hen autocorrelation analysis is made respectively for conse2 quent intrinsic mode f unctions.Some int rinsic mode f unctions co ntaining periodic component s are select2 ed according to correspo nding autocorrelogram and f urt her analyzed by f requency spect rum,t hus t he weak periodic signal can be ext racted.Simulation result s show t hat t he app roach can effectively ext ract t he weak periodic signals hidden in t he strong background noise.K ey w ords:empirical mode decomposition;weak signals,background noise;feat ure ext raction;autocor2 relation analysisCharacteristic study of typical faults of rotor systems combining w avelet packet with fractal/2007,31(5):85 -87FEN G Cheng2f u1,YAN G Li2jing2,ZHON G Sheng3(1.Equi pment and Pow er De p artment,D aqi n g Ref i nery an d Chemical Co.,D aqi ng,Heilong j i ang 163411,Chi na;2.Oil Recovery En gi neeri ng I nstit ute,D aqi ng Oil f iel d Cor p.L t d.,D aqi ng,Hei2 long j i ang163453,Chi na;3.W ell D rilli n g En gi neeri ng I nstit ute,D aqi ng Pet roleum A dmi nist ration B ureau,D aqi ng,Heilong j i ang163413,Chi na)Abstract:Based on t he nat ural consistence of wavelet packet and f ractal t heory on t he multi scales analy2 sis and self2similarity,t his paper p resent s a met hod of fault characteristics ext raction combining t he wavelet packet decomposition wit h t he correlation dimension for several typical fault(such as friction, mass imbalance and oil film whirling)of rotor system.Firstly,t he wavelet packet is applied to decom2 pose t he vibration signal,and t he correlation dimensions of decomposition coefficient obtained are regar2 ded as characteristic vector of fault,t hen t he characteristic vector of fault is identified by neural net2 work.The simulation result verifies t hat t he met hod presented by t his paper is very effective for several typical fault diagno ses of rotor system.K ey w ords:rotor;wavelet packet;fractal;feat ure ext ractio n;fault diagnosisIdentif ication of the location of damaged part a simple supported beam model based EMD/2007,31(5):88 -90YUAN Zhao2qing,ZHAO Dan,CA I Y ing2jun(College of Ci vil Engi neeri ng,D aqi n g Pet roleum I nstit ute,D aqi n g,Heilon g j i ang163318,Chi na) Abstract:To identify t he location of t he damaged part of a st ruct ure is a difficult task for st ruct ure healt h monitoring.To solve it,a system of signal acquisition and analysis consisting of a vibration signal generator,acceleration sensors,signal acquisition and a comp uter has been established.The acceleration data of a simple supported steel beam model are collected separately under t he conditions intact and inju2 ry,t hen data p rocessed by using EMD and shape factor,t he damage locations are found by comparing t he change of shape factor.Experiment indicates t hat damage locations are accurately identified.key w ords:empirical mode decomposition;shape factor;damage location;simple supported beamV ertical vibration analysis of rectangular space grids based on the equivalent sandwich plate method/2007, 31(5):91-93ZHAN G Wen2f u1,2,L U Y ing2hua1,SU Kan2qing3(1.College of Ci vil Engi neeri n g,D aqi ng Pet roleum I nstit ute,D aqi ng,Heilong j i ang163318,Chi2 na;2.College of Civil En gi neeri ng,H unan U ni versit y,Chan gs ha,H unan410082,Chi na;3.Yatong Road B uil di n g Cor p.L t d.,D aqi ng,Heilong j i ang163000,Chi na)Abstract:Equivalent sandwich plate met hod(ESPM)is a simplified met hod for double2layer space grids in which space grids st ruct ure is assumed as ort hogonal and ort ho2laid plate and analyzed by t he t heory。

说话人识别中的Mel特征频率倒谱系数

说话人识别中的Mel特征频率倒谱系数

说话人识别中的Mel特征频率倒谱系数曹辉;徐晨;赵晓;吴胜举【摘要】目的研究语音特征梅尔频率倒谱系数(MFCC)的选取对说话人识别系统性能的影响.方法采用基于平均影响值(MIV)的支持向量机(SVM)方法研究了说话人识别中的梅尔频率倒谱系数各维倒谱分量对于识别分类的贡献度.结果选择具有代表性的特征向量进行说话人分类识别,能得到维数更低、识别率更高的特征参数.结论通过MIV值可判断各维特征参数分量的重要性,选取权重值高的MFCC特征参数来提高系统识别率和缩短系统运行时间.【期刊名称】《西北大学学报(自然科学版)》【年(卷),期】2013(043)002【总页数】6页(P203-208)【关键词】说话人识别;语音特征参数;梅尔频率倒谱系数;支持向量机;平均影响值【作者】曹辉;徐晨;赵晓;吴胜举【作者单位】陕西师范大学物理学与信息技术学院/陕西省超声重点实验室,陕西西安710100;陕西师范大学物理学与信息技术学院/陕西省超声重点实验室,陕西西安710100;陕西师范大学物理学与信息技术学院/陕西省超声重点实验室,陕西西安710100;陕西师范大学物理学与信息技术学院/陕西省超声重点实验室,陕西西安710100【正文语种】中文【中图分类】TN912.34说话人识别与指纹识别、虹膜识别等一样,属于生物识别的一种,被认为是最自然的生物特征识别身份鉴定方式,因此又被称为“声纹”识别[1]。

说话人识别(speaker recognition)按照任务可以分为2个范畴:说话人辨认(speaker identification)和说话人确认(speaker verification)。

说话人辨认系统的性能随着说话人集合的规模增大而降低,所以其说话人语音特征参数的选择直接影响着语音识别系统的性能,提取维数小、鉴别能力强的特征矢量对于语音分类系统的计算快慢和识别率有直接的关系。

在说话人识别中最常用的特征参数是基于声道的LPCC、基于听觉特性的MFCC以及基于等响度曲线和临界带的PLP等[2-4],本文选取MFCC特征进行模拟实验。

梅尔频率倒谱系数(mfcc)及Python实现

梅尔频率倒谱系数(mfcc)及Python实现

梅尔频率倒谱系数(mfcc)及Python实现语⾳识别系统的第⼀步是进⾏特征提取,mfcc是描述短时功率谱包络的⼀种特征,在语⾳识别系统中被⼴泛应⽤。

⼀、mel滤波器每⼀段语⾳信号被分为多帧,每帧信号都对应⼀个频谱(通过FFT变换实现),频谱表⽰频率与信号能量之间的关系。

mel滤波器是指多个带通滤波器,在mel频率中带通滤波器的通带是等宽的,但在赫兹(Hertz)频谱内mel滤波器在低频处较密集切通带较窄,⾼频处较稀疏且通带较宽,旨在通过在较低频率处更具辨别性并且在较⾼频率处较少辨别性来模拟⾮线性⼈类⽿朵对声⾳的感知。

赫兹频率和梅尔频率之间的关系为:假设在梅尔频谱内,有M 个带通滤波器Hm (k),0≤m<M,每个带通滤波器的中⼼频率为F(m) F(m)F(m)每个带通滤波器的传递函数为:下图为赫兹频率内的mel滤波器,带通滤波器个数为24:⼆、mfcc特征MFCC系数提取步骤:(1)语⾳信号分帧处理(2)每⼀帧傅⾥叶变换---->功率谱(3)将短时功率谱通过mel滤波器(4)滤波器组系数取对数(5)将滤波器组系数的对数进⾏离散余弦变换(DCT)(6)⼀般将第2到底13个倒谱系数保留作为短时语⾳信号的特征Python实现import waveimport numpy as npimport mathimport matplotlib.pyplot as pltfrom scipy.fftpack import dctdef read(data_path):'''读取语⾳信号'''wavepath = data_pathf = wave.open(wavepath,'rb')params = f.getparams()nchannels,sampwidth,framerate,nframes = params[:4] #声道数、量化位数、采样频率、采样点数str_data = f.readframes(nframes) #读取⾳频,字符串格式f.close()wavedata = np.fromstring(str_data,dtype = np.short) #将字符串转化为浮点型数据wavedata = wavedata * 1.0 / (max(abs(wavedata))) #wave幅值归⼀化return wavedata,nframes,frameratedef enframe(data,win,inc):'''对语⾳数据进⾏分帧处理input:data(⼀维array):语⾳信号wlen(int):滑动窗长inc(int):窗⼝每次移动的长度output:f(⼆维array)每次滑动窗内的数据组成的⼆维array'''nx = len(data) #语⾳信号的长度try:nwin = len(win)except Exception as err:nwin = 1if nwin == 1:wlen = winelse:wlen = nwinnf = int(np.fix((nx - wlen) / inc) + 1) #窗⼝移动的次数f = np.zeros((nf,wlen)) #初始化⼆维数组indf = [inc * j for j in range(nf)]indf = (np.mat(indf)).Tinds = np.mat(range(wlen))indf_tile = np.tile(indf,wlen)inds_tile = np.tile(inds,(nf,1))mix_tile = indf_tile + inds_tilef = np.zeros((nf,wlen))for i in range(nf):for j in range(wlen):f[i,j] = data[mix_tile[i,j]]return fdef point_check(wavedata,win,inc):'''语⾳信号端点检测input:wavedata(⼀维array):原始语⾳信号output:StartPoint(int):起始端点EndPoint(int):终⽌端点'''#1.计算短时过零率FrameTemp1 = enframe(wavedata[0:-1],win,inc)FrameTemp2 = enframe(wavedata[1:],win,inc)signs = np.sign(np.multiply(FrameTemp1,FrameTemp2)) # 计算每⼀位与其相邻的数据是否异号,异号则过零 signs = list(map(lambda x:[[i,0] [i>0] for i in x],signs))signs = list(map(lambda x:[[i,1] [i<0] for i in x], signs))diffs = np.sign(abs(FrameTemp1 - FrameTemp2)-0.01)diffs = list(map(lambda x:[[i,0] [i<0] for i in x], diffs))zcr = list((np.multiply(signs, diffs)).sum(axis = 1))#2.计算短时能量amp = list((abs(enframe(wavedata,win,inc))).sum(axis = 1))# # 设置门限# print('设置门限')ZcrLow = max([round(np.mean(zcr)*0.1),3])#过零率低门限ZcrHigh = max([round(max(zcr)*0.1),5])#过零率⾼门限AmpLow = min([min(amp)*10,np.mean(amp)*0.2,max(amp)*0.1])#能量低门限AmpHigh = max([min(amp)*10,np.mean(amp)*0.2,max(amp)*0.1])#能量⾼门限# 端点检测MaxSilence = 8 #最长语⾳间隙时间MinAudio = 16 #最短语⾳时间Status = 0 #状态0:静⾳段,1:过渡段,2:语⾳段,3:结束段HoldTime = 0 #语⾳持续时间SilenceTime = 0 #语⾳间隙时间print('开始端点检测')StartPoint = 0for n in range(len(zcr)):if Status ==0 or Status == 1:if amp[n] > AmpHigh or zcr[n] > ZcrHigh:StartPoint = n - HoldTimeStatus = 2HoldTime = HoldTime + 1SilenceTime = 0elif amp[n] > AmpLow or zcr[n] > ZcrLow:Status = 1HoldTime = HoldTime + 1else:Status = 0HoldTime = 0elif Status == 2:if amp[n] > AmpLow or zcr[n] > ZcrLow:HoldTime = HoldTime + 1else:SilenceTime = SilenceTime + 1if SilenceTime < MaxSilence:HoldTime = HoldTime + 1elif (HoldTime - SilenceTime) < MinAudio:Status = 0HoldTime = 0SilenceTime = 0else:Status = 3elif Status == 3:breakif Status == 3:breakHoldTime = HoldTime - SilenceTimeEndPoint = StartPoint + HoldTimereturn FrameTemp1[StartPoint:EndPoint]def mfcc(FrameK,framerate,win):'''提取mfcc参数input:FrameK(⼆维array):⼆维分帧语⾳信号framerate:语⾳采样频率win:分帧窗长(FFT点数)output:'''#mel滤波器mel_bank,w2 = mel_filter(24,win,framerate,0,0.5)FrameK = FrameK.T#计算功率谱S = abs(np.fft.fft(FrameK,axis = 0)) ** 2#将功率谱通过滤波器P = np.dot(mel_bank,S[0:w2,:])#取对数logP = np.log(P)#计算DCT系数# rDCT = 12# cDCT = 24# dctcoef = []# for i in range(1,rDCT+1):# tmp = [np.cos((2*j+1)*i*math.pi*1.0/(2.0*cDCT)) for j in range(cDCT)] # dctcoef.append(tmp)# #取对数后做余弦变换# D = np.dot(dctcoef,logP)num_ceps = 12D = dct(logP,type = 2,axis = 0,norm = 'ortho')[1:(num_ceps+1),:]return S,mel_bank,P,logP,Ddef mel_filter(M,N,fs,l,h):'''mel滤波器input:M(int):滤波器个数N(int):FFT点数fs(int):采样频率l(float):低频系数h(float):⾼频系数output:melbank(⼆维array):mel滤波器'''fl = fs * l #滤波器范围的最低频率fh = fs * h #滤波器范围的最⾼频率bl = 1125 * np.log(1 + fl / 700) #将频率转换为mel频率bh = 1125 * np.log(1 + fh /700)B = bh - bl #频带宽度y = np.linspace(0,B,M+2) #将mel刻度等间距print('mel间隔',y)Fb = 700 * (np.exp(y / 1125) - 1) #将mel变为HZprint(Fb)w2 = int(N / 2 + 1)df = fs / Nfreq = [] #采样频率值for n in range(0,w2):freqs = int(n * df)freq.append(freqs)melbank = np.zeros((M,w2))print(freq)for k in range(1,M+1):f1 = Fb[k - 1]f2 = Fb[k + 1]f0 = Fb[k]n1 = np.floor(f1/df)n2 = np.floor(f2/df)n0 = np.floor(f0/df)for i in range(1,w2):if i >= n1 and i <= n0:melbank[k-1,i] = (i-n1)/(n0-n1)if i >= n0 and i <= n2:melbank[k-1,i] = (n2-i)/(n2-n0)plt.plot(freq,melbank[k-1,:])plt.show()return melbank,w2if __name__ == '__main__':data_path = 'audio_data.wav'win = 256inc = 80wavedata,nframes,framerate = read(data_path)FrameK = point_check(wavedata,win,inc)S,mel_bank,P,logP,D = mfcc(FrameK,framerate,win)以上就是本⽂的全部内容,希望对⼤家的学习有所帮助,也希望⼤家多多⽀持。

基于经验模态分解-Wigner分布的光学元件中频误差识别

基于经验模态分解-Wigner分布的光学元件中频误差识别

基于经验模态分解-Wigner分布的光学元件中频误差识别姜涛;杨炜;郭隐彪;王健
【期刊名称】《强激光与粒子束》
【年(卷),期】2014(026)003
【摘要】对于大尺寸高精密光学元件,不仅要对光学元件表面低频面形精度和高频粗糙度进行控制,还需要严格限制中频误差,以保证其使用性能和稳定性.为了确定光学元件的不合格区域并指导其返修,引入经验模态分解(EMD)和Wigner分布(WVD)函数方法,通过理论分析确定该方法与功率谱密度函数间的关系,实现对光学元件表面中频误差的辨识与定位.实验结果表明:EMDWVD方法不仅可以识别分布在实验光学元件表面15~27 mm空间频率为0.1mm-1的中频误差,还可以减小多分量信号所引起的空间频率为1.0~1.5 mm-1的交叉项干扰,提高中频误差辨识的准确率.
【总页数】6页(P108-113)
【作者】姜涛;杨炜;郭隐彪;王健
【作者单位】厦门大学机电工程系,福建厦门361005;厦门大学机电工程系,福建厦门361005;厦门大学机电工程系,福建厦门361005;中国工程物理研究院激光聚变研究中心,四川绵阳621900
【正文语种】中文
【中图分类】O436.1
【相关文献】
1.基于经验模态分解的Wigner-Ville时频分布 [J], 沈向存;刘文奎;陈杰
2.基于经验模态分解的Wigner-Ville分布交叉项抑制方法 [J], 李振兴
3.基于经验模态分解结合傅氏变换与Wigner分布的Mel频率倒谱系数提取 [J], 曾以成;陈雨莺;毛燕湖;谢小娟
4.基于Wigner分布和经验模态分解的谐波分析方法 [J], 张莉萍
5.基于经验模态分解的精密光学表面中频误差识别方法 [J], 毕果;郭隐彪;杨峰因版权原因,仅展示原文概要,查看原文内容请购买。

基于FPGA的Mel倒谱系数提取方法设计与实现

基于FPGA的Mel倒谱系数提取方法设计与实现

基于FPGA的Mel倒谱系数提取方法设计与实现杨鸿武;张帅;丁朋程【期刊名称】《仪表技术与传感器》【年(卷),期】2017(000)003【摘要】为了在嵌入式系统中实现参数化语音合成,提出一种在FPGA(field programmable gate array)中通过SOPC(system on programmable chip)系统提取Mel倒谱系数的方法.用SOPC Builder搭建硬件平台,然后在嵌入式Nios Ⅱ处理器中对语音信号做短时傅里叶变换、对数幅度运算、逆傅里叶变换,最后通过牛顿迭代法实现Mel倒谱系数的求解.将Nios Ⅱ处理器得到的Mel倒谱系数通过JTAG接口回传到计算机上,并与MATLAB仿真结果进行比较,结果表明Nios Ⅱ处理器提取的Mel倒谱系数与MATLAB提取的系数结果相同.【总页数】5页(P82-85,89)【作者】杨鸿武;张帅;丁朋程【作者单位】西北师范大学物理与电子工程学院,甘肃兰州 730070;西北师范大学物理与电子工程学院,甘肃兰州 730070;西北师范大学物理与电子工程学院,甘肃兰州 730070【正文语种】中文【中图分类】TP391【相关文献】1.基于Mel频率倒谱系数的说话人识别研究 [J], 朱宇轩2.基于 MEL 频率倒谱系数技术的音控汽车天窗的研究设计 [J], 袁霞;赵向阳3.基于经验模态分解和Mel倒谱系数的语音端点检测 [J], 陈蔚;熊卫华;施巍巍4.基于经验模态分解结合傅氏变换与Wigner分布的Mel频率倒谱系数提取 [J], 曾以成;陈雨莺;毛燕湖;谢小娟5.基于多窗频谱估计和平滑幅度谱包络的Mel频率倒谱系数(MFCC)改进算法 [J], 张怡然;白静;王力因版权原因,仅展示原文概要,查看原文内容请购买。

一种语音特征提取中Mel倒谱系数的后处理算法

一种语音特征提取中Mel倒谱系数的后处理算法

一种语音特征提取中Mel倒谱系数的后处理算法张毅;谢延义;罗元;席兵【期刊名称】《智能系统学报》【年(卷),期】2016(011)002【摘要】为提高语音识别系统的鲁棒性,本文以Mel频率倒谱系数( MFCC)为基础,结合均值消减法、方差归一化、时间序列滤波法和加权自回归移动平均滤波法,提出了一种后处理算法,本文将该算法命名为MVDA后处理法,所得语音特征参数简称MVDA。

本文首先从理论上推导了MVDA后处理法可以去除加性噪声和卷积噪声的干扰,接着针对MVDA与MFCC做了对比试验,并分析了含噪语音与语音信号的欧氏距离变化,证明MVDA后处理法的每一步均有效降低了噪声的干扰,且得出了MVDA在不同噪声环境中均更优的结论。

这种简洁的语音特征不仅可以达到许多复杂语音特征处理方法的效果,而且有效减少了自动语音识别系统的计算量。

%To improve the robustness of automatic speech recognition systems, a new speech feature postprocessing method based on theMel⁃frequency Cepstral Coefficient ( MFCC) is proposed, which is named the MVDA postpro⁃cessing method. The postprocessed feature parameters are named MVDAs. This technique combines meansubtrac⁃tion, variance normalization, time sequence fltering, and autoregressive moving average flters. Experiments were conducted to compare MVDA and MFCC. Changes in the Euclidean distance of the speech with noise and the speech signal were analyzed, proving that every step of MVDA postprocessing could effectively reduce the noisein⁃terference. Thus, all MVDAs in different noise environments were superior. This simple feature does not only a⁃chieve the effect of many complex speech feature processing methods but also effectively reduces the computational complexity of automatic speech recognition systems.【总页数】8页(P208-215)【作者】张毅;谢延义;罗元;席兵【作者单位】重庆邮电大学先进制造工程学院,重庆400065;重庆邮电大学自动化学院,重庆400065;重庆邮电大学光电工程学院,重庆400065;重庆邮电大学光电工程学院,重庆400065【正文语种】中文【中图分类】TP391.4【相关文献】1.语音信号特征提取中Mel倒谱系MFCC算法的讨论 [J], 李玉鼎2.基于小波Mel倒谱系数的抗噪语音识别 [J], 张小玫;张雪英;梁五洲3.语音信号特征提取中Mel倒谱系MFCC的改进算法 [J], 张震;王化清4.一种基于加权Mel倒谱的语音信号共振峰提取算法 [J], 杨鸿武;赵涛涛5.基于经验模态分解和Mel倒谱系数的语音端点检测 [J], 陈蔚;熊卫华;施巍巍因版权原因,仅展示原文概要,查看原文内容请购买。

梅尔倒频谱算法

梅尔倒频谱算法

梅尔倒频谱算法
梅尔倒频谱算法(Mel-frequency cepstral coefficients, MFCC)是一种常用的语音信号特征提取方法,主要用于语音识别和语音信号处理任务。

该算法模拟了人耳对声音的感知特点,将声音信号的频率特征转换成对应的梅尔频率特征,进而提取梅尔倒谱系数(Mel-frequency cepstral coefficients, MFCC)作为声音信号的特征表示。

MFCC算法包含以下几个主要步骤:1. 预加重:对原始语音信号进行预加重操作,目的是强调高频部分,减小低频部分的影响。

2. 分帧:将预加重后的语音信号分成多个固定长度的帧,通常使用加窗函数(如汉宁窗)对每一帧进行加窗操作,避免频谱泄漏。

3. 快速傅里叶变换(FFT):对每一帧加窗后的语音信号进行快速傅里叶变换,将时域信号转换到频域。

4. 梅尔滤波器组:根据梅尔刻度(Mel scale)将频域的信号映射到梅尔频率上,通常使用一组三角滤波器对频谱进行滤波。

5. 对数运算:取滤波后的结果的对数,得到梅尔倒谱。

6. 倒谱系数提取:对梅尔倒谱进行离散余弦变换(DCT),得到梅尔倒谱系数(MFCC)。

7. 降维:通常只保留一部分MFCC系数,常用的做法是只保留前几个系数。

MFCC算法的输出是一组MFCC系数,这些系数用于描述声音信号的频率特征,可以用于语音识别器进行声学模型的训练和识别。

该算法在语音信号处理和语音识别中广泛应用,能够有效提取语音信号的关键特征,提升系统的性能。

基于多窗频谱估计和平滑幅度谱包络的Mel频率倒谱系数(MFCC)改进算法

基于多窗频谱估计和平滑幅度谱包络的Mel频率倒谱系数(MFCC)改进算法

基于多窗频谱估计和平滑幅度谱包络的Mel频率倒谱系数
(MFCC)改进算法
张怡然;白静;王力
【期刊名称】《科学技术与工程》
【年(卷),期】2014(0)19
【摘要】语音的特征提取是说话人识别系统中的关键问题.在传统的Mel频率倒谱系数(MFCC)参数的基础上,提出一种改进的MFCC特征提取算法.该算法着眼于语音的前端处理,在预处理阶段,利用SWCE窗函数,对信号进行多窗频谱估计.并对得到的频谱进行平滑处理,得到信号的谱包络.然后对信号的谱包络进行计算,得到改进的MFCC参数.实验表明,在不同噪声环境下,与传统的MFCC算法相比,改进的算法识别率提高四个百分点以上.
【总页数】5页(P253-256,274)
【作者】张怡然;白静;王力
【作者单位】太原理工大学信息工程学院,太原030024;太原理工大学信息工程学院,太原030024;太原理工大学信息工程学院,太原030024
【正文语种】中文
【中图分类】TN912.3
【相关文献】
1.基于语音频谱包络抽取的MFCC算法 [J], 李波;王成友;杨聪;蔡宣平;张尔扬
2.基于循环谱包络的BPSK信号码元速率改进估计算法 [J], 史建锋;沈辉
3.卫星信道中基于包络的改进信噪比估计算法 [J], 游伟;郭道省;易旭;牛和昊
4.基于美尔卷曲的TELPC频谱包络估计算法 [J], 李烨;杨家玮;梁彦霞
5.基于改进能量算子和六项余弦窗频谱校正的电压闪变包络参数检测 [J], 古庭赟; 高云鹏; 吴聪; 吕黔苏; 高吉普
因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

[ Ab s t r a c t ] S p e e c h s i g n a l h a s t h e n o n - s t a t i o n a r y a n d n o n l i n e a r c h a r a c t e r i s t i c s ,a n d i s d e c o mp o s e d i n t o a
( De p a r t me n t o f P h y s i c s a n d P h o t o e l e c t r i c En g i n e e r i n g 。X i a n g t a n Un i v e r s i t y 。 Xi a n g t a n 4 1 1 1 0 5 Ch i n a )
n u mb e r o f i n t r i n s i c mo d e f u n c t i o n i c a l Mo d e De c o mp o s i t i o n me t h o d .E a c h I MF c o n t a i n s
第 3 7卷 第 2期
2 0 1 5年 6月



学 自 然




Vo1 .3 7 NO. 2
Na t u r a l S c i e n c e J o u r n a l o f Xi a n g t a n Un i v e r s i t y
J u n .2 0 1 5
同, 对这些 I MF s 进行加权处理 , 得到新 的语音 , 再对 其进 行后 续处理 . Wi g n e r - Vi l l e分 布 能 精 确 地 定 位 信
号 的 时频 结 构 , 而 传 统 傅 氏变 换 不 能 反 映信 号 的 瞬 时 变 化 情 况 , 但 多 分 量 信 号 的 Wi g n e r — Vi l l e 分 布 受 困 于 交 叉 项 的 干扰 , 因此 利 用 W i g n e r — Vi l l e 分布 的优点 , 采 用 Wi g n e r - Vi l l e 谱 与 傅 氏 谱 结 合 来 代 替 单 独 的 傅 氏 谱作 为每帧的特征 , 进 行 Me l 频率倒谱 系数( Me l F r e q u e n c y C e p s t r u m C o e f f i c i e n t , MF C C ) 提取. 实验表 明 , 经 改 进 后 的 MF C C参 数 较 传 统 的 MF C C参 数 应 用 于说 话 人 识 别 系 统 , 识 别 率 有 较 大提 升 , 且鲁棒性较好. 关 键 词: 经验模态分解 ; Wi g n e r — Vi l l e 谱; 傅 氏变 换 ; Me l 频 率 倒 谱 系 数
基 于 经 验 模 态 分 解 结 合 傅 氏 变 换 与 Wi g n e r 分 布 的 Me l 频 率 倒 谱 系数 提 取
曾 以成 , 陈雨莺 , 毛 燕湖 , 谢 小娟
( 湘 潭 大 学 物 理 与 光 电工 程 学 院 , 湖南 湘潭 4 1 1 1 0 5 )
[ 摘要] 根据语音信 号的非平稳特点 , 用经 验模 态分解 方法把语 音信 号分解 成一 系列 固有模 态函数 ( I n — t r i n s i c Mo d e F u n c t i o n , I MF ) , 一个 I M F只 含 有 语 音 信 号 的 一 部 分 信 息 , 不同 I MF分 量 携 带 的特 征 信 息 不
文献 标 识 码 : A 文章编号 : 1 0 0 0—5 9 0 0 ( 2 0 1 5 ) 0 2—0 0 2 0— 0 7
中图 分 类 号 : TP 3 9 1
Me l Fr e qu e n c y Ce ps t r u m Co e f f i c i e nt Ex t r a c t i o n Me t ho d Ba s e d o n Em p i r i c a l Mo d e De c o mp o s i t i o n a n d Co mb i ne d S pe c t r u m o f
Fo u r i e r Tr a ns f o r m a nd W i g ne r Di s t r i b u t i o n
ZEN G Yi — c h e n g , CH EN Y u — y i n g。 M AO Ya h — h u, XI E Xi a o — j u a n
onl y pa r t of t he i nf o r m at i o n o f t he s pe e c h s i g na l ,an d di f f e r e n t c ha r a c t e r i s t i c i n f or ma t i on c a r r i e d b y di f f e r e n t I M F c o mp on e nt . T he n t he s e I M Fs a r e we i ght e d t O g e t a ne w s pe e c h s i g na l f or f ur t he r pr oc e s s i ng. W i g ne r - Vi l l e Di s t r i but i o n c a n a c c u r a t e l y r e f l e c t t h e t i me - f r e q ue nc y s t r uc t ur e o f t h e s i gna 1 . On t he c ont r a r y, t he Fou r i e r t r a ns f or m c a n no t r e f l e c t t he i ns t a n t a ne ou s c h an ge of s i gn a 1 . But Wi gne r - Vi l l e Di s t r i but i o n t r a pp e d
相关文档
最新文档