倒谱计算与分析
梅尔频率倒谱系数计算
梅尔频率倒谱系数计算
梅尔频率倒谱系数(MFCC)是一种常用于语音信号处理的特征提取方法。
它通过模拟人耳听觉机制,将频率轴上的线性间隔转换为梅尔刻度,再对梅尔频率进行离散余弦变换,得到一组能够描述语音谱图特征的系数。
其中,计算梅尔频率时需要用到一种称为梅尔滤波器组的滤波器组,它们的频率特性类似于三角形,用于模拟不同频段的听觉分辨率。
MFCC 系数的计算步骤如下:
1. 将音频信号进行预处理,如加窗、去噪等。
2. 将预处理后的音频信号进行傅里叶变换,得到幅度谱和相位谱。
3. 将幅度谱转换为功率谱,并将其通过梅尔滤波器组。
4. 取每个滤波器输出的对数值,并通过离散余弦变换得到 MFCC 系数。
5. 对 MFCC 系数进行归一化,去除不必要的信息。
MFCC 系数的应用非常广泛,如语音识别、音乐信息检索、情感识别等领域。
它具有特征提取快速、稳定性好、抗噪性强等优点,因此成为语音信号处理中不可或缺的一部分。
- 1 -。
倒谱分析
倒谱分析(1).倒频谱的数学描述倒频谱函数CF(q)(power cepstrum)其数学表达式为:(2.6)CF(q)又叫功率倒频谱,或叫对数功率谱的功率谱。
工程上常用的是式(2.6)的开方形式,即:(2.7)C0(q)称为幅值倒频谱,有时简称倒频谱。
倒频谱变量q的物理意义为了使其定义更加明确,还可以定义:(2.8)即倒频谱定义为信号的双边功率谱对数加权,再取其傅里叶逆变换,联系一下信号的自相关函数:看出,这种定义方法与自相关函数很相近,变量q与τ在量纲上完全相同。
为了反映出相位信息,分离后能恢复原信号,又提出一种复倒频谱的运算方法。
若信号x(t)的傅里叶变换为X(f):(2.9)x(t)的倒频谱记为:(2.10)显而易见,它保留了相位的信息。
倒频谱与相关函数不同的只差对数加权,目的是使再变换以后的信号能量集中,扩大动态分析的频谱范围和提高再变换的精度。
还可以解卷积(褶积)成分,易于对原信号的分离和识别。
(2).倒频谱的应用分离信息通道对信号的影响图2.26对数功率谱关系图。
在机械状态监测和故障诊断中,所测得的信号,往往是由故障源经系统路径的传输而得到的响应,也就是说它不是原故障点的信号,如欲得到该源信号,必须删除传递通道的影响。
如在噪声测量时,所测得之信号,不仅有源信号而且又有不同方向反射回来的回声信号的混入,要提取源信号,也必须删除回声的干扰信号。
若系统的输入为x(t),输出为y(t),脉冲响应函数是h(t),两者的时域关系为: y(t)=x(t)*h(t)频域为: Y(f)=X(f)*H(f)或Sy(f)=Sx(f)*|H(f)|2对上式两边取对数,则有:(2.11)式(2.72)关系如图(2.26)所示,源信号为具有明显周期特征的信号,经过系统特性logGk(f)的影响修正,合成而得输出信号logGy(f)。
对于(2.72)式进一步作傅里叶变换,即可得幅值倒频谱:(2.12)即:(2.13)以上推导可知,信号在时域可以利用x(t)与h(t)的卷积求输出;在频域则变成X(f)与H(f)的乘积关系;而在倒频域则变成Cx(q)和Ch(q)相加的关系,使系统特特性Ch(q)与信号特性Cx(q)明显区别开来,这对清除传递通道的影响很有用处,而用功率谱处理就很难实现。
语音信号的倒谱分析
因为
ˆ X ' (Z ) X ' (Z ) X (Z )
求复倒谱的一种有效的递推算法
ˆ Z[nx(n)] Z (nx(n))Z[ x(n)]
ˆ n( x(n)) {nx(n)} x(n)
n 1
l ˆ ˆ x(n) ( ) x(l ) x(n l ) x(n) x(0) l 0 n 可推导出: ˆ x ( n)
i 1
P
ˆ e(n) s(n) s(n) s(n) ai s(n i) ai s(n i)
i 1 i 0
P
P
线性预测原理
线性预测是目前分析语音信号的最有效的方法之一,分 析的结果是得到一组信号的全极点模型参数,所以又称 为信号参数模型法。 这个方法的基本思想是将被分析信号模型化,即用有限 数目的模型参数来描述信号中的信息,具体来说,将被 分析信号s(n)视为某系统(即模型)的输出,而系统的 输入,在s(n)为确定性信号是采用单位取样序列。在s(n) 为随机信号是采用白噪声序列。
Linear
Prediction
1947年维纳提出; 1967年板仓等人应用于语音分析与合成;
语音信号处理与分析的核心技术
提供了预测功能;
提供了声道模型和声道模型的参数估计方法;
基本思想:
语音样本之间存在相关性,一个语音信号的样本可 以用过去若干个样本的线性组合来逼近;
ˆ s ( n) a i s ( n i )
g jZ
j 0
Q
j
, A( Z ) ai Z i
i 0
P
g j 和ai都是实数,且a0 1。如果能有一种算法,可能根据已知的s (n) 正确的估计出这些参数,那么未知的系统V(Z)便可求得。由于 E ( Z )V ( Z ) S ( Z ),根据V ( Z )和S ( Z )便可以求得E(Z),从而全部解决 解卷的的问题。
共振峰 倒谱法
共振峰倒谱法
共振峰是指在声音或信号频谱中出现较高振幅的频率区域。
这些共振峰通常对应于声音源或信号中的共振频率,即在该频率下共振现象特别明显。
倒谱法是一种用于分析信号频谱的方法。
它将频谱转化为倒谱系数,通过对这些倒谱系数进行分析,可以得到信号的特征参数,例如共振峰频率、带宽等。
在使用倒谱法进行分析时,首先需要获取信号的频谱。
一种常见的做法是使用傅里叶变换将信号从时域转化为频域。
然后,将频谱对数化,并应用倒谱变换得到倒谱系数。
倒谱系数可以通过对频谱进行对数变换来得到。
常见的做法是取频谱的对数幅度,并进行倒谱变换。
这样可以将信号的频谱转化为倒谱系数,并对其进行分析。
倒谱法常用于语音信号分析、音乐信号分析等领域。
通过分析倒谱系数,可以提取信号的共振峰特征,并用于声音识别、音乐分析等应用中。
复倒谱的基本原理
复倒谱的基本原理倒谱(cepstrum)是一种在信号处理领域中常用的技术,用于对信号进行频谱分析和声学特征提取。
它的基本原理是将信号的频谱变换到另一个域,该域被称为倒谱域。
在倒谱域中,信号的频谱特征能够更加凸显,从而便于进行后续的分析和处理。
倒谱的基本原理可以分为以下几个步骤:1.首先,对原始信号进行预加重处理。
这是为了强调信号的高频分量,减少低频分量对信号频谱的影响。
预加重可以通过一阶高通滤波器来实现,可以使用以下差分方程来计算:y[n]=某[n]-α某某[n-1]其中,y[n]为预加重后的信号,某[n]为原始信号,α是预加重的系数,一般取0.95。
2.接下来,对预加重后的信号进行分帧处理。
将信号分成若干小片段,每个片段称为一帧。
分帧可以使用矩形、汉明窗等窗函数来实现,窗函数有助于减少帧之间的边界效应。
3.对每一帧的信号进行傅里叶变换,得到每帧的频谱。
频谱表示了不同频率上的信号成分的幅度信息。
4.对每一帧的频谱取对数,这样可以将频谱的幅度响应转换成对数刻度,使得频谱的动态范围更容易处理。
5.对取对数后的频谱进行傅里叶逆变换,得到该帧信号的倒谱。
倒谱是频谱的对数表示。
6.最后,对所有帧的倒谱取均值,并进行后续的处理和分析。
均值操作可以减小每帧之间的差异,得到更加稳定的倒谱特征。
倒谱技术的应用非常广泛。
在音频处理领域,倒谱可以用于语音识别、音乐分析等任务。
在图像处理领域,倒谱可以用于图像轮廓分析和纹理特征提取等任务。
在信号处理领域,倒谱可以用于信号分类、故障诊断等应用。
总之,倒谱是一种非常有效的信号处理技术,能够将信号的频谱特征更好地显示出来,并方便后续的分析和处理。
通过倒谱分析,我们可以获取到信号的重要频谱信息,从而实现对信号的更深入理解和利用。
倒谱计算与分析
《视频语音处理技术》倒谱计算与分析学院名称:计算机与信息工程学院专业名称:计算机科学与技术年级班级:姓名:学号:计算机与信息技术学院综合性、设计性实验报告一、 实验目的:对语音信号进行同态分析可得到语音信号的倒谱参数。
语音的倒谱是将语音的短时谱取对数后再进行IDFT 得到的,所以浊音信号的激励反映在倒谱上是同样周期的冲激,借此,可从倒谱波形中估计出基音周期。
对倒谱进行低时窗选,通过语音倒谱分析的最后一级,进行DFT 后的输出即为平滑后的对数模函数,这个平滑的对数谱显示了特定输入语音段的谐振结构,即谱的峰值基本上对应于共振峰频率,对于平滑过的对数谱中的峰值进行定位,即可估计共振峰。
对于倒谱计算与分析的设计实验可作如下训练: 1、复倒谱的几种计算方法: 2、最小相位信号法和递归法; 3、基音检测; 4、共振峰检测。
二、实验仪器或设备:windowsXP 下的Matlab 编程环境 三、总体设计(设计原理、设计方案及流程等)1.复倒谱的几种计算方法:在复倒谱分析中,z 变换后得到的是复数,所以取对数时要进行复对数运算。
这时存在相位的多值性问题,称为“相位卷绕”。
设信号为则其傅里叶变换为对上式取复对数为 则其幅度和相位分别为:)()()(21n x n x n x *=)()()(21ωωωj j j e X e X e X ⋅=)(ln )(ln )(ln 21ωωωj j j e X e X e X +=)(ln )(ln )(ln 21ωωωj j j e X e X e X +=)()()(21ωϕωϕωϕ+=)()()(21ωϕωϕωϕ+=上式中,虽然 , 的范围均在 内,但 的值可能超过范围。
计算机处理时总相位值只能用其主值 表示,然后把这个相位主值“展开”,得到连续相位。
所以存在下面的情况:(K 为整数) 此时即产生了相位卷绕。
下面介绍几种避免相位卷绕求复倒谱的方法。
最小相位信号法这是解决相位卷绕的一种较好的方法。
倒频谱分析 (DEMO)
倒频谱分析倒频谱分析也称为二次频谱分析,是近代信号处理科学中的一项新技术,是检测复杂谱图中周期分量的有用工具。
它对于分析具有同族谐频或异族谐频、多成分边频等复杂信号,找出功率谱上不易发现的问题非常有效。
实数倒谱又分为功率倒频谱、幅值倒频谱和类似相关函数的倒频谱。
工程上经常使用的是功率倒频谱和幅值倒频谱。
在语言分析中语音音调的测定、机械振动中故障监察和诊断以及排除回波(反射波)等方面均得到广泛的应用。
若一个测量信号)s(t)x(=,则当两个分量y+tt)(ty是由两个分量)(tx与)(t(s叠加而成的,即)的能量分别集中在不同的频率段时,可用频域分析中的线性滤波或功率谱分析;当所要提取的分量以一定的形状作周期性重复而其中一分量是随时间变化的噪声时,可用时域分析中的信号平均法或相关分析。
这些方法都可有效地处理线性叠加信号。
但是有的信号不是由其分量的线性叠加,例如机床的输出信号是)(ty,激发振动的输入信号是切削力)tty+xhy是(t=即输出)(th描述的,则有)(t(t(x,而机床的动力特性是由脉冲响应))()输入)h的卷积,这是用处理线性叠加信号的方法就不够了。
另外、对于一个(tx与脉冲响应力)(t复杂的功率谱图,有的很难直观看出它的一些特点和变化情况。
而倒谱分析则能很好地处理这类问题,使故障诊断更加便利。
倒频谱是频域函数的傅里叶再变换,与相关函数不同只差对数加权。
对功率谱函数取对数的目的,是使再变换以后的信号能量格外集中,同时还可解析卷积(褶积)成分,易于对原信号的识别。
功率倒谱主要定义为时间信号的功率谱取对数再进行傅里叶逆变换。
通过上述分析可知,倒谱分析技术可适用于:(1)机械故障诊断,对于机械故障信号在频谱图上,出现难以识别的多族调制边频时,采用倒频谱分析技术,可以分解和识别故障频率,分析和诊断产生故障的原因和部位。
在齿轮箱的振动分析中,倒谱分析技术有广泛的应用。
(2)语音和回声分析,求解卷积问题。
gammatone倒谱系数
gammatone倒谱系数
Gammatone倒谱系数(Gammatone Frequency Cepstral Coefficients,GFCC)是一种音频特征提取方法,主要用于声音处理、语音识别和音乐信息检索等领域。
以下是GFCC的基本概念和计算步骤:
GFCC基于Gammatone滤波器组,这是一种模拟人耳听觉特性的滤波器组。
Gammatone滤波器可以很好地模拟人耳基底膜的频率响应特性,只需要很少的参数就能模拟听觉实验中的生理数据。
由于相邻的Gammatone滤波器通道有重叠的部分,因此提取的Gammatone特征系数相互之间存在相关性。
为了减小这种相关性,GFCC采用了离散余弦变换(DCT)进行处理。
GFCC的计算过程主要包括以下步骤:
对经过预处理后的语音帧进行快速傅里叶变换(FFT),获得频谱,并计算短时能量谱。
使用Gammatone滤波器组对频谱进行滤波,模拟人耳听觉的频率响应特性。
对滤波后的信号进行非线性变换,如对数变换,以模拟人耳对声音强度的感知特性。
对变换后的信号进行离散余弦变换(DCT),得到Gammatone 倒谱系数。
GFCC具有一些优点,例如能够模拟人耳的听觉特性,提取
出与人耳感知相关的音频特征;同时,GFCC的计算复杂度相对较低,适用于实时处理和大规模数据处理。
cmvn 倒谱系数均值归一化
cmvn 倒谱系数均值归一化
在语音处理中,倒谱系数(cepstral coefficients)是用于表示语音信号的一种常用方法。
倒谱系数是通过将语音信号进行傅里叶变换并取其逆变换得到的,它能够反映语音信号的频谱包络信息。
倒谱系数均值归一化(CMVN,Cepstral Mean Variance Normalization)是一种常用的预处理技术,用于消除不同说话人或不同语音之间的差异,使语音识别更加准确。
CMVN 的主要思想是对倒谱系数进行均值归一化,即将每个倒谱系数减去其均值,并除以标准差。
这样可以消除不同语音之间的规模和偏移差异,使不同语音在倒谱空间中具有可比性。
以下是CMVN 的计算步骤:
1.计算所有语音样本的倒谱系数均值(mean)和标准差(std)。
2.对每个语音样本的倒谱系数进行归一化,即减去均值并除以标准差。
3.将归一化后的倒谱系数作为新的特征向量用于后续的语音识别或分类任务。
通过CMVN 预处理,可以减小不同说话人或不同语音之间的差异,提高语音识别的准确率。
倒谱计算与分析..
《视频语音处理技术》倒谱计算与分析学院名称:计算机与信息工程学院专业名称:计算机科学与技术年级班级:姓名:学号:计算机与信息技术学院综合性、设计性实验报告一、 实验目的:对语音信号进行同态分析可得到语音信号的倒谱参数。
语音的倒谱是将语音的短时谱取对数后再进行IDFT 得到的,所以浊音信号的激励反映在倒谱上是同样周期的冲激,借此,可从倒谱波形中估计出基音周期。
对倒谱进行低时窗选,通过语音倒谱分析的最后一级,进行DFT 后的输出即为平滑后的对数模函数,这个平滑的对数谱显示了特定输入语音段的谐振结构,即谱的峰值基本上对应于共振峰频率,对于平滑过的对数谱中的峰值进行定位,即可估计共振峰。
对于倒谱计算与分析的设计实验可作如下训练: 1、复倒谱的几种计算方法: 2、最小相位信号法和递归法; 3、基音检测; 4、共振峰检测。
二、实验仪器或设备:windowsXP 下的Matlab 编程环境 三、总体设计(设计原理、设计方案及流程等)1.复倒谱的几种计算方法:在复倒谱分析中,z 变换后得到的是复数,所以取对数时要进行复对数运算。
这时存在相位的多值性问题,称为“相位卷绕”。
设信号为则其傅里叶变换为对上式取复对数为 则其幅度和相位分别为:)()()(21n x n x n x *=)()()(21ωωωj j j e X e X e X ⋅=)(ln )(ln )(ln 21ωωωj j j e X e X e X +=)(ln )(ln )(ln 21ωωωj j j e X e X e X +=)()()(21ωϕωϕωϕ+=)()()(21ωϕωϕωϕ+=上式中,虽然 , 的范围均在 内,但 的值可能超过范围。
计算机处理时总相位值只能用其主值表示,然后把这个相位 主值“展开”,得到连续相位。
所以存在下面的情况:(K 为整数) 此时即产生了相位卷绕。
下面介绍几种避免相位卷绕求复倒谱的方法。
最小相位信号法这是解决相位卷绕的一种较好的方法。
倒谱均值方差归一化原理
倒谱均值方差归一化原理倒谱均值方差归一化是一种信号处理方法,主要应用于音频信号分析中。
它的目的是通过将信号的均值方差归一化来消除信号幅度变化的影响,从而更好地揭示出信号的时域和频域特征。
下面就来逐一解释倒谱均值方差归一化的原理。
1. 倒谱分析倒谱是时域上的信号在频域上的反演。
具体地,对于一个实际序列x(n),其倒谱序列r(k)定义为:r(k)=IDFT(log(|X(f)|^2))其中,X(f)是x(n)的傅里叶变换,IDFT表示对傅里叶反变换,log表示对傅里叶变换的幅度取对数运算。
倒谱分析的基本思想是,通过对一个信号的倒谱序列进行分析,可以得到该信号的周期、谐波和旋律等信息。
2. 均值方差归一化均值方差归一化是一种数据预处理方法,用于将数据进行均值减法和方差归一化处理。
具体地,对于一个实数序列x=[x1,x2,...,xn],其均值方差归一化后的序列为:x'=(x-mean(x))/std(x)其中,mean(x)表示序列x的均值,std(x)表示序列x的标准差。
均值方差归一化的目的是消除数据的幅度变化对模型学习和预测的影响。
3. 倒谱均值方差归一化倒谱均值方差归一化是将倒谱分析和均值方差归一化相结合的一种信号处理方法。
具体地,对于一个音频信号x(t),首先进行倒谱分析,得到其倒谱序列r(k)。
然后,对r(k)进行均值方差归一化处理,得到归一化倒谱序列r'(k)。
最后,对r'(k)进行IDFT运算,得到信号的时域波形。
倒谱均值方差归一化的优点在于,它可以消除信号幅度变化的影响,从而更好地揭示出信号的时域和频域特征。
同时,它也可以减小信号非线性失真和频域泄漏的影响,提高信号的可辨识度和分类准确率。
总的来说,倒谱均值方差归一化是一种有效的信号处理方法,应用广泛于音频信号分析、语音识别、音乐信息检索等领域。
第3章 频谱与滤波-3. 倒谱分析
第3章 频谱与滤波3. 倒谱分析倒谱分析是在频谱分析的基础上发展起来的一种分析技术,就是对原信号Fourier 变换的对数值进行逆向Fourier 变换,也称为二次谱或二重谱分析技术,倒谱的英文单词为Cepstrum ,从拼写顺序上是频谱的英文单词Spectrum 的倒序,也能体现出倒谱分析和频谱分析的紧密关系。
对时域中的信号进行倒谱分析与进行频谱分析的实现过程较为相似,通过对复杂的频谱作进一步的倒谱分析,可以查清频谱中的主要频率组成和变化。
倒谱分析已经在机械故障诊断、地震数据分析、语音信号分析、图像处理、边频噪声分离等方面得到了非常广泛的应用。
显而易见,倒谱分析是一种同态映射运算。
笔者在第一章中曾经提到过:如果)()()(f x ef X f X ϕ⋅=是函数)(t x 的Fourier 变换,那么函数)(t x 的自相关函数的计算公式为⎰+∞∞-+⋅=dt t x t x r xx )()()(*ττ,)(τxx r 是一个偶函数,并且对应频谱关系式:)()()]([2f S f X r F x xx ==+τ,)(f S x 为)(t x 的自谱密度函数。
实倒谱或功率倒谱就是通过对)(f S x 的对数值进行逆向Fourier 变换获得的计算结果,如果我们用)(τR x C 表示)(t x 的实倒谱,那么有:])([log 2)]([log )(f X F f S F C x R x --==τ (3-16)复倒谱是直接对)(f X 的对数值进行逆向Fourier 变换得到的计算结果,如果用)(τC x C 表示)(t x 的复倒谱,那么有:)]()([log )]([log )(f j f X F f X F C x C x ϕτ⋅+==-- (3-17)显而易见,上面两个公式(3-16)和(3-17)中的变量τ与自相关函数dt t x t x r xx ⎰+∞∞-+⋅=)()()(*ττ中的变量τ在量纲上是一致的,称其为倒频率(Quefrency)。
倒谱法检测信号异常的灵敏度分析
第26卷第4期2011年8月(页码:1298~1303)地 球 物 理 学 进 展PROGRESS IN GEOPHYSICSVol.26,No.4Aug.,2011田仁飞,曹俊兴.倒谱法检测信号异常的灵敏度分析.地球物理学进展,2011,26(4):1298~1303,DOI:10.3969/j.issn.1004 2903.2011.04.021.TianRF,CaoJX.Thesensitivityanalysisofsignalabnormalitydetectionbasedoncepstrum.犘狉狅犵狉犲狊狊犻狀犌犲狅狆犺狔狊.(inChinese),2011,26(4):1298~1303,DOI:10.3969/j.issn.1004 2903.2011.04.021.倒谱法检测信号异常的灵敏度分析田仁飞1, 曹俊兴2(1.成都理工大学地球物理学院,成都610059; 2.成都理工大学“油气藏地质及开发工程”国家重点实验室,成都610059)摘 要 信号异常检测的主要目的是寻找对信号反应灵敏的特征参数.本文从倒谱法的算法、性质等阐释了倒谱系数对信号异常具有较好的灵敏度,并通过实际计算,验证了倒谱系数对信号的振幅、时间延迟和相位参数微小变化的灵敏度反应较好.对所设计的指数衰减正弦波信号,倒谱法能够较容易地检测出振幅、时间延迟和相位参数相对变化为百分之一的信号,而时间延迟和相位参数相对变化仅为千分之一也能较容易地检测出来.并利用该方法对某气田的含气性检测进行实验性处理,取得了较好的效果,表明倒谱法检测由油气引起的地震信号异常也是可行性.关键词 倒谱法,信号异常,灵敏度,指数衰减正弦波,油气检测DOI:10.3969/j.issn.1004 2903.2011.04.021 中图分类号 P631 文献标识码 A 犜犺犲狊犲狀狊犻狋犻狏犻狋狔犪狀犪犾狔狊犻狊狅犳狊犻犵狀犪犾犪犫狀狅狉犿犪犾犻狋狔犱犲狋犲犮狋犻狅狀犫犪狊犲犱狅狀犮犲狆狊狋狉狌犿TIANRen fei1, CAOJun xing2(1.犆狅犾犾犲犵犲犗犳犌犲狅狆犺狔狊犻犮狊,犆犺犲狀犵犱狌犝狀犻狏犲狉狊犻狋狔狅犳犜犲犮犺狀狅犾狅犵狔,犆犺犲狀犵犱狌610059,犆犺犻狀犪; 2.犛狋犪狋犲犓犲狔犔犪犫狅狉犪狋狅狉狔狅犳犗犻犾犪狀犱犌犪狊犚犲狊犲狉狏狅犻狉犌犲狅犾狅犵狔犪狀犱犈狓狆犾狅犻狋犪狋犻狅狀,犆犺犲狀犵犱狌犝狀犻狏犲狉狊犻狋狔狅犳犜犲犮犺狀狅犾狅犵狔,犆犺犲狀犵犱狌610059,犆犺犻狀犪)犃犫狊狋狉犪犮狋 Themainpurposeofsignalabnormalitydetectionistofindthesensitivityofthesignalcharacteristics.Infact,usingseismicsignalstodetectHydrocarbonissimilartothesignaldetection.Itfindsthatoilorgas,whichonlyaccountsforasmallpartinreservoirscausedbyseismicsignalanomalies.Inthispaper,weintroducemethodofcepstrumandexplainthemethodofcepstrumandthepropertyofcepstrum,andalsoexpoundcepstralcoefficientisgoodforthesensitivityofthesignalabnormalitydetection.Throughpracticalcalculation,itverifiesthatthecepstralcoefficientisgoodsensitivetoberesponsetothesignalamplitude,timedelayandphaseparameters,whichchangedalittle.Forthedesignoftheexponentialdecayofthesinewavesignal,themethodofcepstrumcaneasilydetecttherelativelychangeonepercentofthesignalamplitude,timedelayandphaseparameters,thetimedelayandphaseparametersoftherelativelychangeisonlyoneinathousandalsocanbeeasilydetected.Finally,weusethemethodofcepstrumtoexperimentalprocessingforoilandgasdetectionforagasfieldT3X2inSichuan,andhaveachievedgoodresults.Thisindicatesthatthemethodofcepstrumdetectedseismicsignals,whichcausedbytheoilandgasanomaliesisalsofeasible.犓犲狔狑狅狉犱狊 themethodofcepstrum,signalabnormality,sensitivity,exponentialsinewave,hydrocarbondetection收稿日期 2010 09 09; 修回日期 2011 01 20.基金项目 国家自然科学基金委员会与中国石油化工股份有限公司联合基金资助项目(40739907)和成都理工大学校青年基金项目(2009QJ26)联合资助.作者简介 田仁飞,男,土家族,1983年生,贵州沿河人,博士研究生,主要从事地球物理信号处理、油气储层预测等方面的教学和研究工作.(E mail:tianrenfei08@cdut.cn) 4期田仁飞,等:倒谱法检测信号异常的灵敏度分析0 引 言信号异常检测在声纹识别、机械故障检测、不同地震波类型的识别、薄层识别等[1,2]方面得到广泛地应用,其检测的主要方法就是寻找与正常信号差异较大、容错性较好的参数.在石油地震勘探中,利用地震信号进行油气检测,其在本质上也类似于信号异常检测,即找出储集层中占很小部分的油气所引起的地震信号异常.近年来,利用地震信号进行油气检测已经发展了一系列方法,如高阶统计量[3]、多波多分量[4-5]、AVO技术[6]、粗集理论[7]、反演技术[5,8,9]、时频分析[10,11]、吸收衰减[12]、数据挖掘技术[13]、局部指数拟合异常[14]等,这些方法在油气检测方面取得了一系列成功的实例.但这些方法也有其局限性,其成功应用必须满足一定的前提条件,因此,由必要发展基于地震信号的油气检测的新技术.在20世纪60年代,当初是为了识别地震和核爆炸的信号而首次提出来了倒谱分析法[1],简称倒谱法.该方法的主要优点[1,15]就是能够将褶积模型的信号在倒谱域变为加信号,有利于区分信号异常特征.本文从倒谱法的算法、性质展开论述,并通过数值模拟实验计算了信号的振幅、时间延迟和相位三参数的微小变化的倒谱系数的变化特征,分析了这三个参数对信号异常反应的灵敏度.最后,利用该方法对某气田的油气检测做了实验性处理.1 倒谱分析基本理论倒谱分析方法最初是为了识别地震和核爆炸的信号而提出来的.随后,该方法在语音识别、轴承故障检测、不同地震波类型的识别等方面中得到了广泛地应用.1.1 复倒谱的定义复倒频谱,简称为复倒谱,有时也称作对数复倒谱.其英文原文为ComplexCepstrum.Cepstrum是由Spectrum这个词的前四个字母倒置而构成的.复倒谱的定义是将信号看成为时间序列,对时间序列信号做犣变换,将变换的值取对数并取绝对值,再做逆犣变换,即狓(狀)=犣-1[ln狘犣(狓(狀))狘],(1)由上式可知,一个时间序列的复倒谱仍然是一个时间序列,而且可以进一步推出,实数时间序列的复倒谱仍然是一个实数时间序列.1.2 倒谱分析的计算[15,16]通常时间序列信号倒谱分析的计算方法有直接计算法,复对数求导法和递推计算法.常用的方法是按复倒谱定义的公式直接计算,其得到的结果蕴含振幅、相位、频率等信息.本文主要研究直接计算法.如果将时间序列信号狓(狀)的Z变换记为: 犡(狕)=∑+∞狀=-∞狓(狀)狕-狀=犃狕犕∏犖1犽=1(1-犪犽狕-1)∏犖2犽=1(1-犫犽狕)∏犖3犽=1(1-犮犽狕-1)∏犖4犽=1(1-犱犽狕),(2)其中犃为常数,犖1、犖2分别为单位圆内、单位团外的零点数目,犖3、犖4分别为单位圆内、单位圆外的极点数目,犪犽、犫犽、犮犽、犱犽模均小于1.对(2)式求对数,得:犡(狕)=ln犃+ln(狕犕)+∑犖1犻=1ln[(1-犪犻狕-1)]+∑犖2犻=1ln[(1-犫犻狕)]-∑犖3犻=1ln[(1-犮犻狕-1)]-∑犖4犻=1ln[(1-犱犻狕)],(3)在(3)式中,犃>0,对数运算ln犃才有意义,常取ln犃.于是,第一项ln|犃|的反犣变换为ln犃狀=00狀≠{0第二项ln犣犕的反犣变换为0狀=0(-1)狀犕狀狀≠0烅烄烆.它对复倒谱的贡献很有规律,且与狓(狀)无关.因此在讨论狓(狀)的复倒谱时可以忽略这一项的影响;后面四项的对数可以先展开成犣-1或者犣的幂级数,再求反犣变换,因此可以得到:珚狓(狀)=ln狘犃狘,狀=0-∑犖1犽=1犪狀犽狀+∑犖3犽=1犮狀犽狀,狀>0∑犖2犽=1犫-狀犽狀-∑犖4犽=1犱-狀犽狀,狀<烅烄烆0(4)结合式(4),陈玉东(2006)归纳了复倒谱具有8条性质[15],利用复倒谱的这些性质,可以较好地帮助我们选择计算方法,以及更好地理解倒谱系数的物理意义,有助于倒谱系数变化特征的分析.2 实验结果与分析为了探讨倒谱法对信号异常检测的灵敏性,文9921地 球 物 理 学 进 展26卷 中设计了指数衰减正弦波作为倒谱分析的输入信号,进行了实验计算.2.1 指数衰减正弦波指数衰减正弦波公式如下:amp=Ae-狋sin(2π犳(狋-τ)+φ),(5)式中的amp为信号振幅,犃为信号的初始最大振幅,犳为频率,狋为时间,τ为时间延迟,φ为相位.采用倒谱法,主要研究信号的振幅、时间延迟、相位三参数的微小变化对信号异常检测灵敏性问题的反应情况.2.2 计算实例及分析实验主要是设计狋=0.5s时,信号的振幅、时间延迟、相位三参数的微小变化形成的实序列信号作为倒谱法的输入信号,并对该信号做倒谱分析,利用倒谱分析的结果,以期研究各参数变化的灵敏性,下面分别讨论.2.2.1 振幅变化按公式(5),令犳=45Hz,犃=2,τ和φ为零.当狋=0.5s时,其它参数不变,犃在初始振幅2的基础之上减少50%,10%,5%,1%和0.1%后,利用倒谱分析研究振幅犃变化后,其倒谱系数的变化规律,从而研究倒谱法对信号振幅微弱变化的灵敏性.从图1中,很难检测出振幅变化的异常位置.即使在狋=0.5s处,振幅变化达到了50%也无法辨识出来.从图2中非常容易的检测到振幅发生异常的位置.图2中原始振幅系数图(a),虽然能够较好的反应出振幅异常的位置,但存在很多毛刺.通过对原始倒谱系数圆滑处理后得到倒谱系数图(b),较好的消除了毛刺现象,使倒谱系数异常幅值更为清晰.因此,后续研究中仅给出经过圆滑处理后的倒谱系数图.由图3可以看出犃减少不同百分比之后的倒谱系数图变化规律,即使犃减少0.5%后,仍然可以清楚地辨识出振幅异常的位置;直到犃减少0.1%后,才难以辨识出信号振幅异常的位置.这说明倒谱系数对信号的振幅变化很灵敏.同时,从图3中,可知:犃减少百分比越小,振幅异常处的倒谱系数异常值就越小.2.2.2 时间延迟参数变化按公式(5),令犳=45Hz,犃=2,τ=2ms和φ=0.当狋=0.5s时,其它参数不变,τ在初始时间延迟2ms的基础之上减少50%,10%,5%,1%和0.1%图1 狋=0.5s时,振幅减少50%的指数衰减正弦波Fig.1 狋=0.5s,Adecrease50%theexponentialdecayofthesinewave图2 狋=0.5s时:犃减少50%倒谱系数图.(a)原始倒谱系数图,(b)圆滑后倒谱系数图.Fig.2 狋=0.5s,Adecrease50%cepstralcoefficients(a)Originalcepstralcoefficientmap,(b)Aftersmoothcepstralcoefficientmap.0031 4期田仁飞,等:倒谱法检测信号异常的灵敏度分析图3 狋=0.5s时:犃减少不同百分比的倒谱系数图(a)10%,(b)1%,(c)0.5%,(d)0.1%.Fig.3 狋=0.5s,犃decreasedifferentpercentofcepstralcoefficients图4 狋=0.5s时:τ减少不同百分比的倒谱系数图(a)50%,(b)10%,(c)1%,(d)0.1%.Fig.4 狋=0.5s,τdecreasedifferentpercentofcepstralcoefficients后,利用倒谱分析研究时间延迟τ变化后,其倒谱系数的变化规律,从而研究倒谱法对信号时间延迟微弱变化的灵敏性.从图4中,可知:τ减少百分比越小,时间延迟异常处的倒谱系数异常值越小.而且时间延迟参数相对变化为0.1%时,仍能够较好的辨识出信号异常的位置,说明倒谱法能够较好的检测出时间参数变化而引起的信号异常.2.2.3 相位变化按公式(5),令犳=45Hz,犃=2,τ=0和φ=π/6.当狋=0.5s时,其它参数不变,φ在初始相位π/6的基础之上减少50%,10%,5%,1%和0.1%后,利用倒谱分析研究相位φ变化后,其倒谱系数的变化规律,从而研究倒谱法对信号相位微弱变化的灵敏性.从图5中,可知:φ减少百分比越小,时间延迟异常处的倒谱系数异常值越小.而且相位参数相对变化为0.1%时,仍能够较好的辨识出信号异常的位置,说明倒谱法仍然能够较好的检测出相位变化而引起的信号异常.1031地 球 物 理 学 进 展26卷图5 狋=0.5s时:φ减少不同百分比的倒谱系数图(a)50%,(b)10%,(c)1%,(d)0.1%.Fig.5 狋=0.5s,φdecreasedifferentpercentofcepstralcoefficients3 应用实例以上数值实验表明信号的振幅、时间延迟、相位三个参数之一的微小变化,即可在倒谱参数上反映出来,而实际地震记录中包含有振幅、相位、频率等信息,因此,利用倒谱分析可综合反映地层中含气引起的地震记录的异常变化.文中应用实例是利用倒谱分析检测川中某气田须二段的地震记录的异常变化.图6 川中某气田须二段倒谱系数异常图Fig.6 cepstralcoefficientsanomalyofagasfieldT3X2inSichuan图6中,黑色线表示T3X2顶界面.井A1为一口实测产气井,主要产气层是须二段,所在位置的CDP号为8048.从图6中,可知:倒谱系数幅值变化较小,在7.7~7.9之间,而井A所在位置对应的须二段存在高值异常,说明倒谱分析能够较好的检测出地层含气而引起的地震信号异常的变化.4 结论与建议本文较为详细地研究了倒谱法的算法、性质等,从理论上阐释了倒谱系数对信号的灵敏性.通过设计简单的指数衰减正弦波,研究了指数衰减正弦波中的振幅、时间延迟和相位参数的变化对检测信号异常的灵敏度,从计算的实际效果表明倒谱法对信号异常具有较好的灵敏度,并将其用于实际气田中的含气性检测,得到以下初步认识:(1)信号的振幅、时间延迟和相位的微小变化在时间域的信号中反应微弱,直接利用原始信号进行信号异常检测很困难;(2)采用倒谱法,提取的倒谱系数,能够较为容易的检测出信号异常的位置.通过指数衰减正弦波的实际计算表明:倒谱系数对信号的振幅、时间延迟和相位参数的变化很灵敏,即使各参数发生相对的变化为1%也能够较好的辨识出信号异常的位置,而时间延迟和相位参数的相对变化仅为0.1%时,仍能够清楚地检测出信号异常的位置;(3)信号的振幅、时间延迟和相位参数对信号异常反应的灵敏度,与各参数相对变化率有关:变化越大,倒谱系数异常幅值越大,即对异常反应越灵敏;(4)由文中计算实例表明:振幅异常比时间延迟、相位参数对信号异常的灵敏度相对较差.(5)倒谱系数异常变化的区域与实际产气层的2031 4期田仁飞,等:倒谱法检测信号异常的灵敏度分析位置相对应,验证了倒谱法检测由油气引起的地震信号异常是可行性.当然,引起地震信号异常的因素较为复杂,具体研究还要进一步深入.参 考 文 献(References):[1] ChildersDG,SkinnerDP,KemeraitRC.TheCepstrum:AGuidetoProcessing[A].In:ProcessingsoftheIEEE[C].1977,65(10):1428~1442.[2] HallM.Predictingbedthicknesswithcepstraldecomposition[J].TheLeadingEdge,2006,25(2):199~204.[3] 熊晓军,尹成,张白林,等.高阶统计量油气检测方法研究[J].地球物理学报,2004,47(5):920~927.XiongXJ,YinC,ZhangBL,犲狋犪犾.Methodresearchofforecastingoilandgasusinghigher orderstatistics[J].ChineseJ.Geophys.(inChinese),2004,47(5):920~927.[4] 王建民,杨冬,魏修成,等.多分量地震资料预测松辽盆地兴城地区深层火山岩与有利含气带[J].地球物理学报,2007,50(6):1914~1923.WangJM,YangD,WeiXC,犲狋犪犾.PredictingdeepvolcanicrocksandfavorablegaszonenearXingchengareainSongliaoBasinusingmulti—componentseismicdata[J].ChineseJ.Ceophys.(inChinese),2007,50(6):1914~1923.[5] 陈树民,王建民,王桂水,等.PP PS协同反演技术预测大庆深层火山岩含气储层[J].地球物理学报,2011,54(2):280~285.ChenSM,WangJM,WangGS,犲狋犪犾.JointPP PSinversiontechniquesandtheirapplicationforpredictinggasreservoirofdeepvolcanicinDaqing[J].ChineseJ.Geophys.(inchinese),2011,54(2):280~285.[6] 杨文采,于常青.深层油气地球物理勘探基础研究[J].地球物理学进展,2007,22(4):1238~1242.YangWC,YuCQ.Onbasicresearchproblemsinappliedgeophysicsfordeepoilandgasfields[J].ProgressinGeophys.(inChinese),2007,22(4):1238~1242.[7] 古发明,尹成,丁峰,等.粗集理论在地震储层预测中的应用[J].地球物理学进展,2009,24(1):231~237.GuFM,YinC,DingF,犲狋犪犾.Applicationoftheroughsettheorytoseismicreservoirpredication[J].ProgressinGeophys.(inChinese),2009,24(1):231~237.[8] 孙小芳,金振奎,赵前华.伪波阻抗反演和频谱成像技术在琼东南盆地储层预测中的应用[J].地球物理学进展,2010,25(2):579~584.SunXF,JinZK,ZhaoQH.ApplicationofPseudo waveimpedanceinversionandspectralimagingtechniquetoreservoirpredictionintheQiongdongnanBasin[J].ProgressinGeophys.(inChinese),2010,25(2):579~584.[9] 张进学,代瑜,屈战海.吐哈盆地葡萄沟地区储层预测及成藏特征探讨[J].石油地球物理勘探,2008,43(5):600~605.ZhangJX,DaiY,QuZH.Discussiononreservoirpredictionandreservoir ac cumulatingfeatureinPutaogouareaofTu Habasin[J].OilGeophysicalProspecting(inChinese),2008,43(5):600~605.[10] 田仁飞,曹俊兴,方磊.时频分析技术及其在识别含气层中的应用———以川中某地区雷口坡组雷3含气层为例[J].天然气地球科学,2008,19(2):72~75.TianRF,CaoJX,FangL.Time frequencyanalysisanditsapplicationingas bearingreservoirs:acasefromtheLei3gas bearingreservoirofLeikoupoformationinaareaofcentralSichuan[J].NatureGasGeosience(inChinese),2008,19(2):72~75.[11] 张波,王真理,周水生,等.谱分解在含气检测中的应用[J].地球物理学进展,2010,25(4):1360~1364.ZhangB,WangZL,ZhouSS,犲狋犪犾.Applicationofspectraldecompositiontogasdetection.ProgressinGeophys.(inChinese),2010,25(4):1360~1364.[12] 董宁,杨立强.基于小波变换的吸收衰减技术在塔河油田储层预测中的应用研究[J].地球物理学进展,2008,23(2):533~538.DongN,YangLQ.Applicationofabsorptionandattenuationbasedonwavelettransformforpredictionofreservoirintaheoilfield[J].ProgressinGeophys.(inChinese),2008,23(2):533~538.[13] 李雄炎,李洪奇.数据挖掘技术在石油天然气勘探领域的应用探索[J].地球物理学进展,2009,24(5):1807~1813.LiXY,LiHQ.Applicationofthedataminingtechniquesinexploringtheoilandnaturalgas[J].ProgressinGeophys.(inChinese),2009,24(5):1807~1813.[14] 林昌荣,王尚旭.局部指数拟合异常提取法在普光气田的应用[J].地球物理学报,2011,54(1):218~226.LinCR,WangSX.ApplicationofthemethodofextractinglocalexponentialfittingabormitytoPuguanggasfield[J].ChineseJ.Geophys.(inChinese),2011,54(1):218~226.[15] 陈玉东.地球物理信息处理基础[M].北京:地质出版社,2006.ChenYD.Basicinformationprocessinggeophysics(inChinese)[M].Beijing:GeologicalPublishingHouse,2006.[16] PhuaPB,IppenE.FastrecursivealgorithmforbroadbandAPFsusingcomplexcepstrums[J].OpticsExpress,2004,12(20):4896~4904.3031。
梅尔倒谱系数的含义
梅尔倒谱系数的含义
梅尔倒谱系数(Mel Cepstrum Coefficient)是一种用于描
述声谱图的数学工具,它是声学信号的一种变换,可以用来区分不同的发声者。
它的最初用途是用来识别和分类声音信号,但是现在也被广泛用于语音识别、语音处理和计算机音频处理方面。
梅尔倒谱系数是根据梅尔频谱(Mel spectrogram)来计算的,它是一种声音信号处理方法,可以将一段时间内的声音信号转换成具有梅尔频率分布的频谱图。
梅尔频率是以人耳对声音的感知为基础的频率,它可以将不同频率的声音分布到不同的频率范围内,从而可以更好的描述声音的特征。
梅尔倒谱系数的计算是通过梅尔频谱图的逆变换完成的,它可以将一段时间内的声音信号从频谱图上的变换到梅尔倒谱系数,从而可以获得声音信号的深度特征信息。
梅尔倒谱系数是一维的,它可以将声音信号分解成一系列的组件,从而帮助我们更深入的理解声音的内部特征,从而更好的识别和分类声音信号。
梅尔倒谱系数的应用非常广泛,它可以用来识别和区分不同的发声者,也可以用来识别语音的语言和语音的性别,还可以用来控制音乐的音色和声音的深度,以及识别声音的文字等。
在计算机音频处理方面,它也有着重要的作用,比如语音识别、语音处理、音乐混音等等,都可以使用梅尔倒谱系数来实现。
总之,梅尔倒谱系数是一种描述声谱图的数学工具,它可以用来识别和分类声音信号,也可以用来识别语音的语言和语音的性别,以及识别声音的文字等,它的应用也非常广泛,可以用于语音处理、语音识别和计算机音频处理等多个方面,是一项非常有用的技术。
倒谱分析 2
实验三、用MATLAB实现语音信号的倒谱分析学院:信息与通信工程学院专业:通信工程班级:通信112学号:*******姓名: ***指导教师:***1.实验目的观察语音信号的倒谱系数,理解并掌握语音信号倒谱分析的原理和语音信号倒谱系数的特点,为深入学习语音信号处理的各种应用奠定基础。
2.实验内容(1)由麦克风采集语音数据,将采集的数据存成WA V文件(要求采样率为8000Hz),存在本人的文件夹中。
(2)读取WA V文件,分别计算并显示一帧浊音和一帧清音的原始语音信号、加窗信号、倒谱(要求窗函数为汉宁窗、帧长为256,帧移为128),观察并分析浊音和清音倒谱的差异,并利用浊音的倒谱近似的估计出浊音的基音周期。
(3)读取WA V文件,选取一帧浊音并显示其波形,计算并显示不同窗函数情况下这帧浊音的加窗信号、倒谱(要求窗函数分别为矩形窗和汉宁窗、帧长为256,帧移为128),观察并分析不同的窗函数对倒谱分析的影响。
3. (1)由麦克风采集语音数据,将采集的数据存成WA V文件(要求采样率为8000Hz),存在本人的文件夹中。
供参考的程序代码:clear;close all;Fs=8000;y=wavrecord(5*Fs,Fs,'double');wavwrite(y,'e:\\my.wav');soundview(y,Fs);(2读取WA V文件,分别计算并显示一帧浊音和一帧清音的原始语音信号、加窗信号、倒谱(要求窗函数为汉宁窗、帧长为256,帧移为128),观察并分析浊音和清音倒谱的差异,并利用浊音的倒谱近似的估计出浊音的基音周期。
供参考的程序代码clear;close all;x= wavread('e:\\my.wav'); % 从文件my.wav读取语音x = double(x);LEN = 256;INC= 128;f = enframe(x, LEN, INC); % 分帧ff=f(36,:); % 选取一帧浊音信号ff1=ff'.*hamming(length(ff)); % 加汉宁窗% 计算倒谱r=fft(ff1);LogMag=log(abs(r));Ceps=ifft(LogMag);LEN1=LEN/2;Ceps1=zeros(LEN,1);Ceps1(1: LEN1-1)= flipud(Ceps(2:LEN1));Ceps1(LEN1:LEN)= Ceps(1:LEN1+1);subplot(3,1,1); plot(ff); % 绘制截取的一帧语音信号axis([0,LEN,-0.5,0.5]);title('截取的一帧语音信号'); xlabel('样点数'); ylabel('幅度');subplot(3,2,1); plot(ff1); % 绘制一帧加窗后的语音信号axis([0,LEN,-0.5,0.5]);title('加汉宁窗的语音帧'); xlabel('样点数'); ylabel('幅度');subplot(3,2,5);Q=[-LEN1+1:1:LEN1];plot(Q,Ceps1); % 绘制倒谱axis([-LEN1+1,LEN1,-2,0.7]);xlabel('倒频/s '); ylabel('倒频谱幅度'); title ('加汉宁窗的倒谱');x= wavread('e:\\my.wav'); % 从文件my.wav读取语音x = double(x);LEN = 256;INC= 128;f = enframe(x, LEN, INC); % 分帧ff=f(36,:); % 选取一帧浊音信号ff1=ff'.*hamming(length(ff)); % 加汉宁窗% 计算倒谱r=fft(ff1);LogMag=log(abs(r));Ceps=ifft(LogMag);LEN1=LEN/2;Ceps1=zeros(LEN,1);Ceps1(1: LEN1-1)= flipud(Ceps(2:LEN1));Ceps1(LEN1:LEN)= Ceps(1:LEN1+1);subplot(3,2,2); plot(ff); % 绘制截取的一帧语音信号axis([0,LEN,-0.5,0.5]);title('截取的一帧语音信号'); xlabel('样点数'); ylabel('幅度');subplot(3,2,4); plot(ff1); % 绘制一帧加窗后的语音信号axis([0,LEN,-0.5,0.5]);title('加汉宁窗的语音帧'); xlabel('样点数'); ylabel('幅度');subplot(3,2,6);Q=[-LEN1+1:1:LEN1];plot(Q,Ceps1); % 绘制倒谱axis([-LEN1+1,LEN1,-2,0.7]);xlabel('倒频/s '); ylabel('倒频谱幅度'); title ('加汉宁窗的倒谱');(3)读取.WA V文件,选取一帧浊音并显示其波形,计算并显示不同窗函数情况下这帧浊音的加窗信号、倒谱(要求窗函数分别为矩形窗和汉宁窗、帧长为256,帧移为128),观察并分析不同的窗函数对倒谱分析的影响。
6.3 倒频谱分析方法
6.3.1 倒频谱的概念
6.3.2 倒频谱与解卷积
6.3.3 倒频谱的应用
对于高速大型旋转机械,其旋转状况较复杂,尤其当设备 出现不对中,轴承或齿轮的缺陷、油膜涡动、磨擦、 陷流及质量不对称等异常现象时,振动更为复杂。此 时用一般频谱分析方法已经难于辩识缺陷的频率分量, 而用倒频谱,则会增强识别能力。
例如一对工作中的齿轮,在实测得到的振动或噪声信号中, 包含着一定数量的周期分量。如果齿轮产生缺陷,则其振动 或噪声信号还将产生大量的谐波分量及边带频率成分。
6.4 细化谱分析方法
细化谱分析是增加频谱中某些部分分辨能力的方法,即 “局部放大”的方法。
实际应用中常有这种情况,即对整个频率范围内的某一 部分希望有较高的分辨率。
%用ZOOM-FFT处理 load zoomfftdata; fi=6;%最小细化截止频率 np=10;%放大倍数 nfft=512;%FFT长度 nt=length(x); fa=fi+0.5*fs/np; %最大细化截止频率 nf=2^nextpow2(nt); na=round(0.5*nf/np+1); %频移 n=0:nt-1; b=n*pi*(fi+fa)/fs;%确定旋转因子 y=x.*exp(-i*b);
例6.5 产生一个由3个频率相近的正弦波 叠加组成的周期信号,分别采用细化 FFT和普通FFT处理,比较两种结果。
%产生信号 clear;
fs=200;%采样频率
N=1024;%采样点数 n=0:N-1;t=n/fs;f=(0:N-1)*fs/N; f1=7;f2=7.2;f3=8; s1=sin(2*pi*f1*t);s2=sin(2*pi*f2*t);s3=sin(2*pi*f3*t); x=s1+s2+s3; save zoomfftdata fs,x
倒谱计算与分析
倒谱计算与分析上式中,虽然 , 的范围均在 内,但 的值可能超过范围。
计算机处理时总相位值只能用其主值 表示,然后把这个相位主值“展开”,得到连续相位。
所以存在下面的情况:(K 为整数) 此时即产生了相位卷绕。
下面介绍几种避免相位卷绕求复倒谱的方法。
最小相位信号法这是解决相位卷绕的一种较好的方法。
但它有一个限制条件:被处理的信号想x(n)必须是最小相位信号。
实际上许多信号就是最小相位信号,或可以看作是最小相位信号。
语音信号的模型就是极点都在z 平面单位圆内的全极点模型,或者极零点都在z 平面单位圆内的极零点模型。
设信号x (n )的z 变换为X (z )=N (z )/ D (z ) ,则有根据z 变换的微分特性有若x (n )是最小相位信号,则 必然是稳定的因果序列。
由Hilbert 变换的性质可知,任一因果复倒谱序列都可分解为偶对称分量和奇对称分量之和: 其中这两个分量的傅里叶变换分别为 的傅里叶变换的实部和虚部。
从而可得)()()(21ωϕωϕωϕ+=)(1ωϕ)(2ωϕ()ππ,-)(ωϕ()ππ,-)(ωΦπωωϕk 2)()(+Φ=)()(ln )(ln )(ˆz D z N z X z X==⎥⎦⎤⎢⎣⎡-=-=-∞-∞=∑)()(ln )(ˆ)(ˆz D z N dz d z z X dzd z z n x n n n [])()()()()()(z D z N z D z N z N z D z'-'-=)(ˆn x )(ˆ)(ˆ)(ˆn x n x n xo e +=[]2/)(ˆ)(ˆ)(ˆn x n x n xe -+=[]2/)(ˆ)(ˆ)(ˆn x n x n xo --=)(ˆn x )(ˆ)(ˆ)(ˆ)(ˆωωωωj Ij R jn n j e X j e X e n x e X +==-∞-∞=∑⎪⎩⎪⎨⎧>=<=0)(ˆ20 )(ˆ00)(ˆn n x n n x n n xe e此即复倒谱的性质3,也就是说一个因果序列可由其偶对称分量来恢复。
倒谱分析
倒谱分析(1).倒频谱的数学描述倒频谱函数CF(q)(power cepstrum)其数学表达式为:(2.6)CF(q)又叫功率倒频谱,或叫对数功率谱的功率谱。
工程上常用的是式(2.6)的开方形式,即:(2.7)C0(q)称为幅值倒频谱,有时简称倒频谱。
倒频谱变量q的物理意义为了使其定义更加明确,还可以定义:(2.8)即倒频谱定义为信号的双边功率谱对数加权,再取其傅里叶逆变换,联系一下信号的自相关函数:看出,这种定义方法与自相关函数很相近,变量q与τ在量纲上完全相同。
为了反映出相位信息,分离后能恢复原信号,又提出一种复倒频谱的运算方法。
若信号x(t)的傅里叶变换为X(f):(2.9)x(t)的倒频谱记为:(2.10)显而易见,它保留了相位的信息。
倒频谱与相关函数不同的只差对数加权,目的是使再变换以后的信号能量集中,扩大动态分析的频谱范围和提高再变换的精度。
还可以解卷积(褶积)成分,易于对原信号的分离和识别。
(2).倒频谱的应用分离信息通道对信号的影响图2.26对数功率谱关系图。
在机械状态监测和故障诊断中,所测得的信号,往往是由故障源经系统路径的传输而得到的响应,也就是说它不是原故障点的信号,如欲得到该源信号,必须删除传递通道的影响。
如在噪声测量时,所测得之信号,不仅有源信号而且又有不同方向反射回来的回声信号的混入,要提取源信号,也必须删除回声的干扰信号。
若系统的输入为x(t),输出为y(t),脉冲响应函数是h(t),两者的时域关系为:y(t)=x(t)*h(t)频域为:Y(f)=X(f)*H(f)或Sy(f)=Sx(f)*|H(f)|2对上式两边取对数,则有:(2.11)式(2.72)关系如图(2.26)所示,源信号为具有明显周期特征的信号,经过系统特性logGk(f)的影响修正,合成而得输出信号logGy(f)。
对于(2.72)式进一步作傅里叶变换,即可得幅值倒频谱:(2.12)即:(2.13)以上推导可知,信号在时域可以利用x(t)与h(t)的卷积求输出;在频域则变成X(f)与H(f)的乘积关系;而在倒频域则变成Cx(q)和Ch(q)相加的关系,使系统特特性Ch(q)与信号特性Cx(q)明显区别开来,这对清除传递通道的影响很有用处,而用功率谱处理就很难实现。
梅尔频率倒谱系数
c(n)
M m1
S
(m)
cos
n(m M
0.5)
(n
0,1,
2,L
p)
当n=0时,c(0)为第0阶MFCC,反应频谱能量
求MFCC LPC转换法
参数转换公式
c0 ln 2
cm
am
m1 k 1
k m
ck amk ,
1 m p
m1 k
cm k 1 m ck amk ,
m p
Generally, a cepstral representation with Q>p coefficients is used, where Q=(3/2)p
滤波器
Hm (k ),1 m M
M为滤波器的个数。每个滤波器具有三角滤波特性,其中心频 率为f(m), 每个带通滤波器的传递函数为:
0
k f (m 1)
f (m) f (m 1)
Hm (k)
f (m 1) k
f (m 1) f (m)
0
(k f (m 1)) ( f (m 1) k f (m))
同态信号处理的基本原理
由于x^(n)为加性信号,所以第二个子系统可对其进行需要 的线性处理得到y^(n)。
第三个子系统是逆特征系统D*-1[ ],它对y^(n)= y1^(n)+y2^(n)进行逆变换,使其恢复为卷积性信号,即进 行了如下处理:
{
(1)Z[ yˆ(n)] Yˆ(z) Yˆ1(z) Yˆ2 (z) (2) exp Yˆ(z) Y (z) Y1(z) Y2 (z)
人的听觉对频率是有选择性的
✓虽然语音信号的大部分功率包含在低频分量中,但是它们对清晰度 的贡献并不大 ✓人耳听到声音的高低与声音频率不成线性关系,而是与该声音频 率的对数近似成线性正比关系
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《视频语音处理技术》倒谱计算与分析学院名称:计算机与信息工程学院专业名称:计算机科学与技术年级班级:姓名:学号:计算机与信息技术学院综合性、设计性实验报告一、 实验目的:对语音信号进行同态分析可得到语音信号的倒谱参数。
语音的倒谱是将语音的短时谱取对数后再进行IDFT 得到的,所以浊音信号的激励反映在倒谱上是同样周期的冲激,借此,可从倒谱波形中估计出基音周期。
对倒谱进行低时窗选,通过语音倒谱分析的最后一级,进行DFT 后的输出即为平滑后的对数模函数,这个平滑的对数谱显示了特定输入语音段的谐振结构,即谱的峰值基本上对应于共振峰频率,对于平滑过的对数谱中的峰值进行定位,即可估计共振峰。
对于倒谱计算与分析的设计实验可作如下训练: 1、复倒谱的几种计算方法: 2、最小相位信号法和递归法; 3、基音检测; 4、共振峰检测。
二、实验仪器或设备:windowsXP 下的Matlab 编程环境 三、总体设计(设计原理、设计方案及流程等)1.复倒谱的几种计算方法:在复倒谱分析中,z 变换后得到的是复数,所以取对数时要进行复对数运算。
这时存在相位的多值性问题,称为“相位卷绕”。
设信号为则其傅里叶变换为对上式取复对数为 则其幅度和相位分别为:)()()(21n x n x n x *=)()()(21ωωωj j j e X e X e X ⋅=)(ln )(ln )(ln 21ωωωj j j e X e X e X +=)(ln )(ln )(ln 21ωωωj j j e X e X e X +=)()()(21ωϕωϕωϕ+=)()()(21ωϕωϕωϕ+=上式中,虽然 , 的范围均在 内,但 的值可能超过范围。
计算机处理时总相位值只能用其主值表示,然后把这个相位 主值“展开”,得到连续相位。
所以存在下面的情况:(K 为整数) 此时即产生了相位卷绕。
下面介绍几种避免相位卷绕求复倒谱的方法。
最小相位信号法这是解决相位卷绕的一种较好的方法。
但它有一个限制条件:被处理的信号想x(n)必须是最小相位信号。
实际上许多信号就是最小相位信号,或可以看作是最小相位信号。
语音信号的模型就是极点都在z 平面单位圆内的全极点模型,或者极零点都在z 平面单位圆内的极零点模型。
设信号x (n )的z 变换为X (z )=N (z )/ D (z ) ,则有根据z 变换的微分特性有若x (n )是最小相位信号,则 必然是稳定的因果序列。
由Hilbert 变换的性质可知,任一因果复倒谱序列都可分解为偶对称分量和奇对称分量之和: 其中这两个分量的傅里叶变换分别为 的傅里叶变换的实部和虚部。
从而可得此即复倒谱的性质3,也就是说一个因果序列可由其偶对称分量来恢复。
如果引入一个)(1ωϕ)(2ωϕ()ππ,-)(ωϕ()ππ,-)(ωΦπωωϕk 2)()(+Φ=)()(ln )(ln )(ˆz D z N z X z X==⎥⎦⎤⎢⎣⎡-=-=-∞-∞=∑)()(ln )(ˆ)(ˆz D z N dz d z z X dzd z z n x n nn [])()()()()()(z D z N z D z N z N z D z'-'-=)(ˆn x )(ˆ)(ˆ)(ˆn x n x n xo e +=[]2/)(ˆ)(ˆ)(ˆn x n x n xe -+=[]2/)(ˆ)(ˆ)(ˆn x n x n xo --=)(ˆn x )(ˆ)(ˆ)(ˆ)(ˆωωωωj Ij R jn n j e X j e X e n x e X +==-∞-∞=∑⎪⎩⎪⎨⎧>=<=0)(ˆ20 )(ˆ00)(ˆn n x n n x n n xe e辅助因子g (n ),上式可写作 其中最小相位信号法求复倒谱原理框图如下这种方法仅限于是最小相位信号的情况。
根据z 变换的微分特性得对上式求逆z 变换,根据z 变换的微分特性,有所以设x (n )是最小相位序列,而最小相位信号序列一定为因果序列 ,所以有由于 及 可得递推公式 递归运算后由复倒谱定义可知 如果x (n )是最大相位序列,则变为00()120n g n n n <⎧⎪==⎨⎪>⎩)n )()()(z X dzdz z X dz d z zX -=- [])()()(ˆn x n n x n x n ⋅=*⋅0)()(ˆ)(≠-⎪⎭⎫ ⎝⎛=∑∞-∞=n k n x k xn k n x k ∑∑-==+-⎪⎭⎫ ⎝⎛=-=100)0()(ˆ)()(ˆ)()(ˆ)()(n k nk x n x k n x k x n k k n x k x n k n x )0(0)(ˆ<=k k x )(0)(ˆn k k n x>=-)0()()(ˆ)0()()(ˆ10x k n x k xn k x n x n x n k -⎪⎭⎫ ⎝⎛-=∑-=[]{}⎭⎬⎫⎩⎨⎧==∑∞-∞=---])(ln[)(ln )(ˆ11n n z n x z n x z z n x[][])0(ln )()0(ln )0(ln )0(1x n x x z z x ===-δ⎪⎩⎪⎨⎧<=>=0 2010 0)(n n n n g 0)()(ˆ)()()(ˆ0<--=∑n k n x k x k n x n x其中 2、基音检测;语音的倒谱是将语音的短时谱取对数后再进行IDFT 得到的,所以浊音信号的周期性激励反映在倒谱上是同样周期的冲激。
借此,可从倒谱波形中估计出基音周期。
一般把倒谱波形中第二个冲激,认为是对应激励源的基频。
下面给出一种倒谱法求基音周期的框图及流程图如下3.共振峰检测倒谱将基音谐波和声道的频谱包络分离开来。
对倒谱进行低时窗选,通过语音倒谱)0(ln )0(ˆx x =图5.8 一种倒谱法求基音周期的实现框图分析系统的最后一级,进行DFT后的输出即为平滑后的对数模函数,这个平滑的对数谱显示了特定输入语音段的谐振结构,即谱的峰值基本上对应于共振蜂频率,对平滑过的对数谱中的峰值进行定位,即可估计共振峰。
原理框图及流程图如下。
图5.12 共振峰检测框图四、实验步骤(包括主要步骤、代码分析等)1.倒谱MATLAB实现代码段clear all; %倒谱[s,fs,nbit]=wavread('beijing.wav'); %读入一段语音b=s'; %将s转置x=b(5000:5399); %取400点语音N=length(x); %读入语音的长度S=fft(x); %对x进行傅里叶变换Sa=log(abs(S)); %log为以e为底的对数sa=ifft(Sa); %对Sa进行傅里叶逆变换ylen=length(sa);for i=1:ylen/2;sal(i)=sa(ylen/2+1-i);endfor i=(ylen/2+1):ylen;sal(i)=sa(i+1-ylen/2);end%绘图figure(1);subplot(2,1,1);plot(x);%axis([0,400,-0.5,0.5])title('截取的语音段');xlabel('样点数');ylabel('幅度');subplot(2,1,2);time2=[-199:1:-1,0:1:200];plot(time2,sa1);%axis([-200,200,-0.5,0.5])title('截取语音的倒谱');xlabel('样点数');ylabel('幅度');运行结果如图:2. 倒谱法求浊音、清音的基音周期function s=p5_2pitchdetectwaveFile='beijing.wav';[y,fs,nbits]=wavread(waveFile);time1=1:length(y);time=(1:length(y))/fs;frameSize=floor(50*fs/1000); % 帧长startIndex=round(5000); % 起始序号endIndex=startIndex+frameSize-1; % 结束序号frame=y(startIndex:endIndex); % 取出该帧frameSize=length(frame);frame2=frame.*hamming(length(frame)); % 加汉明窗rwy=rceps(frame2); % 求倒谱ylen=length(rwy);cepstrum=rwy(1:ylen/2);for i=1:ylen/2;cepstrum1(i)=rwy(ylen/2+1-i);endfor i=(ylen/2+1):ylen;cepstrum1(i)=rwy(i+1-ylen/2);end%基因检测LF=floor(fs/500); %基因周期的范围是70~500Hz HF=floor(fs/70);cn=cepstrum(LF:HF);[mx_cep ind]=max(cn);if mx_cep>0.08&ind>LF;a=fs/(LF+ind);elsea=0;endpitch=a%画图figure(1);subplot(3,1,1);plot(time1,y);title('语音波形');%axis tightylim=get(gca,'ylim');line([time1(startIndex),time1(startIndex)],ylim,'color','r');line([time1(endIndex),time1(endIndex)],ylim,'color','r');xlabel('样点数');ylabel('幅度');subplot(3,1,2);plot(frame);%axis([0,400,-0.5,0.5])title('一帧语音');xlabel('样点数');ylabel('幅度')subplot(3,1,3);time2=[-199:1:-1,0:1:200];plot(time2,cepstrum1);%axis([-200,200,-0.5,0.5])title('一帧语音的倒谱');xlabel('样点数');ylabel('幅度');运行结果如下图:倒谱法求浊音的基音周期清音的倒谱3. 共振峰检测程序waveFile='qinghua.wav';[y,fs,nbits]=wavread(waveFile);time=(1:length(y))/fs;frameSize=floor(40*fs/1000); % 帧长startIndex=round(15000); % 起始序号endIndex=startIndex+frameSize-1; % 结束序号frame=y(startIndex:endIndex); % 取出该帧frameSize=length(frame);frame2=frame.*hamming(length(frame)); %加汉明窗rwy=rceps(frame2); %倒谱求ylen=length(rwy);cepstrum=rwy(1:ylen/2);% 基音检测LF=floor(fs/500);HF=floor(fs/70);cn=cepstrum(LF:HF);[mx_cepind]=max(cn);% 找到最大的突起的位置% 共振峰检测核心代码NN=ind+LF;ham=hamming(NN);cep=cepstrum(1:NN);ceps=cep.*ham; %汉明窗formant1=20*log(abs(fft(ceps)));formant(1:2)=formant1(1:2);for t=3:NN% do some median filteringz=formant1(t-2:t);md=median(z);formant2(t)=md;endfor t=1:NN-1if t<=2formant(t)=formant1(t);elseformant(t)=formant2(t-1)*0.25+formant2(t)*0.5+formant2(t+1)*0.25; endendsubplot(3,1,1);plot(cepstrum);title('倒谱');xlabel('样点数');ylabel('幅度')%axis([0,220,-0.5,0.5])spectral=20*log(abs(fft(frame2)));subplot(3,1,2);xj=(1:length(spectral)/2)*fs/length(spectral);plot(xj,spectral(1:length(spectral)/2));title('频谱');xlabel('频率/Hz');ylabel('幅度/dB') %axis([0,500,-100,50]) subplot(3,1,3); xi=(1:NN/2)*fs/NN; plot(xi,formant(1:NN/2)); title('平滑对数幅度谱'); xlabel('频率/Hz'); ylabel('幅度/dB'); %axis([0,5500,-80,0])运行结果如图所示:020406080100120140160180200220-0.50.5倒谱样点数幅度5001000150020002500300035004000450050005500-100-50050频谱频率/Hz 幅度/d B5001000150020002500300035004000450050005500-80-60-40-20平滑对数幅度谱频率/Hz幅度/d B五、结果分析与总结对语音信号进行同态分析可得到语音信号的倒谱参数。