实验报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一.峰度检测
(一)实验目的
利用峰度检测识别人员活动和车辆的震动信号 (二)实验原理
1. 常规峰值检测算法
峰度是用来反映频数分布曲线顶端尖峭或扁平程度的指标。
有时两组数据的算术平均数、标准差和偏态系数都相同,但他们分布曲线顶端的高耸程度却不同。
统计屮是用四阶屮心矩来测定峰度的。
因为实验研究表明,偶阶屮心矩的大小与图形分布的峰度有关。
其屮的二阶屮心矩就是数据的方差,在一定程度上可以反映分布的峰度,但有时方差相同的数据却有不同的峰度,因此利用四阶屮心矩来反映分布的尖峭程度。
为了消除变量值水平和计是单位不同的影响,实际工作屮利用四阶屮心矩与标准偏差四次方的比值作为衡電峰度的指标,称为峰度系数。
数学统计上,峰度系那定义为:
2
24
4]
)([)()(EX X E EX X E x Kur --==σμ (1) 式中:4μ为随机变量的四阶中心距,σ为标准偏差,E 表示数学期望。
对于离散数据,设样本},...,{21n x x x X =,样本容量为n ,则样本峰度系数定义为
21
2
1
4
22
4
)
()()(∑∑==--==
n
i i
n
i i x x x x n m m x Kur (2)
式中,4m 为四阶中心距,2m 为二阶中心距,i x 是第i 个样本,x 是样本均值。
2. 改进峰值检测算法[1]
将式(2)中的分母用函数)(k ξ代替,由此得到
)
()()(1
4
k x x n x Kur n
i i ξ∑=-=
式中)(k ξ是一个分段函数:
(a) 如果
)1()(2
21
_
-<-∑=k X x n i k ki ξ,则
∑=-=n
i k ki X x k 1
_
2
2)()(ξ
(b) 如果)1()()1(2
21
_
-⨯≤-<
-∑=k r X x k n i k ki ξξ,则
∑=-⨯+--=n
i k ki X x p k p k 1
_
2
2)()1()1()(ξξ
(c) 如果
)1()(2
2
1
_
->-∑=k X x
n
i k
ki ξ ∑=-⨯+--=n
i k ki r X x p k p k 1
_
2
2
)()1()1()(ξξ
(三)实验结果
图1为一组人员走动产生的震动信号,采样频率5000Hz ,使用常规峰值检测算法对信号进行分析的结果如下:
图1
图2为一组履带式车辆产生的震动信号,采样频率为5000Hz ,使用常规峰值检测算法对信号进行分析的结果如下:
图2
图3为一组轮式车辆产生的震动信号,采样频率为5000Hz,使用常规峰值检测算法对
信号进行分析的结果如下:
图3
图4为一组背景信号,采样频率为5000Hz,使用常规峰值检测算法对信号进行分析的
结果如下:
图4
实验表面,如果在样本区间存在人员入侵引起的震动信号,样本峰度系数出现明显上升,因此常规峰度算法可以用于判断是否存在人员入侵目标。
但是当样本区间存在车辆入侵引起的震动信号时,样本峰度系数没有明显变化,与背景噪声产生的样本峰度变化很相近,常规峰度算法无非用于车辆入侵的检测。
图5为一组使用改进峰值检测算法得到的履带式车辆震动信号分析结果,采样5000Hz:
图5
图6为一组使用改进峰值检测算法得到的轮式车辆震动信号分析结果,采样频率
5000Hz:
图6
图7为一组使用改进峰值检测算法得到的人员活动震动信号分析结果,采样频率
5000Hz:
图7
由图6,图7可以看出,改进峰度算法能够检测出人员入侵和车辆入侵,并且有效排除
毛刺信号。
二.过零检测
(一)实验目的
利用过零检测法识别目标震动信号
(二)实验原理
过零率是指在每帧中,震动信号通过零点(从正变为负或从负变为正)的次数。
(三)实验结果
背景噪声的信号波形和短时平均过零率如图8:
履带式车辆的信号波形和短时平均过零率如图9:
轮式车辆的信号波形和短时平均过零率如图10:
人员活动的信号波形和短时平均过零率如图11:
如图所示,背景噪声的短时平均过零率主要分布在0.05到0.1区间,当有车辆入侵时,短时平均过零率出现明显下降,主要分布在0.02左右,与背景噪声的短时平均过零率有明显差别,可以作为车辆入侵的判断依据。
而当人员入侵时,短时平均过零率仍主要集中于0.05-0.1区间,无法作为人员入侵的判断依据。
三.功率谱密度估计
(一)实验目的
利用功率谱密度估计进行震动传感器目标信号的识别
(二)实验原理
功率谱密度简称为功率谱,是自相关函数的傅里叶变换。
对功率谱密度的估计又称功率
谱估计。
经典谱估计是基于傅里叶变换发展而来的谱估计方法,主要包括间接法和直接法。
间接
法在估计功率谱时,不仅要将有限序列数据傅里叶变换,还要建立数据之间的相关函数,形
式较为灵活。
直接法又称周期图法,相比于间接法,周期图法不需要建立序列数据之间的相
关函数,而是在将有限序列数据进行傅里叶变换后,直接用于功率谱估计。
周期图法应用十
分广泛,但是其估计结果的方差偏大,在实际应用中往往采取必要的措施减小估计方差。
减
少周期图方差的方法有几种,由于本文的测量只有一种实现,所以使用Welch 方法来估计震动信号的PSD 。
Welch 功率谱密度估计方法先将数据分段加窗处理,分段进行功率谱密度估计,然后再求出所有段的功率谱密度估计的总平均。
Welch 功率谱密度的基本原理如下:
在计算周期图之前,将震动数据进行分段并加窗。
第i 段被定义为:
()()
iD m x m x i +=, (3.1)
其中()m x 是输入信号序列,D 表示重叠。
对于第i 个窗口段,给出周期图,如下:
()
()()()2
1
21∑-=-=N m fm
j i
i xx
e
m x m NU f p πω, (3.2)
其中()m ω是窗函数,U 是窗口函数的幂,由下式给出:
()
∑-==
1
21N m m N U ω, (3.3)
其中N 是重叠段中的样本数,Welch 功率谱,如下所示:
()()()
∑-==
10
1
K i i
xx
w
xx
f p K f p (3.4)
根据概率统计中方差的性质可知,通过Welch 法估计出的功率谱的方差约是直接估计出的谱的方差的1/K 倍,有效减小了估计的方差。
但是随着分段数量增加,偏差也会增大,导致分辨率下降。
所以在实际应用过程K 和N 值的选取将影响到估计出的功率谱,应根据实验对于方差和分辨率的具体要求,选取适当的K 和N 的值。
(三)实验结果
履带式车辆的功率谱密度估计曲线如图12:
图12
轮式车辆的功率谱密度估计曲线如图13:
图13
将履带式车辆和轮式车辆的功率谱密度估计数据输入RNN网络进行训练和测试,迭代100次,实验结果如下:
准确度函数曲线如下:
损失函数如下:
由图可知,利用功率谱密度估计作为目标识别的信号特征,识别准确率仅为0.65,无法实现履带式车辆和轮式车辆的震动信号识别。
四.梅尔倒谱系数(MFCC)
(一)实验目的
利用梅尔倒谱系数作为震动信号的信号特征进行履带式车辆和轮式车辆的目标识别(二)实验原理
梅尔倒谱系数(Mel-scale Frequency Cepstral Coefficients,简称MFCC)是在Mel标度频率域提取出来的倒谱参数,Mel标度描述了人耳频率的非线性特性,它与频率的关系可用下
式近似表示:
式中f为频率,单位为Hz。
下图展示了Mel频率与线性频率的关系:
语音特征参数MFCC提取过程
1.预加重
预加重处理其实是将语音信号通过一个高通滤波器:
式中的值介于0.9-1.0之间,我们通常取0.97。
预加重的目的是提升高频部分,使信
号的频谱变得平坦,保持在低频到高频的整个频带中,能用同样的信噪比求频谱。
同时,也是为了消除发生过程中声带和嘴唇的效应,来补偿语音信号受到发音系统所抑制的高频部分,也为了突出高频的共振峰。
2.分帧
先将N个采样点集合成一个观测单位,称为帧。
通常情况下N的值为256或512,涵盖的时间约为20~30ms左右。
为了避免相邻两帧的变化过大,因此会让两相邻帧之间有一段重叠区域,此重叠区域包含了M个取样点,通常M的值约为N的1/2或1/3。
通常语音识别所采用语音信号的采样频率为8KHz或16KHz,以8KHz来说,若帧长度为256个采样点,则对应的时间长度是256/8000 1000=32ms。
3.加窗(Hamming Window)
将每一帧乘以汉明窗,以增加帧左端和右端的连续性。
假设分帧后的信号为S(n),
n=0,1,…,N-1, N为帧的大小,那么乘上汉明窗后,W(n)形式如下:
不同的a值会产生不同的汉明窗,一般情况下a取0.46
4.快速傅里叶变换
由于信号在时域上的变换通常很难看出信号的特性,所以通常将它转换为频域上的能量分布来观察,不同的能量分布,就能代表不同语音的特性。
所以在乘上汉明窗后,每帧还必须再经过快速傅里叶变换以得到在频谱上的能量分布。
对分帧加窗后的各帧信号进行快速傅里叶变换得到各帧的频谱。
并对语音信号的频谱取模平方得到语音信号的功率谱。
设语音信号的DFT为:
式中x(n)为输入的语音信号,N表示傅里叶变换的点数。
5.三角带通滤波器
将能量谱通过一组Mel尺度的三角形滤波器组,定义一个有M个滤波器的滤波器组(滤波器的个数和临界带的个数相近),采用的滤波器为三角滤波器,中心频率为。
M通常取22-26。
各f(m)之间的间隔随着m值的减小而缩小,随着m值的增大而增宽,如图所示:
三角滤波器的频率响应定义为:
式中:
三角带通滤波器有两个主要目的:
对频谱进行平滑化,并消除谐波的作用,突显原先语音的共振峰。
(因此一段语音的音调或音高,是不会呈现在MFCC 参数内,换句话说,以MFCC 为特征的语音辨识系统,并不会受到输入语音的音调不同而有所影响)此外,还可以降低运算量。
6.计算每个滤波器组输出的对数能量为
7.经离散余弦变换(DCT)得到MFCC系数
将上述的对数能量带入离散余弦变换,求出L阶的Mel-scale Cepstrum参数。
L阶指MFCC 系数阶数,通常取12-16。
这里M是三角滤波器个数。
8.对数能量
此外,一帧的音量(即能量),也是语音的重要特征,而且非常容易计算。
因此,通常再加上一帧的对数能量(定义:一帧内信号的平方和,再取以10为底的对数值,再乘以10)使得每一帧基本的语音特征就多了一维,包括一个对数能量和剩下的倒频谱参数。
注:若要加入其它语音特征以测试识别率,也可以在此阶段加入,这些常用的其它语音特征包含音高、过零率以及共振峰等。
9.动态查分参数的提取(包括一阶差分和二阶差分)
标准的倒谱参数MFCC只反映了语音参数的静态特性,语音的动态特性可以用这些静态特征的差分谱来描述。
实验证明:把动、静态特征结合起来才能有效提高系统的识别性能。
差分参数的计算可以采用下面的公式:
式中,dt表示第t个一阶差分;Ct表示第t个倒谱系数;Q表示倒谱系数的阶数;K表示一阶导数的时间差,可取1或2。
将上式中结果再代入就可以得到二阶差分的参数。
(三)实验结果
背景噪声的梅尔倒谱系数和原始数据如下图所示:
轮式车辆的梅尔倒谱系数和原始数据如下图所示:
履带式车辆的梅尔倒谱系数和原始数据如下图所示:
将履带式和轮式车辆的MFCC特征输入RNN网络进行训练测试,测试准确率和损失函数如下:
如图所示,利用震动数据的MFCC特征进行履带式车辆和轮式车辆的识别,准确率达到93%。
为了进一步验证识别算法的有效性,接下来进行泛化测试,利用未参与训练的数据对模型进行测试,测试结果如下:
利用未参与训练的数据进行测试,准确率达到了87%,证明MFCC特征对于识别履带式车辆和轮式车辆具有有效性。
将车辆(包含轮式和履带式)和背景噪声的MFCC特征输入RNN网络进行训练和测试,测试结果如下:
如图可知,车辆和背景噪声的识别精度达到了99%,模型可以有效识别车辆信号和背景噪声信号。
测试数据说明
一.车辆测试数据说明
测试时间:201907044上午10:00-11:30
测试产品:10cm孔径集成声阵列1台(1-4通道),动圈式振动传感器2台(5通道,NO1产品、6通道NO2产品)
路面状态:车辆运行于水泥路面,产品布设路边松软泥地,距离水泥路面约0.5m
目标运动方式示意图如下:
[1]一种低复杂度振动信号分类算法。