节能的基于EM分簇与压缩感知的数据收集方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2017 年软件2017,V〇1.38,No. 5第3 8 卷第 5 期COMPUTER ENGINEERING & SOFTWARE 国际IT 传媒品牌
基金项玛办文
节能的基于E M分簾与压缩感知
的数据收集方法
聂文梅,刘宏英
(山西大同大学数学与计算机科学学院,山西大同037009)
摘要:在稠密无线传感网进行数据收集的过程中,网絡寿命的延长一直是人们重点关注的问题。
为了减少能 耗延长网络寿命,从考虑网络数据传输距离和数据传输量两个角度,提出一种基于E M分簇与压缩感知相结合的数 据收集方法。
本文在分簇之前从能耗角度对最优簇数进行了分析。
仿真实验表明该方法能极大地减少数据收集能耗,从而延长无线传感网絡寿命。
关键词:无线传感网;数据收集;压缩感知;分簇;能量有效;E M算法
中图分类号:TP301.6 文献标识码:A D O I: 10.3969/j.issn.l003-6970.2017.05.008
本文著录格式:聂文梅,刘宏英.节能的基于E M分簇与压缩感知的数据收集方法t n.软件,2017, 38 (5): 39-42
Energy-efficient Data Gathering Scheme Based on EM Clustering and Compressed Sensing
NIE Wen-m ei,LIU H ong-ying
{School o f M athematics and Computer Science, Shanxi Datong University, Datong 037009, China)
【A bstract】:In the process o f data collection in dense wireless sensor network,extending the nelwork lifetim e is the focused problem.In order to reduce energy consumption and prolong the network lifetim e,a data collection scheme based on EM clustering and compressed sensing is put forward.This scheme considers the network data transmission distance and data transmission quantity.Before clustering,the optimal number o f clusters is analyzed considering the energy consumption.Experimental results show that the scheme can greatly reduce the energy consumption o f data collection and extend the lifetim e o f the wireless sensor network.
【Key w ords】:Wireless sensor networks;Data gathering;Compressed sensing;Clustering;EM algorithm
0引言
近年来无线传感网在军事、民用和商业上得到 了广泛应用。
无线传感网中的一个重要操作是数据 收集,即从传感器节点收集感知数据并将其传输给 汇聚节点。
各种应用都依赖于有效的数据收集,例 如战场监测、生活习性监测和环境监测等等。
无线传感网数据收集的一个重要挑战是延长网 络寿命。
首先,作为传感器节点的微电子设备的能 源是有限的,而且在许多应用中不便充电;其次,多对一的无线传输方式使得数据收集产生热点问题,即越接近汇聚节点的传感器节点能量消耗越快。
为了延长网络寿命,在数据收集过程中,采用高效节能的算法成为必需的。
设计髙效节能的算法 需要考虑两大主要问题,一个是数据传输距离;另 一个是数据传输量。
针对这两大问题,本文将分簇 和压缩感知相结合,提出了基于E M分簇与压缩感 知相结合的数据收集方法。
E M分簇算法可以使数 据传输距离平方和最小化[1],压缩感知可以有效减 少数据传输量,从而达到节能的目的。
1相关工作
1.1相关研究分析
在稠密无线传感网中,传感器节点的感知数据 通常采取多跳的方式发送给汇聚节点,由于传感器
基金项目:山西大同大学博士科研启动基金(2015-B-05);山西大同大学科研项目(2014K4)
作者简介:聂文梅(1975-),女,讲师,主要研究方向:大数据和无线传感器网络。
刘宏英(1977-),女,讲师,主要研究方向:大数据 和无线传感器网络。
第38卷第5期软 件
节点数目众多,如采用传统的树形路由策略会造成 大量无需参与计算的节点参与测量值的收集。
在数 据收集过程中,如果参与单个测量值的节点数目过 多将产生以下问题:(1)单个测量传输代价太大,导 致整个网络性能提髙有限;(2)参与单个测量值收集 的节点越多测量值越容易出错。
采用傭路由不能减少数据收集过程中的采样数目,但可以减少单个测量 值收集过程中参与的节点数目。
分簇路由数据收集主 要的两个挑战:(1)簇内簇头如何分布,簇内传输代 价最优;(2)网络分成几饥数据收集代价最优。
LEACH[2]是无线传感网中最著名的分簇算法,毎个传感器节点执行该算法,交换剩余能量信息,有较高剩余能量的节点将更可能成为下一个簇头,通过周期性的重新分簇,每个节点消耗的能量接近 于平均。
然而L E A C H是基于每个节点都能与其他 节点相互通信的假设,因此,部署在大范围的WSNs 是不适合使用该算法的。
KO CA[3]和k-CONID[4]都是 分布式分簇的典型算法,K O C A重点关注重叠分簇,K-C O N ID节点互相交换它们的随机ID,有最小ID 的节点被选为簇头。
然而在W S N S中对分布式分簇 算法最小化数据传输很难。
为了实现最小能量的分 簇,需采用集中分簇算法。
PEGASIS[5^K A T mo-b ility[6]是常用的集中分簇算法,PEGASIS基于位置 构建链簇,并且重复选择簇头,它考虑了通信范围 的限制,实现了能量消耗均匀化,然而仍然不能实 现能耗最小化。
K-C O N ID通过采用K-M E A N S算法 进行分簇,这样的分簇结果接近整体最优,然而该 算法没有考虑通信范围限制,因此s in k可能不能从 所有传感器节点收集信息。
为了实现最小化数据传 输和从所有节点收集数据我们需要采用同时考虑节 点位置和通信范围的集中式算法。
E M算法就是一 种既考虑了节点位置又考虑了通信范围的分簇算法。
文献[1]中使用E M分簇算法对稠密无线传感网 进行了数据收集,但收集过程只考虑了缩短传输距 离,但没有考虑传输量。
文献[7]提出了一个新颖的 使用压缩感知进行数据收集的算法方案,该方案只 需要少数压缩测量值,极大的减少了能量消耗。
传统的数据收集[8_13]模式都假设基站静止不动,节点通过多跳的方式向基站传输数据,这样基 站周围的节点由于负载大而成为网络性能的瓶颈,这些节点将会快速死亡,从而缩短网络寿命。
采用 移动汇聚节点(M obile S ink,以下简称M S)收集 数据可以均衡网络能量消耗,剔除网络热点问题。
同时为减少延迟可以利用TSP算法[14]。
1.2 E M分簇算法
E M算法是一种典型的迭代分簇算法,其假设 节点遵循高斯混合分布。
p(x)=^nkA^(x|n k,^k)
k=l
k指簇数,7T k表示第k簇的混合系数。
定义如下:
^(X I^Z)=
exp(
x-^)T S_1 (x-^)|
㈣E l L 2 -x是所有节点的位置向量,h和是簇参数,分别代表第k簇的中心向量和第k簇的协方差矩阵。
E M算法计算每个节点的依赖度值,第n个节 点对第k簇的依赖度计算公式如下:
丫冗k Y(x!>k,Z k)
I^(x t>j,Z j)
E M算法利用如下公式计算极大似然估计:
V=ln p(x|= X111!
n=l [k=l
E M算法重复迭代,直到极大似然值收敛。
1.3压缩感知
假设X^X h X w J,T为稀疏或可压缩信号,其中 x e R n,N e R.Y=[%,Y2,…,Y N]是信号 X的 系数表示基,如果X本身为稀疏信号,则Y可以看 作是单位矩阵。
根据表示基X可以转换为K稀 疏信号S如下:
N
i=l
2006年,D onoho等人提出对于稀疏信号或可 压缩信号而言,只要获取其少量的线性组合值就足 够对压缩信号进行精确恢复。
信号压缩如下:y=^X=j^S
其中多为M*N的矩阵而且M«N,称之为测量 矩阵,y为压缩后的信号,称为测量值向量(M*l 维)平为N*N的表示基。
2 EM分簇与压缩感知结合的数据收集方法
2.1能量模型
W S N中能量的消耗与传输距离d有极大的关 系,当距离d的值小于阈值(^(10= 7^/7^)
《软件》杂志欢迎推荐投稿:cosoft@vip. 163 .com 40
聂文梅等:节能的基于EM分喫与压缩感知的数据收集方法
时,我们可以用自由空间模型来计算能量消耗,否 则用多信道衰减模型。
节点传送或接收L比特的数 据所需能量公式如下:
ET(L,d)= Eelec(L)+Emp(L,d)=
|lE e ie c+iE fsd d<d0
(1)
[iE^+ZE^d4d>d0
ER(L)=LE e le c(2)其中ET(L,d)指传感器节点向距离为d的节点传送 L比特的数据所需要消耗的能量,ER(L)指节点接 收L比特数据的能耗。
Etotal = Ejntra + Einter ( 3 ) Etotal为总的能量消耗,它主要包括簇内能耗E h h 和簇间能耗E i n t e r。
2.2最优簇数分析
假设N个传感器随机均匀分布在方形的感知区 域,每个簇形成半径为R的圆,簇的个数为k,每 个簇内节点个数相同,则每个簇内节点个数为N/k。
随机稀疏测量矩阵的稀疏度为s,每个簇内有m 个传感器节点在发送数据,其余节点处于休眠状态,E(m)= sN/k〇
簇内通信能耗主要包括簇内传感器节点将数据 发送到簇头的能耗和簇头接收数据的能耗。
以理想 状态分析单次数据收集簇内的平均能耗Sintra为:
Eintra=I;ET(L>di)+ mER(L)=
i=l
f](LE e le e+ LE fsdi2 )+ m LEe le e(4)
i=l
其中m=s.N/k为单次数据收集簇内发送数据的节点 数目。
4为节点i到簇头的距离。
为解决W S N中的网络热区问题,本文使用了 移动S in k来从各个簇头收集数据,因此总的主要能耗即为簇内能耗:
/\
E—= M k X(LEe le c+LEfedi2)+mLEe le c(5)
Vi=l )
其中M表示每一个簾中所收集的单个测量值得个 数,由C S来决定。
最佳簇数可以由以下公式定义:
k〇pt = argm ink Etotal(6) 2.3算法步骤
我们的目的是提出一种基于E M分簇和C S相 结合的最小能量消耗的数据收集算法,该方法适用
于密集分布的W SN。
下面A lgorithm1是我们提出的E M首轮分簇算法。
EM Algorithm
Initialize s
Calculate
Initialize cluster centroids
Calculate clusters’ param eters 兀 and X
Calculate and P
W hile |P -pn e w<e do
For n e k
Calculate nth node’s responsibility value .
Calculate num ber o f nodes belong to cluster, Nk
Update the clusters5 parameters t t , |j l and Z
Endfor
Evaluate the log likelihood P new .
Endwhile
Return cluster centroids, |x,E a n d N k
簇内单个测量值的收集算法的整体过程为:首 先,根据能量公式和具体场景移动s in k计算最优簇 数其次,根据上面的算法A lg o rith m l E M对传感器节点进行分簾;然后,在每个簾内使用CS 进行数据的收集;最后移动s in k用最短路径移动算 法对簇头的数据进行收集。
3仿真分析
通过使用C++编程语言并结合M A T LA B对EM 分簇算法进行了仿真。
考虑场景为N=100个节点随 机分布在100 m x l〇〇m的区域的无线传感网。
该区 域中的节点分布如图1所示。
不失一般性,假设基 站在传感区域的中心。
首先,将E M分簇与其它的 分簇算法如K M eans分簇相比较。
如图2所示,显 然可以看出,E M算法的稳定时间要比KM eans算法 的稳定时间明显延后很多,而且E M算法的死亡点 数的增长要更缓慢些。
之后我们又在使用E M算法分簇后的簇内节点 进行数据传输时采用压缩感知C S后的情况进行了 实验分析。
从图3可以看出,采用C S后可以使簇 内节点的能耗均匀分布,很大程度的避免了个别节 点的提前死亡。
4总结
本文提出的E M分簇与C S相结合的算法适用 于密集型大规模网络。
E M分簇算法采用最小化数 据传输距离平方和的方法使簇内节点数据传输时达 到能耗最小。
采用C S后可以使簇内节点的能耗均
41《软件》杂志欢迎推荐投稿:cosoft@
第38卷第5期软件
18〇:+++;
+++
160-+'
14。
-+*+*'+
120’♦♦♦♦-
♦♦
100'♦♦+♦♦♦+"
80-V♦/++♦_
♦♦ ♦♦♦♦♦♦♦
E D-♦+♦♦♦ ♦♦♦
40'++
I
Q_______|________|________|________|________|^____|________|________|________|________
020406080100120140160180200
图1(左)100个点的随机网络;(右)采用EM算法分簇的动态分簇结构Fig.l (left) the network with 100 random nodes; (right) the structure of cluster by EM algorithm
图2 EM分簇与KMeans分簇的死亡点数
Fig.2 the death nodes number of EM cluster
and KMeans cluster
图3 EM分簇与EM和CS相结合的死亡点数
Fig.3 the death nodes number of EM cluster
and the scheme based EM and CS
匀分布,很大程度的避免了个别节点的提前死亡。
仿真实验表明E M分簇与C S相结合的算法性能良 好,可以很大程度的延长网络寿命。
参考文献
[1] Takaishi D, Nishiyama H, Kato N, et al. Toward Energy
Efficient Big Data Gathering in Densely Distributed Sensor
Networks[J]. IEEE Transactions on Emerging Topics in
Computing, 2014, 2(3): 388-397.
[2] W Heinzelman, A Chandrakasan H Balakrishnan. Energy-
efficient communication protocol for wireless microsensor
networks[J]. Proc. 33rd Annu. Hawaii Int. Conf. Syst. Sci.,
Jan. 2000, vol. 2.
[3] M Youssef, A Youssef M Younis. Overlapping multihop
clustering for wireless sensor networks[J]. IEEE Trans.
Parallel Distrib. Syst., vol. 20, no. 12: 1844-1856, Dec. 2009.
[4] T Khac C Hyunseung. Connectivity-based clustering scheme
for mobile and hoc networks[J]. IEEE Int. Conf. RIVF, Jul.
2008: 191-197.
[5] S Lindsey C Raghavendra. PEGASIS: Power-efficient
gathering in sensor information systems[J]. IEEE Aerosp.
Conf. , Mar. 2002: 1125-1130.
[6] H Nakayama, N Ansari, A Jamalipour, N Kato. Fault- resil
ient sensing in wireless sensor networks [J]. Comput. Com-
mun., vol. 30, nos. 11-12: 2375-2384, Sep. 2007.
[7] Xiao-Yang Liu, Yanmin Zhu, et al. Compressive Data
Collection for Wireless Sensor Networks[J]. IEEE Transactions
on Parallel and Distributed Systems, vol. 26, no. 8: 2188-
2197, August 2015.
[8]夏季文,马福昌,乔学工.节能的无线传感器网络分簇路
由算法的研究m.新型工业化,2011,1(8): 56-63.
[9]杜彦敏.无线传感器网络(WSN)安全综述[J].软件,2015,
36(3): 127-131.
[10]聂文梅,刘宏英,张叶娥等.基于大数据的医疗信息平台
建设研究m.山西大同大学学报,2016, 32(2): 8-12.
[11]杜淑颖.基于大型数据集的聚类算法研究[J].软件,2016,
37(01): 132-135.
[12]吕占伟,陶峥.重传下的无线传感器网络的生命周期分析
[J].软件,2015, 36(1): 116-121.
[13]夏娜,冯如吉,蒋建国.W S N s中基于SPSA的数据包长优
化算法[J].新型工业化,2011, 1(3): 1-14.
[14] L Zhu, Z Pan, Y Liu, A Zhan. Analysis of cluster wireless
sensor network based on energy harvesting [J]. International
Conference on Wireless Communications, 2014: 468-472.
《软件》杂志欢迎推荐投稿:cosoft@
42。