基于核模糊C均值指纹库管理的WIFI室内定位方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于核模糊C均值指纹库管理的WIFI室内定位方法
杨慧琳;黄智刚;刘久文;杜元锋
【摘要】针对目前已有的基于指纹的WIFI室内定位指纹库的管理方法对野值和噪声的敏感性,提出一种基于核模糊C均值聚类的指纹库管理的室内定位方法.利用核函数将指纹库从低维空间映射到高维空间并结合模糊聚类方法在高维空间进行指纹库管理,并在管理后的指纹库上进行定位匹配.将指纹库映射到高维空间可以使指纹库中的数据线性可分,从而实现更好的聚类.核模糊C均值(KFCM-Ⅱ)的聚类鲁棒性能够降低聚类对噪声和野值的敏感性,从而保证系统的鲁棒性.在实测数据的实验中,将所提出的方法与基于K均值聚类和基于模糊C均值聚类的室内定位方法进行对比,实验结果表明,所提出的方法相较于K均值方法和模糊C均值方法聚类准确度分别提高了14.20%和10.58%,定位精度分别提高了26.98%和20.43%.
【期刊名称】《浙江大学学报(工学版)》
【年(卷),期】2016(050)006
【总页数】8页(P1126-1133)
【关键词】WIFI室内定位;指纹;核模糊C均值(KFCM)聚类;鲁棒性;K最近邻居法【作者】杨慧琳;黄智刚;刘久文;杜元锋
【作者单位】北京航空航天大学电子信息与工程学院,北京 100191;北京航空航天大学电子信息与工程学院,北京 100191;北京航空航天大学电子信息与工程学院,北京 100191;北京航空航天大学电子信息与工程学院,北京 100191
【正文语种】中文
【中图分类】TN99
随着无线定位技术的发展和人们对生活品质的不断追求,定位需求从室外延伸到室内.室外主要由GNSS[1]提供服务,而室内受到墙体的遮挡,一般在室内GNSS信号很弱或无法接收,不能提供室内定位服务,因此适用于室内的定位方法得到广泛研究和关注.WIFI定位技术由于具有覆盖范围广、实现成本较低等优点备受人们关注[2].但WIFI信号在室内为多径传播,加上墙体、家具、门窗的阻挡,其经典Log传播模型[3]精度较低不具有普遍适用性.目前WIFI定位系统主要采用场景分析法[4],即将定位区域内指纹点与WIFI信号强度值的映射关系建立成“指纹数据库”,然后将用户收到的接入点(access point, AP)信号强度矢量用匹配算法与指纹库进行匹配得出用户位置.当定位区域范围较大时,如:大型写字楼或大型商场的指纹库数据量庞大,逐一遍历指纹点进行匹配的计算量十分可观,系统负担繁重.因此,研究人员提出将聚类技术用于指纹库管理,在离线阶段对指纹库进行有效聚类,使得在线匹配时只需要先锁定所属的类,然后遍历所属类中的指纹点进行匹配即可.该方法在很大程度上降低了计算负荷和能耗,可有效提高定位实时性,已成为基于WIFI的室内定位系统研究热点.
目前指纹库聚类方法包括Affinity propagation[5-6],SVM-C[7],K均值[8],Fuzzy C-Means[9-11].Affinity propagation将指纹点看作网内结点,在结点之间传递吸引度和隶属度信息进行聚类,该方法产生的中心是真实的指纹点,不需要预设聚类数目,但该方法的聚类数目受每个结点的优先权值影响,优先权值越大聚类数目越多,但并非聚类数目越多聚类效果就越好,且其实现复杂度较大.SVM-C使用收集到的所有接收信号强度指示(received signal strength indicator,RSSI)取代均值,将待聚类的指纹库中指纹点的信号强度矢量映射到高维特征空间,然后根据指纹点与每个类的超平面间的距离进行类别划分,该聚类方法需要将所有收到的RSSI值都进行比较分类,需要训练出多个二分类器,实现较复杂且不能有效处理RSSI中的野值.K均
值通过随机初始化聚类中心和指定聚类数然后不断迭代优化使得所有类成员与相应类中心的欧氏距离之和最小来获得聚类结果,K均值虽然能够实现类的划分,但只是简单地在低维空间计算并比较欧氏距离的大小,不能有效处理线性不可分数据,且目标优化函数不可微,使得算法没有一个终止准则,结果严重依赖于初始聚类中心的选取.Suroso等[9]提出基于FCM的指纹库管理方法,引入每个指纹点相对于每类的隶属度,该方法属于模糊聚类,解决了目标优化函数不可微的问题,但仍然存在对于噪声及野值敏感的不足.Yang等[12]提出修改的鲁棒型准则函数改善算法噪声敏感性,但只适合于只有1种噪声的情形,而在室内环境中,传播环境复杂且具有时变性.
相较于Affinity propagation和SVM-C实现的复杂性,本文提出一种实现较简便且具有改善指纹库聚类效果和鲁棒性的指纹库管理方法,与KNN结合进行匹配定位,即基于KFCM的WIFI室内指纹定位方法.将核聚类用于指纹库的管理,把指纹库中非线性的RSSI通过核函数映射到高维空间实现线性可分,在高维空间中进行聚类处理.本文提出的方法能够充分利用指纹库信息,有效处理噪声,提高定位系统精度和鲁棒性.
1.1 基于WIFI的室内指纹定位系统
基于WIFI 的室内指纹定位分为离线阶段和在线阶段.离线阶段进行定位区域内指纹点的划分和每个指纹点接收到的信号强度矢量的采集,构建指纹库,指纹点坐标已知.设共有n个指纹点,d个WIFI的接入点(AP),则第i个指纹点采集的接收信号强度RSSI向量为xi=(xi1,xi2,xi3,…,xid),将每一个指纹点的编号和RSSI映射存储到数据库中,形成定位指纹库.
在未加指纹库聚类时,在线阶段将用户实时接收到的RSSI向量上传到服务器(一般为降低终端负荷,采用终端—服务器模式提供定位服务),并通过定位匹配算法与指纹库中的所有指纹点进行匹配,选取匹配度最高的N个点,对这N个点的坐标进行加权求算术平均后得到用户位置,再返回给用户.基于WIFI指纹的定位系统图如图1
所示.箭头接向结点1时表示无聚类的系统;箭头接向结点2时表示添加聚类后的系统,这时实时接收到的RSSI与指纹库进行二次匹配,第一次与各类中心进行匹配确定所属的类,第二次与此类中的指纹点进行匹配得到用户位置.
1.2 基于KFCM的室内定位指纹库管理
好的聚类具有高的类内紧密度和类间分离度,类内紧密度越高则认为数据点归到正确的类的程度越高,类间分离度越大.由于核函数[13-14]有能够在不需要具体求出映射函数的情况下隐式地降低维空间内的数据映射到高维空间实现线性可分且计算简便的特点,已经被广泛用于模式识别领域[15].室内WIFI信号具有非线性特性,每个指纹点接收到的RSSI为非线性数据,是线性不可分的,核函数的性质能够有效处理这种非线性,使其实现线性可分,因此在室内定位中也得到了广泛应用[16].将基于核函数的核聚类KFCM-II[17]用于指纹库管理,提出基于KFCM-II聚类的WIFI室内指纹定位方法.利用KFCM-II聚类能够有效处理非线性样本和聚类本身具有鲁棒性特点[18],在降低计算量和能耗、提高定位实时性的同时提高定位系统精度和鲁棒性.指纹库管理选用高斯核函数[19],在聚类划分时将有限维信号强度向量映射到无限维空间中,使得指纹点的接收信号强度向量在高维空间中线性可分;充分将指纹点间的接收信号强度向量的内在联系显现出来;将具有相似特性的指纹点聚到同一类中,使得聚类更加准确.如图2所示为K均值和高斯核映射的示意图,不同的形状表示不同类的样本.
KFCM-II指纹库管理步骤:
1) 初始化聚类数目c和模糊度m的值;
2) 初始化c个聚类中心,在n个指纹点中随机选取c个互不相同的指纹点进行聚类中心初始化;
3) 重复以下步骤直至目标函数的变化小于0.000 01:
a. 根据下式更新隶属度:
uki=.
b. 根据下式更新聚类中心:
c. 高斯核函数:
式中:σ表示高斯函数的径向作用范围,根据不同的样本集进行训练调整.
Jm(u,v)为以u,v为变量的指纹库管理目标函数,u为隶属度,v为聚类中心,c为聚类
的数目,k=1,2,…,c为第k类,i=1,2,…,n为第i个指纹点,共有n个指纹点,uki为第i
个指纹点属于第k类的隶属度,m为聚类模糊度,xi=(xi1,xi2,xi3,…,xid)为第i个指纹点的RSSI向量,vk=(vk1,vk2,…,vkd)为第k个聚类中心向量,φ(xi),φ(vk)分别表示
指纹点i和第k类中心映射到高维空间中的向量,2表示两者的欧氏距离.指纹库管
理过程是一个交叉优化的迭代过程,最终使指纹库管理目标函数(式(1))达到预设条件.
1.3 定位匹配算法
采用最近K近邻算法[20](KNN)作为定位阶段的匹配算法.KNN从最小距离开始选取K(K≥2)个最接近的指纹库矢量,再计算其平均坐标作为待测目标的位置输出.
设Sij是指纹库中第i个AP的第j个样值,Si是在线阶段第i个AP的一个观测值,d 是AP的个数,n是指纹点的数目.Si与数据Sij之间的欧式距离为
在结果中从小到大选取K个指纹点,利用下式计算出位置坐标的均值作为结果输出:式中:(xl,yl)为第l个被选取的指纹点所对应的坐标.
2.1 实验部署
为验证本文提出方法的有效性,在北京市中关村欧美汇商场二层进行了指纹库采样
和实验,欧美汇二层平面图如图3所示.
欧美汇地形为非规则形状,坐标轴选取如图3所示,采用商场里已有的AP(共检测到312个)采集指纹,以走道方向为纵向,在较窄的走道处横向采集1个点,较宽的部分
横向采2个点,每隔1.8 m布置1个指纹点进行采样,共183个指纹点,采样设备是
华为手机P6,采样APP是用安卓开发的WIFI Scanner,每个指纹点采60 s,间隔1 s 采1次,然后将信号强度做算术平均处理后跟指纹点ID、坐标形成映射一同存入指纹库,作为定位的原始指纹数据库.聚类处理及定位匹配在CPU为Intel core i5-4690K,内存16 GB的台式电脑上进行.将原始数据库用本文提出的指纹库管理办法进行处理,生成最终的指纹数据库.从原点开始绕二层走一圈采集了72个测试点,测试点轨迹如图4所示,每个测试点上采集30 s,间隔1 s采1次,每个点上形成30组数据,共30×72=2 160组数据进行匹配,测试点真实的类与匹配后的类不同则认为聚错,统计聚错的百分比、计算最终定位的误差和标准差进行比较,定位匹配中KNN 的K取值为2.
2.2 实验结果
2.2.1 c值的选取c值代表聚类数目,采用基于密度的方法来进行了c值选取[21].分别计算每个参考点与剩余参考点的RSSI欧式距离,根据式(7)计算第i个参考点的密度ρi,再根据式(8)计算第i参考点与比它拥有更高密度的参考点的欧式距离的最小值δi,对于具有最高密度的参考点则取δi=maxj(dij).根据每个参考点的ρi,δi可作ρ-δ图,如图5所示.
式中:dij表示参考点i和j的RSSI的欧氏距离,dc为密度阈值.
从图5中可以看出,在密度较大的区域有3个参考点的δ值较突出,说明该3个参考点拥有较高密度的同时,与其他高密度参考点欧式距离的最小值较远,因此本文将c 值取为3.
2.2.2 σ值和m值的选取σ是高斯核函数参数,σ值的大小控制了高斯核函数的径向作用范围,可选取与样本超球面半径倒数相当的值[14].本文分别选取了[3,21]内步长为3的值进行多次实验取均值.表1表明在本实验环境中,σ值取15最佳,其中a为定位平均误差,p为聚错百分比.m为聚类模糊度,取值范围为[1,+∞],但m值过大会导致聚类效果很差,实验中m取值在[1.1,2.5]内以步长0.1进行,多次实验取
均值.由表2可知,在本实验环境中,当m>2.1后定位误差趋于稳定,m取1.5时效果最佳.
2.2.3 KFCM与FCM、K均值的比较在没有障碍物时,WIFI信号的传播随着距离的增加呈对数模型衰减,邻近指纹点的RSSI具有类似的特点,因此,认为地理位置接近的指纹点更有可能属于同一类.实验结果显示,本文提出的指纹库管理方法能够有效地将类与类区分,尤其是在类与类的边界处.FCM和K均值的聚类效果没有本文提出的方法的聚类效果好,尤其是在类与类的边界处经常出现类别的交叉,本文提出方法、FCM和K均值的聚类效果如图7所示,所属同一类的指纹点用同一个灰度表示,不同的颜色表示属于不同的类.
由于采用的是商场内部已部署的AP,其稳定性要比专门部署的AP差,在每秒采集数据的时候会出现某些AP信号的缺失,导致定位信息的缺失.在此情况下,本文提出的方法显示出优越性,在用2 160组数据进行匹配后得到平均聚错率为5.12%,而FCM和K均值的平均聚错率分别为14.56%、17.27%.
图8和表3分别显示了本文方法、FCM+KNN和K均值+KNN的定位误差累计分布函数(cumulative distribuion function, CDF)图、最大误差、平均误差、标准差及误差4 m以内的百分比.其中ε为定位误差,b为最大误差、a为平均误差、s 为标准差,w为误差4 m以内的百分比,结果表明本文方法有90.71%的测试点误差在4 m以内,而FCM+KNN和K均值+KNN分别为77.60%和70.49%.
2.2.4 KFCM鲁棒性的验证WIFI信号波动较大,同一个AP在不同的时刻值波动范围在5 dB左右.如图6所示为在同一指纹点AP1和AP2在不同时刻的信号波动图.为验证本文方法的鲁棒性,在指纹点中人为加入干扰,在183个指纹点中随机选取30个指纹点将其RSSI中的元素加入均值为0、标准差为5的高斯噪声,重新进行指纹库管理,再次比较本文方法与FCM+KNN、K均值+KNN的聚类结果和定位结果,实验结果如图9、10和表4所示.可以看到在加入高斯噪声后,本文方法仍有
85.25%的测试点定位误差在4 m以内,而FCM+content_center
(1) 本文提出的基于KFCM-II的指纹库管理方法能够对指纹库进行有效聚类,聚类准确度相较于FCM和K均值分别提高了10.58%、14.20%.
(2) 本文提出的基于KFCM-II的WIFI室内定位方法相较于FCM+KNN和K均值+KNN的定位精度有明显提高,以均方误差计分别提高了20.43%和26.98%,测试点误差在4 m以内的百分比分别提高了16.89%和26.68%.
(3) 在加入干扰后,本文方法的定位精度以均方误差计仅下降了0.503 2 m,而FCM+KNN和K均值+KNN分别下降了1.783 4 m和1.717 5 m,测试点误差在4 m以内的百分比仅下降了5.46%,而FCM+KNN和K均值+KNN分别下降了17.49%和14.21%.显示出本文提出方法较FCM+KNN和K均值+KNN的鲁棒性.
【相关文献】
[1] 季宇虹,王让会.全球导航定位系统GNSS的技术与应用[J].全球定位系统,2010, 35(5): 69-75.
JI Yu-hong, WANG Rang-hui. Technologies and applications of GNSS [J]. Global Positioning System, 2010, 35(5): 69-75.
[2] MAINETTI L, PATRONO L, SERGI I. A survey on indoor positioning systems [C]∥ 2014 22nd International Conference on Software, Telecommunications and Computer Networks (SoftCOM). Split: IEEE, 2014: 111-120.
[3] 姜莉.基于WiFi室内定位关键技术的研究[D].大连:大连理工大学, 2010.
JIANG Li, Research on the key technology of indoor location based on Wi-Fi [D]. Dalian: Dalian University of Technology, 2010.
[4] YOUSSEF M. A WIFI-based indoor location determination system [D].City of College Park: University of Maryland.2004.
[5] TIAN Z, TANG X, ZHOU M, et al. Fingerprint indoor positioning algorithm based on affinity propagation clustering [J]. EURASIP Journal on Wireless Communications and Networking, 2013, 2013(1): 1-8.
[6] FREY B J, DUECK D. Clustering by passing messages between data points[J]. Science, 2007, 315(5814):972-976.
[7] LEE C W, LIN T N, FANG S H, et al. A novel clustering-based approach of indoor location fingerprinting [C]∥2013 IEEE 24th International Symposium o n Personal Indoor
and Mobile Radio Communications (PIMRC). London: IEEE, 2013: 3191-3196.
[8] BAI S, WU T. Analysis of K-Means algorithm on fingerprint based indoor localization system[C]∥2013 IEEE 5th International Symposium on Microwave, Antenna, Propaga tion and EMC Technologies for Wireless Communications (MAPE). Chengdu: IEEE, 2013: 44-48.
[9] SUROSO D J, CHERNTANOMWONG P, SOORAKSA P, et al. Location fingerprint technique using fuzzy C-means clustering algorithm for indoor localization [C]∥ TENCON 2011-2011 IEEE Region 10th Conference.Bali: IEEE, 2011: 88-92.
[10] ZHOU H, VAN N N. Indoor fingerprint localization based on fuzzy c-means clustering
[C]∥2014 Sixth International Conference on Measuring Technology and Mechatronics Automation (ICMTMA). Zhangjiajie: IEEE, 2014: 337-340.
[11] ZIJIE Q, ZHAN X, DAN L, et al. Algorithm of indoor location based on RSS and secondly fuzzy clustering [C]∥2013 International Conference on Communications, Circuits and Systems (ICCCAS). Chengdu: IEEE, 2013: 55-58.
[12] SZOTT S, GOZDECKI J, KOSEK-SZOTT K, et al. The risks of wifi flexibility: Enabling and detecting cheating [C] ∥ Future Network and Mobile Summit (Future Network Summit). 2013, Lisbon: IEEE, 2013: 1-9.
[13] FILIPPONE M, CAMASTRA F, MASULLI F, et al. A survey of kernel and spectral methods for clustering [J]. Pattern Recognition, 2008, 41(1): 176-190.
[14]张莉,周伟达.核聚类算法[J].计算机学报, 2002, 25(6): 587-590.
ZHANG Li, ZHOU Wei-da, Kernel clustering algorithm [J]. Chinese Journal of Computers, 2002, 25(6):587-590.
[15] SHAWE-TAYLOR J, CRISTIANINI N. Kernel methods for pattern analysis [M]. Cambridge: Cambridge University Press, 2004: 17-19.
[16] XU Y, DENG Z, MENG W. An indoor positioning algorithm with kernel direct discriminant analysis [C]∥Global Telecommunications Confer ence (GLOBECOM 2010). Miami: IEEE, 2010: 1-5.
[17] GRAVES D, PEDRYCZ W. Kernel-based fuzzy clustering and fuzzy clustering: a comparative experimental study [J]. Fuzzy Sets and Systems, 2010, 161(4):522-543. [18] 李道华.基于核函数参数优化的FCM聚类算法研究[D].哈尔滨:哈尔滨工业大学,2008
LI Dao-hua, A study of a new fcm clustering algorithm based on the kernel method with optimized parameters[D]. Harbin: Harbin Institute of Technology, 2008.
[19] 王华忠, 俞金寿. 核函数方法及其模型选择[J]. 江南大学学报: 2006, 5(4): 500-504.
WANG Hua-zhong, YU Jin-shou. Study on the Kernel-based methods and its model selection [J]. Journal of Southern Yangtze University: Natural Science Edition, 2006, 5(4): 500-504.
[20] 秦泗明.基于位置指纹的WiFi室内定位技术研究[D].成都:电子科技大学, 2010.
QIN Si-ming, The WiFi indoor location technology based on the fingerprint[D]. Chengdu:
University of Electronic Science and Technology of China, 2010.
[21] RODRIGUEZ A, LAIO A. Clustering by fast search and find of density peaks [J]. Science, 2014, 344(6191): 1492-1496.。