移动计算中的群智感知

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

移动计算中的群智感知
Crowd Sensing in Mobile Computing
杨铮 吴陈沭
清华大学
hmilyyz@ wucs32@
完成于7月5日,修改于8月27日
摘要
随着无线通信和传感器技术的快速发展,无线移动终端设备呈爆炸式
普及,市场上的手机和平板电脑等设备集成了越来越多的传感器,拥有越来
越强大的计算和感知能力。

在这样的背景下,群智感知成为当前移动计算中
的研究热点。

无线网络与移动计算的几个著名学术会议中,例如ACM MobiCom、ACM MobiSys、IEEE INFOCOM等,许多论文都采纳了群智感知的
思想。

MobiSys 2011专门开辟一个会议单元收录相关论文,MobiCom 2012
中至少有5篇论文涉及群智感知。

在群智感知中,大量普通用户使用手机、平板电脑等移动设备作为基本感知单元,通过移动互联网进行协作,实现感
知任务分发与感知数据收集利用,最终完成大规模的、复杂的社会感知任务。

简而言之,群智感知发挥“人多力量大”的特点,将大量草根用户拧成一股绳,形成随时随地、无孔不入、与人们生活密切相关的感知系统。

以前需要
耗费大量人力物力的工作例如道路交通情况监测、大规模无线信号勘测等等
都可以通过群智感知的模式来完成。

本文首先介绍了群智感知的基本概念及
其思想,着重讨论了群智感知中的任务分发与收集利用机制,并以监测道路
交通情况和构建建筑物室内地图为代表介绍了两个群智感知的案例,最后在
总结本文的同时探索群智感知中的研究热点。

群智感知的概念
在群智感知中,大量普通用户使用移动设备作为基本感知单元,通过
移动互联网进行协作,实现感知任务分发与感知数据收集利用,最终完成大
规模的、复杂的社会感知任务。

在计算机科学领域,与群智感知相近的概念包括群体计算(Crowd Computing)、参与式感知(Participatory Sensing)、社群感知(Social Sensing)、众包(Crowdsourcing)等等,它们都以大量用户参与作为基础,
可以说在理念上是一致的。

对比群智感知,群体计算包含的范围更广一些, 众包多指是任务分发的机制,而参与式感知和社群感知与群智感知在理念上
近似,但分别强调不同的方面。

在群智感知这种协作模式中,完成复杂感知任务的参与者无需是拥有
专业技能的人士。

与此相反,大量草根用户成为中坚力量,通过合理的协作
来完成他们单独不可能完成的任务。

用户可以主动参与感知任务,也可以被
动参与。

假设我们想知道某一时刻城市道路的拥堵情况,那么各地广播电台
交通台的工作模式就是用户主动参与,依赖于走在路上或者开车的人通过发
短信汇报当时当地的道路交通情况。

如果利用手机中的传感器自动的监测人
群的移动情况并进行汇报,那么就是用户被动参与。

用户被动参与的好处是
用户无需为完成感知任务付出额外的精力和负担,因此用户参与热情高,用
户数量容易提升。

通常来讲,群智感知中的感知任务是复杂的,其感知对象也不仅仅是
一般传感器所感知的温度、湿度、位置等物理属性,更不限于图像、声音等
多媒体数据。

上面提到的道路交通状况,以及其他社会事件、人群的活动
等等都是具有强烈社会属性的,因此在本文中称为社会感知任务。

社会感知
任务具有范围广、规模大、工作任务重等特点,不是一个用户能够轻易完成的。

为了发挥“人多力量大”,群智感知渐露峥嵘,将大量草根用户拧成一
股绳,形成随时随地、无孔不入、与人们生活密切相关的感知系统。

群智感知背后的思想古已有之,近几年移动计算的爆炸式发展拓展了
群智感知的规模,而传感器技术的普及增强了群智感知的力量,很多以前不
易完成的任务变得轻而易举。

在大城市中,监测道路交通状况通常需要耗费
大量人力物力资源,在大街小巷安排交通警察执勤不现实,而部署大量摄像
头还必须要结合上先进的图像分析技术才能自动监测。

有研究者则利用手机
监测人群在公共交通中的运动情况,从而推断出道路拥堵情况。

群智感知还
可应用于灾难场景恢复,用来确定灾难发生的原因,为今后的灾难应变积累
经验寻找突破口。

例如在建筑坍塌或者人群踩踏等事故中,移动设备可以通
过摄像头、GPS等多种传感器成为事故现场的忠实记录者,事故调查人员可
以从大量数据中恢复出事故发生的全貌。

感知任务的分发与收集利用
感知任务的分发与收集利用想起来容易做起来难。

大量用户组织松散,并不是一支“军队”,连“散兵游勇”也谈不上,不是一条命令就可以解决的。

因此,任务的分发和收集利用要做到分工合理、负担合适、激励合情,
让用户愿意参与,有所付出有所获得。

许多群智感知任务通过众包的方式完成感知任务的分发与收集利用。

众包(Crowdsourcing)是《连线》(Wired)杂志2006年发明的一个专业
术语,用来描述一种新的生产组织形式,即企业利用互联网将工作分配出去、
发现创意或解决技术问题。

通过互联网,这些企业可以利用大量用户的创意
和能力。

尤其对于软件业和服务业,这提供了一种组织劳动力的全新方式。

众包和普通意义上的外包(Outsourcing)的主要不同点在于,前者的任务
和问题是外派给不确定的群体,而后者是外派给确定的个体。

上面关于众包的定义,更多的是从商业角度来描述,下面我们从任务
分发和收集利用的具体形式讨论众包的两个例子:SETI@home和reCAPTCHA。

SETI@home 足不出户寻找外星人
SETI@home(Search for Extra Terrestrial Intelligence at Home,在家搜寻
外星智慧)1,是一个通过互联网利用家用个人计算机处理天文数据的分布
式计算项目。

该项目试图通过分析阿雷西博(Arecibo)射电望远镜采集的无
线电信号,搜寻能够证实外星智能生物存在的证据。

SETI@home的工作流
程由5部分组成。

1.由波多黎哥国家天文和电离层中心建立在群山森林环抱中的、直径为
305米的巨型射电望远镜Arecibo搜索太空中的无线电信号。

Arecibo
将每天观测到的大约35 GB的数据记录在海量数字磁带上。

2.SETI@home服务器端把从Arecibo收集到的数据,经过计算分析之后
根据客户的需要和电脑的情况,划分为小的工作单元即数据块。

工作
单元通过因特网传送到全球成千上万个客户端以进行数据处理。

3.SETI@home传送数据结束后将自动切断连接,客户电脑便在计算资
源闲置时(即屏幕保护运行时)开始对数据进行处理。

SETI@home
客户端应用程序对工作单元中的数据完成快速傅立叶变换的计算,其
中大约要进行 1750 亿次运算,当一个工作单元分析完毕,闪烁的小
图标便会提示客户回送并下载新的数据。

4.所有客户端所获得的有价值的信号都将送回到 SETI@home服务器端。

绝大多数客户端软件所找到的信号都是来自于地球的无线电频率干扰,
SETI@home 使用一大批算法和已知电信频率干扰资源的大数据库的
数据来对比,从而排除所有可能的干扰。

对于极少数(可能只有
<0.0001%)未被排除的信号,则将通过下一次观测太空中同一部位进
行确认。

1 /
5.一旦信号被确认,SETI@home 将按照国际天文学联合会
(International Astronomical Union, IAU)的电报发表公告,这是天文
学界取得重大发现时公之于众的一种标准方式。

而用其屏幕保护程序
找到该信号的人,并将和 SETI@home 队伍中的其他成员一起被赋予
“合作发现者”的称号。

SETI@home 工作流程的第2-4步就是典型的通过互联网进行众包的过程,大量闲散计算资源整合在一起完成了规模庞大的计算任务。

巧妙的是,由于计算是在屏保时候完成的,并不对用户的正常使用造成影响,甚至可以说是在用户不知不觉中完成的。

而用户所要做的,仅仅是下载并安装
SETI@home的客户端。

reCAPTCHA 利用全球智慧数字化古籍
提到众包,reCAPTCHA2是不得不提的。

老网民们大概都记得,刚开始上网的时候,是不存在验证码(CAPTCHA)这么一种东西的。

这造成的结
果是,垃圾评论和垃圾邮件可以轻松通过任何一个网站的注册程序,通过各种方式轰炸人民群众的眼球。

发一封垃圾邮件的成本很低,恶意用户仅需注册一个邮箱,就可以向很多目标邮箱地址发动攻势了。

当这个邮箱被列入黑名单后,那就再注册一个,而且注册和发送邮件的过程可以利用计算机自动化的完成。

为了遏制垃圾邮件愈演愈烈的趋势,许多互联网公司都投入了大量的
精力。

大浪淘沙后呈现出的解决方案,就是这个让人民群众微微皱眉,但是让计算机耸肩挠头的验证码。

计算机辨识技术还很落后,对于经过特殊方法扭曲、污染的文字,无法有效辨识。

而人类却可以轻松认出这些文字。

这是一个简单而巧妙的设计,计算机先是产生一个随机的字符串,然后用程序把这个字符串的图像进行随机的污染、扭曲,再显示给显示器前的人或者机器。

凡是能够辨识这些字符的,即为人类。

验证码的广泛使用增加了发送垃圾邮件的成本,注册和发送邮件不再能通过传统的方法自动化完成了。

除了应用于电子邮件,验证码还广泛应用于网站登陆、论坛发帖、电
子商务等等。

尽管输入验证码给正常用户带来了些许负担,但是考虑到使用验证码带来的积极效果,人们也普遍接受了这种方式。

就像北京地铁刚开始实行进站安检的时候,乘客都抱怨耽误时间,影响出行效率。

随着这项政策的展开以及公共安全的需要,乘客也就习惯了这种方式,尽管这种方式对效率的影响也是无疑的。

2 /recaptcha
但是验证码的发展并没有就此结束。

当全世界数以十亿计的人每天都会浪费几秒钟的时间参与辨认文字这一简单活动的时候,其中浪费的人脑智力是否能得到更好的应用呢?在2007年左右,验证码的发明人Luis Von Ahn 提出了新的构想,让人们用这些脑力解决一些计算机无法解决的“图书数字化”问题。

在计算机时代以前,大量信息都存在于书本和报纸等载体上。

如果不经过数字化处理,对于计算机来说这些信息仅以图像的形式存在,在当前信息时代中不能够被有效的利用。

自动化的光学识别技术也不能解决全部问题。

因为早期的印刷术并不精确,文字大小不一,形象有差别。

而且因为印刷品年代久远,拥有各种细微的缺损和污染。

这些缺陷对人眼识别来说不是什么大问题,但对计算机来说就麻烦了。

上述构想最终形成了新一代验证码系统——reCAPTCHA,每天帮助辨识数以百万计的古老印刷品。

问题在于,对于最初的验证码来说,计算机实际上是知道正确答案的,这样才能通过判断用户提供的答案是否正确来检验用户是否为人类。

而reCAPTCHA希望人们辨识的文字,计算机实际上是不知道答案的,那如何能验证返回的答案到底是不是真的呢?reCAPTCHA让人们每次辨识两个,而非一个验证码,其中一个来自于计算机随机生成并经过污染和扭曲的字符串,而另一个则是从印刷品中选取的计算机不认识的字符图像。

只要人们对前一个字符串给出的答案是正确的,那么就判定,人们对后一个验证码的辨识也是正确的。

每次出现的两个字符串的顺序并不是固定的,外观上也是不可分辨的,人们不可能通过只识别计算机生成的验证码来偷懒。

reCAPTCHA目前已被超过10万家网站使用,每天数字化超过4千万单词。

采用这一方法,reCAPTCHA已经帮助完成了整个《纽约时报》130年的报纸存档数字化——这一本可能花费无数时间和资源的工程,在几个月之内就由各位网友们完成了,而且是在网友的事前无知、事后惊讶中完成的。

前不久水木社区上一篇关于reCAPTCHA的介绍文章引起了强烈讨论,大家在赞叹reCAPTCHA设计精巧之余,也表达了“竟然为《纽约时报》服务了这么多年”的感叹。

巧妙的众包机制有种“于无声处听惊雷”的感觉,不知不觉中樯橹灰飞烟灭大功告成。

谁能想到探寻外星智慧以及数字化《纽约时报》类似的大工程竟能通过这样的方式进行?巧妙的众包机制还有种“明修栈道,暗度陈仓”的意味,让用户在休闲、娱乐、享受、获得服务的过程中,完成具有其他目的的任务。

下面以大家熟悉的盲人摸象为例,讨论群智感知中的感知数据收集和利用。

据《涅槃经》记载,从前有四个盲人很想知道大象是什么样子,可他们看不见,只好用手摸。

有人摸到了大象的牙齿认为大象就是一个又粗又大的萝卜,有人摸到了大象的耳朵认为大象就是一把大蒲扇,有人摸到了大象
的腿认为大象是根大柱子,还有人摸到了大象的尾巴认为大象并不大,不过
是根草绳。

这则故事里面的盲人就是感知大象这个任务中的基本感知单元,
尽管是盲人,他们正确感知到了事物,并如实的进行了汇报。

作为个体,这些盲人存在以偏概全的问题;但是作为整体,盲人摸象
失败的原因并不在于“盲”,也不在于感知数据稀缺或者角度片面,而在于
数据没有充分收集和利用。

我们假设将每个盲人的信息进行汇总,那么大象
应该是两颗牙如萝卜、两只耳如蒲扇、四条腿如柱子、一条尾巴如草绳的复
杂的组合体,这样离事实就更近了一些。

在群智感知中也存在同样的问题,一个用户的感知数据可以是没有实
用价值的,但千千万万这样的数据汇聚到一起,会产生质的飞跃,合理的利
用方法可以从大量平凡的数据中挖掘出有价值的信息。

例如,当一个用户感
知到道路行驶缓慢,其原因可能是多种多样的;而当同一路段的大部分用户
都报告此问题,那么则可以比较肯定的认为这段路发生了堵车,并采取相应
的措施。

一个简单的感知数据利用方法是挖掘数据的时间、空间关联性。


如将同一地点的感知数据汇聚到一起,判断该地点所发生的事情以及该地点
的属性。

或者将同一时间的感知数据汇聚到一起,用来挖掘社会热点和流行
信息。

然而,更多情况下,感知数据的收集和利用是因应用而异的,需要根
据应用的特点来设计具体的方式和方法。

传统的互联网终端通过有线方式接入互联网,通常放置于室内环境中
的固定地点,因此不适应用于完成社会感知的任务。

而移动网络的终端设备
随时随地围绕用户身边,在移动网络中通过众包机制完成社会感知的任务是
最合适不过了。

案例分析
案例1:公交车到站时间预测
对于在城市生活的人们来说,公交车是大多数人出门最常见的交通工
具。

随着生活节奏越来越快,公交车到达每站的准确时间对于出行的乘客来
说是很有价值的信息。

许多公交公司提供了公交运行时刻表,乘客可以从中
了解到公交车的首末车时间,发车时间间隔等等。

但是这些信息往往太过粗略,再加上当时当地交通状况的影响,人们很难得到准确的公交车到达时间。

许多商业公司开始提供公交车到达时间方面的信息,但是这样的服务都必须
得到公交公司的配合。

2011年,来自美国伊利诺伊大学芝加哥分校的科研
人员开发出一套基于智能手机的公交车到站预测系统,通过在公交车上嵌入
智能手机,收集公交车运行的相关数据3。

然而不可避免的,改造公交车需
要公交公司的许可与配合,同时也会带来更高的系统部署成本。

3 James Biagioni, Tomas Gerlich, Timothy Merrifield, and Jakob Eriksson. EasyTracker: Automatic Transit Tracking, Mapping, and Arrival Time Prediction Using Smartphones. In Proceedings of ACM SenSys, 2011.
将上述应用向普适的方向再推进一步,新加坡南洋理工大学的Pengfei Zhou、Yuanqing Zheng和Mo Li 开发出一个基于参与感知的公交车到达时间预测系统4。

这套系统的参与者正是经常乘坐公交车的乘客们,整个系统
不需要借助于公交公司的配合,乘客群体自己就可以合作地实现这个系统。

该系统的基本思想是当前正在乘车的乘客们为一个后台服务器提供实时的公交车信息,服务器通过乘客们提供的信息计算预测每一辆公交车到达每个公交车站的时间,并将这样的实时信息提供给正在等公交车或者准备搭乘公交的人们。

那么乘客们怎么提供实时的公交车信息呢?最简单常见的方法是GPS
定位,这是大部分智能手机都可以完成的功能。

但是GPS有其固有的两个缺陷:一是在公交车内,由于车厢阻挡了GPS卫星的信号,GPS 在公交车内定位精度常常不够准确;二是GPS定位的能耗非常高,而智能手机的电池容量相对较小,所以大多数用户平时都是关闭GPS模块的。

如果采用GPS定位,过高的能耗很可能无法吸引乘客们来参与该系统。

基于这些原因,研究人员利用手机信号来定位公交车。

相对于GPS定位,利用手机信号几乎不会给手机带来额外的能量消耗,因为手机需要时刻保持与信号塔的连接。

但是传统的利用手机信号塔定位的方法精度很低,无法满足需求。

实际上,研究人员发现并不需要精确地定出公交车的二维的物理位置,如图1,由于公交车总是在特定的公交线路上行驶的,并不会走到公交线路以外的路段上去,所以每辆公交车的路线其实是非常确定的。

如果将公交线路拉成一条直线,那么公交就是在这条直线上行驶,系统只需要知道公交车在这一维的空间中的位置就可以了。

在手机蜂窝网络中,由于单个手机信号塔的覆盖范围比较小(通常是100~500米),所以乘客在乘坐公交车运动的时候,乘客的手机会不断地从一个信号塔转到另一个信号塔,整个公交线路就形成一个信号塔的序列。

该系统用信号塔序列来表示公交线路。

一个公交线路可以用一个信号塔序列唯一地表示。

图1:公交线路与信号塔序列
4 Pengfei Zhou, Yuanqing Zheng, and Mo Li. How Long to Wait?: Predicting Bus Arrival Time with Mobile Phone based Participatory Sensing. In Proceedings of ACM MobiSys, 2012.
图2:公交预测系统整体框架
该系统中使用一些手机上的轻量级传感器(如加速度计,麦克风等)
来实现自动地数据采集和传输。

图2显示了整体的系统框架图。

整个系统主
要分为三个部分:请求用户、共享乘客和服务器。

请求用户向服务器发出某
一路公交车到达某一个公交车站的时间预测的请求。

共享乘客为后台服务器
提供手机传感信息。

当共享乘客上公交车之后,数据采集模块开始采集周围
环境的信号。

由于乘客们可能采用不同的交通方式,系统需要检测当前乘客
是否在乘坐公交车。

从图2(左侧)中所示,乘客的手机周期性地采集周围
的信号并且智能地识别出公交车的特殊信号特征。

一旦手机检测到乘客在公
交车上,手机便开始周期性地采集手机信号塔信号和加速度信号并且发送给
后台服务器。

整个过程中,公交车检测、数据采集和发送都是自动进行的,
不需要用户的手动输入。

后台服务器完成整个系统中大部分的计算任务。


务器接收来自共享乘客的数据。

通过将共享乘客上传的信号塔信号与数据库
中得信号塔信号进行序列匹配,服务器自动地识别出共享乘客乘坐的具体是
哪一路公交车,并根据信号塔信号将公交车定位在图1所示的一维的线路上,从而为请求用户预测公交车到达时间。

整个系统中,公交车检测和公交车分类是较为核心的两个部分。

现代
的公交系统几乎都使用公交IC卡来收取费用,当乘客们上车的时候,需要
刷卡付费。

而每次刷卡的时候,读卡器都会发出“嘀”的回复声来说明支付
成功。

而这“嘀”的一声通常来说是只有在公交车上才能听到的特定的声音。

从频域上看,新加坡公交车刷卡声音是由1kHz 和3kHz声音信号合成的。

通过检测这两个频带的声音信号,系统就可以准确地检测到公交车。

而在其
他地方人们或许也能听到类似的“嘀”声,但是从频率上看,这样的声音是
非常特殊的,从而可以成为新加坡公交车的一个特征,该系统通过检测这个
特征来自动地识别出公交车。

公交车分类是通过信号塔信号序列匹配的方法
实现的。

当乘客上传了当前公交车的信号塔序列之后,服务器将乘客上传的
信号塔信号与数据库中进行匹配,计算出与其匹配度最高的公交线路,并将
此作为乘客所在公交车的公交线路。

感知道路交通情况是一项复杂的任务。

首先,它的规模宏大,特别是
大城市中的交通状况,空间上连绵上百公里,牵扯几百万辆机动车和更多数
目的行人,绝非“一瓶一钵足矣”的简单任务。

其次,交通具有强烈的空间
与时间关联性,牵一发而动全身,一个轻微的交通事故可以让几公里之外的
车辆排队等待,中小学校放学会造成周边道路临时拥堵。

第三,影响交通状
况的因素众多,工作日写字楼周边拥堵而周末则顺畅,体育比赛造成场馆周
边交通异常,发改委提高油价的指令让加油站挤满了汽车,更不用提北京“7.21”暴雨造成的大面积交通瘫痪。

在这样的背景下,群智感知以其鲜明
的特点契合城市交通感知的需求。

尽管这方面的真实应用和系统部署还处于
襁褓阶段,其中涉及的应用模式、任务分发、数据收集、用户参与策略等等
已成为当前移动计算特别是城市计算的研究热点。

案例2:室内定位与室内地图构建
随着社会的飞速发展,城市中高楼大厦鳞次栉比,宏大的建筑规模以
及复杂的室内环境使得以GPS为代表的室外定位技术不能满足人们日常生活
的需求,人们越来越迫切地需要精准、便捷的室内定位服务。

事实上,室内
定位在十多年前就已经引起了研究者的注意。

早期的尝试工作包括在室内特
定位置上部署特殊的硬件设备,如红外装置、超声波、RFID标签或者传感
器等,作为已知参考点,进而通过测距或测方位等手段来实现室内定位。


些研究工作的方法可以取得较好的定位精度,可是却依赖于特定固件并且需
要提前部署,因此难以推广。

为解决这个问题,研究者提出了一种基于指纹 (fingerprinting)的
定位方法,即利用室内现有的环境特征(如无线信号、声音、光线等)作为
指纹进行定位。

指纹定位方法的核心思想是,人们事先在大楼内对环境信息(通常是无线信号)进行勘测,并建立一个样本数据库以标记每一条指纹数
据对应的实际位置,之后就可以通过指纹的匹配来实现位置估计了。

具体而言,指纹定位方法分为以下两个阶段:训练阶段和运行阶段。

在训练阶段,
定位服务的提供者对定位区域进行细致的勘测,即在每个位置上采集无线信
号样本,并标上对应的位置坐标,由此建立指纹-位置关系的样本数据库。

而在运行阶段,定位服务的使用者上传其所在位置的无线信号指纹数据,与
上述样本数据库中的指纹进行匹配,即得到用户所在的位置坐标。

在所有指
纹定位方法中,基于无线信号的工作最为突出。

微软研究院的两位研究员Victor Bahl和Venkata N. Padmanabhan最早开发了采用WiFi信号作为指
纹的定位系统 RADAR。

随后,从2003年开始,美国马里兰大学的教授Moustafa Youssef带领他的工作团队改进了RADAR,研发出一套新的定位系
统Horus,并发表了一系列室内定位相关的文章。

过去数年中,基于WiFi
信号的指纹定位得到广泛而深入的研究,究其原因,最重要的是WiFi以及
支持WiFi的智能手机在全球范围内得到广泛普及为这一类方法奠定了普适
基础。

不仅是学术界,产业界关于实时定位系统(Real-time Location System)的商用产品亦不少见。

其中,较为知名的有芬兰的Ekahau、英国
的Ubisense、挪威的Sonitor等公司。

尽管采用了不同的技术,这些商业
产品无一例外地都是基于特制的固件和终端。

高昂的价格,特殊的固件,定
制的终端,都使得这些系统难以打开普适室内定位产品市场的大门。

直到今天,真正与普适室内定位服务沾得上边的企业,也仅有大家熟知的Google。

相关文档
最新文档