大数据在医疗领域的应用(下)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

大数据在医疗领域的应用(下)

宁家骏——国家信息化专家咨询委员会委员

二、大数据与云计算相向而行、发展迅速

(三)大数据时代及其特点

我们说现在我们进入大数据时代,为什么叫大数据时代?大家知道,是因为人类前进的脚步有了重大的变化,我们已经从农业社会进入到工业社会,又从工业社会进入到了信息社会,当今我们面临着一个生活、工作和思维方式的巨大变革的时期,就是我们说的大数据的时代。

为什么叫大数据时代呢?也是因为我们人类对信息的利用和认识的手段,经过了5次巨大的变革。比如开始最早的时候,我们的猿人,我们的先祖直立起来,能够进行语言的交换,这是第一轮。之后,在公元3500年有了文字。之后,大家知道是我们国家的骄傲,到了15世纪,我们毕升发明了活字印刷。到了19世纪开始有了电子,比如说电话、广播。到了上世纪有了电视。但是现在大家知道,从20世纪末开始到本世纪,人们更加青睐的互联网。互联网最大的问题就给我们带来了方便。大家过去查个东西很麻烦,以前我们大家知道,比如说过去国家图书馆,你去查资料挺麻烦,你要查一个国外的一个数据库的东西,是报刊的东西,也非常麻烦,还要花很多钱,现在很方便。所以这是我们看到时代的变化,在这样一个时代点上,它推动了我们认知的格局,就是你认识世界、了解世界,你实际是变化,所以这一点是非常重要的。

就是我们开通了新的望远镜,开通萨德,这个坦率说,对我们威胁还是非常大,所以这也就是我们为什么现在更加重视这种数据的分析,比如说韩国部署了萨德,最大的一个问题就是它能够监测我们各种的这种卫星、导弹,我们的部署和活动的信息,所以这是为什么我们坚持反对,这一点是我们一个很大的一个,可以说是必须引起高度警惕的一件事情。所以大数据的利用成了新时代的一个显微镜,一个望远镜。

我们说为什么叫大数据时代?我们要理解大数据,就是因为当今我们有三大定律还在发挥重要作用。第一个就是大家熟知的摩尔定律,英国人摩尔提出说,同一个面积的集成电路上可容纳的晶体管的数,每18个月翻一番,同时性能提高一倍。这个就说明什么呢?我们现在对数据的存储和管理,它的效率越来越高,而且越来越方便了,因为能力提高了,价钱还越来越便宜。

第二个定律就是我们常说叫吉尔德定律,吉尔德定律就是指的在当前,我们凡是一个成功的商业运作,总是把价格最低的资源尽可能消费掉,来保留价格最贵的资源。我们举个例子,比如现在大家上网老是找wifi,因为wifi免费不花钱,你自己流量就可以省一些,而现在的这个发展的趋势,将来就是都可以免费上网,而且速度会越来越高。

第三个定律叫麦特卡尔夫定律,这个老麦是以太网的发明人,也就是我们过去常说的一种网络连接方式,特别是局域网,它的核心的思想就是物以多为贵,就是网络的价值与用户数的平方成正比,也就是你上网的人越多,创造的价值越大。所以这个是为什么当今互联网时代,大家都在争夺用户、争夺入口的一个重要的原因。基于这三大定律我们可以看到,在新的时期,数据成为重要的战略资源,在这样一个背景下面,我们可以看到,就是大数据它的应用呈现了很好的前景,所以这一点是我们必须看到,比如航空公司利用数据搞清楚,怎么样来确定我的航班,怎么样来给航班进行定价,银行利用这个大数据决定把贷款贷给谁,贷给谁,谁最有效益,而且还没有风险。

前面讲了,大数据是不讲为什么,它不讲究数据之间为什么有勾连,它只讲这个关联性,各位领导可能都知道,一个非常熟悉的一个例子,叫做“啤酒尿布效应”,这是在美国的沃尔玛超市里头,超市的经理发现了,就是到了周末的时候,这个尿布的销售量有提高,啤酒销售量也提高,后来这个经理就真正到现场去研究、调研。大家知道,美国人他都是周末的时候,到超市去买一大堆东西回来。然后他就注意到了,一些男性的顾客他要给小孩买纸尿布的时候,他想想给自己还是买点东西,就买啤酒。所以超市老板发现这个之后,本来这两个东西毫不相关,但是通过这个调研之后,它相关了之后,他就在商店里头,把这个啤酒和尿布靠的很近,方便大家买。第二,把那个最不好卖的,价格最贵的啤酒跟尿布放得最近,这样照顾一些人,反正我拿着方便,我也不管什么,这提高了它上涨的效应。

所以大数据的价值重在于挖掘,而挖掘就是分析,我们不仅仅是为了数据而数据,而分析就是找出它们的关联程度,找出它们的交点,找出它们的规律,来提高我们的洞察力。所以我们说大数据它颠覆了很

多传统,比如说过去,我们在各种研究里经常讲抽样调查,现在当然也不能完全代替,但是这个抽样就有问题,你抽的是不是合理?是不是有代表性?你比如说现在经常老百姓吐槽我们现在一些价格的调整,说搞了听证会,说听证会上选的代表,一致都同意涨价,网民都吐槽,说你们这一点代表都没有。所以实际上说,就过去搞抽样调查,也有这个问题,因为你那样本,选择的合理、规范,是不是标准?是不是具有代表性?但现在大数据我不搞抽象调查,我是搞全体的,样本是全部,我这样得出来的结论可能就比抽样要准确得多。

这样一个情况下我们说大数据时代它的核心做的是洞察,洞察有以下几个特色。一个我们可以洞察工作的重点,这点国内外都一样,因为美国也是,它城市里头也有发生丢井盖,或者井盖破损,结果怎么解决这问题呢?美国人也是,也是用了物联网技术,他把井盖都贴上RFID标签,将来一旦没有了,出事了,他自动就警报。

另外可以洞察未来的趋势,这个也是一个很经典的例子,2008年,谷歌就利用网上搜集,搜索到个人,所以它的用户搜索的数据都跟某些看排名,说一发现这段时间大家都在搜流感有关的一些词,可能发生流感,后来就准确预报出来。我们国内其实也有这个例子,2013年,百度的数据分析师就查到网民在国庆节前集中去查询九寨沟的信息,到九寨怎么走?住在哪?怎么玩?当时百度的数据分析师就给有关部门,包括四川省旅游局九寨沟送了这个报告,说今年十一可能游客有爆发性的增长,你们要特别小心。但是很遗憾,这个报告有关部门没重视,结果就造成了什么呢?那个到九寨沟的游客太多,大家知道,进沟是要用他们当地专用的车,车不够,上不去车,结果游客就发生了一些不愉快的事情,什么砸售票处、砸车,这个国际影响很不好。

大数据的洞察还体现在它可以洞察出管理的规律,就像前面我们说的像首尔公共车的部分,还可以洞察出我们生产调度管理的这种其他的缺陷。另外大数据可以用来洞察我们有生产管理的调度。这一点这个华为也是用这个解决了问题。大家知道,华为这个手机出来之后,大家很受欢迎,但是有一段时间这个手机脱销,它其中的问题,大家知道,华为的手机它这个供应链上,也是有一些关键的器件,靠其他的企业来提供,但是当一些企业跟不上它这个调度的时候就会掉链。所以后来华为就利用大数据,包括我们国家信息中心的那个大数据研究的团队,和他们合作,对每一个供应链上的ERP系统的数据进行获取,然后进行分析,每一个环节,每一个零件企业的ERP的数据把它会在一起,然后就可以看到,比如哪个企业它这个环节供不上东西,然后就及时的来提醒他加快进度也好,或者加快进料也好,就使得这个供应链就好了。大数据作为洞察,还可以洞察客户的需求。比如现在电子商务,你要经常在淘宝上买东西,他可以给你画像,因为你老买东西,他知道你身高多少,穿多大的衣服,几码的鞋,你喜欢什么颜色的?另外还可以洞察你的员工的表现,可以洞察你客户的诚信,你可以洞察合适的人选等等。

所以大数据成为当今新的一个数据采集的手段,比如说可以用于在打击犯罪里头分析一些犯罪嫌疑人的行为,进行预测,可以作为预防犯罪一个很重要的。你看我们现在的视频的监控信息,包括一些犯罪嫌疑人指纹的信息,掌纹的信息,甚至人脸图像的信息,都成为我们打击犯罪的重要手段。

(四)大数据的建立

要做好一个大数据,要设计一个大型的系统。首先我们说这个系统应该能够存储数据,能够处理数据,能够开发出相应的应用,然后可以把这些应用放到一个合适的平台上,比如说像现在大家更喜欢把很多应用放在手机上。这个大家随时都可以用,比如现在大家老用的像这种高德地图、百度地图,这种交通流量也是用的大数据。

这里不能不跟大家提到,就是目前大多数系统里头都用了一个比较成熟的技术,叫hadoop,这个词大家知道一下就可以,它是目前一个开源架构的简称,这个基本上是由谷歌开发出来。然后把它作为一个现代支撑大数据应用的一个公共平台。

我们当今要建设一个大数据的系统,就要搭平台、采数据、建模型,然后再编写应用,最后是以图呈现的方式,是一种最好的模式。我们看到,现在比如说华能一些企业都给领导开发了这种大数据的这种领导的决策系统。像华能做的这个东西,它可以每个领导早晨一上班,就可以看到,在这个pad上或者手机智能终端上推送,他们企业昨天一天经营所有的数据,比如发了多少度电,每个电厂发了多少度电,每个电厂发这些电输出了多少,成本是多少,其中包括这个成本是用了哪个煤矿的煤,煤价是多少,运费是多少?而且每天都给你分析它的效益有提升,还是有下降,所以这些是非常重要的。所以我们要建好数据采

相关文档
最新文档