大数据时代下的创新思维20170816
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大数据时代下的创新思维
一、大数据时代下的创新思维
一、过去与未来:摩尔定律的时代VS数据为王的时代
在过去的五十年里,人类整个的发展根本的动力从科技的角度来讲,就是一个摩尔定律,什么意思呢?就是在1965年的时候,英特尔公司后来的创始人摩尔先生,他提出来在今后的十几年里,半导体处理器的性能,比如说容量、计算速度和复杂程度每18个月左右可以翻一番,他也没有预想到这件事一直发生了五十年,以至于整个人类发生了天翻地覆的变化。可以这么讲,我们过去的整个的社会的科技进步、工业进步以及这个GDP的提升都是靠这个摩尔定律,如果我们把这个摩尔定律带来的电信化从过去五十年中拿去,我们会发现我们可能GDP不但没有增加,而且还在减少。那么这是过去五十年的情况,在今后二十年它又会往哪儿走呢?
在未来的二十年里,什么决定世界经济发展的方向?我认为如果说过去五十年是摩尔定律的时代,未来二十年就是数据为王的时代。大数据会带来机器智能,也就是说让我们的计算机变得非常聪明,以至于它超过我们人类的智能。为什么这么说呢?我们刚才讲了,计算机的发展速度本身是一个指数增长,而我们人的智能的发展速度是一个线性增长,甚至还会稍微慢一点,那么一定在某一个时间点,它会重合。今天可能就是这个重合的时间点,那可能你又会问了,为什么正好在这个时间点上,我们会有这么多的数据?一个是互联网的收集和积累,再有一个就是今天各种传感器,各种智能设备,各种监控设备,它们无时无刻地不在为我们提供大量的数据。而在我们过去,因为存储量、计算量不够的时候,我们把这些数据都抛弃掉了,不是说这些数据在过去不存在现在存在,只是说我们现在因为半导体事业的发展,我们有能力、有可能来存储和处理这样一些数据。
二、什么是机器智能
在讲机器智能以前,我们就首先要说说,什么是机器智能?我们都知道1946年人类第一台电子计算机诞生了,名字叫做ENIAC(电子数值积分计算机)诞生。那台计算机其实计算速度只有一秒钟五千次,大概是你的手机计算速度差不多可能几十万分之一。那么计算机诞生后不久,人类其实就开始考虑,说既然这个计算机计算速度能这么快,它能不能产生一些智能?所以五十年代初的时候,计算机老祖宗阿兰图灵就提出了一个叫图灵测试的概念。什么意思呢?就是说在屏幕后面,我放一台机器放一个人,然后我们问他一个问题,比如说天为什么是蓝色的?计算机给一个,人给一个,给出的答案让我来判断,说哪一个计算机给的?哪个是人给的?如果我判断不出来,哪个答案是计算机给的或者是人给的,已经能够把这两个答案要混淆起来了,我就认为机器和人一样的智能。人类为这个目标做了20年,这20
年的发展非常不顺利,到了1970年基本上计算机还做不了任何具有智能的事情。为什么会产生这样的问题呢?或者说这20年研究为什么会走弯路呢?主要是我们完全地按照人的方式去理解机器,没有完全按机器的方式理解。
举一个例子,预测美国总统选举结果这么一个例子。比较著名的大家可能听说过盖洛普这样一个预测公司,那么它实际上是用一些传统的抽样的统计方法做一些预测,有时灵,有时不灵。即使正确的时候,基本上误差两到三个百分点,在全国范围预测能准,但是你知道竞选是一个州一个州这么算选票,它不是一人一票制,所以它从来没有做到过美国50个州全部做对的。到了2012年,有一个毛头小伙子,这个人从来以前没有名,也不是什么了不得的科学家,他就做了一件事儿,他就在互联网上比如社交网络上,比如脸书上、推特上、地方
的报纸上、大家的论坛上等等,凡是他能找到信息的地方,他就把信息都搜集起来,然后他做一次2012年美国总统选举结果的预测,50个州他全部预测对了。这件事在过去是不敢想象的,从这里头你可以看出,当这个数据完备了以后是非常可怕的。
三、大数据——一种颠覆式的思维方式
大家不知道有没有注意到这个名词大数据Big data,为什么不叫large data?其实在英语里,它并不是说一开始随机的选了这么一个词Big data就这么叫了,在英语里这个Big和Large虽然都是大的意思,但是有一个比较细微的差别,Big这个大是相对抽象一点的一个概念,Big、Small大和小是这样子。那Large是体量大,比如我这张桌子很大,我说Large table。大数据所以用big data,实际上它是指一种思维方式,一种抽象的概念。它不仅仅是讲我们数据的体量大,那么既然说到它是一个思维方式,是什么样的一个思维方式呢?
我给大家再举一个例子。你从中学开始到大学,你的老师就会教你说因果逻辑关系非常重要,为什么呢?因为没有了这个因果逻辑,我们这个推理就进行不下去了,过去说知其然一定要知其所以然。刚才我们就讲了那个美国总统竞选预测的这件事儿,它实际上就告诉了你一个结果,你问他为什么是这样子?是哪个州的人喜欢某个候选人哪句话吗?不是,他说不出这原因,但是它就给了个结果。这就是现在说先有了结论,然后你可能反过来推这些其中的原因,这是一个完全不同的思维方式。所以叫大数据,是指全新的这么一个思维方式。
在2002年到2004年左右的时候,我在一家计算机公司做搜索,那么当时因为数据量变得很大,我们就观察到很多特点,你比如说你搜索了一个关健词,我们就说“凤凰卫视大数据”这样一个关健词。用户老不点击第一条结果,老点击第三条结果,这里头就有一个原因,肯定你第一条结果做得不好,第三条结果可能更好。那么你的思维方式是什么样?你是否接受说把第三条结果我直接就搬到第一条去?按我们过去老师教我们的,因果关系你是不能这么做的,因为你不能跳过这个推理的过程来做件事,但是大数据的思维告诉你这件事儿是可以做的。当我们的脑筋转换成这样的一种思路的时候,我们实际上就是一个开始具有某种大数据的思维,这时候也就是我们在变相地承认,计算机在有一些方面其实比我们因为有数据的作用做的更好了。
(一)大数据+机器智能:革新传统行业
我想说,为什么说大数据这个事这么重要?大数据加上机器智能,它可以把我们以前所有的行业,全部的改造的一遍,或者我换一句话说,就是说所有未来公司,都是某种程度上的一个大数据公司,我们不妨看两个传统行业的例子。
第一个是关于意大利一个品牌服装公司的例子,大家知道可能如果你们去一些专卖店,你就会发现它把某一件衣裳,有的放在前面,有的放在后面,这里头可能有一些道理,但是你也说不出有什么道理。我和他们这些公司的有些销售人员做过一些了解,事实上像它们这些大牌的公司,在北京开一家这种专卖店,就是一比一的模型差不多要做三个,才能确定这个店里头的结构怎么布置,哪件衣裳放前头,哪件衣裳放后面更好。即使如此,这完全靠过去营销人员的经验,也很难检测说,到底这样放合适不合适。有些衣裳放前面,它就是卖不出去,没人知道什么原因。那么这家品牌服装,它就做了一件很简单的事情。它就把衣裳的背后就是我们放防偷盗墨水那个地方放一个小芯片,如果谁拿了这个衣裳,到试衣间试衣服以后,试衣间再放一个传感器,能记录你什么时候进去的,在那里头试了多长时间这个衣裳,然后它就通过这个数据,就可以提高销售。为什么呢?因为假设哪件衣裳又放在一个显眼的位置,如果大家不拿进试衣间去试,说明它在设计上肯定第一眼看上去就一定有什么一些什么问题。但是,如果很多衣裳,经常地拿到试衣间里去试,最后没人买,那可能在细节上有一些什么需要改进地方,这样它通过这么一件简单的事情,就能提高销售,这是一个非常传统的行业。