大数据时代的利与弊

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

虽然早已听说过舍恩伯格的《大数据时代》,但直到前不久才浏览本书的内容,看完之后还是有点震撼的,主要是大数据对我们日常生活和思维的影响太大了。下面摘取部分原文表述或案例来梳理一下这本书,其中有我本人的部分总结和评述。

有三个案例比较有意思,一是福特的名言,“如果当年去问顾客他们想要什么,他们肯定会告诉我:一匹更快的马。”

乔布斯多年来持续不断地改善Mac笔记本依赖的可能是行业分析,但是他发行的iPod、iPhone和iPad靠的不是数据,而是直觉,第六感。谷歌公司内部的研究表明工作表现与大学毕业时的平均绩点没有关系,但其创始人依然要应聘者提供分数。

前两个例子(福特和苹果)说明大数据有时候是无效的,后面谷歌的例子则说明管理层对数据过度的执着。

大数据对人类生活的破坏莫过于它过于强大的预测功能,如通过一个人过去的表现可以准确预测到他在特定环境下一定会犯罪,那么,社会保障机制就会惩罚一个从来没有犯错的人。如书中所述:

“因为预测的结果几乎不可辩驳,人们也就无法为自己开脱。但这种基于预测得出的惩罚不仅违背自由意志的原则,同时也否定了人们会突然改变选择的可能性。”

以上弊多些,下面谈利。

聪明的公司会从人们与信息交互中收集数据废气,以用来改善现有的服务或推出全新的服务。

“拥有知识曾意味着掌握过去,现在则更意味着能够预测未来。”-----这句话很精辟。

“情报分析员结合实地考察报告和过去IED袭击地点、时间和人员伤亡的详细信息,据此预测一天中最安全的运送路线。”类似的,我也听说过美国建立的爆炸物碎片博物馆的事情,基于爆炸物的各种信息追踪恐怖分子武器弹药的生产基地和储存地点。

“为了促进大数据平台的良性竞争,政府必须运用反垄断条例。”

谷歌对量化数据的极致追求可能过头了,因此激起了员工的反抗。(弊)通过大数据预测来判断和惩罚人类的潜在行为是对公平公正和自由意志的一种亵渎。(弊)

过去是要成为一个优秀的生物学家就需要认识很多生物学家,但现在可能是,要解决一个生物难题或许和天体物理学家或数据视图设计师联系即可。

由于大数据的功劳,微软机器翻译部门的统计学家在茶余饭后的谈资就是每次一有语言学家离开他们的团队,翻译质量就会好一点。

当亚马逊的贝索斯发现算法推荐能促进销量增加的时候,他就不再需要书籍评论员了。

“有风险才有回报。”

更明智的选择是让自己受益,汽车制造商与供货商的例子十分精彩,感兴趣的可以参见原书p171.

上班高峰期交通状况的变好说明失业率增加,即经济状况变差。

谷歌和亚马逊:数据、技能和思维三者兼备的优秀公司。

数据的拥有者可能没有使用数据的动机和强制要求。

外行人的思维不受专业限制,可能做出有更有价值的发现。

数据科学家是统计学家、软件程序员、图形设计师和作家的结合体。谷歌首席经济学家范里安认为统计学家是世界上最棒的职业,“如果你想成功,你不应该成为一个普通的、可被随意替代的人,你应该成为稀缺的、不可替代的那类人。”“数据非常之多,但是真正缺乏的是从数据提取价值的能力。”

DataMarket向人们提供其他机构(如联合国、世界银行和欧盟统计局等)的免费数据,真的吗??

无形资产,如数据占到美国上市公司价值的75%。

政府才是大数据的原始采集者,因此奥巴马说的很好,“面对怀疑,公开优先”,就是政府应该承担的责任。

丹麦癌症协会的案例:手机是否增加致癌率。他们使用的数据集原本根本不是用来研究这个问题的,基于“样本=总体”,做出了重大发现:使用移动电话与癌症风险增加不存在任何关联。这项研究彰显了“重组数据(二次利用)”的魅力。

思维的转换案例:零售商在店内安装监控摄像头不仅能认出商店扒手,还能跟踪在商店购物的顾客和他们停留的位置。零售商利用后面的信息可以设计店面的最佳布局并判断营销活动的有效性。在此之前,监控摄像头仅用于安保,现在则变成的一种可以增加收入的投资。

同样是亚马逊和谷歌的案例,AOL和Nuance与他们合作简直亏死了,大公司真可怕!

同样是震撼的案例:

“数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,而绝大部分则隐藏在表面之下。”

1)Farecast利用机票销售数据来预测未来的机票价格;2)谷歌重复使用搜索关键词来预测流感的传播;3)麦格雷戈博士用婴儿的生命体征预测传染病的发生;4)莫里重新利用老船长的日志而发现了洋流。几十年的试验和错误才实现现有加油站的有效分配,但电动汽车的充电站的需求和设置点目前还不得而知。

哈哈,“鱼不知道自己是湿的”,真的吗??

验证码的发明人路易斯27岁时获得了50万美元的麦克阿瑟的“天才奖”。(题外话:2012年美国的最低工资是7.25美元/小时,一天工作八小时的话,则是348元人民币。)

一点点的不精确比完全精确更有效。

当地板数据化的时候,它能滋生无穷无尽的用途。

大数据分析表明:个人偿还债务的可能性和其朋友偿还债务的可能性正相关,物以类聚,人以群分啊!

UPS最佳行车路径:尽量少左转,因为左转要求货车在交叉路口穿过去,所以更容易出事故。货车往往需要等待一会才能左转,因此更耗油,减少左转使得行车的安全性和效率都得到了大幅提升。

莱维斯:“预测给我们知识,而知识赋予我们智慧和洞见。”iPhone本身就是一个“移动间谍”,同样包括安卓的和微软的手机。谷歌,一个喜欢跨界的叛逆的大数据公司。亚马逊深谙数字化内容的意义,而谷歌触及了数据化内容的价值。

哈佛大学的研究人员发现5000亿个单词中有一半以上在字典中无法找到,真的吗?

1900年以前,“因果关系(causality)”这个词比“相关关系”(correlation)使用频率高,但在1900年之后,情况相反。(Google Ngram Viewer)

相关文档
最新文档