大数据方面的书籍推荐

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

大数据方面的书籍推荐

大数据现在正在被称为一个时代的标志,了解和学习大数据,要从理念上彻底转变,彻底理解大数据思维,并渗透到血液和骨髓中,换句话说,你的世界观要彻底转变!而要实现这个转变,必须经过初级、中级和高级三个阶段的学习。以下是这三个阶段大数据方面的书籍推荐。初级阶段:《大数据时代》

作者:[英]维克托·迈尔-舍恩伯格,[英]肯尼思·库克耶,翻译:盛杨燕,周涛

不用说了,肯定是这本书。读完这本书,要求你形成大数据的概念,即知道这么几点:

1、绝不是有很多数据就叫大数据;

2、大数据是一种数据分析方式,与传统数据分析方式有着本质上的不同;

3、大数据的特点是“关注相关性,不关注因果”,这是大数据最核心的东西,一定要真正理解,并牢牢记住,不然你就很容易被别人忽悠;

4、大数据采用的是统计的方法;

5、大数据主要是结合人工智能进行机器的自动数据挖掘;

6、大数据主要是用来作预测的。而不是象一般的数据分析,只是分析出历史情况和现状,未来还是要靠人去预测,大数据则是直接告诉你未来的结果。

中级阶段:《失控》

作者:凯文·凯利(KEVIN KELLY),很多人都亲切地叫他KK,翻译:东西文库

为什么是这本书呢?学完初级阶段要记住的几件事还没忘吧?对,用统计的方法,而不是因果的方法,预测未来。在对预测机制进行剖析的时候,法默最喜欢用这个例子来进行说明:「来,接着!」他说着就朝你扔过来一个棒球。你抓住了球。「你知道你是怎么接住这个球的吗?」,他问道。「通过预测。」

用f=ma(公式)来预测,或者说线性预测,就是通过因果推理来进行预测,即根据球的质量、加速度等等因素,找出这个球为什么会从那个地方飞到这个地方的原因;

而“归纳”即是“统计”的意思,或者说是较粗略的统计,归纳是不问原因的,接住这个球就完了,管它是什么原因。

你想成为大数据高手,你想用统计的方法来对某些东西进行预测?好了,现在你来告诉我,还有什么理由不去好好读这本书?

高级阶段:《复杂性》

作者:[美]尼古拉斯·雷舍尔(NICHOLAS RESCHER),翻译:吴彤

学完中级阶段,你接触到了一件事,“复杂性”,知道了事情复杂到一定程度,就不可能用寻找因果的方法去进行预测。那么到底什么是复杂性,它的本质和原理是什么?想成为大数据高手,你不能对此一无所知,因为你将一辈子与复杂甚至是极其复杂的事情打交道。

推荐这本书还有个原因。大家都知道大数据是研究数据的相关性,即找出数据之间的关系。当我经历了15年统计学人工智能数据相关性的探索和研究,感觉已经研究得差不多了,但又觉得要解决所有的问题还有不小的距离,这时就感到很迷茫,不知下一步的研究该往何方去,有种路越走越窄的感觉,又有一种达到顶峰的幻觉,直到看到这本书中的一句话:“可以考虑它们的关系,再考虑这些关系中的关系,如此下去。”

大家千万不要小看这句话中的“如此下去”几个字,他指明了一个无穷叠代,即“关系的关系的……关系”,而智能将在这里涌现,解决复杂性问题预测的关键很可能就在这里,这句话打开了一个非常广阔的前景,将象宇宙一样没有穷尽。

高级阶段(2):《量子物理史话》

作者:曹天元,辽宁教育出版社

你一定有疑问,“这本书就能让我改变世界观?”

那么我们就来看看书中说些什么吧:量子世界的本质是“随机性”。传统观念中的严格因果关系在量子世界是不存在的,必须以一种统计性的解释来取而代之,波函数ψ就是一种统计,它的平方代表了粒子在某处出现的概率。当我们说“电子出现在x处”时,我们并不知道这个事件的“原因”是什么,它是一个完全随机的过程,没有因果关系。

因果性必须死,因为物理学需要生!

停止争论吧,上帝真的掷骰子!随机性是世界的基石,当电子出现在这里时,它是一个随机的过程,并不需要有谁给它加上难以忍受的条条框框。……而统计规律则把微观上的无法无天抹平成为宏观上的井井有条。——摘自《量子物理史话》

“统计规律则把微观上的无法无天抹平成为宏观上的井井有条”,这句话实际上就是表明,统计方法可以使极其复杂的随机事件成为可预测。我认为,社会、市场、股票等等与量子世界有着很多相似之处。由于量子理论实际上是从最本质上去研究我们存在于其中的这个世界,因此正如书中的一句话:

“这个世界的本质:它本就是统计性的!

作者:玻尔兹曼大脑的放逐,大家可以关注他的微博:/aizhuangjia

原文地址:/archives/8094

相关文档
最新文档