《可视化未来:数据透视下的人文大趋势》读书笔记
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《可视化未来:数据透视下的人文大趋势》读书笔记
我们可以观赏玫瑰花,也可以数一数玫瑰花的花瓣,读书存在着其他的方式:把文本拆分成字词,然后通过分析文本的“花瓣”来寻找图书背后的数学
原理。
《可视化未来:数据透视下的人文大趋势》书以“谷歌图书”项目为背景,使用“n元词组词频查看器”揭示了英语语法演变、词典如何犯错、人们如何
成名、政府如何压制思想、社会如何记忆和遗忘,以及文化如何以一种确定性
方式运转。并且探讨如何使预测人类未来成为可能。
为什么要用以“谷歌图书”项目数据为研究对象?那是因为我们研究的问
题是关于人文变迁的,所以我们需要的数据需要具备两个特点:大和长,“谷
歌图书”项目正好符合对数据的这个要求。
为什么要使用“n元词组词频查看器”?原因有两个,一是在之前,已经
有学者通过词组词频统计的方式得到了很多意想不到的成果,比如“齐夫定律”;二是这种方法可以解决四个问题:(1)数百万人共同创造了原始数据,数据投影需要能够保护这些人的权利,(2)数据投影必须是令人感兴趣的,(3)数据投影不能和数据公司的目的相违背,(4)产生数据投影的方法要切
实可行。
基于以上,作者的研究结论包括以下:
一、某种类似于自然选择的东西正影响着人类文化,还在动词上留下了
“指纹”。出现频次对于不规则动词的存活有着非同寻常的重要影响。
为什么我们说“drove”而不说“drived”?
我们使用drive比较频繁,所以它还没有变成drived,只要英语继续发展
下去,drove也最终将会消失,我们预计,大约7800年后,drove最终会消失。
二、语言不是在变化,而是在生长
每天有大量的新词汇出现,同时也有旧词汇消失,所以我们的语言是在生
长着的,基于通过“n元词组词频查看器”编纂的“齐夫式词典”可以看出,
目前当有4个新词汇出现时,就会有一个旧词汇死亡。
三、名望的发展是有整体规律的--大统一理论,不同职业获取名望的曲线
截然不同
名望发展的整体模式包括四个阶段:崭露头角、指数级上升、到达名望顶
峰、缓慢衰减,但是不同时代的人名望发展稍有区别,随着时间的推移,
产生的区别为:崭露头角的年龄逐渐变小,上升的速度在加快,衰减的速度也
在加快。唯一没有太大的变化的是到达名望顶峰的年龄一般在75岁左右。
将1800年-1920年之间出生的名人按照他们的职业分成不同小组,研究6
类人可能的职业选择:演员、作家、政治家、科学家、艺术家和数学家,最终
得出的结论:
(1)演员一般会在30岁左右成名,拥有一辈子时间享受自己的名气;
(2)作家一般在接近40岁成名,但是撰写传世佳作的顶级作家最终会获
得的名望要比演员高得多;
(3)政治家一般在40岁之后、50岁之后甚至60岁之后才达到他们名望
的顶峰;
(4)科学家一般在60多岁成名,获得名望和演员差不多;
(5)艺术家和科学家等待的时间一样长,获得的名望却只有其一半;
(6)如果你想出名,最坏的选择是从事数学研究。
四、文化审查无处不在,但是思想却有百万个出口
现代艺术的思想没能像凯勒所说的那样凭借自己的力量“站”起来,并最
终打败纳粹,但是现代艺术思想没有被杀死,最终从“数百万个渠道中渗出”。
信息膨胀时代,“n元词组词频查看器”这样的工具可以代替人脑工作,
这样的工具可以用来使政府坚守诚信,使人民的思想保持自由。
五、我们能原来越快的记住一些东西,同时也遗忘的更快了
我们的集体遗忘包括两个阶段:对某一年的兴趣,在那一年过去之后的前
几十年中迅速下降,随后下降速度大大放缓。同时,这个社会对待过去的态度
在发生变化,我们对过去的事情失去兴趣的速度正变得越来越快。
集体记忆曲线现在正变得越来越短,每10年会缩减约2.5年。这会不会是技术奇点到来的先兆,值得越来越多的学者进行研究。
六、未来的数字化进程会更加迅猛,我们或许可以通过这些数据来预测人
类的未来,同时数字化会带来很多数字困境
数字化未来将触手可及,未来,我们日常生活的点点滴滴都有可能被记录,包括外部环境的、身体的甚至思想的。我们会有越来越多的关于自己的数据,
所以未来数字化可以抓住坏人,也可以伤害好人,保存信息从一个技术谜题变
成一个道德困境,将会有来自企业和政府对我们越来越多的干涉和控制。
未来通过“n元词组词频查看器”的工具或许能对未来进行一定程度的预测。
总体来说,这本书对我们的启示如下:
l大数据提供给了我们新的看待世界的方式,通过这种数据视角,我们能够看出很多意想不到的结果;
l大数据透视的方法能看出来结果,但是却无法解释原因,需要我们不断对原因进行深度思考;
l有时你会想看一下图表,有时你会将自己埋在一本好书中,我们可以两者都尝试一下;
l大数据或许能对历史趋势进行预测。