数据之巅读书笔记
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据之巅读书笔记
巅峰数据是一本有关大数据的书,以下是本人收集的读书笔记,仅供大家阅读参考!
数据之巅读书笔记一最近读了涂子沛先生的《数据之巅》感慨良多,颇有不吐不快的感觉,数据之巅读后感。涂先生作为将"大数据"概念引入中国的学者,其认识的深刻程度自然非同一般。而种深刻表现在对历史大背景的理解上。我特别感兴趣的,是大数据时代到来之前的故事。
"如果按照我倡导的原则去做,你们就能生产出高质量的产品。五年以内,日本产品将占领整个国际市场。" 60多年前,质量管理之父戴明给日本企业家这样的承诺。那时的日本产品,还是以"劣质"而闻名。所有人都将信将疑。但事实却是:仅仅用了四年,日本的优质产品开始占领世界。
戴明为什么有这么大的信心呢?当时的日本刚刚战败,多数人吃不饱肚子。戴明见到的却是整洁的街道、守纪律的国民。戴明教给日本人的招数,是用数据统计的办法管理质量;这种方法与日本民族做事认真、遵守纪律、一丝不苟的民族文化是吻合的。此后的20多年,日本制造一路走高,靠质量实现了"逆袭"、超越了美国。
这段时间,美国制造业又在做什么呢?二战以后,各国百废待兴,美国本土没有经历战争的破坏。在很长的时间里,美国产品供不应求,成为世界各国的"抢手货":生意好做了,
对质量的重视程度也就不够了,从而为日本的赶超提供了机会。直到日本人打到"家门口",美国人才如梦方醒。美国人惊奇地发现:这位"墙内开花墙外香"、对日本制造有巨大贡献的戴明,居然居住在距离白宫不到六英里的地方。
戴明和他的方法来自于美国。美国为什么会产生这种方法呢?恐怕这也与其文化有关:美国是个讲究民主和法治的国家,凡事要争论、要讲道理。争论要有是非曲直、最终要"用数据说话".但是,人们也意识到:数据不仅"会说话",也会"说大话"、"说谎话".所以,用数据说话,必须讲究科学。这样看来,戴明来自美国也就不足为怪了。
其实,戴明的质量管理方法早已传到了中国。
但是,几十年过去了,我们仍然难以摆脱"低质"、"山寨"的帽子、甚至有愈演愈烈的可能。由此可见:我们缺少的不是方法,而是深层次的原因。
改革开放以后,我们有接近40年高速发展的历史。在这段时期,中国依靠廉价的劳动力,生产出物美价廉的产品。但所谓"物美价廉",往往是更重视成本。在保GDP、保就业的背景下,假冒伪劣产品受到了纵容,以至于市场出现了逆向淘汰。于是,原本信奉质量第一的企业被迫做出改变、搞质量的人被边缘化了、企业质量意识就这样淡薄了。
轻视质量还有很多间接的危害。例如,提高质量往往是创新最重要的直接目标之一。离开质量谈创新,就失去了落
地的基础。中国科技界的很多问题与此有关:高校的技术创新往往脱离实际、产学研往往难以结合。可以说,离开高质量的追求,中国制造就缺少了脊梁骨。
我们在追求先进理念的时候,一般不会落后。我们常常听到"用数据说话"的提法。但遗憾的是:现实中,却常常变味,令人啼笑皆非。
究其原因,人们常常不重视数据的本身质量和分析方法的质量。《数据之巅》曾提到:美国人多次为了数据吵得不可开交,从而推动了相关的立法、提高了数据分析的合理性。事实上,只有可靠的数据加上可靠的分析方法,数据才能说出有用的实话。
然而,我们见到的许多数据却是骗人的。例如:据说,获得省部级科技进步奖的潜规则是七亿元的效益。如果数据都是准确的,单纯获奖项目获得的效益,就超过了很多地区的GDP增量,读后感《数据之巅读后感》。然而,尽管浮夸的数据如此明显,却长期得不到纠正。这使得科技界浮夸的歪风越来越盛,牛皮越来越大而实效却越来越少。再如,评奖、评职称都用专利、论文的数量衡量——其实,即便在重视数字的美国,也不主张这种做法。这种做法往往会让科技工作者急功近利,而不愿意去从事真正有价值的创新。不恰当的数字化将很多激励变成了负激励。
还有很多地方,数字化的规则制定得明显不合理。例如,
某企业计算某产品的效益时,要把生产设备的折旧算摊上去——这样的规定看似有道理,却导致了昂贵设备白白的闲置,从而造成了更大的浪费:没有人愿意用这台设备生产产品、宁可让它闲置不用。所以,劣质的数字、劣质的数字化方法,不但不能促进企业的进步和质量的提高,反而有可能起到相反的作用。
我们再看看更深层的原因。人们明明知道这些不合理的现象存在,为什么却能长期持续存在?道理很简单:在这些地方,"用数据说话"变成了一种形式,一种便于交差、便于表功、体现水平的形式。他们并不关心"用数据说话"的目的和最终结果。从本质上说,这种做法不是重视数据,只是用数据做掩饰;不是喜欢"真龙",而是"叶公好龙".
中国制造业要振兴,必须从提升质量开始;关注质量,必须从关注数据和分析方法本身的"质量"开始。所有这一切,都需要有个踏实做事、实事求是的文化氛围。"橘生淮南则为橘,生于淮北则为枳".好的方法必须与文化相匹配。离开良好的文化土壤,再好的办法也无法发挥实效、也会变味。中国制造业的振兴,根子上还是要关注文化。
数据之巅读书笔记二第一次读大数据专题的书,谈起读后感肯定是班门弄斧了,就只是简单的说一说我的一些看法。
涂子沛的这部《数据之巅》,全书共八章,我原以为所
谓"数据之巅"应当是展望未来的大数据时代,没想到全书竟是立足于过去,从历史切入。前面六章的内容,以美国自独立以来的发展历程为主线,从数据应用的角度,讲述美国政治制度,经济建设以及军事管理,每一章的结尾又分析中国的现状,相应对比美国。一个国家的发展历程,从不同角度切入,就会有不同的着重点:军事家可能会串起每一次战争,分析军事战略;经济学家可能会梳理整个宏观经济环境的发展方向;政治学家可能会强调立宪立法各种政治制度的重要性。而作者从数据的角度切入,可以说是别开生面,让我们看到那些耳熟能详的故事背后数据所起到的作用。以南北战争为例,可能你知道林肯的民心所向,知道奴隶制度顺应潮流的消亡,但你未必知道谢尔顿将军以数据分析为基础进行的"向大海进军"的行动。类似的例子有很多,我觉得作者虽然以一个国家的发展历程为主线,但仍然写得有些凌乱,好像想到哪个与数据有关的故事就写哪个似的。美国立法治国过程中政治制度上的博弈、人口普查与统计学、参众议院的席位设置,到数据在医学上的应用、在农业上的应用、霍乱井、预算、诉讼实证、农业应用、商业市场调查与项目决策、戴明的质量控制等,然后又穿插讲一些数据处理的技巧:数据可视化、样本与总体、问卷设计等,接着又跳回内开放:数据与知情权、用数据制衡;直到七八章才涉及一些现代化的数据应用。