读《统计数字会撒谎》有感
统计数据会说谎?!——读书心得
统计数据会说谎?!“自从使用了某某牌牙膏,我们的蛀牙减少了23%”;“1924级的耶鲁毕业生平均年收入是25111美元”;“根据相同的收入取样,计算方法也完全正确,同一个小区居民的年平均收入可以是2000英镑,也能是10000英镑”。
只需施展一点小技巧,就能让数据面目全非!你是否执着于打听智力测验的结果?你是否对电视上那些专家所言的各种标准坚信不疑?你是否认为抽烟与成绩的好坏直接相关?抑或受高等教育与晚婚有必然联系?你是否确信眼见为实?如果图形能让事实的1:2瞬间变为眼前的1:8呢?你还确信自己的感觉吗?真相果真如此?数字的魔力决不仅止于此!这本“故事书”般的经典之作将为您轻松揭开谜底。
作为揭露数据造假的经典工具书,达莱尔〃哈夫这本《统计数据会说谎》在上世纪50年代一经出版,就成为有些人的“心头大患”,他们相当害怕读者看到书中的真相。
这本书不仅被奉为“世界统计学普及读物第一畅销书”,而且被誉为“数据造假曝光宝典”,经久不衰。
达莱尔〃哈夫用风趣的插图和通俗的语言把高深的统计写得像“故事书”一样精彩,这种独具一格的行文和编排使得此书更具魅力。
此外,书中还揭露了大量至今仍被销售员、专家、记者或者广告撰稿人频频使用的“行骗工具”:带有偏差的样本,可以挑选的平均数,没有透露的小小数据,混淆因果关系,滥用一维图形等等。
翻翻报纸,房价,工资,增长率,利润率……你都有可能被这些统计数据狠狠地忽悠一把;看看广告,效果、疗效是真的吗?类似于这样的质疑越来越多,我们要如何才能够看清这些漫天飞舞的数据背后的谎言?在没有重要数据的情况下,千万不要轻易相信一个平均数,一张图表,或是一条趋势线。
否则你就会像一个只凭平均气温选择露营地的人一样盲目。
随便处理数据或利用小数点来混淆因果关系比封建迷信强不了多少,而且前者更具误导性。
放在统计学家桌子上的数据一旦到了推销员、公共关系专家、记者和广告文案撰写人的手里,马上就被歪曲夸大、过分简化,或者在层层筛选中变得面目全非。
统计数字会撒谎
8. 如何反驳统计资料——真相只有一个
•问题二:他是如何知道的?
数值是否足够大,从而能解释问题?观察值是否足够多,从而保证结论的可靠性? ——对亍许多报告中的内容,通过观察,你会収现由亍缺乏足够多的观测值,报告的内容丌足 以说服仸何人。(前面的抛硬币的栗子)
•问题三:遗漏了什么?
通常,你幵丌会被告知包含了多少观测值,这个数据的缺失,特别当信息来源亍信息存在利害 关系一方时,已足以使你对整件事情提出质疑。比如,当均值不中位数相差甚进时,需要注意 那些没有标明类型的平均数。 很多数据因为没有比较而发得缺乏意义。 Longlongago,x大学开始接收女学生时,一丌赞成异性同校的人做 了一个惊人的报道:x大学1/3的女生嫁给了大学老师!民风狠彪悍 啊。
高露洁广告
广告说啥我信啥
某位统计与家曾经建议,在被告知某个调查的结果时,你需要做的就是反问一句 :“你调查了多少名被访者” 采用严重有偏的样本几乎能够产生仸何人需要的仸何结果。
2. 没有披露的数据——想要什么结果就有什么结果
广告骗术中,怎样才能完全依靠机遇形成毫无指导性的结论呢?答案就是足够小的样本
1. 精心挑选的平均数——我们为什么老是拖后腿
你也来上海啦?
恩,魔都是个好地 方~
实际上,即使我们的工资都丌涨,也有让平均工资涨的方法:假设盖茨和乔布斯
搬来上海,我们的平均工资就会涨到10k啦~~~
1. 精心挑选的平均数——我们为什么老是拖后腿
起码拉高一千咧! 你知道吗?咱拉高了 上海人的平均收入呢
7. 如何进行统计操纵——见证奇迹的时刻
•发换基数还能产生增加折扣的幻觉。 折上折!!!“50%折扣再打20%折扣” =
70% ?
60%
•将一些看似能直接相加却丌能这样操作的事情加在一起,会产生大量的欺骗和隐瞒
《别让统计资料骗了你》读后感
传播学概论慎思统计资料——《統計陷阱》讀後感Name:汪明根Student Number:0919500104Major:新闻0901Instructors:邵鹏慎思统计资料——读《统计陷阱》有感前言最近应邵老师的推荐,潜心在读美国著名的统计学家达菜尔·哈夫的名著《统计陷阱》。
《统计陷阱》一书之所以能够历久弥新,是因为其实用性。
随着我国经济持续发展,我们将接触到越来越的统计数据,例如,公司财务报告、证券信息、国家权威机构公布的各种统计数据等等,去粗取精、集思广益,去伪存真、进行鉴别。
作者重说明、轻证明,重文字描述、轻理论推导,并结合活生生的案例,语言轻松诙谐,深入浅出,介绍了一些统计术语和方法,更揭示了很多的统计骗局。
该书一经出版,便畅销美国,成为美国20世纪50年代的畅销书之一。
在进入正题前,我想引入几位比较权威期刊对此书的好评。
《管理评论》认为:“哈夫先生用如此生动的、充满人情味的方式来论述统计这个干巴巴的课题,真是一讯灵丹妙药。
我们太需要这本书了,它虽然娱乐性强、浅显易读,却十分具有说服力。
”《图书期刊》如此评价:“作者和制图者倾注了全力,给大家提供了一本十分轻松活泼的读物和卡通画。
它们能给你带来娱乐,又能引发思考,而且还揭穿了许多统计方法的谎言。
”《大西洋》评价道:“这是一本具有善意破坏性的书,读完它后,你对于‘万能统计’的信任将大大降低。
”正是由于这本书融娱乐性和知识性为一体,使它成为一本具有影响力的著作。
《统计陷阱》内容简介如前言中所说的各种资料、数据如何去伪存真,如何进行鉴别?这本《统计陷阱》回答了这些问题。
全书共分为十章,在前九章里面,作者哈夫分别从九个具体的细节地方给我们阐释了,各种统计陷阱是如何产生的。
第一章以耶鲁大学毕业生的工资来说明通过偏差的样本来获得想要的数据是造成统计误差的首要原因——内在有偏的样本;第二章从数学的角度揭露统计时常采取的所谓平均数、中位数和众数等方式来欺骗人,精心挑选的平均数一般却不给出是哪种平均数;第三章通过多克斯牌牙膏取样数据不科学一例来说明,在没有披露的数据情况下,所产生的统计骗局;第四章告诉我们,在计算,某一个数据时,需要知道这个数据可能造成的误差,如果不考虑这个误差,则数据毫无意义,用章名来说——毫无意义的工作;第五章则通过对图形的夸张画法,来达到误导读者的目的,例如Y轴不从0开始,X、Y轴比例不一样——惊人的统计图形;第六章和第五章是比较类似的,只不过平面图形不只有高度,还有宽度;不相匹配的资料则指出了,问题本身并不能真实地反应这个问题所代表的观点,例如药物试验,实验室的环境,药物与最后在药店里购买的药物有可能很不一样,或者实验室环境与人体环境差别很大等等,都会导致数据的不准确性。
统计数字的谎言
统计数字的谎言我有一位邻居,为了表明他支持美国各地正在发生的“占领运动”,在自己的前院里插了一块牌子,上面是一句占领运动的口号,“我们是99%”,意思是,占领运动对抗的是那个属于1%的富人特权阶层。
我跟这位邻居很熟,所以问他,你真的相信这句口号的数字吗?他说,为什么不?我见他说得很坚决,为了保持邻居和气,决定不再与他多说什么。
我们居住的这个街区,在上个世纪初,随着美国西部铁路的开发,形成了一个蓝领工人的居住区,房子都不大,一般是二三个卧室,再加饭厅、客厅、厨房和厕所。
近几年这个街区房价高涨,已经很难找到蓝领阶层的居民了。
我这位邻人是一位律师,前几年花了90多万买下了他现在的住房。
他称自己是属于99%的美国人,属于“广大的美国人”,但他与那些失了业,或生活在贫困线以下的美国人,又哪里是属于同一个阶层呢?马克·吐温说,“有三种谎言:谎言、该死的谎言和统计数字。
”占领运动的“我们是99%”就是一个统计数字的谎言,而我的邻居正是上了这个谎言的当。
一个国家的贫富界线该如何划分,本来是一个非常复杂的问题,而贫富悬殊的实际状况在各个地区也是不一样的。
在美国,贫富最为悬殊的地方其实并不在华尔街。
据美国人口调查局今年的一项数据,贫富差距最大的是康涅狄格州的布里奇波特-斯坦福德(Bridgeport-Stamford)地区,那里最富有的20%居民,收入占整个地区收入的57.4%;而最贫穷的20%居民,收入则只占整个地区收入的2.5%。
这一差距是美国516个人口调查区中最大的。
如果按这个划分方法,我这位律师邻居,怎么说也应该是我们城市里最富有的20%居民中的一分子。
许多美国人对政府提供的统计数据一直都是采取半信半疑的态度,因为政府总是喜欢公布对它有利的数据,而隐瞒对它不利的数据。
早在1914年,美国著名的公共知识分子李普曼(Walter Lippmann)就曾这么说:“你我永远在受普查执行者和普查制造者的摆布,不同的是,普查执行者得挨家挨户地敲门,而普查制造者则自己就能把结果创造出来。
统计数字会撒谎观后感
统计数字会撒谎观后感第一篇:统计数字会撒谎观后感统计数字会撒谎生活中我们会接触到各式各样的谎言,每个人都需要对各种信息进行识别,因此、掌握书中的工具是防止受骗的可行方法。
培根曾经说过:“如果一个人以种种肯定的立论开始,他必将终止于各种怀疑;但如果他愿意抱着怀疑的态度开始,那么他必将获得肯定的结论。
”我想对数据资料的判断和接受也是如此。
统计学是一个很大的课题。
统计这种神秘的语言,在一个用事实说话的社会里是如此的吸引人,但有时它却别利用并成为耸人听闻、恶意夸大或简化事实、迷惑他人的工具。
在报告社会经济趋势、商业状况、民意测验和普查的大量数据时,统计方法或者统计术语是必不可少的。
但如果人们不能正确理解并恰当地使用这些统计语言,而读者又并不能真正懂得这些术语的含义,那么,统计结果只能是一堆废话。
统计数据通常被人们所滥用,把一些重要的事实弄得似是而非。
本书中也例举了很多很多例子,让我们深入了了解了统计学的另一面,让我们知道很多时候数字是要一定的范围,一定的限定,否则总是有这里哪里的缺陷。
本书常常提到的“平均数”,有的时候人们把中位数当作平均数,有的时候人们又把众数当作平均数,然后再把信息公布于社会。
各个国家、企业、个体把数据公诸于世的时候都是想另读者相信自己的能力,也许食用的是均值,以便利用高收入读者群来大道吸引广告商的目的。
总有那些漏洞可以让人们有机可趁,使报出的这些数据逃避法律的责任,这样就让他们既不用负到法律的责任,又可以以此获得巨大的利益。
群众总是被他们的数据所欺骗,即使是再精明的老统计学专家,也不一定是这组数据的对手。
有的调查报告也是不完整、不规范的,很多时候为了利益,他们也可能会去做一些调查,但是做的调查为了使其更有真实感,不一定会让自己的统计数字十全十美,但是的确又都是利于自己的,在调查的过程中,他们抽样的样本是不是具有片面性,是不是够广泛也是调查结果差异的重要原因。
为了吸引读者,现今大多人开始使用图形来说明数据,形象化的图形的前身是普通的柱状图,在比较两种或两种以上事物时,柱状图是一种描绘数量的便捷常用的方法。
统计数字会撒谎
统计数字会撒谎作者:廖颖林来源:《中国纺织》2010年第03期“自从使用了某某牌牙膏,我们的蛀牙减少了23%。
”或许你刚被这样的广告宣传攻陷,对这新款牙膏的“神奇功效”深信不疑,但是美国统计专家达莱尔·哈夫(Darrell Huff)告诉你:“没有比这更无聊的广告了。
”没错,问题就在这个“23%”上。
在一个用事实说话的社会,我们接触到了越来越多的统计数据和资料,例如各种经济数据、证券信息、投资可行性研究报告、公司财务报告等。
但是却有不少销售员、公关公司、广告撰稿人等在滥用书中所揭露的“数据造彼方法”来蒙蔽对数据知识不甚了解的客户、消费者和上司。
面对这些良莠不齐、真伪并存的数据或资料,我们需要去粗取精、去伪存真的过程。
我们又该如何进行鉴别?20世纪50年代,美国的各大媒体和宣传机构就已经开始越来越重视利用统计——“这个神秘的语言”——说话,然而大量的统计数据、统计资料由于主、客观的原因被滥用,很难起到描述事实、传递信息的作用。
相反,还往往对读者形成误导。
达莱尔·哈夫——一位具有深厚统计背景的新闻记者一发现了这一现象。
他在广泛调查的基础上,从报刊、杂志、书籍中,从美国统计学会一些统计学家提供的实例中,收集了大量案例,并在1954年写下了《How to Lie with Statistics》一书。
该书一经出版,便畅销美国,成为美国20世纪50年代的畅销书之一,并受到了当时美国各种书评杂志的好评,至今依然常常被美国不少权威媒体所引用。
《管理评论》认为:“哈夫先生用如此生动的,充满人情味的方式来论述统计这个干巴巴的课题,真是一剂灵丹妙药,我们太需要这本书了,它虽然娱乐性强、浅显易读,却十分具有说服力。
”《图书期刊》如此评价:“作者和制图者倾注了全力,给大家提供了一本十分轻松活泼的读物和卡通画。
它们能给你带来娱乐,又能引发思考,而且还揭穿了许多统计方法的谎言。
”《大西洋》评价道:“这是一本具有善意破坏性的书,读完它后,你对于‘万能统计’的信任将大大降低。
《统计陷阱》读书笔记
《统计陷阱》读书笔记谨慎对待生活中的统计数据——《统计陷阱》读书笔记第一眼看到《统计陷阱》这本书的时候,以为它是用来指导学生如何学习统计学,如何避开统计学中那些具有误导性和迷惑性的知识与易错点。
抱着尝试的心态读了读总序,才发现它挖掘的是生活中的统计陷阱,揭露生活中那些运用统计学知识来设计、操纵的诡计。
这一发现令我兴趣大增。
而且这本书抛弃了以往一些学科著作一贯说教的方式,,采用活泼有趣的语言,拉近读者与作者的距离,其中娓娓道来的各个事例也让你不禁感叹陷阱就在身旁,与作者一同处于第三方的角度剖析统计陷阱的诡秘之处更是让人大呼过瘾。
其中一章介绍关于平均数的知识,这里的“平均数”真是令人大开眼界。
原来平均数有着很广泛的概念,它既指均值也包括中位数和众数。
也许这样看来这个“平均数”还不够有趣,不过当它们被“精心挑选”后用于不同的地方便会有大大不同的效果。
书中提到的事例是关于某一住宅区居民的年均收入。
当房地产公司希望你能购买此处房子时,你会得知此处居民的年均收入为15000美元,而当你遇见某纳税委员会的成员为了降低税率、降低财产估价或者降低公共交通费用而四处奔走时,你会得知此处居民的年均收入只有3500美元。
他们谁也没有撒谎,出现差距如此之大的数据只是因为他们用了两种不同的平均数,数值较大的均值与数值较小的中位数。
均值与中位数的巨大差别则是来自于在此区拥有房产用于度周末的三位百万富翁,他们的巨大年收入拉高了此处绝大多数居民的年均收入——那些小农、工薪阶层还有靠退休金过日子的老人。
相同的数据,选择不同的操作便能显现出不同的效果用以达成各人的目的。
实际生活中的大公司也经常如此处理平均数用来发布数据,这便是生活中一部分关于统计学的陷阱。
所以当我们看到那些漂亮的,精确的、令人心动的数字时,先不忙着激动欢呼或者沮丧叹气,不妨先认真地研究一下这些数据是如何被得到的以及如何被处理的,它的精确含义是什么,因为也许你看到的数字只是有心人为了得到读者的像你最初那样反应而精心处理过的。
统计数字会撒谎
University
7/13
6/13
某大学历史系和地理系招生,共13男13女报名。
历史系:5男报名,录取1男;8女报名,录取2女。 地理系:8男报名,录取6男;5女报名,录取4女。
整个学校统计:男生录取率(7/13)高于女生(6/13) 按系统计:每个系的女生录取率却都高于男生录取率。
$150,000 $35,000 $20,000
D’Amario
$10,000
2.精心挑选的平均数
算数平均数(Arithmetic mean) 中位数(median) 众数(mode)
正态分布的钟型曲线,三种数落在相同点上
例如人类身高,体型
长尾曲线,三种数值相差甚远 收入的中位数,一般人挣得比它多,一半人挣得比他少 说到平均收入时,首先要问问是什么平均,包括哪些人
1.样本容量 2.实验过程 3.事物整体范围的全距和与平均数偏离水平的数据
3.没有披露的数据
不充分的样本…统计角度的不充分 数量小的样本,存在偶然因素 信息来源的显著性程度,5%的显著性意味着有95%的概率 保证是正确的 要注意没有披露的数据 另一种没有披露的数据:表明事物的变动范围和给定平均数 的偏离水平
Garnett
Jackson Nelson Olson Smith Jones Howard Johnson Hamlin
$1,000,000
$225,000 $80,000 $60,000 $40,000 $30,000 $20,000 $20,000 $15,000
Mean Median Mode
样本选取难度大,成本昂贵
分层随机样本
准备好内部所有单位的名单,调查被随机抽中的单位
统计陷阱读后感
《统计陷阱》读后感放寒假前,经学长的介绍,特地在图书馆里借了一本《统计陷阱》在假期里读,看完之后的感触到真不少,而且总想着什么时候写一点读后心得之类的东西,无奈,因为惰性,总是找各种各样的理由来推迟。
这次还得感谢学校这个次机会,让我终于可以完成早该结束的任务了。
先来谈谈写这本书的背景:在20世纪50年代,美国出现了一种尊崇统计风,太多的人都乐意,也轻易的相信了那些统计数据,原因很简单,大多数的统计数据都可以让不同的人产生不同的效果.例如,一个企业可以让员工看出今年的效益,同样的数据,换一种统计方法,也可以反映出企业的不景气,这就是为什么太多的公司,企业,甚至政府部门都习惯用统计的方法来传达自己的意思.介于这个背景之下,美国作家达莱尔·哈夫以一个经验老道,且退休的窃贼的身份,用回忆录的形式,在本书的前八章讲述了常用的一些行骗手段,在第九章总结了前面所列出的所有方法,而在最后一章中,教人们如何识破统计数据中的陷阱,告诫人们以一个正确的态度去看待一个数据,从而不做一个被数据玩弄于手的玩偶.本书中列举出的,常用统计手段大致可分为:利用内在有偏样本,选出不同的平均数,隐藏总要的数据,忽略必要的误差,滥用统计图形,采用不完整匹配的资料以及误解相关关系等。
当读完这本书时,回过头在,如果你用书中的衡量标准来看任何一组数据,都会发现其中的不可行性,所有的数据都是可以质疑的,那么不禁会有两种念头:其一,为什么统计着要这样做,公布这样的数据是为什么?答案很简单,无非是利益所趋,商家,政府乃至所有人都想隐藏掉那些自己认为很重要的数据,公诸于世的无非是想博得同情或者获得荣耀.其二,这个世上不就没有可以相信的数据,因为没哟绝对的正确,那么我们是否就因此而否定自己看到的,听到的一切呢?显然不是,这本书最重要的是,教会我们如何正确的看待数据,正确的从数据中拿去自己需要的,不可全信,但不意味着一点也都不可信。
在这里,我重点来谈谈:内在有偏样本,选取不同平均数,采用不完整匹配的资料以及误解相关关系这几种“行骗手段”.首先说说内在有偏样本,我用原文中的一个例子来解释这种方法的意思:“1924级的耶鲁毕业生平均年收入有25111美元。
统计数据会说谎阅读心得
统计数据会说谎阅读心得一、概述在当今社会中,数据无处不在,从商业报告到社交媒体统计,再到政府发布的统计数据。
这些数据真的可靠吗?统计数据会说谎,本文将探讨为什么统计数据会撒谎,以及如何识别和避免被误导。
统计学是一门旨在从数据中提取有意义信息和结论的科学,当涉及到统计数据时,事情并不总是那么简单。
统计数据会因为各种原因而说谎,从而误导读者。
在本阅读心得中,我们将探讨统计数据为什么会说谎,以及如何识别和避免被误导。
1. 数据作为现代社会的重要组成部分在现代社会中,数据已经成为了不可或缺的一部分。
它像空气一样弥漫在我们的生活中,从商业决策、医疗健康,到教育、交通乃至国家治理,每一个方面都离不开数据的支撑。
作为一名统计学家,我深知数据的重要性。
但当我们沉浸在这些美丽而富有洞察力的数据时,也需要时刻保持警惕,防止数据被误用或篡改。
因为数据本身并没有意义,只有当它被正确解读和使用时,才能真正发挥其价值。
2. 数据分析和解读的重要性在数据分析的过程中,我们不仅要关注数据的准确性和完整性,更要学会如何正确地解读这些数据。
数据本身并不能告诉我们任何事情,它只是一种工具,帮助我们更好地理解和分析现实世界。
对数据进行深入的分析和解读,是每一个数据分析师不可或缺的技能。
我们需要明确数据解读的目标,这可能是为了评估一个项目的成功程度,也可能是为了发现潜在的市场机会,或者是为了优化业务流程。
无论目标是什么,我们都应该确保我们的解读方法与目标的契合度,这样才能确保我们的分析工作具有实际意义。
我们要掌握正确的数据解读方法,这包括统计学原理、数据可视化技巧以及领域专业知识等。
通过运用这些方法,我们可以从数据中提取出有价值的信息,并形成能够支持决策的见解。
数据解读是一个持续的过程,随着市场和业务环境的变化,我们需要不断地更新我们的解读方法和策略,以适应新的情况。
我们才能确保我们的数据分析工作始终与现实世界保持一致,为决策者提供真正有价值的见解。
(1)《统计数字会撒谎》读后感
(1)《统计数字会撒谎》读后感
最近,书还是一直在看,但是写得不多。
发现,还是写写比较好,收获能保留得更久。
要不,就是有收获,也扛不过时间。
50年前的书了,依然很有意义。
不过,看的时候,和想象的有出入。
本来以为是一本很专业关于统计学的书,结果,具体上时和数字情况说明的书籍。
150页的小书,刨掉标题,刨掉插图,实际内容估计就100页左右。
前面部分是,对于观点由来的阐述,核心内容,在最后一章。
作者做了很好的总结,我就抄写记录一下就是。
关于数字,要了解它的真实情况,需要了解下面几个方面:
1,谁说的?确认是不是有人为的因素在里面。
2,他是如何知道的?数字来源是不是可靠,样本是不是有代表性,数量足够说明问题。
3,遗漏了什么?表述的是不是全面,是否有东西没有说明,并对实际判断有影响。
4,是否有人偷换了概念?留心收集原始资料到形成结论的整个过程,是不是存在概念变化。
5,这个资料有意义吗?让人印象深刻的精确数据也会与实际情况相左。
其实,在市场调查和其他分析的方面,需要多注意。
这些方面对于上面的5个问题,确实必要。
如何反驳统计资料
如何反驳统计资料——《统计数字会说谎》读后感近日,读了一本叫做《统计数字会说谎》的书,该书是美国统计专家达莱尔·哈夫的传世之作,书中大胆地揭露了至今仍被销售员、广告撰稿人、记者甚至专家频频使用的大量的统计操纵技巧,同时还配有别具一格的风趣插图以及众多幽默的案例。
神秘的统计学在这里被哈夫像讲故事一样一一道来,莞尔一笑中让你知晓深奥的统计学基本原理,掌握揭露“虚假数据”的最有力武器。
当然这里所说的统计数据不是专门指我们统计局的数据,而是指跟我们生活、学习、工作相关的各种各样的统计数据。
个人认为,是非常有看点的一本书。
本书给我留下印象最深刻的是教会我们如何反驳统计资料。
怎样凭借双眼就能识破虚假的统计资料,并解开它的老底;如何在这一大片充满欺骗性的数据海洋中找出可靠有用的资料。
书中指出,我们接触到统计资料时,应该要提5个问题,分别是:1、谁说的?2、他是如何知道的?3、遗漏了什么?4、是否有人偷换了概念?5、这个资料有意义吗?下面分别对着五点做简单的介绍。
1、谁说的?某些企业、单位或者个人,出于自身利益,提供的数据可能产生偏差,这些偏差的表达形式可能是错误的陈述,可能是不易被揭穿的含糊之词,还可能是可以挑选的适合的数据,而将不合适的数据放在一边。
由于有了自身的利益而有了这些偏差,所以,我们应该要问一句这些数据到底是谁说的?例1:美国的共和党在竞选时宣称1942年该党的杜威竞选州长前,一些地区教师的最低收入只有900美元;而到1948年,由于杜威当政有方,纽约市教师最低收入水平提高到2500-5325美元之间。
以前只有900美元,现在已在2500-5325美元之间,的确有了长足的进步。
但是我们得问一个问题,谁说的?这是共和党在竞选时,出于竞选的目的,所说的是否有什么奥妙在里面呢?经过分析,实际上,900美元是这个州所有乡村地区的最低收入,而2500-5325美元却是纽约市的最低收入水平。
这个数据并不能反映在杜威执政期间,这个州的教师收入水平有所提高。
不靠谱的统计数字如何欺骗了你?
不靠谱的统计数字如何欺骗了你?【⼀】在这个信息爆炸的时代,我们的周围总是充斥着各种各样的新闻和数据,⽐如“⼴东本科⽣平均⽉薪7000,你拖后腿了吗?”、“北京⼈初婚平均年龄为27岁,结婚越晚越稳定”、“从除⼣开始放假会让很多员⼯觉得浪费⼀天假期”……⾯对这些数字时,你是否会在被戳中痛点后默默回⼀句“我⼜⼀次被代表了”或者“哥⼜拖后退了”?当然,还有⼀些所谓的研究结果甚⾄通过⽹络被快速传播,成为了⼈⼈都知道的“科学”事实:“近视眼戴眼镜会眼球变突”、“家⽤电⼦设备辐射⼤,所以⼿机不要放床头、电脑⼀定要⽤防辐射的机箱,接电话时不要离⽿朵太近”、“碱性体质的孕妇更容易⽣⼉⼦”……这些所谓的“科学”通过“⽤数字说话”的⽅式吸引了你的注意⼒。
可是,客观真实的数字摆在那,我们就能正确认识世界了吗?今天,精读君就为⼤家推荐⼀部美国统计专家达莱尔·哈夫的著作《统计数字会撒谎》,看看我们周围的数据中都暗含了哪些骗局。
作者达莱尔是⼀名⾃由记者,因其1954年出版的这本精彩、⼤为畅销的《统计数字会撒谎》⽽深受数代极客的爱戴。
【⼆】“平均年收⼊10万”,对你来说是什么概念?作为揭露数据造假的经典⼯具书,这本《统计数字会撒谎》在50年代⼀出版,就成为有些⼈的“⼼头⼤患”,他们在全世界对其进⾏围追堵截,就是因为害怕读者看到书中的真相。
它诞⽣之后,不仅被奉为“世界统计学普及读物第⼀畅销书”、“25本投资经典之⼀”、“经典社会学读本”,⽽且被誉为“数据造假曝光宝典”,在世界畅销50年⽽不衰。
达莱尔⽤风趣的插图和通俗的语⾔把⾼深的统计写得像“故事书”⼀样精彩,这种独具⼀格的⾏⽂和编排使得此书更具魅⼒。
此外,书中还揭露了⼤量⾄今仍被销售员、专家、记者或者⼴告撰稿⼈频频使⽤的“⾏骗⼯具”,如:有偏的样本,精⼼挑选的平均数,遗漏某些重要的数据,混淆因果关系,滥⽤⼀维图形等。
更为重要的是,达莱尔在书中破解了如何识破虚假统计数据。
读书笔记《统计陷阱》《统计数字会撒谎》
读书笔记《统计陷阱》《统计数字会撒谎》两本⼀样的书,不同的出版社⽽已,晕...本来是个怀疑主义者,看过了就更怀疑了,呵呵~~P16从总体中抽出的样本(第⼀次抽样)远不能称为随机抽样,因此可能对所有的总体都不具有显著的代表性。
同样,我们需要了解到:任何⼀个调查问卷都只不过是所有相关问题的样本(第⼆次抽样)。
⽽绅⼠或⼥⼠们所给的答案也只不过是他(或她)关于每个问题的态度或经历的样本(第三次抽样)。
脑筋急转弯,以下说法的问题在哪⾥?1、随处可见某种榨汁机的⼴告:“经过实验室的证明”该榨汁机的“榨汁功能增强了26%”,并且“得到了好管家研究院的推荐”。
2、“⼤多数——约78%的职员反对⼯会。
”3、在美国与西班⽛交战期间,美国海军的死亡率是千分之9,⽽同时期纽约市居民的死亡率是千分之16。
后来海军征兵⼈员就⽤这些数据来证明参军更安全。
4、在1942年杜威当选州长时,⼀些地区教师的最低年收⼊只有900美元;⽽今天,纽约州的教师享有全世界最⾼的收⼊⽔平。
在杜威政府的建议下,在由杜威指定的委员会的表决下,⽴法机构于1947年从州财政盈余中拨出3200万美元直接⽤于提⾼教师收⼊⽔平,这使得纽约市教师最低收⼊⽔平提⾼到2500-5323美元之间。
5、康奈尔⼤学对1500名普通的、年龄中等的毕业⽣进⾏了调查。
他们中的男孩,93%已婚(同年龄层的该⽐例为83%)。
但是⼥孩中只有65%已婚。
未婚笔记是同年龄层⼥孩的3倍。
结论:如果你是个⼥孩,上⼤学会提⾼你成为未婚⼥⼦的⼏率。
但如果你是⼀个男⼦,结果相反——它将减少你单⾝的机会。
6、英国新赫布⾥群岛⼟著居民的信条:⾝上的跳蚤会带来健康。
因为通过⼏个世纪的观察,⼟著居民发现健康⼈的⾝上总有⼀些跳蚤,⽽⾝体羸弱的⼈⾝上通常没有跳蚤。
于是他们得出结论:跳蚤使⼈⾝体健康,每个⼈⾝上都应该有跳蚤。
P131谁说的?⾸先要寻找的是偏差....他们提供的数据都有可能产⽣偏差。
使⽤不正确的测量⽅法也是产⽣偏差的原因之⼀,⽐如在进⾏⽐较时,⼀次采⽤某年为⽐较年份,⽽另⼀次却采⽤更有⼒的年份。
1 统计数字会说谎
统计数字会说谎摘要: 在我们的工作、生活中,经常能接触到各种各样的数据、调查结果,这些数据和结果都是正确的吗?哪些数据有误导性?哪些数据有限定条件?哪些数据不可以比较?本次分享告诉大家如何解读数据,如何看透数据的真相!在我们的工作、生活中,经常能接触到各种各样的数据、调查结果,这些数据和结果都是正确的吗?哪些数据有误导性?哪些数据有限定条件?哪些数据不可以比较?本次分享告诉大家如何解读数据,如何看透数据的真相!【案例一】样本的代表性1936年《青年文摘》对美国总统大选的结果进行预测,结果失败,问题出在调查方法上(调查对象是其读者,调查方法为电话调查)。
1936年有能力购买电话和订阅杂志的人并不能代表所有的选民,至少在经济上,他们是一个极其特殊的群体,是有偏的,事实后来证实他们有许多人是共和党的选民。
但是如果调查选择的样本是代表性的,能代表全部选民那么调查就能得到准确的预测结果。
盖洛普为什么预测美国大选的结果很准确?他们采用抽样调查方法,在全国各州按比例选择调查对象对总体有很强的代表性。
【案例二】样本量是否足够?我们来调查“喜欢大番茄的人多还是小番茄的人多”,究竟调查10个人、20个人还是100个人得出的结论是准确的呢?我们选择多少个人作为调查对象,即需要多少个样本量的决定因素有很多,总体的大小,总体内部的变异程度等等。
总体的大小很容易理解,调查全市市民和调查一个班级哪个需要的样本量大呢?显然是前者。
至于总体内部的变异程度,举个例子,如果总体只有100个人且这100个人差异不大,或许十几个样本就已经足够了,但是如果这100个人每个人差异性都很大呢?是不是要选取更多的样本才能更真实反映100个人的情况呢?举一个用研的例子:对于整个淘宝网买家的调研,基本上我们要保障1500的样本量,而对于某一类目卖家的调研可能几百就足够了(比如机票等类目卖家较少)。
PS:抽样经验:1500以上的样本量基本就能很好地代表总体,无论总体有多大。
统计数据撒谎
•问题三:遗漏了什么?
通常,你并不会被告知包含了多少观测值,这个数据的缺失,特别当 信息来源于信息存在利害关系一方时,已足以使你对整件事情提出质
大家好才是真 的好
疑。比如,当均值与中位数相差甚远时,需要注意那些没有标明类型
的平均数。很多数据因为没有比较而变得缺乏意义。
如何反驳统计资料——真相只有一个
3
图形图表变身 —— 看我72变
黄金联盟的黄金奖励 持续6000C,第3个月奖励1g黄金 第6个月奖励2g黄金, 第9个月奖励3g黄金
第12个月奖励4g黄金
2g
1g
3g
4g
宣导时,图形上长、宽、高按比例放大,文字上的“2”倍,给人
的感觉却是8倍,刺激感更强。
统计数字撒谎的
4种方式
精选的平均数
未披露的数据 图形图表变身
平均睡眠时间为 7.8小时
4
混乱的神逻辑 ——见证统计操纵
•百分数也给误解提供了肥沃的土壤,和小数一样,它也能为不确切的 事物蒙上精确的面纱。
A:本月绩优 率环比提升 20个点
B:本月绩优 率环比提升 25%
如何反驳统计资料——真相只有一个
•怎样凭双眼就能识破虚假的统计资料,并揭开它的老底,同样重要的是,如何在一大 片充满欺骗性的数据海洋中找出可靠有用的资料。
•问题一:谁说的?
首先寻找的是偏差——出于名誉或收入的考虑, 而需要证明某些结论,他们提供的数据都有可能 产生偏差.
•——
提出5个问题
如何反驳统计资料——真相只有一个
•问题二:他是如何知道的?
数值是否足够大,从而能解释问题?观察值是否足够多,从而保证结 论的可靠性?——对于许多报告中的内容,通过观察,你会发现由于 缺乏足够多的观测值,报告的内容不足以说服任何人。
《统计陷阱》读后感——关于辩论
《统计陷阱》读后感——关于辩论《统计陷阱》读后感——关于辩论韩小蝶粗读达莱尔·哈夫的《统计陷阱》这本书后,感觉将高中所学统计学知识复习了一遍,比如选取样本的代表性及广泛性,统计数值的选取以及统计表图的绘制。
然而《统计陷阱》这本书并不是教我们如何应用统计,而是告诉我们其中存在的陷阱,帮助我们更好的辨别数据的真假和衡量数据的价值。
在辩论中,我们经常需要使用广泛的具有代表性的统计数据来支撑我们的论点,是论证更加充实有力,可以将论点展开分析,从而使逻辑连贯,论据翔实。
所以,在从《统计陷阱》我们可以学到很多,让我们有能力去甄别数据对我们的利用价值和在辩论过程中,对对方辩友提出的数据提出合理质疑,从而达到拆论的目的。
本书共分为十个章节,分别为第一章内在有偏的样本第二章精心挑选的平均数第三章没有披露的数据第四章毫无意义的工作第五章惊人的统计图形第六章平面图形第七章不相匹配的资料第八章相关关系与因果关系第九章如何进行统计操纵第十章对统计资料提出的五个问题其实章节的标题就可以概括其中的中心思想。
第一章所提醒我们的是样本的代表性。
在一个辩题中,往往会确定一个主体,有时候很明显而有时候需要我们自己判断,在这个时候就需要明确这个主体,围绕其来寻找资料,多求权威的数据,。
但我觉得辩论还有一点很重要就是预判能力,你若是能预先知道别人会如何拆你的论,做好防御便可。
第二章告诉我们各种统计数值的陷阱,如平均数,众数,中位数。
当初在学习它们的时候我们就学习了使用方法区别,但往往对方都会选择最有利于自己论点的那个数据,在此时便可想法进行拆解。
第三章所讲是指商家往往会披露有利于自己的实验数据,其实此时也是与代表性挂钩,人为的选择让统计本身失去了意义。
在辩论中表现为正反与反方的冲突。
其实任何事物都存在正反两面,当我们想要赢得辩论赛胜利的时候,便要从本方角度出发,拆解对方的论点,从逻辑上征服。
第五六章所讲的是通过绘制统计图形或图像的技巧来夸大或缩小数据变化带来的直观感受,我记得当初我们物理老师所讲越均匀越有美感越好,而此时所带来的视觉上的冲击会让我们产生错觉。
读《统计数字会撒谎》有感
读《统计数字会撒谎》有感最近刚读完《统计数字会撒谎》这本书,读完这本书后对统计学的重要性有了进一步的认识,对统计数字真实性的重要性有了很深的感触。
这本书是美国统计专家达莱尔·哈夫的传世之作,该书引发的“编造虚假信息”话题受到美国社会持续普遍的关注和美国权威媒体的激烈争论。
书里面大胆地揭露了至今仍然被销售员、广告撰稿人、记者甚至专家频频使用的大量的统计操纵技巧,同时还配有别具一格的风趣插图以及众多幽默的案例。
神秘的统计学在这里被哈夫像讲故事一样一一道来,莞尔一笑中让你知晓深奥的统计学基本原理,掌握揭露“虚假数据”的最有力武器。
自50年代出版以来,此书不断再版,并被翻译成多种文字,在世界的影响力持久不衰,被誉为美国商业人士、研修人员的重要入门必修书之一。
数学是一个很严谨的工具,然而正如任何工具都可以被别有用心的人用作它途一样,数学亦不例外,而在所有数学的分支里,统计学由于与不确定性有关,以致用它来有意或无意地行骗的人存在于各个领域,正是这些人,让统计学背上了“臭名昭着”的恶名,统计学家甚至成了专业骗子的代名词。
就这样,人们对统计数据失去了信任,并不是因为知道了统计数据的骗人手法,而是越来越多不靠谱的结论让我们很难再相信它们。
尤其是对于政府做出的统计数据,我们几乎是当笑话在看了,比如平均工资的统计,我们经常会觉得自己的工资连平均都没达到,那么是不是这些统计错了呢?不是,它们没有错,显然是因为有部分群体工资偏高,从而导致了总体平均数偏高,这里的平均数是指均值,平均数有均值、中位数、众数三种,均值一般是三者中能够得到的最大平均数,在没有点明是哪种平均数的情况下,通常就是均值,但人们正是可以利用这点来做出各种不同的平均数来达到自己的目的。
类似这种统计数据,它本身并没有错,错的是我们赋予了它与原统计数据含义不同的其他意义,以致被误读了,当然,很多时候并不是我们在赋予,而是调查者本人有意为之。
上面说的是本身正确的研究成果被媒体报道后却成了荒诞的结果的情况,这些数据还会被人穿凿附会用来谋利或证明自己的观点。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
读《统计数字会撒谎》有感
最近刚读完《统计数字会撒谎》这本书,读完这本书后对统计学的重要性有了进一步的认识,对统计数字真实性的重要性有了很深的感触。
这本书是美国统计专家达莱尔·哈夫的传世之作,该书引发的“编造虚假信息”话题受到美国社会持续普遍的关注和美国权威媒体的激烈争论。
书里面大胆地揭露了至今仍然被销售员、广告撰稿人、记者甚至专家频频使用的大量的统计操纵技巧,同时还配有别具一格的风趣插图以及众多幽默的案例。
神秘的统计学在这里被哈夫像讲故事一样一一道来,莞尔一笑中让你知晓深奥的统计学基本原理,掌握揭露“虚假数据”的最有力武器。
自50年代出版以来,此书不断再版,并被翻译成多种文字,在世界的影响力持久不衰,被誉为美国商业人士、研修人员的重要入门必修书之一。
数学是一个很严谨的工具,然而正如任何工具都可以被别有用心的人用作它途一样,数学亦不例外,而在所有数学的分支里,统计学由于与不确定性有关,以致用它来有意或无意地行骗的人存在于各个领域,正是这些人,让统计学背上了“臭名昭着”的恶名,统计学家甚至成了专业骗子的代名词。
就这样,人们对统计数据失去了信任,并不是因为知道了统计数据的骗人手法,而是越来越多不靠谱的结论让我们很难再相信它们。
尤其是对于政府做出的统计数据,我们几乎是当笑话在看了,比如平均工资的统计,我们经常会觉得自己的工资连平均都没达到,那么是
不是这些统计错了呢?不是,它们没有错,显然是因为有部分群体工资偏高,从而导致了总体平均数偏高,这里的平均数是指均值,平均数有均值、中位数、众数三种,均值一般是三者中能够得到的最大平均数,在没有点明是哪种平均数的情况下,通常就是均值,但人们正是可以利用这点来做出各种不同的平均数来达到自己的目的。
类似这种统计数据,它本身并没有错,错的是我们赋予了它与原统计数据含义不同的其他意义,以致被误读了,当然,很多时候并不是我们在赋予,而是调查者本人有意为之。
上面说的是本身正确的研究成果被媒体报道后却成了荒诞的结果的情况,这些数据还会被人穿凿附会用来谋利或证明自己的观点。
这在媒体里占了很大一部分,尤其是对于严肃的科学研究。
除此之外,更多的是不严谨的统计调查和骗人的统计数据,这些也常见于各种媒体上,当然,这些本身错不在媒体,但是正因为他们不报道数据来由,才导致人无法看清统计数字的真面目,所以,这就提醒我们在不知道统计数据如何得出的情况下,切忌太当真。
对待统计数据,作者告诉我们要问5个问题,“谁说的”,他是如何知道的,“遗漏了什么”,“是否有人偷换了概念”,“这个资料有意义吗”,以后看数据看新闻,如果自己看到后激动了,有话要说,那么先憋着,然后提醒自己问一下这几个问题,别骂完后才发现原来是假的。
作者说:如果你想证明某事,却发现没有能力办到,那么试着解释其他事情并假装它们是一回事,这就是我们常犯的逻辑谬误,偷换
概念。
统计学中所包含的思维,利用统计学所犯的错误,归根到底就是逻辑。
把相关性当成因果性,这是事后归因;小样本得出大结论,这是以偏概全;为了证实自己的观点,刻意用统计方法放大比例,这是诉诸公众谬误。
基本上每一个统计陷阱就是一个逻辑谬误,学会统计学,就是学会怎么说理。