统计数字会撒谎书评11-04]
产品经理-数据也会说谎隐藏在统计数据中的那些小把戏
数据也会说谎隐藏在统计数据中的那些小把戏数据本身不会说谎,但说谎者需要数据。
统计数据主要在决策时拥有十分重要的意义,然而许多数据显示机构却经常以一些谎言无耻掩盖数据的真实性,因此,学会识破统计数据中的一些常见小把戏非常有必要。
“世界上为有三种谎言:谎言、同谋和统计数据!”——美国统计专家达约莱尔·哈夫在其传世之作《统计数据会说谎》中如是说。
对于统计数据,我们似乎对其有着某种天然的信任感,认为其代表者着客观公正,数据不会说谎乃至成为了我们的潜意识,在许多时候成为了我们评判事物好坏已成与否的标准。
但现实的悖论在于,许多聪明机构人或的就是抓住了我们对于数据的这种天然的信任感做起了文章,通过各种统计手段得出各种或好或坏的各种数据,进而消极影响普通消费者消费者的判断。
的确,在日常生活中,我们时常也能看到,在那些价格竞争激烈的行业,不同的统计机构往往会在同一时间给出相互打架的数据结论,造就同一行业中同时出现多个第一的闹剧,这在过往的外卖、移动支付、共享单车、智能手机等市场中都智能手机已是屡见不鲜。
但常识告诉我们,各别行业中四个同时出现两个第一,是概率极小乃至是不或许事件。
那种为何这种统计闹剧屡见不鲜?其中原因在于多种多样,往小了则表示有统计口径差异,基数偏差、数据粉饰、夸大等等,而往大了说那么就有可能是佯装数据为之的数据造假,以求达到不可告人的目的。
诚如政治家格罗夫纳(C.H.Grosvenor)所言:“数据本身不会私底下,但说谎者可能需要数据。
”所以对于我们而言,在以统计数据作为决策依据时,可能需要擦亮自己的眼睛,预防辨别出统计数据中时常出现小把戏的一些小把戏,选择具备真正有意义的来做参考。
关联性不同统计口径造就的数据差异,往往在市场份额、销售量这类统计中时常出现,表现得颇为明显。
诸如在过往国产厂商在国内智能手机市场销量谁是第一的竞争中,甲乙两家厂商都宣称自己是当年的销量第一,并且拉出了不同的市场调研机构给出的结论来站台背书。
统计数据会说谎?!——读书心得
统计数据会说谎?!“自从使用了某某牌牙膏,我们的蛀牙减少了23%”;“1924级的耶鲁毕业生平均年收入是25111美元”;“根据相同的收入取样,计算方法也完全正确,同一个小区居民的年平均收入可以是2000英镑,也能是10000英镑”。
只需施展一点小技巧,就能让数据面目全非!你是否执着于打听智力测验的结果?你是否对电视上那些专家所言的各种标准坚信不疑?你是否认为抽烟与成绩的好坏直接相关?抑或受高等教育与晚婚有必然联系?你是否确信眼见为实?如果图形能让事实的1:2瞬间变为眼前的1:8呢?你还确信自己的感觉吗?真相果真如此?数字的魔力决不仅止于此!这本“故事书”般的经典之作将为您轻松揭开谜底。
作为揭露数据造假的经典工具书,达莱尔〃哈夫这本《统计数据会说谎》在上世纪50年代一经出版,就成为有些人的“心头大患”,他们相当害怕读者看到书中的真相。
这本书不仅被奉为“世界统计学普及读物第一畅销书”,而且被誉为“数据造假曝光宝典”,经久不衰。
达莱尔〃哈夫用风趣的插图和通俗的语言把高深的统计写得像“故事书”一样精彩,这种独具一格的行文和编排使得此书更具魅力。
此外,书中还揭露了大量至今仍被销售员、专家、记者或者广告撰稿人频频使用的“行骗工具”:带有偏差的样本,可以挑选的平均数,没有透露的小小数据,混淆因果关系,滥用一维图形等等。
翻翻报纸,房价,工资,增长率,利润率……你都有可能被这些统计数据狠狠地忽悠一把;看看广告,效果、疗效是真的吗?类似于这样的质疑越来越多,我们要如何才能够看清这些漫天飞舞的数据背后的谎言?在没有重要数据的情况下,千万不要轻易相信一个平均数,一张图表,或是一条趋势线。
否则你就会像一个只凭平均气温选择露营地的人一样盲目。
随便处理数据或利用小数点来混淆因果关系比封建迷信强不了多少,而且前者更具误导性。
放在统计学家桌子上的数据一旦到了推销员、公共关系专家、记者和广告文案撰写人的手里,马上就被歪曲夸大、过分简化,或者在层层筛选中变得面目全非。
统计数字会撒谎
8. 如何反驳统计资料——真相只有一个
•问题二:他是如何知道的?
数值是否足够大,从而能解释问题?观察值是否足够多,从而保证结论的可靠性? ——对亍许多报告中的内容,通过观察,你会収现由亍缺乏足够多的观测值,报告的内容丌足 以说服仸何人。(前面的抛硬币的栗子)
•问题三:遗漏了什么?
通常,你幵丌会被告知包含了多少观测值,这个数据的缺失,特别当信息来源亍信息存在利害 关系一方时,已足以使你对整件事情提出质疑。比如,当均值不中位数相差甚进时,需要注意 那些没有标明类型的平均数。 很多数据因为没有比较而发得缺乏意义。 Longlongago,x大学开始接收女学生时,一丌赞成异性同校的人做 了一个惊人的报道:x大学1/3的女生嫁给了大学老师!民风狠彪悍 啊。
高露洁广告
广告说啥我信啥
某位统计与家曾经建议,在被告知某个调查的结果时,你需要做的就是反问一句 :“你调查了多少名被访者” 采用严重有偏的样本几乎能够产生仸何人需要的仸何结果。
2. 没有披露的数据——想要什么结果就有什么结果
广告骗术中,怎样才能完全依靠机遇形成毫无指导性的结论呢?答案就是足够小的样本
1. 精心挑选的平均数——我们为什么老是拖后腿
你也来上海啦?
恩,魔都是个好地 方~
实际上,即使我们的工资都丌涨,也有让平均工资涨的方法:假设盖茨和乔布斯
搬来上海,我们的平均工资就会涨到10k啦~~~
1. 精心挑选的平均数——我们为什么老是拖后腿
起码拉高一千咧! 你知道吗?咱拉高了 上海人的平均收入呢
7. 如何进行统计操纵——见证奇迹的时刻
•发换基数还能产生增加折扣的幻觉。 折上折!!!“50%折扣再打20%折扣” =
70% ?
60%
•将一些看似能直接相加却丌能这样操作的事情加在一起,会产生大量的欺骗和隐瞒
统计数据会说谎读书笔记
统计数据会说谎读书笔记摘要:一、引言1.统计数据在日常生活中的重要性2.统计数据可能存在误导性二、统计数据的说谎方式1.数据选取偏差2.数据处理方式不当3.数据展示方式不合理三、如何识别和避免统计数据说谎1.了解数据来源和背景2.分析数据采集方法和过程3.对比不同来源的数据4.掌握统计学基本知识四、实际案例分析1.政治领域的数据谎言2.商业广告中的数据误导3.媒体传播中的数据失实五、结论1.统计数据的价值和局限性2.提高数据素养的重要性正文:在我们的日常生活中,统计数据无处不在,它帮助我们了解社会现象、分析经济趋势、评估政策效果等。
然而,统计数据也可能存在误导性,让我们走进“统计数据会说谎”的世界,了解其中的奥秘。
一、引言随着大数据时代的到来,统计数据已经成为决策的重要依据。
然而,统计数据并非绝对真实,它在传播和应用过程中可能会因为各种原因失去原本的意义。
这就要求我们在分析和使用统计数据时,要保持警惕,以免被误导。
二、统计数据的说谎方式1.数据选取偏差:数据选取偏差是指在收集数据过程中,对数据样本的选取存在主观故意或无意疏忽,导致数据不能真实反映整体情况。
例如,在调查某产品满意度时,只选取特定人群作为样本,使得结果偏离实际。
2.数据处理方式不当:数据处理包括收集、整理、分析等环节。
在这些环节中,处理方法的选择和应用可能影响数据的准确性。
例如,在平均数计算中,采用不同的数据分布方法,得到的结果会有很大差异。
3.数据展示方式不合理:数据展示是将数据分析结果以图表、文字等形式呈现给观众。
展示方式不合理,容易让读者误解数据含义。
例如,将柱状图高度比例放大,使得数据差异显得更为明显,误导观众。
三、如何识别和避免统计数据说谎1.了解数据来源和背景:在接触统计数据时,首先要关注数据的来源和背景,了解数据产生的过程,判断数据的可靠性。
2.分析数据采集方法和过程:对数据的采集方法、样本选取、调查问卷等进行分析,判断数据是否具有代表性。
《别让统计资料骗了你》读后感
传播学概论慎思统计资料——《統計陷阱》讀後感Name:汪明根Student Number:0919500104Major:新闻0901Instructors:邵鹏慎思统计资料——读《统计陷阱》有感前言最近应邵老师的推荐,潜心在读美国著名的统计学家达菜尔·哈夫的名著《统计陷阱》。
《统计陷阱》一书之所以能够历久弥新,是因为其实用性。
随着我国经济持续发展,我们将接触到越来越的统计数据,例如,公司财务报告、证券信息、国家权威机构公布的各种统计数据等等,去粗取精、集思广益,去伪存真、进行鉴别。
作者重说明、轻证明,重文字描述、轻理论推导,并结合活生生的案例,语言轻松诙谐,深入浅出,介绍了一些统计术语和方法,更揭示了很多的统计骗局。
该书一经出版,便畅销美国,成为美国20世纪50年代的畅销书之一。
在进入正题前,我想引入几位比较权威期刊对此书的好评。
《管理评论》认为:“哈夫先生用如此生动的、充满人情味的方式来论述统计这个干巴巴的课题,真是一讯灵丹妙药。
我们太需要这本书了,它虽然娱乐性强、浅显易读,却十分具有说服力。
”《图书期刊》如此评价:“作者和制图者倾注了全力,给大家提供了一本十分轻松活泼的读物和卡通画。
它们能给你带来娱乐,又能引发思考,而且还揭穿了许多统计方法的谎言。
”《大西洋》评价道:“这是一本具有善意破坏性的书,读完它后,你对于‘万能统计’的信任将大大降低。
”正是由于这本书融娱乐性和知识性为一体,使它成为一本具有影响力的著作。
《统计陷阱》内容简介如前言中所说的各种资料、数据如何去伪存真,如何进行鉴别?这本《统计陷阱》回答了这些问题。
全书共分为十章,在前九章里面,作者哈夫分别从九个具体的细节地方给我们阐释了,各种统计陷阱是如何产生的。
第一章以耶鲁大学毕业生的工资来说明通过偏差的样本来获得想要的数据是造成统计误差的首要原因——内在有偏的样本;第二章从数学的角度揭露统计时常采取的所谓平均数、中位数和众数等方式来欺骗人,精心挑选的平均数一般却不给出是哪种平均数;第三章通过多克斯牌牙膏取样数据不科学一例来说明,在没有披露的数据情况下,所产生的统计骗局;第四章告诉我们,在计算,某一个数据时,需要知道这个数据可能造成的误差,如果不考虑这个误差,则数据毫无意义,用章名来说——毫无意义的工作;第五章则通过对图形的夸张画法,来达到误导读者的目的,例如Y轴不从0开始,X、Y轴比例不一样——惊人的统计图形;第六章和第五章是比较类似的,只不过平面图形不只有高度,还有宽度;不相匹配的资料则指出了,问题本身并不能真实地反应这个问题所代表的观点,例如药物试验,实验室的环境,药物与最后在药店里购买的药物有可能很不一样,或者实验室环境与人体环境差别很大等等,都会导致数据的不准确性。
统计数字的谎言
统计数字的谎言我有一位邻居,为了表明他支持美国各地正在发生的“占领运动”,在自己的前院里插了一块牌子,上面是一句占领运动的口号,“我们是99%”,意思是,占领运动对抗的是那个属于1%的富人特权阶层。
我跟这位邻居很熟,所以问他,你真的相信这句口号的数字吗?他说,为什么不?我见他说得很坚决,为了保持邻居和气,决定不再与他多说什么。
我们居住的这个街区,在上个世纪初,随着美国西部铁路的开发,形成了一个蓝领工人的居住区,房子都不大,一般是二三个卧室,再加饭厅、客厅、厨房和厕所。
近几年这个街区房价高涨,已经很难找到蓝领阶层的居民了。
我这位邻人是一位律师,前几年花了90多万买下了他现在的住房。
他称自己是属于99%的美国人,属于“广大的美国人”,但他与那些失了业,或生活在贫困线以下的美国人,又哪里是属于同一个阶层呢?马克·吐温说,“有三种谎言:谎言、该死的谎言和统计数字。
”占领运动的“我们是99%”就是一个统计数字的谎言,而我的邻居正是上了这个谎言的当。
一个国家的贫富界线该如何划分,本来是一个非常复杂的问题,而贫富悬殊的实际状况在各个地区也是不一样的。
在美国,贫富最为悬殊的地方其实并不在华尔街。
据美国人口调查局今年的一项数据,贫富差距最大的是康涅狄格州的布里奇波特-斯坦福德(Bridgeport-Stamford)地区,那里最富有的20%居民,收入占整个地区收入的57.4%;而最贫穷的20%居民,收入则只占整个地区收入的2.5%。
这一差距是美国516个人口调查区中最大的。
如果按这个划分方法,我这位律师邻居,怎么说也应该是我们城市里最富有的20%居民中的一分子。
许多美国人对政府提供的统计数据一直都是采取半信半疑的态度,因为政府总是喜欢公布对它有利的数据,而隐瞒对它不利的数据。
早在1914年,美国著名的公共知识分子李普曼(Walter Lippmann)就曾这么说:“你我永远在受普查执行者和普查制造者的摆布,不同的是,普查执行者得挨家挨户地敲门,而普查制造者则自己就能把结果创造出来。
统计数字会撒谎观后感
统计数字会撒谎观后感第一篇:统计数字会撒谎观后感统计数字会撒谎生活中我们会接触到各式各样的谎言,每个人都需要对各种信息进行识别,因此、掌握书中的工具是防止受骗的可行方法。
培根曾经说过:“如果一个人以种种肯定的立论开始,他必将终止于各种怀疑;但如果他愿意抱着怀疑的态度开始,那么他必将获得肯定的结论。
”我想对数据资料的判断和接受也是如此。
统计学是一个很大的课题。
统计这种神秘的语言,在一个用事实说话的社会里是如此的吸引人,但有时它却别利用并成为耸人听闻、恶意夸大或简化事实、迷惑他人的工具。
在报告社会经济趋势、商业状况、民意测验和普查的大量数据时,统计方法或者统计术语是必不可少的。
但如果人们不能正确理解并恰当地使用这些统计语言,而读者又并不能真正懂得这些术语的含义,那么,统计结果只能是一堆废话。
统计数据通常被人们所滥用,把一些重要的事实弄得似是而非。
本书中也例举了很多很多例子,让我们深入了了解了统计学的另一面,让我们知道很多时候数字是要一定的范围,一定的限定,否则总是有这里哪里的缺陷。
本书常常提到的“平均数”,有的时候人们把中位数当作平均数,有的时候人们又把众数当作平均数,然后再把信息公布于社会。
各个国家、企业、个体把数据公诸于世的时候都是想另读者相信自己的能力,也许食用的是均值,以便利用高收入读者群来大道吸引广告商的目的。
总有那些漏洞可以让人们有机可趁,使报出的这些数据逃避法律的责任,这样就让他们既不用负到法律的责任,又可以以此获得巨大的利益。
群众总是被他们的数据所欺骗,即使是再精明的老统计学专家,也不一定是这组数据的对手。
有的调查报告也是不完整、不规范的,很多时候为了利益,他们也可能会去做一些调查,但是做的调查为了使其更有真实感,不一定会让自己的统计数字十全十美,但是的确又都是利于自己的,在调查的过程中,他们抽样的样本是不是具有片面性,是不是够广泛也是调查结果差异的重要原因。
为了吸引读者,现今大多人开始使用图形来说明数据,形象化的图形的前身是普通的柱状图,在比较两种或两种以上事物时,柱状图是一种描绘数量的便捷常用的方法。
《统计陷阱》读后感
《统计陷阱》《统计陷阱》本书是美国著名的统计学家达菜尔·哈夫的名著。
该书自1954年出版至今,多次重印并被译成多国文字,是一本影响深远的经典性著作。
《统计陷阱》一书之所以能够历久弥新,是因为其实用性,作者重说明、轻证明,重文字描述、轻理论推导,并结合活生生的案例,语方轻松诙谐,深入浅出,介绍了一些统计语和方法,更揭示了许多统计骗局,本书一共分八章:第一章内在有偏的样本主要将通过偏差的样本来获得想要的数据,文中举例耶鲁大学毕业生的工资来说明这个问题,给出统计结论时却并未给出样本,通过合理的猜测,可以知道这样的样本是有偏差的,例如能联系上的人一般都不穷,愿意告诉别人自己工资的人更不穷第二章精心挑选的平均数一般给统计结论时却并不给出是哪种平均数,是算术平均还是中位数或者是众数,通过这种方式来欺骗人,例如最近很流行的居民平均居住面积,平均收入等第三章没有披露的数据反复做试验,指给出对自己有利的数据,例如我想证明抛硬币正面出现的次数是80%,那么我每次抛10次,反复抛,直到某次试验正面出现8次,以此作为支持我结论的数据第四章毫无意义的工作计算某一个数据时,需要知道这个数据可能的误差,如果不考虑这个误差,则数据毫无意义,例如智力测验,需要首先明确测验可能的误差,例如正负3,平均智力是100正负3,如果不考虑这个误差,而直接说平均智力是100,a的智力是98,b的智力是101,b的智力比a的好,这样的结论是没有意义的第五章惊人的统计图形通过对图形的夸张画法,来达到误导读者的目的,例如将y轴不从0开始,x,y比例不一致等第六章平面图形本章与上一章比较类似,不过图形换成了平面图形,平面图形不只有高度还有宽度,例如通过钱袋子来比较工资,本来2倍的工资只需要钱袋子高两倍就可以,但这样不协调,因此要更宽,更鼓,导致的结果就是不是2倍,看着是8倍第七章不相匹配的资料问题本身并不能真实地反映这个问题所代表的观点,例如黑人与白人的就业机会均等 == 黑人与白人平等,事实上有种族歧视的人更愿意回答二者的工作机会相等,而同情黑人的人更愿意回答不等,另外很多数据与最终的结论也没有多大的关系,例如药物实现,实验室的环境,药物与最后在药店里购买的药物有可能很不一样,或者实验室环境与人体环境差别很大,等等,都导致数据的不准确性。
统计数据会说谎读后感
统计数据会说谎读后感
你知道吗,以前我总觉得统计数据那就是板上钉钉的事实,就像数学公式一样,一加一肯定等于二。
可是这本书完全颠覆了我的想法。
书里讲了好多例子,都是关于那些看似确凿的统计数据,其实背后藏着各种猫腻。
我当时就想,原来我们平时看到的数据,说不定很多都是在“骗”我们呢!
就比如说,有些数据的样本选取就很有问题。
可能只选了一小部分特定的对象,然后就得出一个看似普遍适用的结论。
这就好比你只看了一群爱运动的人的健康状况,就说所有人只要运动就肯定健康,这显然不合理嘛。
看到这里的时候,我就忍不住摇头,心里想着,这也太能糊弄人了吧!
还有那些数据的呈现方式,那也是大有文章。
同样的数据,用不同的图表或者表述方式,给人的感觉就完全不一样。
这让我想起了有时候在广告里看到的数据,看着好像很厉害,可仔细一琢磨,可能就是被“美化”过的。
这真的很容易误导我们消费者啊,你说是不是?
不过呢,这本书也不是一味地在揭露黑暗面。
它其实也在提醒我们,要学会正确地看待统计数据。
不能盲目相信,要有点批判性思维。
我觉得这一点对我们在这个信息爆炸的时代特别重要。
现在到处都是数据,各种各样的统计结果在我们眼前晃悠,如果我们没有一点分辨能力,那就只能被牵着鼻子走了。
我在想,要是更多的人能读一读这本书就好了。
这样大家在面对那些看似权威的统计数据时,就不会轻易被忽悠了。
你看了这本书也会有同样的感觉吗?这真的是一
本能让你对数据有全新认识的好书啊!我感觉我以后再看到数据,肯定会多留个心眼儿了。
这书的影响,真的是很深远呢!。
统计陷阱读后感
统计陷阱读后感第一篇:统计陷阱读后感由于知识,信息和地位的不对称,普通人在面对行业精英专门设计的陷阱总是无法防备.就像普通美国民众无法理解华尔街“金融天才”搞的次级抵押贷款的潜在风险一样...恩,不光是普通人,就连中石油这样的顶级上市公司,在顶级ceo的带领下也会中套,油价顶点超高价大笔收购国外油田例如TYK之类的...信息欺骗有很多种,而利用统计数字来进行欺骗可能是比较普遍的了,就像马克吐温说的,There are three kinds of lies: lies, damned lies and statistics.这本书就是揭露说明专家们的欺骗行为的.比如报社为了吸引眼球,如何发布关于名牌大学毕业生高收入的报道,政府部门如何利用同样的原始数据,算出不同的统计结果,房地产为了卖房子,如何统计出小区业主的超高收入,一般人如何误读智商测验的一般统计结论,大公司的销售和市场部门如何用图形上的视觉欺骗来提高统计数字给人的感官效果,广告商如何用不匹配数据对大众进行误导....接着,在罗列了种种利用统计欺骗的手段后,书里描述了一系列方法和手段,告诉我们在面对统计数字的时候,如何去理解和评估那些数据,如何揭穿有意或无意的统计骗局.这本书的特色就是案例非常多,用案例的好处是比较容易能理解,缺点就是有的时候比较罗嗦,有时候一眼就能看出问题所在,书里还要花个几千字去描述他...好比那个经典的二维图形欺骗案例...书里我最喜欢的一段是介绍平均工资偏高的案例,不过有些地方用词太学术了:“当数据的分布呈现正偏态时,均值往往偏离一般水平。
收入分布是典型的正偏态分布,这样一来,平均工资偏高就十分正常了。
"囧。
这有优点像概率统计课程了。
这个还不如我的解释通俗易懂:假如有10个穷人工资是1块,1个富人工资是12块”,算术平均数的算法,就是22块除以11人,平均工资是2块。
这个结果明显高于普通人“平均”工资.所以统计局平时说的大家平均工资有2k了,其实一般人是没有2k的,大家感觉偏高了,可是统计局可以言之确凿的说,这确实是某种统计方法算出来的还有一种常用的统计方法我记得是平方平均数,计算方法是平方数相加后取平均,再开根号,用上面的例子就是(10+12*12)/11=14,14开根号就是 3.7块.还有一种统计数值,调和平均数(將数值个数除以数值倒数的总和)算出来是1 我发现最夸张的是几何平均数算出来是11。
统计数据会说谎阅读心得
统计数据会说谎阅读心得一、概述在当今社会中,数据无处不在,从商业报告到社交媒体统计,再到政府发布的统计数据。
这些数据真的可靠吗?统计数据会说谎,本文将探讨为什么统计数据会撒谎,以及如何识别和避免被误导。
统计学是一门旨在从数据中提取有意义信息和结论的科学,当涉及到统计数据时,事情并不总是那么简单。
统计数据会因为各种原因而说谎,从而误导读者。
在本阅读心得中,我们将探讨统计数据为什么会说谎,以及如何识别和避免被误导。
1. 数据作为现代社会的重要组成部分在现代社会中,数据已经成为了不可或缺的一部分。
它像空气一样弥漫在我们的生活中,从商业决策、医疗健康,到教育、交通乃至国家治理,每一个方面都离不开数据的支撑。
作为一名统计学家,我深知数据的重要性。
但当我们沉浸在这些美丽而富有洞察力的数据时,也需要时刻保持警惕,防止数据被误用或篡改。
因为数据本身并没有意义,只有当它被正确解读和使用时,才能真正发挥其价值。
2. 数据分析和解读的重要性在数据分析的过程中,我们不仅要关注数据的准确性和完整性,更要学会如何正确地解读这些数据。
数据本身并不能告诉我们任何事情,它只是一种工具,帮助我们更好地理解和分析现实世界。
对数据进行深入的分析和解读,是每一个数据分析师不可或缺的技能。
我们需要明确数据解读的目标,这可能是为了评估一个项目的成功程度,也可能是为了发现潜在的市场机会,或者是为了优化业务流程。
无论目标是什么,我们都应该确保我们的解读方法与目标的契合度,这样才能确保我们的分析工作具有实际意义。
我们要掌握正确的数据解读方法,这包括统计学原理、数据可视化技巧以及领域专业知识等。
通过运用这些方法,我们可以从数据中提取出有价值的信息,并形成能够支持决策的见解。
数据解读是一个持续的过程,随着市场和业务环境的变化,我们需要不断地更新我们的解读方法和策略,以适应新的情况。
我们才能确保我们的数据分析工作始终与现实世界保持一致,为决策者提供真正有价值的见解。
(1)《统计数字会撒谎》读后感
(1)《统计数字会撒谎》读后感
最近,书还是一直在看,但是写得不多。
发现,还是写写比较好,收获能保留得更久。
要不,就是有收获,也扛不过时间。
50年前的书了,依然很有意义。
不过,看的时候,和想象的有出入。
本来以为是一本很专业关于统计学的书,结果,具体上时和数字情况说明的书籍。
150页的小书,刨掉标题,刨掉插图,实际内容估计就100页左右。
前面部分是,对于观点由来的阐述,核心内容,在最后一章。
作者做了很好的总结,我就抄写记录一下就是。
关于数字,要了解它的真实情况,需要了解下面几个方面:
1,谁说的?确认是不是有人为的因素在里面。
2,他是如何知道的?数字来源是不是可靠,样本是不是有代表性,数量足够说明问题。
3,遗漏了什么?表述的是不是全面,是否有东西没有说明,并对实际判断有影响。
4,是否有人偷换了概念?留心收集原始资料到形成结论的整个过程,是不是存在概念变化。
5,这个资料有意义吗?让人印象深刻的精确数据也会与实际情况相左。
其实,在市场调查和其他分析的方面,需要多注意。
这些方面对于上面的5个问题,确实必要。
读书笔记《统计陷阱》《统计数字会撒谎》
读书笔记《统计陷阱》《统计数字会撒谎》两本⼀样的书,不同的出版社⽽已,晕...本来是个怀疑主义者,看过了就更怀疑了,呵呵~~P16从总体中抽出的样本(第⼀次抽样)远不能称为随机抽样,因此可能对所有的总体都不具有显著的代表性。
同样,我们需要了解到:任何⼀个调查问卷都只不过是所有相关问题的样本(第⼆次抽样)。
⽽绅⼠或⼥⼠们所给的答案也只不过是他(或她)关于每个问题的态度或经历的样本(第三次抽样)。
脑筋急转弯,以下说法的问题在哪⾥?1、随处可见某种榨汁机的⼴告:“经过实验室的证明”该榨汁机的“榨汁功能增强了26%”,并且“得到了好管家研究院的推荐”。
2、“⼤多数——约78%的职员反对⼯会。
”3、在美国与西班⽛交战期间,美国海军的死亡率是千分之9,⽽同时期纽约市居民的死亡率是千分之16。
后来海军征兵⼈员就⽤这些数据来证明参军更安全。
4、在1942年杜威当选州长时,⼀些地区教师的最低年收⼊只有900美元;⽽今天,纽约州的教师享有全世界最⾼的收⼊⽔平。
在杜威政府的建议下,在由杜威指定的委员会的表决下,⽴法机构于1947年从州财政盈余中拨出3200万美元直接⽤于提⾼教师收⼊⽔平,这使得纽约市教师最低收⼊⽔平提⾼到2500-5323美元之间。
5、康奈尔⼤学对1500名普通的、年龄中等的毕业⽣进⾏了调查。
他们中的男孩,93%已婚(同年龄层的该⽐例为83%)。
但是⼥孩中只有65%已婚。
未婚笔记是同年龄层⼥孩的3倍。
结论:如果你是个⼥孩,上⼤学会提⾼你成为未婚⼥⼦的⼏率。
但如果你是⼀个男⼦,结果相反——它将减少你单⾝的机会。
6、英国新赫布⾥群岛⼟著居民的信条:⾝上的跳蚤会带来健康。
因为通过⼏个世纪的观察,⼟著居民发现健康⼈的⾝上总有⼀些跳蚤,⽽⾝体羸弱的⼈⾝上通常没有跳蚤。
于是他们得出结论:跳蚤使⼈⾝体健康,每个⼈⾝上都应该有跳蚤。
P131谁说的?⾸先要寻找的是偏差....他们提供的数据都有可能产⽣偏差。
使⽤不正确的测量⽅法也是产⽣偏差的原因之⼀,⽐如在进⾏⽐较时,⼀次采⽤某年为⽐较年份,⽽另⼀次却采⽤更有⼒的年份。
1 统计数字会说谎
统计数字会说谎摘要: 在我们的工作、生活中,经常能接触到各种各样的数据、调查结果,这些数据和结果都是正确的吗?哪些数据有误导性?哪些数据有限定条件?哪些数据不可以比较?本次分享告诉大家如何解读数据,如何看透数据的真相!在我们的工作、生活中,经常能接触到各种各样的数据、调查结果,这些数据和结果都是正确的吗?哪些数据有误导性?哪些数据有限定条件?哪些数据不可以比较?本次分享告诉大家如何解读数据,如何看透数据的真相!【案例一】样本的代表性1936年《青年文摘》对美国总统大选的结果进行预测,结果失败,问题出在调查方法上(调查对象是其读者,调查方法为电话调查)。
1936年有能力购买电话和订阅杂志的人并不能代表所有的选民,至少在经济上,他们是一个极其特殊的群体,是有偏的,事实后来证实他们有许多人是共和党的选民。
但是如果调查选择的样本是代表性的,能代表全部选民那么调查就能得到准确的预测结果。
盖洛普为什么预测美国大选的结果很准确?他们采用抽样调查方法,在全国各州按比例选择调查对象对总体有很强的代表性。
【案例二】样本量是否足够?我们来调查“喜欢大番茄的人多还是小番茄的人多”,究竟调查10个人、20个人还是100个人得出的结论是准确的呢?我们选择多少个人作为调查对象,即需要多少个样本量的决定因素有很多,总体的大小,总体内部的变异程度等等。
总体的大小很容易理解,调查全市市民和调查一个班级哪个需要的样本量大呢?显然是前者。
至于总体内部的变异程度,举个例子,如果总体只有100个人且这100个人差异不大,或许十几个样本就已经足够了,但是如果这100个人每个人差异性都很大呢?是不是要选取更多的样本才能更真实反映100个人的情况呢?举一个用研的例子:对于整个淘宝网买家的调研,基本上我们要保障1500的样本量,而对于某一类目卖家的调研可能几百就足够了(比如机票等类目卖家较少)。
PS:抽样经验:1500以上的样本量基本就能很好地代表总体,无论总体有多大。
统计数据撒谎
•问题三:遗漏了什么?
通常,你并不会被告知包含了多少观测值,这个数据的缺失,特别当 信息来源于信息存在利害关系一方时,已足以使你对整件事情提出质
大家好才是真 的好
疑。比如,当均值与中位数相差甚远时,需要注意那些没有标明类型
的平均数。很多数据因为没有比较而变得缺乏意义。
如何反驳统计资料——真相只有一个
3
图形图表变身 —— 看我72变
黄金联盟的黄金奖励 持续6000C,第3个月奖励1g黄金 第6个月奖励2g黄金, 第9个月奖励3g黄金
第12个月奖励4g黄金
2g
1g
3g
4g
宣导时,图形上长、宽、高按比例放大,文字上的“2”倍,给人
的感觉却是8倍,刺激感更强。
统计数字撒谎的
4种方式
精选的平均数
未披露的数据 图形图表变身
平均睡眠时间为 7.8小时
4
混乱的神逻辑 ——见证统计操纵
•百分数也给误解提供了肥沃的土壤,和小数一样,它也能为不确切的 事物蒙上精确的面纱。
A:本月绩优 率环比提升 20个点
B:本月绩优 率环比提升 25%
如何反驳统计资料——真相只有一个
•怎样凭双眼就能识破虚假的统计资料,并揭开它的老底,同样重要的是,如何在一大 片充满欺骗性的数据海洋中找出可靠有用的资料。
•问题一:谁说的?
首先寻找的是偏差——出于名誉或收入的考虑, 而需要证明某些结论,他们提供的数据都有可能 产生偏差.
•——
提出5个问题
如何反驳统计资料——真相只有一个
•问题二:他是如何知道的?
数值是否足够大,从而能解释问题?观察值是否足够多,从而保证结 论的可靠性?——对于许多报告中的内容,通过观察,你会发现由于 缺乏足够多的观测值,报告的内容不足以说服任何人。
读《统计数字会撒谎》有感
读《统计数字会撒谎》有感最近刚读完《统计数字会撒谎》这本书,读完这本书后对统计学的重要性有了进一步的认识,对统计数字真实性的重要性有了很深的感触。
这本书是美国统计专家达莱尔·哈夫的传世之作,该书引发的“编造虚假信息”话题受到美国社会持续普遍的关注和美国权威媒体的激烈争论。
书里面大胆地揭露了至今仍然被销售员、广告撰稿人、记者甚至专家频频使用的大量的统计操纵技巧,同时还配有别具一格的风趣插图以及众多幽默的案例。
神秘的统计学在这里被哈夫像讲故事一样一一道来,莞尔一笑中让你知晓深奥的统计学基本原理,掌握揭露“虚假数据”的最有力武器。
自50年代出版以来,此书不断再版,并被翻译成多种文字,在世界的影响力持久不衰,被誉为美国商业人士、研修人员的重要入门必修书之一。
数学是一个很严谨的工具,然而正如任何工具都可以被别有用心的人用作它途一样,数学亦不例外,而在所有数学的分支里,统计学由于与不确定性有关,以致用它来有意或无意地行骗的人存在于各个领域,正是这些人,让统计学背上了“臭名昭着”的恶名,统计学家甚至成了专业骗子的代名词。
就这样,人们对统计数据失去了信任,并不是因为知道了统计数据的骗人手法,而是越来越多不靠谱的结论让我们很难再相信它们。
尤其是对于政府做出的统计数据,我们几乎是当笑话在看了,比如平均工资的统计,我们经常会觉得自己的工资连平均都没达到,那么是不是这些统计错了呢?不是,它们没有错,显然是因为有部分群体工资偏高,从而导致了总体平均数偏高,这里的平均数是指均值,平均数有均值、中位数、众数三种,均值一般是三者中能够得到的最大平均数,在没有点明是哪种平均数的情况下,通常就是均值,但人们正是可以利用这点来做出各种不同的平均数来达到自己的目的。
类似这种统计数据,它本身并没有错,错的是我们赋予了它与原统计数据含义不同的其他意义,以致被误读了,当然,很多时候并不是我们在赋予,而是调查者本人有意为之。
上面说的是本身正确的研究成果被媒体报道后却成了荒诞的结果的情况,这些数据还会被人穿凿附会用来谋利或证明自己的观点。
《为什么数据会说谎》读书笔记模板
0 4
第六章天差 地别的事物: 忽略不同的 品质
0 5
第五章只见 树木,不见 森林:简化 复杂系统
第七章并非所 1
有计算得清楚 的东西都重要
第八章并非所 2
有重要的东西 都计算得清楚
3 第九章对衡量
指标的反思
4 第十章衡量指
标不是我们的 主宰
5
致谢
精彩摘录
这是《为什么数据会说谎》的读书笔记模板,可以替换为自己的精彩内容摘录。
作者介绍
彼得·施莱弗斯(Peter Schryvers),城市规划师与环境设计师,加拿大规划师协会成员,Beltline城市 壁画项目的发起人,毕业于卡尔加里大学。
目录分析
0
第1 一 章 应 试 教育:古德 哈特定律与 衡量指标悖 论
0 2
第二章投入 和产出:逻 辑模型与程 序评估
0 3
第三章长期 主义和短期 主义:跨期 问题和被低 估的时间
读书笔记
并非所有重要的东西都计算得清楚,也并非所有计算得清楚的东西都重要。 推荐各位老板看看。 2023.07.01——第16本书《为什么数据会说谎》作者希望读者得到的收获:“不是一切东西都可以测量,不 是一切有价值的东西都值得测量。以下为总结: 1.复杂性衡量指标可以帮我们将一个复杂的系统提炼成简化模 型,从而更容易做出决策。 2.客观性我们经常使用衡量指标来避免做出主观判断。 数据本身是客观精准的,骗人的是分析后得出的结论,说白了骗人的是人。 并非所有重要的东西都计算得清楚,也并非所有计算得清楚的东西都重要。 在数据化的时代静下心来思考如何数据化及数据背后的意义,思考数据的真实性。 数据本身是世界运行的基石,其反映的抽象能力将人类区别于动物和ai但是数据并不是客观公正的代名词, 我们需要审慎看待数据的来源,以及数据是否真的能代表想表达的观点。 测量只是手段,不是目的。 整本书核心,测量是手段,不是目的,不要让数据绑架自己,陷入数据陷阱。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
科研诚可贵科普价更高
——读《统计数字会撒谎》有感
对一年四季以出差为日常工作、飞机为每周必乘交通工具的笔者,随着年龄的徒增,将知天命,青春的激情早已逝去,并逐渐从喜欢推杯换盏的老友聚会和各种怡身养性的户外运动中隐退。
每逢辞旧迎新之际,心中最大的期盼就是节日里阳光灿烂,能够在温暖的阳台上读自己喜爱的书。
感谢天公作美,2011年的元旦阳光明媚,使自己梦想成真。
说出来一定会令人难以置信,对一位以阅读和修改文章为生的人,一位一目十行、博闻强志的老编辑而言,阅读理解一本仅8万字的故事书竟然耗费了自己两年的时光。
这就是笔者阅读美国作者达莱尔.哈夫著、廖颖林译、中国城市出版社出版的《统计数字会撒谎》一书的真实写照。
首次听朋友介绍该书时,有关它的各种传奇就促使自己立即将其购入囊中。
由于俗事的繁杂和乐于做新书收藏者的癖好,一直幻想等自己闲暇之余再认真研读。
直到聆听智者教诲:人生永远都不会知道,明天和意外哪个会先到。
这才将许多未来的规划加紧在当下付诸实施,阅读家藏的好书就是其中之一。
通过认真研读,笔者认为该书的吸引人之处如下。
1.经典科普,历久弥新。
该书的英文原版问世于20世纪50年代,作者达莱尔.哈夫是一位具有很深统计学造诣的新闻记者。
在科技发展日新月异、各种昙花一现的书籍汗牛充栋的时代,一本具有明显统计学科普特征、小巧的故事书却能在全球范围内畅销半个多世纪,不仅数十次重印,而且被翻译成多国语言出版,实在是令人惊叹不已。
这不仅表明作者选题的准确,而且证明大众对科普知识的旺盛需求以及经典科普著作对社会的重要影响。
2.倡导统计思维和读写能力一样必要。
早在上个世纪中叶,美国著名科幻作家H.G.威尔斯就曾断言:对于追求效率的公民而言,统计思维总有一天会和读写能力一样必要。
其实在科技高速发展的今日,使我们陷入麻烦的通常并非我们不知道的事情,而是那些我们知道得不确切的事情。
在更加注重事实与证据的今日,人们接触到越来越多的统计数据和资料,由于统计基本知识的匮乏,多种简单且易于被戳穿的低级骗术大行其道,导致国民对各种统计数据的普遍不信任。
最近网上广为流传的一条智力测试题就很说明问题:统计学家、地理学家及长跑冠军在沙漠里迷了路,谁活下来的机率最大,为什么?正确答案:统计学家,因为他身体中含的水分最多。
时至今日,面对各种良莠不齐、真伪难鉴的数据,只有在全民中广泛开展多种形式的科普教育,大力倡导统计思维,才有可能去粗取精、去伪存真。
3.全书的构思独具匠心。
本书共分为十章,哈夫认为,在一个以事实为依据的社会里,统计这一神秘的语言是如此地吸引眼球。
从第一到第九章,介绍了带有偏差的样本、精心挑选的平均数、故意遗漏重要数据、样本的误差、精心设计的各种有利于结论的图表、提供不匹配的资料、混淆相关关系与因果关系、不正确地使用资料等各种行骗的手段和工具。
通过多种实例告诉读者,统计数据是如何被人利用,并成为恶意夸大或简化事实、迷惑他人的工具。
如果作者不能正确理解并恰当运用统计语言,而读者无法真正获知这些术语的含义,那么,统计结果只能是废纸一堆。
哈夫明确指出:虽然经验告诉我们“眼见为实”,但眼睛告诉我们的“真相”或许隐瞒了部分事实,或许夸大了事实,所以,事实往往在所见所闻之外。
在本书的最后一章,真正显示出作者的统计学研究功底,哈夫通过具体措施指导读者凭双眼就能识别虚假的统计资料,并揭开它的老底。
他提醒我们,对待任何统计学资料都要存有必不可少的五问:(1)谁说的?(2)如何知道的?(3)是否遗漏了什么?(4)是否偷换了概念?(5)资料是否有意义?
4.写作风格独树一帜,令人叹为观止。
作者倾其全力为读者提供了一本可读性极强的卡通科普书,采用生动活泼、充满人情味的方式剖析了统计学这一枯燥无味的命题。
本书在充
满娱乐性中,能充分引发读者思考,并通过各种手段揭穿许多统计学方法中的谎言,具有很强的说服力。
尽管作者在前言中谦虚地指出,该书是一本如何利用统计学瞒天过海的入门读物,但哈夫坦言:毕竟骗子对于行骗的技巧早已胸有成竹,而诚实的人出于自卫也应该掌握它。
培根曾言:如果一个人以种种肯定的立论开始,他必将终止于各种怀疑;但如果他愿意抱着怀疑的态度开始,那么他必将获得肯定的结论。
一般而言,人们对数据的判断和接受也无外于此。
回溯历史,尽管该书的出版已逾五十载,但作者当年所提倡的思维和方法,对半个世纪后的我们仍然具有极强的实用性,正是由于该书的畅销,使得人们普遍关注“编造虚假信息”这一命题。
尽管笔者多年前也借助字典读过该书的外文原著,但毕竟属于非母语阅读,深刻领悟原著之精髓尚显不足。
该书中文版的问世,译者廖颖林功不可没。
笔者非常赞赏廖颖林对本书的评价,认为该书是“一顾倾人城,再顾倾人国”的绝色美人,由此也为笔者穷其两年才读完此小书提供了绝佳的理由。
衷心祝愿本书的所有读者不仅能开卷有益,而且能在轻松愉悦的心情中“抱得美人归”。