统计数据背后的真相 — 读《How to lie with statistics》
统计学数据背后的故事
![统计学数据背后的故事](https://img.taocdn.com/s3/m/93af5960905f804d2b160b4e767f5acfa1c783e4.png)
统计学数据背后的故事统计学是一门研究数据收集、分析和解释的科学。
通过统计学,我们可以深入了解数据背后的故事,揭示出隐藏在数字背后的真相。
本文将探讨统计学数据背后的故事,从而窥探数据背后的真实意义。
一、数据背后的故事数据,并不仅仅是一些冰冷的数字,它是对于现实世界的抽象和总结。
而这些数字背后,往往隐藏着人们的行为、心理和社会规律。
统计学正是通过分析这些数据,帮助我们理解背后的故事。
以人口统计为例,通过对人口数量、年龄分布、性别比例等数据进行分析,我们能够了解到一个地区的人口结构和发展趋势。
从这些数据中,可以发现人口老龄化的程度,以及一些社会问题的原因和解决方案。
数据背后的故事可能包括某一地区经济的繁荣或衰退,社会的稳定或动荡等等。
同样,对于经济统计数据的分析也能揭示出一国或地区的经济发展状态。
通过分析国内生产总值(GDP)、消费指数、就业率等经济指标,我们可以判断一个经济体的发展速度、经济结构的改善和投资方向的优化等。
这些数据背后的故事可能包括某个行业的兴衰,某个地区的经济合作模式等。
二、揭示数据背后的真相统计学不仅仅是对数据的收集和整理,更重要的是通过适当的方法,揭示数据背后隐藏的真相。
在数据的分析中,我们需要小心陷入到数据的陷阱中,避免被误导。
首先,我们需要考虑数据的来源和采集方法。
数据的来源和采集方法会对数据的可靠性和有效性产生重要影响。
如果数据来源不确切或采集方法存在偏差,那么分析结果可能会出现错误的偏差。
因此,在进行数据分析时,我们需要注意对数据进行可靠性和有效性的验证。
其次,我们需要关注数据之间的关系和相关性。
在统计学中,我们通过相关性分析等方法来探究不同数据之间的关系。
相关系数的计算可以帮助我们了解两个变量之间的相关性,从而进一步解读数据的背后故事。
最后,我们需要审慎地解读数据。
数据本身并没有价值,真正的价值在于我们如何解读并运用数据。
我们需要避免盲目追求数字背后的表面含义,而是要有系统的思维和深入的分析。
《统计数据会说谎》课件
![《统计数据会说谎》课件](https://img.taocdn.com/s3/m/2f25acc003d276a20029bd64783e0912a2167c09.png)
描述统计数据误导
当描述性统计数据被断章取 义或无视背景时,会导致人 们产生错误的印象。
推断统计数据误导
当推断性统计数据的样本选 取或分析方法存在问题时, 会导致错误的结论。
统计数据的谎言案例分析
案例一:政治民调数据 的谎言
政治民调常常被用来操纵公众 舆论,通过有选择性的数据展 示来达到特定的政治目的。
案例二:商业广告中的 谎言
许多商业广告使用模糊的统计 数据或夸大的效果来误导消费 者,以增加销售量。
案例三:科学实验数据 的谎言
有些科学研究可能受到资金、 压力或偏见的影响,导致其结 果被错误地呈现或解读。
如何辨别统计数据的谎言
1
多方获取信息
通过多个不同的渠道获取信息,以避免过于依赖单一数据源。
2
1 自然观测
通过观察和记录自然现象、行为或事件来收集数据,例如天气变化或动物行为。
2 人工实验
在控制环境中进行的实验来收集数据,例如药物试验或心理学实验。
3 抽样调查
通过随机抽样收集数据,以便代表总体进行统计推断。
统计数据的谎言
误导性统计数据
通过选择性地呈现数据或使 用不正确的统计方法来误导 观众。
《统计数据会说谎》PPT 课件
统计数据是我们生活中无处不在的一部分,它们既普遍又重要。然而,我们 必须认识到统计数据可能存在谎言的问题。
统计数据的类型
描述性统计数据
用于总结和展示数据的特征,例如平均值、中位数和标准差。
推断性统计数据
基于样本数据进行推断以得出总体数据的估计值和结果。
统计数据的来源
调查统计样本
仔细检查统计数据的样本,确保其代表性和可靠性。
3
检查数据来源
《统计学基础:透过数据看世界》随笔
![《统计学基础:透过数据看世界》随笔](https://img.taocdn.com/s3/m/e5b9a53e0a1c59eef8c75fbfc77da26925c596a3.png)
《统计学基础:透过数据看世界》读书笔记目录一、统计学基础概述 (2)1.1 统计学定义与作用 (3)1.2 统计学的基本概念 (3)1.2.1 总体与样本 (5)1.2.2 参数与统计量 (5)1.2.3 随机变量与概率分布 (7)二、数据收集与整理 (7)2.1 数据的来源与类型 (9)2.2 数据收集方法 (11)2.3 数据整理与描述 (12)三、数据分析方法 (13)3.1 描述性统计分析 (15)3.1.1 均值、中位数与方差 (16)3.1.2 偏度与峰度 (17)3.1.3 数据可视化 (17)3.2 推断性统计分析 (18)3.2.1 假设检验 (20)3.2.2 置信区间 (22)3.2.3 方差分析 (22)四、回归分析与预测 (24)4.1 线性回归分析 (25)4.2 多元线性回归分析 (26)4.3 时间序列分析 (28)五、统计学应用案例 (30)5.1 经济学领域 (31)5.2 社会学领域 (32)5.3 生物学领域 (34)六、总结与展望 (35)6.1 本书重点回顾 (36)6.2 统计学的未来发展趋势 (38)一、统计学基础概述作为一门处理数据的科学,为我们提供了一种系统的方法来收集、整理、分析和解释数据,从而揭示事物的内在规律和趋势。
在日常生活和工作中,我们经常需要面对大量的数据,如销售数据、人口统计数据、医疗记录等。
这些数据背后隐藏着许多有价值的信息,但只有通过科学的统计方法才能被挖掘出来并加以利用。
统计学的基础主要包括描述性统计和推断性统计两部分,描述性统计主要通过对数据的整理和展示,提供对数据的基本认识,如平均数、中位数、众数等统计量。
这些统计量可以帮助我们概括和描述数据的中心趋势和离散程度。
而推断性统计则是基于样本数据对总体进行推断和预测,它可以帮助我们估计总体的参数值,并检验我们对总体的假设是否成立。
统计学还涉及数据的收集和抽样方法,有效的收集方法能够确保数据的准确性和完整性,而合理的抽样方法则能够使我们以较小的成本获取足够的信息来支持决策和分析。
每周一本书《揭开数据真相》:质疑“看得见”的数据,挖出“看不见”的真相
![每周一本书《揭开数据真相》:质疑“看得见”的数据,挖出“看不见”的真相](https://img.taocdn.com/s3/m/de8f467ccbaedd3383c4bb4cf7ec4afe04a1b179.png)
每周一本书《揭开数据真相》:质疑“看得见”的数据,挖出“看不见”的真相本周给大家推荐的书是《揭开数据真相:从小白到数据分析达人》,这本书的技术门槛不高,主要目的是让读者学会如何质疑“看得见”的数据,并挖出“看不见”的数据真相,还原基本的事实。
来源:数据猿作者:jean小编寄语:“你看到的,只是我想让你看到的”,让数据说话,说客观其实也不客观,所以别太迷信数据啦~统计数据之所以强大有力,是因为它一点都不care我们的情怀、梦想和信仰——数据让我们客观地看待事物。
但是,当数据耿直的显示了人们讨厌的结果时,命运只能被操纵,最终变成“漂亮”的数据(企业财报、销售额、阅读量等等)……因此懂得解释统计数据,了解各种歪曲、滥用数据的技术对于理解数据真相是非常必要的。
本周给大家推荐的书是《揭开数据真相:从小白到数据分析达人》,这本书的技术门槛不高,主要目的是让读者学会如何质疑“看得见”的数据,并挖出“看不见”的数据真相,还原基本的事实。
有人会担心,我没有经过系统科学训练,是不是要再去读一个数学课程呢?其实完全没必要,那些复杂的数学公式主要用来让你崩溃的(回想自己的高数课程),最重要的还是见识一些常见套路,遇到类似的能举一反三,升华出来一些方法论就更棒了。
这本书就从很多实例中总结了数据分析的技巧和“骗人”招数。
比如通过内在不完备的样本,精心挑选的平均数,统计图表范围的切割,相关系数因果关系的误解,混淆逻辑,操控是非,达到一些不可告人的目的。
这并不是一本教科书,让你去学习深奥枯燥的统计数学,而是用风趣幽默的例子从别的视角来观察世界,启迪智慧。
比如本书的第十章在讲确认性偏差时,作者就“分母”的重要性举了一个很有趣的例子:假设有一群人看见你盯着一根树枝就把树枝折断了只要你不告诉这些人一个事实——你盯着这些树枝看了很久而树枝迟迟不断,那么,这些人肯定会对你表面上的断树功力大感敬畏。
在奇妙的统计学讨论中,只提分子、不提分母可以让不真实的事情看上去很真实。
统计数字会撒谎
![统计数字会撒谎](https://img.taocdn.com/s3/m/fa583177b4daa58da0114ad6.png)
统计数字会撒谎作者:廖颖林来源:《中国纺织》2010年第03期“自从使用了某某牌牙膏,我们的蛀牙减少了23%。
”或许你刚被这样的广告宣传攻陷,对这新款牙膏的“神奇功效”深信不疑,但是美国统计专家达莱尔·哈夫(Darrell Huff)告诉你:“没有比这更无聊的广告了。
”没错,问题就在这个“23%”上。
在一个用事实说话的社会,我们接触到了越来越多的统计数据和资料,例如各种经济数据、证券信息、投资可行性研究报告、公司财务报告等。
但是却有不少销售员、公关公司、广告撰稿人等在滥用书中所揭露的“数据造彼方法”来蒙蔽对数据知识不甚了解的客户、消费者和上司。
面对这些良莠不齐、真伪并存的数据或资料,我们需要去粗取精、去伪存真的过程。
我们又该如何进行鉴别?20世纪50年代,美国的各大媒体和宣传机构就已经开始越来越重视利用统计——“这个神秘的语言”——说话,然而大量的统计数据、统计资料由于主、客观的原因被滥用,很难起到描述事实、传递信息的作用。
相反,还往往对读者形成误导。
达莱尔·哈夫——一位具有深厚统计背景的新闻记者一发现了这一现象。
他在广泛调查的基础上,从报刊、杂志、书籍中,从美国统计学会一些统计学家提供的实例中,收集了大量案例,并在1954年写下了《How to Lie with Statistics》一书。
该书一经出版,便畅销美国,成为美国20世纪50年代的畅销书之一,并受到了当时美国各种书评杂志的好评,至今依然常常被美国不少权威媒体所引用。
《管理评论》认为:“哈夫先生用如此生动的,充满人情味的方式来论述统计这个干巴巴的课题,真是一剂灵丹妙药,我们太需要这本书了,它虽然娱乐性强、浅显易读,却十分具有说服力。
”《图书期刊》如此评价:“作者和制图者倾注了全力,给大家提供了一本十分轻松活泼的读物和卡通画。
它们能给你带来娱乐,又能引发思考,而且还揭穿了许多统计方法的谎言。
”《大西洋》评价道:“这是一本具有善意破坏性的书,读完它后,你对于‘万能统计’的信任将大大降低。
《统计陷阱》读后感
![《统计陷阱》读后感](https://img.taocdn.com/s3/m/41a89a81e53a580216fcfeb3.png)
《统计陷阱》《统计陷阱》本书是美国著名的统计学家达菜尔·哈夫的名著。
该书自1954年出版至今,多次重印并被译成多国文字,是一本影响深远的经典性著作。
《统计陷阱》一书之所以能够历久弥新,是因为其实用性,作者重说明、轻证明,重文字描述、轻理论推导,并结合活生生的案例,语方轻松诙谐,深入浅出,介绍了一些统计语和方法,更揭示了许多统计骗局,本书一共分八章:第一章内在有偏的样本主要将通过偏差的样本来获得想要的数据,文中举例耶鲁大学毕业生的工资来说明这个问题,给出统计结论时却并未给出样本,通过合理的猜测,可以知道这样的样本是有偏差的,例如能联系上的人一般都不穷,愿意告诉别人自己工资的人更不穷第二章精心挑选的平均数一般给统计结论时却并不给出是哪种平均数,是算术平均还是中位数或者是众数,通过这种方式来欺骗人,例如最近很流行的居民平均居住面积,平均收入等第三章没有披露的数据反复做试验,指给出对自己有利的数据,例如我想证明抛硬币正面出现的次数是80%,那么我每次抛10次,反复抛,直到某次试验正面出现8次,以此作为支持我结论的数据第四章毫无意义的工作计算某一个数据时,需要知道这个数据可能的误差,如果不考虑这个误差,则数据毫无意义,例如智力测验,需要首先明确测验可能的误差,例如正负3,平均智力是100正负3,如果不考虑这个误差,而直接说平均智力是100,a的智力是98,b的智力是101,b的智力比a的好,这样的结论是没有意义的第五章惊人的统计图形通过对图形的夸张画法,来达到误导读者的目的,例如将y轴不从0开始,x,y比例不一致等第六章平面图形本章与上一章比较类似,不过图形换成了平面图形,平面图形不只有高度还有宽度,例如通过钱袋子来比较工资,本来2倍的工资只需要钱袋子高两倍就可以,但这样不协调,因此要更宽,更鼓,导致的结果就是不是2倍,看着是8倍第七章不相匹配的资料问题本身并不能真实地反映这个问题所代表的观点,例如黑人与白人的就业机会均等 == 黑人与白人平等,事实上有种族歧视的人更愿意回答二者的工作机会相等,而同情黑人的人更愿意回答不等,另外很多数据与最终的结论也没有多大的关系,例如药物实现,实验室的环境,药物与最后在药店里购买的药物有可能很不一样,或者实验室环境与人体环境差别很大,等等,都导致数据的不准确性。
《统计数据会说谎》课件
![《统计数据会说谎》课件](https://img.taocdn.com/s3/m/41d0d3467dd184254b35eefdc8d376eeafaa175e.png)
详细描述
一些学者在研究中为了证明自己的观点,可能会篡改或编造 实验数据,或者选择性地使用部分数据来支持自己的论点, 导致研究结果失真。
05
如何避免统计数据的说谎
提高公众的数据素养
培养对数据的敏感性和批判性思维
01
让公众了解数据的基本概念、特点和局限性,学会从多角度分
析数据,不盲目相信或传播数据。
惕,仔细核实数据的真实性和可靠性。
04
统计数据的说谎案例
媒体报道中的数据误用
总结词
媒体在报道时往往为了制造轰动效应 或引导读者做出某种判断,会选择性 地使用或解读数据,导致数据误导。
详细描述
媒体在报道时有时会忽略数据的背景 信息,只选取部分数据来支持他们的 观点,或者对数据进行断章取义的解 读,使读者产生误解。
数据的选取偏差
总结词
在收集和选择数据时,可能会因为主观因素或外部压力而产生偏差,导致数据不 能客观反映实际情况。
详细描述
数据的选取偏差通常源于对数据的理解不足或偏见,导致只选取符合某种观点或 利益的数据,而忽略其他重要信息。例如,在市场调研中,如果只选择有利于自 己产品的数据,而忽略其他竞争产品的优点,就会产生数据选取的偏差。
损害信任
不准确的统计数据会破坏 人们对数据和信息来源的 信任,影响数据和信息的 公信力。
浪费资源
基于错误数据的决策可能 导致资源的不合理分配, 造成资源浪费。
提高对统计数据的重视和警惕性
增强意识
通过培训和宣传,提高人 们对统计数据重要性的认 识,了解数据质量对决策 的影响。
严格审核
建立数据审核机制,对统 计数据进行严格把关,确 保数据的准确性和可靠性 。
数据解读的误区
统计陷阱读书笔记
![统计陷阱读书笔记](https://img.taocdn.com/s3/m/658c0d01a300a6c30d229f04.png)
统计陷阱读书笔记(摘抄为黑色字体,个人感悟为蓝色字体)译者的话20世纪50年代,美国的各大媒体和宣传机构越来越重视利用统计——“这个神秘的语言”—一说话,然而大量的统计数据、统计资料由于主、客观的原因被滥用,很难起到描述事实、传递信息的作用。
相反,还往往对读者形成误导。
从1950年开始,越来越多的人开始注重数据的作用,但是,由于数据被一些机构和商家滥用,甚至是被不正确的利用,很有可能使人们形成错误观念,而达成这些机构和商家的目的。
协助行骗的工具有很多,包括:有偏的样本、刻意挑选的平均数、遗漏某些重要的数据、样本的误差、统计图、平面图、不匹配的资料、混淆相关关系与因果关系以及不正确地使用资料。
每一种工具从某种角度上都可以提高人们对某一数据的信服度,但也可以诱导人们信服错误的虚假的数据。
对“统计资料”应该“提出的五个问题”:“谁说的?”“如何知道的?”“是否遗漏了什么?’’“是否偷换了概念?’’"资料是否有意义?”通过寻找这5个问题的答案,读者能初步判断资料是否真实可信在遇到数据时,应该对数据保持一种怀疑的态度,可能看起来那么真实的数据也有可能是被故意歪曲真相所创造的。
所以对于数据可以提出五个问题来验证数据的可信度,同时在自己运用数据时也要求做到更加真实客观。
培根曾经说过:“如果一个人以种种肯定的立论开始,他必将终止于各种怀疑;但如果他愿意艳着怀疑的态度开始,那么他必将获得肯定的结论。
”我想对数据资料的判断和接收也是如此。
对一个事情一个说法留有怀疑的态度,并为之去检验验证,那么最终得到的结论会有检验的结果作为依据去支撑它的正确性,但如果从一开始就肯定各种事物,那么最后也只能得到一个看似是肯定,实际上可能错误的结论。
有3种谎言:谎言,楷糕透顶的谎言和统计资料。
---Disraeli这句话体现统计资料被滥用后缺乏真实性,常常会引导大众产生错误观念。
绪言平均数、作用关系、趋势和图表与看上去的并不总是一致。
统计数据会说谎读后感
![统计数据会说谎读后感](https://img.taocdn.com/s3/m/5d51f67f182e453610661ed9ad51f01dc2815782.png)
统计数据会说谎读后感
你知道吗,以前我总觉得统计数据那就是板上钉钉的事实,就像数学公式一样,一加一肯定等于二。
可是这本书完全颠覆了我的想法。
书里讲了好多例子,都是关于那些看似确凿的统计数据,其实背后藏着各种猫腻。
我当时就想,原来我们平时看到的数据,说不定很多都是在“骗”我们呢!
就比如说,有些数据的样本选取就很有问题。
可能只选了一小部分特定的对象,然后就得出一个看似普遍适用的结论。
这就好比你只看了一群爱运动的人的健康状况,就说所有人只要运动就肯定健康,这显然不合理嘛。
看到这里的时候,我就忍不住摇头,心里想着,这也太能糊弄人了吧!
还有那些数据的呈现方式,那也是大有文章。
同样的数据,用不同的图表或者表述方式,给人的感觉就完全不一样。
这让我想起了有时候在广告里看到的数据,看着好像很厉害,可仔细一琢磨,可能就是被“美化”过的。
这真的很容易误导我们消费者啊,你说是不是?
不过呢,这本书也不是一味地在揭露黑暗面。
它其实也在提醒我们,要学会正确地看待统计数据。
不能盲目相信,要有点批判性思维。
我觉得这一点对我们在这个信息爆炸的时代特别重要。
现在到处都是数据,各种各样的统计结果在我们眼前晃悠,如果我们没有一点分辨能力,那就只能被牵着鼻子走了。
我在想,要是更多的人能读一读这本书就好了。
这样大家在面对那些看似权威的统计数据时,就不会轻易被忽悠了。
你看了这本书也会有同样的感觉吗?这真的是一
本能让你对数据有全新认识的好书啊!我感觉我以后再看到数据,肯定会多留个心眼儿了。
这书的影响,真的是很深远呢!。
统计陷阱读后感
![统计陷阱读后感](https://img.taocdn.com/s3/m/4355db3dfe00bed5b9f3f90f76c66137ee064fe4.png)
统计陷阱读后感第一篇:统计陷阱读后感由于知识,信息和地位的不对称,普通人在面对行业精英专门设计的陷阱总是无法防备.就像普通美国民众无法理解华尔街“金融天才”搞的次级抵押贷款的潜在风险一样...恩,不光是普通人,就连中石油这样的顶级上市公司,在顶级ceo的带领下也会中套,油价顶点超高价大笔收购国外油田例如TYK之类的...信息欺骗有很多种,而利用统计数字来进行欺骗可能是比较普遍的了,就像马克吐温说的,There are three kinds of lies: lies, damned lies and statistics.这本书就是揭露说明专家们的欺骗行为的.比如报社为了吸引眼球,如何发布关于名牌大学毕业生高收入的报道,政府部门如何利用同样的原始数据,算出不同的统计结果,房地产为了卖房子,如何统计出小区业主的超高收入,一般人如何误读智商测验的一般统计结论,大公司的销售和市场部门如何用图形上的视觉欺骗来提高统计数字给人的感官效果,广告商如何用不匹配数据对大众进行误导....接着,在罗列了种种利用统计欺骗的手段后,书里描述了一系列方法和手段,告诉我们在面对统计数字的时候,如何去理解和评估那些数据,如何揭穿有意或无意的统计骗局.这本书的特色就是案例非常多,用案例的好处是比较容易能理解,缺点就是有的时候比较罗嗦,有时候一眼就能看出问题所在,书里还要花个几千字去描述他...好比那个经典的二维图形欺骗案例...书里我最喜欢的一段是介绍平均工资偏高的案例,不过有些地方用词太学术了:“当数据的分布呈现正偏态时,均值往往偏离一般水平。
收入分布是典型的正偏态分布,这样一来,平均工资偏高就十分正常了。
"囧。
这有优点像概率统计课程了。
这个还不如我的解释通俗易懂:假如有10个穷人工资是1块,1个富人工资是12块”,算术平均数的算法,就是22块除以11人,平均工资是2块。
这个结果明显高于普通人“平均”工资.所以统计局平时说的大家平均工资有2k了,其实一般人是没有2k的,大家感觉偏高了,可是统计局可以言之确凿的说,这确实是某种统计方法算出来的还有一种常用的统计方法我记得是平方平均数,计算方法是平方数相加后取平均,再开根号,用上面的例子就是(10+12*12)/11=14,14开根号就是 3.7块.还有一种统计数值,调和平均数(將数值个数除以数值倒数的总和)算出来是1 我发现最夸张的是几何平均数算出来是11。
统计数据会说谎阅读心得
![统计数据会说谎阅读心得](https://img.taocdn.com/s3/m/cc688f50591b6bd97f192279168884868762b88d.png)
统计数据会说谎阅读心得一、概述在当今社会中,数据无处不在,从商业报告到社交媒体统计,再到政府发布的统计数据。
这些数据真的可靠吗?统计数据会说谎,本文将探讨为什么统计数据会撒谎,以及如何识别和避免被误导。
统计学是一门旨在从数据中提取有意义信息和结论的科学,当涉及到统计数据时,事情并不总是那么简单。
统计数据会因为各种原因而说谎,从而误导读者。
在本阅读心得中,我们将探讨统计数据为什么会说谎,以及如何识别和避免被误导。
1. 数据作为现代社会的重要组成部分在现代社会中,数据已经成为了不可或缺的一部分。
它像空气一样弥漫在我们的生活中,从商业决策、医疗健康,到教育、交通乃至国家治理,每一个方面都离不开数据的支撑。
作为一名统计学家,我深知数据的重要性。
但当我们沉浸在这些美丽而富有洞察力的数据时,也需要时刻保持警惕,防止数据被误用或篡改。
因为数据本身并没有意义,只有当它被正确解读和使用时,才能真正发挥其价值。
2. 数据分析和解读的重要性在数据分析的过程中,我们不仅要关注数据的准确性和完整性,更要学会如何正确地解读这些数据。
数据本身并不能告诉我们任何事情,它只是一种工具,帮助我们更好地理解和分析现实世界。
对数据进行深入的分析和解读,是每一个数据分析师不可或缺的技能。
我们需要明确数据解读的目标,这可能是为了评估一个项目的成功程度,也可能是为了发现潜在的市场机会,或者是为了优化业务流程。
无论目标是什么,我们都应该确保我们的解读方法与目标的契合度,这样才能确保我们的分析工作具有实际意义。
我们要掌握正确的数据解读方法,这包括统计学原理、数据可视化技巧以及领域专业知识等。
通过运用这些方法,我们可以从数据中提取出有价值的信息,并形成能够支持决策的见解。
数据解读是一个持续的过程,随着市场和业务环境的变化,我们需要不断地更新我们的解读方法和策略,以适应新的情况。
我们才能确保我们的数据分析工作始终与现实世界保持一致,为决策者提供真正有价值的见解。
如何反驳统计资料
![如何反驳统计资料](https://img.taocdn.com/s3/m/89401d4ec850ad02de8041e0.png)
如何反驳统计资料——《统计数字会说谎》读后感近日,读了一本叫做《统计数字会说谎》的书,该书是美国统计专家达莱尔·哈夫的传世之作,书中大胆地揭露了至今仍被销售员、广告撰稿人、记者甚至专家频频使用的大量的统计操纵技巧,同时还配有别具一格的风趣插图以及众多幽默的案例。
神秘的统计学在这里被哈夫像讲故事一样一一道来,莞尔一笑中让你知晓深奥的统计学基本原理,掌握揭露“虚假数据”的最有力武器。
当然这里所说的统计数据不是专门指我们统计局的数据,而是指跟我们生活、学习、工作相关的各种各样的统计数据。
个人认为,是非常有看点的一本书。
本书给我留下印象最深刻的是教会我们如何反驳统计资料。
怎样凭借双眼就能识破虚假的统计资料,并解开它的老底;如何在这一大片充满欺骗性的数据海洋中找出可靠有用的资料。
书中指出,我们接触到统计资料时,应该要提5个问题,分别是:1、谁说的?2、他是如何知道的?3、遗漏了什么?4、是否有人偷换了概念?5、这个资料有意义吗?下面分别对着五点做简单的介绍。
1、谁说的?某些企业、单位或者个人,出于自身利益,提供的数据可能产生偏差,这些偏差的表达形式可能是错误的陈述,可能是不易被揭穿的含糊之词,还可能是可以挑选的适合的数据,而将不合适的数据放在一边。
由于有了自身的利益而有了这些偏差,所以,我们应该要问一句这些数据到底是谁说的?例1:美国的共和党在竞选时宣称1942年该党的杜威竞选州长前,一些地区教师的最低收入只有900美元;而到1948年,由于杜威当政有方,纽约市教师最低收入水平提高到2500-5325美元之间。
以前只有900美元,现在已在2500-5325美元之间,的确有了长足的进步。
但是我们得问一个问题,谁说的?这是共和党在竞选时,出于竞选的目的,所说的是否有什么奥妙在里面呢?经过分析,实际上,900美元是这个州所有乡村地区的最低收入,而2500-5325美元却是纽约市的最低收入水平。
这个数据并不能反映在杜威执政期间,这个州的教师收入水平有所提高。
如何看穿统计数据造假
![如何看穿统计数据造假](https://img.taocdn.com/s3/m/2df8e87cb7360b4c2e3f6475.png)
声 誉 却 让 你 糊 里 糊 涂 地 将 结 论 看 成 了 到 底 是 因 为 选 择 不 当 ,还 是 像 这 个 案
有 时 . 材 料 只 给 出 了 百 分 数 , 却
康 奈 尔 大学 说 的 。
例 一 样 。 调 查 者 有 意 识 地 选 择 对 自 己 没 有给 出原 始 数 据 ,这 种 数 据 也 带 有欺
题 采 探 讨 .从 而 通 过 问 题 的 答 案 来 避 能 够 说 明 问题 ),却 使 非 的东 西 昕迷 惑 。 最 后 还 用 了 一 个 狡 猾 的 措 辞 — — 平 均
数 — — 来 掩 盖事 宴真 相 .
是 谁 这 么 说 ? 首 先 ,要找 的 第 一 样 东西 是 偏 差 。
如何看穿统计数据造假
[美 ]达莱尔 一啥夫
并不 是你遇 见的 所有统 计 信息都 能 用化学 分析 或化验 室里 那一 套设备 来 检 验 。但 是 你 可 以提 出 几 个 简单 的 问
自 己 更 为 有 利 的 男 一 年 为 基 期 ;或 是 使 用 不 恰 当 的 测 算 方 式 , 例 如 . 明 明 是 中 位 数 更 能 说 明 问 题 (或 许 足 过 于
己有 利 的数 据 ,剔除 对 自 己不 利的 数 据 : 从 而试 图说 明 家 已 进 入繁 荣 时 期 、
也 可 以 改 变 衡 量 的 标 准 , 比 如 存 对 比
之 前 提 到 的 那 个 声 称 h大 学 会 导
时 先 用 某 一 年 为 基 期 ,而 后 又 选 择 对 致 女 性 结 婚 概 率 降 低 的 作 者 正 是 利 用
悦读 /秀场 /收藏 /旅途 /经济ABC
一 编者按 : 统计 数 字 会说 谎 》是 达 莱 尔 ·哈 夫 的传 世 之 作 ,该 书 大胆 地 揭 露 了
统计陷阱读后感
![统计陷阱读后感](https://img.taocdn.com/s3/m/1b30de59b0717fd5370cdcc2.png)
《统计陷阱》读后感放寒假前,经学长的介绍,特地在图书馆里借了一本《统计陷阱》在假期里读,看完之后的感触到真不少,而且总想着什么时候写一点读后心得之类的东西,无奈,因为惰性,总是找各种各样的理由来推迟.这次还得感谢学校这个次机会,让我终于可以完成早该结束的任务了。
先来谈谈写这本书的背景:在20世纪50年代,美国出现了一种尊崇统计风,太多的人都乐意,也轻易的相信了那些统计数据,原因很简单,大多数的统计数据都可以让不同的人产生不同的效果。
例如,一个企业可以让员工看出今年的效益,同样的数据,换一种统计方法,也可以反映出企业的不景气,这就是为什么太多的公司,企业,甚至政府部门都习惯用统计的方法来传达自己的意思。
介于这个背景之下,美国作家达莱尔·哈夫以一个经验老道,且退休的窃贼的身份,用回忆录的形式,在本书的前八章讲述了常用的一些行骗手段,在第九章总结了前面所列出的所有方法,而在最后一章中,教人们如何识破统计数据中的陷阱,告诫人们以一个正确的态度去看待一个数据,从而不做一个被数据玩弄于手的玩偶.本书中列举出的,常用统计手段大致可分为:利用内在有偏样本,选出不同的平均数,隐藏总要的数据,忽略必要的误差,滥用统计图形,采用不完整匹配的资料以及误解相关关系等。
当读完这本书时,回过头在,如果你用书中的衡量标准来看任何一组数据,都会发现其中的不可行性,所有的数据都是可以质疑的,那么不禁会有两种念头:其一,为什么统计着要这样做,公布这样的数据是为什么?答案很简单,无非是利益所趋,商家,政府乃至所有人都想隐藏掉那些自己认为很重要的数据,公诸于世的无非是想博得同情或者获得荣耀。
其二,这个世上不就没有可以相信的数据,因为没哟绝对的正确,那么我们是否就因此而否定自己看到的,听到的一切呢?显然不是,这本书最重要的是,教会我们如何正确的看待数据,正确的从数据中拿去自己需要的,不可全信,但不意味着一点也都不可信。
在这里,我重点来谈谈:内在有偏样本,选取不同平均数,采用不完整匹配的资料以及误解相关关系这几种“行骗手段”。
统计数据会说谎读书笔记
![统计数据会说谎读书笔记](https://img.taocdn.com/s3/m/5c4b0249a517866fb84ae45c3b3567ec102ddcf2.png)
统计数据会说谎读书笔记
【原创版】
目录
1.统计数据为什么会说谎
2.如何识别和避免被统计数据欺骗
3.从统计数据中获取真实信息的方法
正文
统计数据是现代社会中不可或缺的一部分,它被广泛应用于各个领域,如科学研究、商业决策、政策制定等。
然而,统计数据有时也会说谎。
那么,为什么会出现这种情况呢?
首先,统计数据的产生过程中可能存在偏差。
比如,样本选取偏差、测量误差等,这些都可能导致统计数据与实际情况存在差异。
其次,统计数据的解读和表达可能受到主观因素的影响。
人们往往会根据自己的观点和立场去解读数据,从而让数据为自己的观点服务。
那么,我们应该如何识别和避免被统计数据欺骗呢?一个有效的方法是保持怀疑和批判性思维。
在面对统计数据时,我们应该问自己:这个数据的来源是什么?它是如何被收集和处理的?数据的解读者是否有偏见?只有当我们对数据有足够的了解,才能避免被数据欺骗。
同时,我们也需要学会从统计数据中获取真实信息。
这需要我们具备一定的数据分析能力,能够从数据中发现规律、趋势和关联。
此外,我们也需要了解数据的局限性,知道在什么情况下,数据可能无法反映实际情况。
第1页共1页。
统计学解读数据背后的故事
![统计学解读数据背后的故事](https://img.taocdn.com/s3/m/f6f62b2358eef8c75fbfc77da26925c52cc59185.png)
统计学解读数据背后的故事统计学作为一门科学,专门研究数据的收集、分析和解释,能够揭示数据背后的故事。
通过统计学的方法和技巧,我们可以更好地理解数据所呈现的趋势和规律。
本文将探讨统计学如何帮助我们解读数据背后的故事,以及其在不同领域的应用。
一、统计学的基本概念和原理统计学是一门独立的科学学科,它关注的是数据的收集、整理和分析。
统计学家使用统计方法和技术来推断和预测数据的特征、趋势和关系。
常见的统计学方法包括描述统计、推断统计和回归分析等。
1. 描述统计描述统计是统计学中最基本的方法,它通过数值指标和图标来描述数据的集中趋势和变异程度。
常见的描述统计指标包括均值、中位数、标准差和范围等。
图标形式可以有直方图、饼图和散点图等,用以展示数据的分布情况。
2. 推断统计推断统计是基于样本数据对总体特征进行推断和预测的方法。
它利用概率和抽样理论,通过估计总体参数和进行假设检验来得出结论。
推断统计有助于我们从数据中挖掘出更多的信息,以便做出合理的决策。
3. 回归分析回归分析是研究变量间关系的一种统计技术。
它通过建立数学模型,分析自变量对因变量的影响程度和方向。
回归分析常用于预测和解释因果关系,对于理解数据背后的故事具有重要意义。
二、统计学在市场营销中的应用统计学在市场营销领域有着广泛的应用,可以帮助企业了解消费者行为、市场趋势和竞争对手的表现。
1. 消费者行为分析通过统计学的方法,可以对消费者行为进行分析,了解他们的购买偏好、消费习惯和反馈意见。
这有助于企业制定更有针对性的销售策略,提升产品和服务的质量。
2. 市场趋势预测统计学可以通过对历史数据的分析和建模,预测市场的趋势和走向。
这对企业决策和市场营销活动的规划至关重要,能够帮助企业抢占市场先机。
3. 竞争对手分析统计学可以帮助企业对竞争对手的销售数据、市场份额和产品定价等进行分析,以评估自身在市场中的竞争地位。
通过对竞争对手的数据进行解读,企业可以找到自身的优势和改进的空间。
统计分析揭示数据背后的规律性
![统计分析揭示数据背后的规律性](https://img.taocdn.com/s3/m/234c9eb4710abb68a98271fe910ef12d2af9a9c6.png)
统计分析揭示数据背后的规律性数据统计分析是一种重要的工具和方法,它能够帮助我们揭示数据背后的规律性。
通过对数据进行系统的整理、归纳和分析,我们可以发现隐藏在数据中的模式、趋势和关联,从而得出有意义的结论,并作出相应的决策。
本文将以数据统计分析为核心,探讨它在揭示数据背后规律性方面的作用和价值。
首先,数据统计分析可以帮助我们发现数据之间的关系和趋势。
通过对大量数据的整理和计算,我们可以得到一系列统计指标,如均值、方差、相关系数等,这些指标可以直观地反映数据之间的关联和变化趋势。
例如,在市场调研中,我们可以通过对消费者之间的收入水平和消费习惯进行统计分析,来揭示两者之间的关系,进而为企业制定营销策略提供依据。
其次,数据统计分析可以帮助我们发现数据中存在的模式和规律。
有些数据在表面上看起来毫无规律可言,但通过数据统计分析,我们可以发现其中的规律性。
举个例子,研究者通过对天气数据的统计分析,发现了温度与大气湿度之间的关系,从而形成了著名的露点温度理论。
这个理论在农业、气象等领域具有重要的应用价值。
此外,数据统计分析还可以帮助我们进行预测和预测。
通过对历史数据的统计分析,我们可以建立数学模型,从而根据过去的经验预测未来的趋势和结果。
例如,在金融领域,通过对股票市场的历史数据进行统计分析,可以构建股票价格的预测模型,帮助投资者做出合理的投资决策。
此外,数据统计分析还可以帮助我们发现数据中的异常和规律。
有时候,数据中会存在一些异常的值或者规律性的变化,这些异常和规律可能对我们的决策产生重大的影响。
通过对数据进行统计分析,我们可以及时发现这些异常和规律,并进行相应的调整和决策。
例如,在质量控制领域,通过对产品质量数据的统计分析,可以发现存在的问题和改进的空间,从而提高产品质量和效率。
综上所述,数据统计分析是一种揭示数据背后规律性的重要方法和工具。
通过数据统计分析,我们可以发现数据之间的关系和趋势,发现数据中的模式和规律,进行预测和预测,并发现异常和规律。
统计数据撒谎
![统计数据撒谎](https://img.taocdn.com/s3/m/8d4f01c776a20029bd642de6.png)
•问题三:遗漏了什么?
通常,你并不会被告知包含了多少观测值,这个数据的缺失,特别当 信息来源于信息存在利害关系一方时,已足以使你对整件事情提出质
大家好才是真 的好
疑。比如,当均值与中位数相差甚远时,需要注意那些没有标明类型
的平均数。很多数据因为没有比较而变得缺乏意义。
如何反驳统计资料——真相只有一个
3
图形图表变身 —— 看我72变
黄金联盟的黄金奖励 持续6000C,第3个月奖励1g黄金 第6个月奖励2g黄金, 第9个月奖励3g黄金
第12个月奖励4g黄金
2g
1g
3g
4g
宣导时,图形上长、宽、高按比例放大,文字上的“2”倍,给人
的感觉却是8倍,刺激感更强。
统计数字撒谎的
4种方式
精选的平均数
未披露的数据 图形图表变身
平均睡眠时间为 7.8小时
4
混乱的神逻辑 ——见证统计操纵
•百分数也给误解提供了肥沃的土壤,和小数一样,它也能为不确切的 事物蒙上精确的面纱。
A:本月绩优 率环比提升 20个点
B:本月绩优 率环比提升 25%
如何反驳统计资料——真相只有一个
•怎样凭双眼就能识破虚假的统计资料,并揭开它的老底,同样重要的是,如何在一大 片充满欺骗性的数据海洋中找出可靠有用的资料。
•问题一:谁说的?
首先寻找的是偏差——出于名誉或收入的考虑, 而需要证明某些结论,他们提供的数据都有可能 产生偏差.
•——
提出5个问题
如何反驳统计资料——真相只有一个
•问题二:他是如何知道的?
数值是否足够大,从而能解释问题?观察值是否足够多,从而保证结 论的可靠性?——对于许多报告中的内容,通过观察,你会发现由于 缺乏足够多的观测值,报告的内容不足以说服任何人。
统计数据背后的真相 — 读《How to lie with statistics》
![统计数据背后的真相 — 读《How to lie with statistics》](https://img.taocdn.com/s3/m/bae4410f964bcf84b9d57bc4.png)
范围、方法等都不一样,两方面数据结果根本没有可比性。
新浪公布的那个结果是我们在国内128个城市采取计算机辅助电话访问的调查结果,而搜狐公布的那份结果是我们在北京、上海、广州、青岛、南京5个重要城市采取街访方式的调查结果。
那5个最重要的城市和其他128个城市的网络普及率、人对网络的偏好都不一样,数据结果反映的东西肯定也不同”,普通网民在关注到“第一”的同时会去关注这些背后的数据吗?另外就是同一个数据,但是图表的基准值、刻度等不一样,也会导致图表表达出的效果截然不同,比如下面两个图,左边第一眼给人的感觉是2名用户之间的上网时长差异不大,而右边这个给人的感觉是差异非常大。
这个资料有意义吗?许多统计资料在我们一眼就能看出是有误的。
比如前一阵因为BT事件,一调查机构宣称:在他们随机调查的100位网友中,有87.53%的网友支持封杀BTchina;有时在对用户进行分类时,对于分类结果,分成的各个类别的用户是否都能在现实中找到对应的人群,或者说周围认识的每一个人是否都能找到属于自己的类别,这都是一眼能够看出是否有意义的。
最后再举一个最常见但也最经常被误导的两个例子:很多人在学生时代肯定都听过老师有过这样的计算:离某某考试还有1个月时间,扣去一天8小时共10天的睡眠时间,扣去一天约4小时共5天的进餐活动等时间,再扣掉每周两天共8天的双休日,这时余下的学习时间就只剩7天了,这时一听都觉得很紧张,但是感觉没有这么短啊,其实是我们被老师忽悠了;一个产品开发项目计划本来总时长是1个月,后来因为某种变更,需求规划时间要增加15%,界面设计时间要增加20%,开发的时间要增加10%,测试时间要增加5%,则总时间要增加50%?实际总时间增加肯定不到20%。
在这个信息爆炸的时代,统计本是一个通过数据揭露本质的有力工具,但遗憾的是,统计未必能够揭示真实,有时候还可能成为假象的帮凶。
当我们面对生活中形形色色的统计数据时,还要多保持一些理智和清醒,并要有所保留地看待问题。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
范围、方法等都不一样,两方面数据结果根本没有可比性。
新浪公布的那个结果是我们在国内128个城市采取计算机辅助电话访问的调查结果,而搜狐公布的那份结果是我们在北京、上海、广州、青岛、南京5个重要城市采取街访方式的调查结果。
那5个最重要的城市和其他128个城市的网络普及率、人对网络的偏好都不一样,数据结果反映的东西肯定也不同”,普通网民在关注到“第一”的同时会去关注这些背后的数据吗?
另外就是同一个数据,但是图表的基准值、刻度等不一样,也会导致图表表达出的效果截然不同,比如下面两个图,左边第一眼给人的感觉是2名用户之间的上网时长差异不大,而右边这个给人的感觉是差异非常大。
这个资料有意义吗?
许多统计资料在我们一眼就能看出是有误的。
比如前一阵因为BT事件,一调查机构宣称:在他们随机调查的100位网友中,有87.53%的网友支持封杀BTchina;有时在对用户进行分类时,对于分类结果,分成的各个类别的用户是否都能在现实中找到对应的人群,或者说周围认识的每一个人是否都能找到属于自己的类别,这都是一眼能够看出是否有意义的。
最后再举一个最常见但也最经常被误导的两个例子:
很多人在学生时代肯定都听过老师有过这样的计算:离某某考试还有1个月时间,扣去一天8小时共10天的睡眠时间,扣去一天约4小时共5天的进餐活动等时间,再扣掉每周两天共8天的双休日,这时余下的学习时间就只剩7天了,这时一听都觉得很紧张,但是感觉没有这么短啊,其实是我们被老师忽悠了;一个产品开发项目计划本来总时长是1个月,后来因为某种变更,需求规划时间要增加15%,界面设计时间要增加20%,开发的时间要增加10%,测试时间要增加5%,则总时间要增加50%?实际总时间增加肯定不到20%。
在这个信息爆炸的时代,统计本是一个通过数据揭露本质的有力工具,但遗憾的是,统计未必能够揭示真实,有时候还可能成为假象的帮凶。
当我们面对生活中形形色色的统计数据时,还要多保持一些理智和清醒,并要有所保留地看待问题。
因为“如果一个人以种种肯定的立论开始,他必将终止于各种怀疑;但如果他愿意抱着怀疑的态度开始,那么他必将获得肯定的结论。
”
(本文出自Tencent CDC Blog,转载时请注明出处)
人人都是产品经理()中国最大最活跃的产品经理学习、交流、分享平台。