第六章 统计学悖论

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计数字还表明,在 亚利桑那州死于肺结核的 人比其他州的人多。这是 否就意味着亚利桑那州的 气候容易生肺病? 正好相反。亚利桑那 的气候对害肺病的人有好 处,所以肺病患者纷纷前 来,自然这就使这个州死 于肺结核的平均数升高了。
有一个调查研究说脚 大的孩子拼音比脚小的 孩子好。这是否是说一 个人脚的大小是他拼音 能力的度量? 不是的。这个研究对 象是一群年龄不等的孩 子。它的结果实际上是 因为年龄较大的孩子脚 大些,他们当然比年幼 的男子拼得好些。
乙:这个世界是多么小啊! 她是我妻子最好的朋友!
这是不大可能的巧合吗? 统计学家已经证明并非如此。
很多人在碰到一位陌生人,尤其是在远离家 乡的地方碰到一个生人,而发现他与自己有一个 共同的朋友时,他们都会感到非常惊讶。 在麻省理工学院,由伊西尔领导的一组社会 科学家对这个“小世界悖论”作了研究。他们发 现,如果在美国随便任选两个人,平均每个人认 识大约1000个人。这时,这两个人彼此认识的概 率大约是1/100000,而他们有一个共同的朋友的 概率却急剧升高到1/100。而他们可由一连串熟人 居间联系(如上面例举的二人)的概率实际上高 于百分之九十九。换言之,如果布朗和史密斯是 在美国任意选出的两个人,上面的结论就表示: 一个认识布朗的人,几乎肯定认识一个史密斯熟 识的人。
教学目的: 1.了解统计学的一些概念和方法。 2.对统计学中的一些悖论进行分析和思考。 3.初步认识统计分析方法的一些局限性。
1.骗人的“平均数”
吉斯莫先生有一个小
工厂,生产超级小玩意儿。
管理人员由吉斯莫先生、 他的弟弟、六个亲戚组成。 工作人员由5个领工和10个 工人组成。
工厂经营得很顺利,需
吉斯莫:我不同意你 的说法!你实在是不明白 道理。我已经把工资列了 个表,并告诉了你,工资 的中位数是200元,可这 不是平均工资,而是中等 工资。 萨姆:每周100元又是 怎么回事呢? 吉斯莫:那被称为众 数,是大多数人挣的工资。
中等工资!
大多数人的工资。
吉斯莫:老弟,你 的问题是出在你不懂平 均数、中位数和众数之 间的区别。 萨姆:好,现在我可 懂了。我……我辞职!
的感受是以这个价格买不到房子。而同样是郑州市
房管局公布的另外一组数字却值得关注,即2007年
9月的商品住宅预售均价金水区为4825元/平方米, 郑东新区为4959元/平方米,惠济区为2958元/平方
米,管城区为4380元/平方米(2007年10月17日
中原区为3919元/平方米,二七区为5010元/平方米,
《大河报》B05版)。
(2)物价涨幅问题。我们经常看到一些关于 物价上涨的数据,这些数据给我们大多数人的感觉
是不真实。这并不是发布数字的机构有意欺骗,而
是和我们关心的对象有关。 (3)工资涨幅问题。 (4)大学毕业生就业率。 (5)城市人均收入问题。 (6)国民生产总值增长率。
2.母亲英雄
这一年年底,萨 姆的妻子接受了这个 城的市长的奖赏。她 被命名为这一年的母 亲英雄。 地方报纸刊登了萨 姆,他的妻子和他们 的13个孩子的照片。
◆ 为了吸引零售商到一个城市来,商会吹嘘道:
“这个城市每个国民的平均收入非常高。”大多数 人看到这句话就以为这个城市的大多数市民都属于 高收入阶层。可是,如果有一个亿万富翁恰好住在
该城,其他人就可能都是低收入的,而平均个人收
入却仍然很高。
(1)房价问题。郑州市房管局公布的2007年9
月的商品住宅均价为3704元/平方米,但是多数人
我懂了,我辞职!
“平均”这个词往往是“算术平均值”的简称。 算术平均值是将所有数字加起来除以所统计的数 字个数。这是一个很有用的统计学的度量指标。 然而,如果有少数几个很大的数,如吉斯莫的工 厂中少数高薪者,“平均”工资就会给人错误的 印象。 中值(中位数)是按大小顺序排列的数值表中 中心位置对应的数值。如果表中数值有奇数项, 则中值就简单地恰好是中间的项的值。如果有偶 数项,中值往往取中间两项的算术平均值。 “众数”——表中经常出现的数,即在统计的 数字中出现次数最多的数。
◆ 报纸上报道有个人在一条河中淹死了,这条
河的平均深度仅只2尺。这不使人吃惊吗?不!你
要知道,这个人是在一个10多尺深的陷坑处沉下去
的。
◆ 一个公司可能报告说它的策略是由股东们民主
制订的,因为它的50个股东共有600张选票,平均 而另外5人每人有84张选票,平均数确实是每人12
每人12票。可是,如果其中45个股东每人只有4票, 票,可是只有那5个人才完全控制了这个公司。
统计学是一门归纳的学科,通过大量数据的 收集、整理和分析,找出事物之间的关系和联系, 将事情的真面目呈现出来。 作为一门学科,统计学的概念和方法有其极为 复杂的一面。对于它的一般理论,我们知道的并不 多,除非我们曾经认真地研究过这门学科。由于它 的应用非常广泛,因此就有人想千方百计的利用它 以达到自己的目的,尽管提供给人们的数据都是真 实可靠的。
上述例子也许能启发大家找出其他一
些统计论述的实例,证明统计学论述在联系
到因果关系时很容易造成误解。现代的广告,
尤其是很多电视的商业广告正是以这种统计
误解为其根基的。
4.小世界的悖论
近来很多人相信巧合是由 星星或别的神秘力量引起的。 譬如说,有两个互不相识百度文库的 人坐同一架飞机。二人对话:
甲:这么说,你是从波士顿 来的啰!我的老朋友露茜· 琼斯 是那儿的律师。
1/2,因此这种巧合毫不足怪。
这是著名的生日悖论的翻版。如果有23个人无意中碰 到一起,至少有两个人的生日是同一天的概率稍小于1/2。 其计算过程类似于上面的黄道宫的算法,不过这里相乘的 有22个因子(任意两人的生日均不在同一天的概率):
乘积是0.5073,或者说稍大于1/2(所求概率 则稍小于1/2)。如果人数多于23个,则生日相同 的概率会迅速升高。如果一个班的同学有40人, 那么至少有两人生日一样的概率是7/10。如果有 100个学生,则至少有两人生日相同的概率与谁的 生日不一样的概率之比是3000000比1。
让我们用一副牌来模拟这种情况。先抽掉四张 K,就是四种花色,每种12张。用一种花色代表一 个人,每个点数代表一个宫。如果 从每一种花色 中任抽一张牌,四张牌里至少两张点数一样的概 率是多少?很明显,这就和四个陌生人中至少两 人有同样的黄道宫的概率一样。解决这个问题最 简单的方法是先算出没有两张牌的点数相同的概 率,再把它从1中减去,就得到我们所要的概率。 结果是41/96,大约是4/10,它也就是四个人 中至少有两个是属于同一宫的概率。这差不多是
要一个新工人。
工作人员23人。
现在吉斯莫先生正在
接见萨姆,谈工作问题。
吉斯莫:我们这里报
酬不错。平均薪金是每周
300元。你在学徒期间每
周得到75元,不过很快就 可以增加工资。 这里报酬不错,平 均每人每周300元!
工作了几天之后,要求 见厂长。 萨姆:你欺骗了我!我 已经找其他工人核对过了, 没有一个人的工资超过每 周100元。平均工资怎么可 能是一周300元呢?
主编对这张照片很满意。 主编:干得好,巴斯 康。我有一个新任务,你 给我弄一张这个城里平均 大小的家庭的照片来。 巴斯康无法做到这一 点。为什么?因为这个城 里没有一个家庭具有平均 的人数。算出的平均数是 一家有两个半孩子。
3.轻率的结论
统计资料表明.大多数 汽车事故出在中等速度的行 驶中,极少的事故是出在大 于150公里/小时的行驶速度 上的。这是否就意味着高速 行驶比较安全? 绝不是这样。统计关系 往往不能表明因果关系。由 于多数人是以中等速度开车, 所以多数事故是出在中等速 度的行驶中。
6.圆周率π中的数字结构
如果我们认真观察π的数字排 列,就会感觉到这些数字是无规则 的,好像每一个数字都是随机出现 的。目前,大多数数学家相信π的 数字排列是无规律的,或者从某种 意义上来讲,π是一个永远不能认 识清楚的数学妖怪。可是当注意看 看从第710154个数以下的数字是怎 样排列的,就会看到一连串排有7 个3。
1767年,约翰· 海因里希· 兰伯特 (Lambert1728—1777)证明了π是无理数,1882 年,林德曼(Lindemann)证明了π是超越数。所 谓超越数,是指不是有理数系数多项式的根的实数, 否则称为代数数。 瑞士数学家李昂纳德· 欧拉(1707—1783)在 1748年首先推导出等式:
吉斯莫:啊,萨姆,不要 激动。平均工资是300元。 我要向你证明这一点。这 是我每周付出的酬金。
没有人超过100元!
没骗你,看看工资表!
吉斯莫 :我得2400元, 我弟弟1000元,我的六个 亲戚每人250元,五个领工 每人200元,10个工人每人 100元。总共是每周6900元, 付给23个人,对吧? 萨姆:对,对,对! 你是对的,平均工资是每 周300元。 可你还是蒙骗了 我。
实际上,像这样一串7个3的数字在π中出现 机会是很多的。但由于从某一位开始,出现一串7 个3的概率是10-7,因此当π中从第710161位以后 出现7个3时,乍一看是很觉惊奇的。可是,如果我 们的注意力放在由7个数字组成的不寻常排列的话, 就会发现这种特定排列的概率变得相当高。比如说, 我们可以见到像4444444或8888888,或1212121, 或1234567,或7654321,或其他引人吃惊的这类数 字排列。由于我们预先并不知道下一次会出现什么 样的7个数字组,所以猜一猜下一组数是什么是很 有趣的。就像亚里斯多德曾经说过的,最不可能的 事也是极可能的事。
e i 1 0
全世界的数学史学家都认为这个等式是全部数 学中最深奥也是最美的数学公式之一,它把加号、 等号、最基本的0和1、两个超越数π和e、虚数单 位i结合到一个等式之中,所有这些东西都聚在如 此简单又令人神迷的表达式中。
5.你属于哪一宫
假如有四个人第一次见面。 如果他们四个人中至少有两个人 属于黄道十二宫中的同一宫,这 岂不是非常巧的偶合吗?你也许 以为,这是非常凑巧的事,而实 际上这种巧合在十次中就会大约 发生四次。 假定每个人都以相同的概率出 生在十二宫之一,那么四个人中 至少有两个人属于同一宫的概率 是多少?
(3)一项研究表明在某个城市心力衰竭而死亡 的人数和啤酒的消耗量都急剧升高。这是否表示喝 啤酒会引起心脏病发作?不!两种情况的增加是人 口迅速增加的结果。若按同样的理由,心脏病发作 还可以归咎于上百个其他因素,如咖啡消耗量增加, 嚼口香糖的人增多,玩桥牌更加盛行,更多的人看 电视,等等。 (4)一项研究显示出,欧洲某个城市的人口大 量增加,同时鹳鸟窝也大量增加。这是否就支持了 鹳鸟送来婴儿这一信念?(欧洲有一种说法,称婴 儿是鹳鸟送来的,常用鹳鸟来临表示婴儿降生)。 不!它反映的事实是这个城市内的房屋增多,鹳鸟 就有更多地盘来筑窝了。
美国心理学家斯坦利· 米尔格拉姆用一种方法 逼近小世界的问题,我们很容易试一试它。他任意 地选择了一组“发信人”,给每一个人一份文件, 让他发给一个“收信者”,这个收信者是他不认识 的,而且住在美国另外一个很远的地方。做法是通 过他把信寄给他的一个朋友,这个朋友再接着发信 给自己朋友,如此下去,直到将文件寄到认识收信 者的某人为止。米尔格拉姆发现,在文件达到收信 者手中之前,中间联系人的数目从2到10不等,其 中位数是5。当你问别人这到底需要多少中间联系 人时,他们多数猜想大约要100人。
第六章 统计学悖论
统计学是关于数量信息的收集、整理和分 析的学科,它在今天高度复杂的世界里变得越来 越重要了,“用数字说话”已经成为政府以及私 人企业提供各种信息的信条和手段。
现代统计学有一大堆的概念和方法,诸如统 计量、样本、平均值、中值、众数、置信度等等, 这些概念有助于我们使用统计方法认识事物的本 质。
(1)常常听说,汽车事故多数发生在离家不远 的地方,这是否就意味着在离家很远的公路上行车 要比在城里安全些呢?不是,统计只不过反映了人 们往往是在离家不远的地方开车,而很少在远处的 公路上开车。 (2)有一项研究表明某一个国家的人民,喝牛 奶和死于癌症的比例都很高。这是否说明是牛奶引 起癌症呢?不!这个国家老年人的比例也很高。由 于癌症通常是年龄大的人易患的病,正是这个因素 提高了这个国家癌症死亡者的比例。
相关文档
最新文档