统计学中的几个问题
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
魔术家的数学魔术
魔术家大卫.科波菲尔提出一个数学魔术:只要走动 一个人,就可以使整整两个国家增加他们的平均国 民收入
请你想想,为什么?
魔术家的数学魔术
大卫.科波菲尔的方法: 比如韩国与朝鲜,韩国的人均年收入是23000美元,朝 鲜的是1000美元,现在一位年收入20000美元的韩国人 调到朝鲜工作,年薪不变。这样两个国家的人均收入 都得到提升。
统计学中的几个问题
北京市第十五中学 凌艺国
平均数的陷阱 样本与总体 辛普森悖论 选举与选举方式 名额分配
平均数的陷阱
小李大学毕业了,他需要找一份合适的工作。一天, 他看到一个小厂的招工启事。其中工资一项工厂承 诺:所有人员平均工资一个月1200元。小李觉得这 个报酬还可以,于是去应聘并成为这个工厂的一员。
男婴的比例
一个小镇有大小两所医院。在大医院里每天大约有 45个婴儿出生,在小医院里每天大约有15个婴儿出 生。我们知道,大约有50%的婴儿是男孩。当然,真 正的百分比每天都不一样,有时候高于50%,有时候 低于50%。在一年的时间里,每一所医院都记录了出 生的男孩比例高于60%的天数。你认为哪一个医院记 录的天数多?大医院、小医院,还是基本一致?
统计的波动
正确答案是:小医院 样本的大小对统计的波动影响很大 在其他因素保持不变时,较大的样本总是能够更精
确的估计出总体的情况,样本越小,波动就越可能 出现
统计的波动
有一个男性团体对女性歧视,想证明女人对男人有 多坏。这个团体找到了一个数据,对这个数据他们 是这样陈述的:在等待处决的女死刑犯中,一半是 因为谋杀了亲夫,而等待处决的男死刑犯中,只有 三分之一是因犯了杀妻罪。
平均数的陷阱
算术平均:总值除以总项数 中位数:把数据按大小顺序排列,处于中心位置的
数值。如果数值有奇数个,则中位数就简单取中间 项的值。如果有偶数项,中位数往往取中间两项的 算术平均 众数:数项中出现次数最多的值
平均数的陷阱
算术平均容易受少数极端数值的影响,事实上,很 多和钱有关的分布,如收入、房价、财富等,都有 很强的右偏现象,用算术平均往往会给人以歪曲的 印象。
从统计学角度看,用中位数和众数表达,最大的好 处是不受两头的影响。对一些有偏的分布,用中位 数和众数往往能更好地反映情况。一般而言,有关 收入的统计若用中位数和众数来表述,较为公平。
平均数的陷阱
北京市统计局关于公布2011年度北京市职工平均工资的通知 京 人社规发[2012]87号 2012年04月06日 各有关委、办、局,各控 股(集团)公司、企业(集团)公司,各区县人力资源和社会 保障局、各社会保险经代办机构:
盖普洛的样本小很多,他分析的结果是:罗斯福将以55.7% 的投票率获胜
最后结果是罗斯福获得了62.5%的投票,竞选总统成功。
支持率与抽样调查
科学的抽样的基本思想是:让没有个人因素的客观 的机遇来选择样本,即用随机选取样本来消除偏差。 现在专业的民意调查和其它一些抽样调查,都是采 用随机抽样。
统计的波动
补充这个团体略而不言的一个事实:等候被处决的 女死刑犯人数自有7人,而等待处决的男死刑犯数目 多达2400人。
支持率与抽样调查
支持率与抽样调查
支持率与抽样调查
美国咨询专栏作家安妮.兰德斯每隔两三年就要进行 一次自愿回答的调查,让她的读者回答一个有争议 的问题。如在1972年第一次调查中她问:“假如你能 重新选择的话,你是否还会要孩子?”在接近10000 个回答中,大约70%回答是“不”,许多人在回答中 还加进动人的故事,讲述抚养孩子种种苦楚。这个 结果是否能真实反映全体父母的情况呢?
支持率与抽样调查
这里使用的样本是一种自发性回应样本,是有人们 自行决定要不要回应。
自愿回答的本性就是吸引那些对问题的真论具有强 烈感情,特别是负面感情的人。
样本中不要孩子的父母百分比远大于全体父母中不 要孩子的百分比
这是一种有偏差的样本,不能代表总体情况
支持率与抽样调查
有人对此有进行了一次科学的抽样调查,结果发现 91%的父母还会再要孩子。
现将2011年度全市职工平均工资公布如下: 2011年度全市职工平均工资为56061元, 月平均工资为4672元,比上年增长11.2%。 凡按2011年度全市职工平均工资计算的事项,均按本通知标准执 行。 市人力资源和社会保障局 北京市统计局 二〇一二年四月六日
平均数的陷阱
值此岁末年初之际,各行各业职工一年来薪酬几多, 是社会广泛关注的话题。放眼三百六十行,银行业 无疑是高收入行业。2010年度,16家上市银行职工人 均年收入8.43万元。其中,浦发银行人均年收入最高, 达24.42万元。据了解,2011年度银行职工薪酬增长 幅度较大。初步估算,16家上市银行2011年度职工总 数为1826605人,人均收入达到12.27万元。
工作一个月后,小李领到了工资,自有800元。气愤 的小李去找厂长问原因。
平均数的陷阱
厂长解释说:我们工厂里共有20人,我厂长每个月 4000元,4个管理人员,没人每月2000元,剩下15个 像你这样的工人,没人每月800元。你算算看,没人 的平均工资是不是1200元?我们的招工启事上的承 诺就是这样的,一点错都没有呀。
随机抽样的样本大小只要在1000~1500间就足够大了 对于从随机样本算出的统计量的表现,总体的大小
影响是很小的。
录取率悖论
一所美国高校的两个学院,分别是法学院和商学院。新学
支持率与抽样调查
第一次科学性的抽样方法出现在美国爱荷华州,创始人盖 洛普(1901~1984),在读博士的时候创建了一种抽样方法
1936年罗斯福与共和党的兰登竞选总统,当时,《文摘》 杂志进行了民意调查。指导思想是:样本越大,结果越准 确。在全国的电话号码薄和汽车登记薄上找出越1000万选 民,进行了大规模的舆论调查,对其中约200万名选民的 回答结果进行了分析后得出:兰登将以压倒性的优势获胜。