统计和统计数据.ppt

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如同工业生产过程中的质量控制程序一样,统计方法是为保证产 品达到所希望的质量和保持其稳定性的的管理系统中建立起来的
统计方法也能用于控制、减少和考察不确定性
统计学是一门艺术
作为归纳推理的统计方法不是没有争议的。不同的人对同一组数据的分 析可能得到不同的结论
一本印度小说《红色城堡》(The Red Fort)说:使用数字讲故事取决于统 计学家的技巧和他们的经验。在这个意义下,统计学也是一门艺术
1 - 10
2019-9-15
统计学研究什么?
统计学是一门科学
统计学提供一套方法和技术,这些方法和技术不能用于固定模式, 使用者在给定的情况下必须根据所掌握的专门知识选择使用的方 法,而且,如果需要还要进行必要的修正
统计方法是通用的数据分析方法。这些方法不是为某个特定的问 题领域而构造的
统计学是一种技术
上课坐在前面的学生平均考试分数比坐在后面的学生 高
1-3
2019-9-15
第 1 章 统计和统计数据
1.1 统计及其应用领域
1.1.1 统计学研究什么? 1.1.2 统计的应用Βιβλιοθήκη Baidu
1.1 统计及其应用领域 1.1.1 统计学研究什么?
什么是统计学?
(statistics)
收集、处理、分析、解释数据并从数据中得出结论的科学
如“企业销售额”、“上涨股票的家数”、“生活费支出”、 “投掷一枚骰子出现的点数”
定量变量的观察结果称为定量数据或数值型数据(metric data)
2. 分类变量(categorical variable)
表现为不同的类别 如“性别”、“企业所属的行业”、“学生所在的学院” 等 分类变量的观察结果就是分类数据(categorical data)
1. 从总体N个单位(元素)中随机地抽取n个单位作为 样本,使得总体中每一个元素都有相同的机会 (概率)被抽中
2. 抽取元素的具体方法有重复抽样和不重复抽样 3. 特点
简单、直观,在抽样框完整时,可直接从中抽取样本 用样本统计量对目标量进行估计比较方便
4. 局限性
当N很大时,不易构造抽样框 抽出的单位很分散,给实施调查增加了困难 没有利用其他辅助信息以提高估计的效率
Thiokol公司制造的。失事前一天晚上,Thiokol公司的经 理们和国家航空航天局就如期发射还是推迟发射产生了 争执。天气预报发射时的气温为310F。争执的结果采纳 了Thiokol公司经理们的建:按计划发射航天飞机。因为 他们觉得没有确凿证据表明低温会对固体燃料火箭推进 器的性能产生影响
1 - 16
2. 统计学研究的是来自各领域的数据,由解决其 他领域内的问题而存在并兴旺发达。按萨维奇 (L.J.Savage)的说法:
统计学基本上是寄生的。靠研究其他领域内的工 作而生存。这不是对统计学的轻视,这是因为对 很多寄主来说,如果没有寄生虫就会死。对有的 动物来说,如果没有寄生虫就不能消化它们的食 物。因此,人类奋斗的很多领域,如果没有统计 学,虽然不会死亡,但一定会变得很弱
2. 化学家测定物质的组成及化学元素之间的交互作 用
3. 生物学家研究植物和动物的生活
4. 数学家则在给出的假定之下沉溺于他自己推演各 种命题的游戏
5. 这些学科中的每一门都有它自己的问题,而且有 解决这些问题的各自的方法,各学科为此而成为 一门单独的学科
1-9
2019-9-15
统计学研究什么?
1. 统计学没有任何固定的对象,是一门独特的学 问
分层抽样
(stratified sampling)
1. 将总体单位按某种特征或某种规则划分为 不同的层,然后从不同的层中独立、随机 地抽取样本
2. 优点
1.2 怎样获得统计数据
1.2.1 变量与数据 1.2.2 数据的来源
1.2 怎样获得统计数据 1.2.1 变量与数据
变量与数据
1. 变量(variable)
从一次观察到下一次观察会出现不同结果的某种 特征
观察一个企业的销售额,这个月和上个月有所不同;观 察股票市场上涨股票的家数,今天与昨天数量不一样; 观察一个班学生的生活费支出,一个人和另一个人不一 样;投掷一枚骰子观察其出现的点数,这次投掷的结果 和下一次也不一样
1 - 11
2019-9-15
统计是一种思维方式
统计思维总有一天会像读与写一样成为一个 有效率公民的必备能力(H.G.Wells)
在终极的分析中,一切知识都是历史;在抽 象的意义下,一切科学都是数学;在理性的 基础上,所有的判断都是统计学(C.R.Rao)
1 - 12
2019-9-15
1.1 统计及其应用领域 1.1.2 统计的应用
少寿命1600天 身体超重30%会使寿命减少1300天 每天摄取500毫升维生素C,生命可延长6年 身材高的父亲,其子女的身高也较高 二个出生的子女没有第一个聪明,第三个出生的子女
没有第二个聪明,依此类推
学生们在听了莫扎特钢琴曲10分钟后的推理测试会比 他们听10分钟娱乐磁带或其他曲目做得更好
2. 在统计应用中,这两个极端都是不可取的 3. 简单的方法不一定没用,复杂的方法也不一
定有用。正如有的学者所说的,最简单的模 型往往是最有用的
4. 统计应该恰当地应用到它能起作用的地方。 不能把统计神秘化,更不能歪曲统计,把统 计作为掩盖实事的陷阱
1 - 19
2019-9-15
第 1 章 统计和统计数据
1 - 25
2019-9-15
抽样方法
抽样方式
概率抽样
非概率抽样
简单随机抽样 整群抽样
多阶段抽样
1 - 26
分层抽样 系统抽样
方便抽样 自愿样本 配额抽样
判断抽样 滚雪球抽样
2019-9-15
概率抽样
(probability sampling)
1. 根据一个已知的概率来抽取样本单位,也称 随机抽样
1. 研究数据收集、整理和描述的统计学方法
搜集数据、整理数据、展示数据、描述性分析 描述数据特征 找出数据的基本规律
2. 研究如何利用样本数据来推断总体特征的统计 学方法
参数估计、假设检验 对总体特征作出推断
1-8
2019-9-15
统计学研究什么?
1. 物理学研究的是如热、光、电、运动规律那样的 自然现象
然而,鳗鱼的脊椎骨的数量变化不大。施密特从欧洲
各地、冰岛、亚速尔群岛以及尼罗河等几乎分离的海域
里所捕获的鳗鱼的样本中,计算发现了几乎一样的均值
和标准偏差值。由此,施密特推断所有各个不同海域内
的鳗鱼是由海洋中某公共场所繁殖的。后来名为“戴纳 (Dana)”的科学考察船在一次远征中发现了这个场所
1 - 15
“企业销售额”、“上涨股票的家数”、“生活费支 出”、“投掷一枚骰子出现的点数”等就是变量
2. 数据(data)
观察到的变量的结果
1 - 22
2019-9-15
变量与数据
1. 定量变量(quantitative variable)或数值变量(metric variable)
可以用阿拉伯数据来记录其观察结果
2019-9-15
统计的应用领域
【例1.3】挑战者号航天飞机失事预测 在此次失事前,该航天飞机24次发射成功。将航天飞机
送入太空的两个固体燃料推进器由6只O型项圈密封。在几次 飞行中,曾发生过O型项圈被腐蚀或气体泄漏事故。这样的事 故是及其危险的。前24次发射中有一次发动机遭到了永久性 破坏。根据23次飞行中发生腐蚀或泄漏事故的次数(因变量)及 火箭连接处的温度(自变量)数据,进行线性回归得到的回归方 程为
统计的应用领域
【例1.1】用统计识别作者
1787—1788年,三位作者Alexander Hamilton, John Jay和James Madison为了说服纽约人认可宪法 ,匿名发表了著名的85篇论文。这些论文中的大多 数作者已经得到了识别,但是,其中的12篇论文的 作者身份引起了争议
通过对不同单词的频数进行统计分析,得出的结 论是,James Madison最有可能是这12篇论文的作 者。现在,对于这些存在争议的论文,认为James Madison是原创作者的说法占主导地位,而且几乎可 以肯定这种说法是正确
1 - 28
2019-9-15
简单随机样本
(simple random sample)
1. 由简单随机抽样形成的样本 2. 从总体N个单位中随机地抽取n个单位作为
样本,使得每一个容量为n样本都有相同 的机会(概率)被抽中 3. 参数估计和假设检验所依据的主要是简单 随机样本
1 - 29
2019-9-15
2. 历史学家Andrew Lang说,一些人使用统计“就像喝醉 酒的人使用街灯柱—支撑的功能多于照明”
3. 统计滥用 不好的样本
过小的样本
误导性图表
局部描述
故意曲解
1 - 18
2019-9-15
统计的误用与滥用
1. 统计应用上的两个极端 不用或几乎不用统计 简单问题复杂化
yˆ 3.698 0.04754x
当温度为310F时,O型项圈发生事故的预计次数为2.225次。 结果显示连接处的温度与O型项圈事故之间有一定的相关性。 如果当时那些经理们看到了回归的预测结果,也许推迟发射 会成为其谨慎的选择
1 - 17
2019-9-15
统计的误用与滥用
1. 大约在一个世纪以前,政治家Benjamin Disraeli曾有一 个著名的论断:“有三类谎言:谎言、糟透的谎言和统 计” 。他还说:“图并没有说谎,是说谎者在画图”
3. 顺序变量(rank variable)或有序分类变量
具有一定顺序的类别变量 如考试成绩按等级,一个人对事物的态度 顺序变量的观察结果就是顺序数据或有序分类数据(rank data)
4. 分类变量和顺序变量统称为定性变量(qualitative variable)
1 - 23
2019-9-15
2019-9-15
统计的应用领域
【例1.3】挑战者号航天飞机失事预测
1986年1月28日清晨,载有7名宇航员的挑战者号进 入发射状态。就在发射前,有冰片牢附在机壳上。几分
钟后,正当电视新闻报道它已进入轨道时,航天飞机在 毁灭性的爆炸声中化成碎片,机上的宇航员片骨未存
推动航天飞机进入太空的两个固体燃料发动机是由
2. 特点
按一定的概率以随机原则抽取样本
• 抽取样本时使每个单位都有一定的机会被抽中
每个单位被抽中的概率是已知的,或是可以计 算出来的
当用样本对总体目标量进行估计时,要考虑到 每个样本单位被抽中的概率
1 - 27
2019-9-15
简单随机抽样
(simple random sampling)
1.2 怎样获得统计数据 1.2.2 数据的来源
数据的来源
1. 寻找二手数据
2. 抽取样本
总体(population):包含所研究的全部个体 (数据)的集合
样本(sample):从总体中抽取的一部分元素 的集合
样本量(sample size):构成样本的元素的数 目
3. 概率抽样方法
第 1 章 统计和统计数据
1.1 统计及其应用领域 1.2 怎样获得统计数据?
学习目标
统计学的含义 统计学的研究内容 统计的应用领域 统计数据的类型 获得统计数据的途径
1-2
2019-9-15
你相信这样的一些统计结论吗?
吸烟对健康是有害的,吸香烟的男性减少寿命2250天 不结婚的男性会减少寿命3500天,不结婚的女性会减
1 - 14
2019-9-15
统计的应用领域
【例1.2】用简单的描述统计量得到一个重要发现
费舍(R.A.Fisher)在1952的一篇文章中举了一个例 子,说明如何由基本的描述统计量的知识引出一个重要 的发现。20世纪早期,哥本哈根卡尔堡实验室的施密特 (J.Schmidt)发现不同地区所捕获的同种鱼类的脊椎骨和 鳃线的数量有很大不同;甚至在同一海湾内不同地点所 捕获的同种鱼类,也发现这样的倾向
1. 收集数据:取得数据 2. 处理数据:图表展示 3. 分析数据:利用统计方法分
析数据 4. 数据解释:结果的说明 5. 得到结论:从数据分析中得
出客观结论
1-6
2019-9-15
统计方法
统计方法
描述统计
推断统计
参数估计
假设检验
1-7
2019-9-15
描述统计和推断统计
(inferential statistics &)descriptive statistics)
相关文档
最新文档