《统计学》课件 第五章统计推断
合集下载
第五章统计推断课件(1)
![第五章统计推断课件(1)](https://img.taocdn.com/s3/m/633dcab8c281e53a5902ff17.png)
2020/8/1
版权所有 BY 统计学课程组
28
一、假设检验的一般性问题(5)
上述的判断实际上体现着反证法的思想。判断的基础是样本
信息,判断的理论依据是小概率原理,即小概率事件在一次试验
(或抽样)中几乎不发生。直观来想,在所做假设是正确的情况
下,那么一次试验(或抽样)中人们期望的结果出现的概率应该
2020/8/1
版权所有 BY 统计学课程组
11
二、区间估计(3)
5.区间估计时应考虑的一些具体问题 在对总体均值进行区间估计时,
常常需要考虑总体是否为正态总体、 总体方差是否已知、用于构造估计量 的样本是大样本(n≥30)还是小样本(n< 30)等几种情况。
2020/8/1
版权所有 BY 统计学课程组
2. 解决问题的统计思想 4. 单、双侧检验问题 6. 统计检验的显著性
二、几种常用、具体的参数检验方法
1. Z检验法 3. c 2 检验法
2. T检验法 4. F检验法
2020/8/1
版权所有 BY 统计学课程组
23
一、假设检验的一般性问题(1)
(一) 问题的提出
2020/8/1
版权所有 BY 统计学课程组
12
二、区间估计(4)--总体均值的区间估计
1.正态总体、总体方差已知;或非正态总体、大样本
2020/8/1
版权所有 BY 统计学课程组
13
二、区间估计(5)--总体均值的区间估计
2.正态总体、总体方差未知、小样本
2020/8/1
版权所有 BY 统计学课程组
14
二、区间估计(6)--总体成数的区间估计
第五章
统计推断
2020/8/1
第五章 统计推断 PPT课件
![第五章 统计推断 PPT课件](https://img.taocdn.com/s3/m/e39f2a775901020207409cb4.png)
(点估计)
置信区间
置信下限 ˆ 1
置信上限 ˆ 2
一般地,如果将构造置信区间的步骤重复多次, 置信区间中包含总体参数真值的次数所占的比率, 称为置信水平(概率保证程度)。
即区间包含总体参数真实值的可信度.
通常用1- 表置信水平,其中称为显著性水平。 比较常用的置信水平:90%,95%和99%。
第五章 统计推断
第一节 总体参数估计 第二节 总体参数检验
统计推断在统计方法中的地位
统计方法
描述统计
推断统计
参数估计
假设检验
大学生每周上网花多少时间?
为了解学生每周上网花费的时间,某校4名 本科生对全校部分本科生做了问卷调查。调 查的对象为本校在校本科生,调查内容包括 上网时间、途径、支出、目的、关心的校园 网内容,以及学生对收费的态度,包括收费 方式、价格等。
例如,抽取了1000个样本,根据每一个样本均构 造了一个置信区间,这1000个置信区间中,有95% 的区间包含了总体参数的真值,而5%的置信区间则 没有包含。这里,95%这个值被称为置信水平(或置 信度)。
两个需要注意的问题
如果用某种方法构造的所有区间中有95%的 区间包含总体参数的真值,5%的区间不包含 总体参数的真值,那么,用该方法构造的区 间称为置信水平为95%的置信区间。
点估计完全正确的概率通常为0。因此, 我们更多的是考虑用样本统计量去估计总 体参数的范围 区间估计。
(一)总体参数的区间估计概述
1.基本概念
(1)区间估计:在点估计的基础上,给出总体参数 估计的一个范围,并给出区间估计成立的概率值。
p(1 2 ) 1 样本统计量
P(X )
均值的抽样分布
第五章 统计推断 《试验设计与统计分析》PPT课件
![第五章 统计推断 《试验设计与统计分析》PPT课件](https://img.taocdn.com/s3/m/404d586f7fd5360cbb1adb0e.png)
则( x1 x 2 ) ~ N ( ( x1 x2 ) , ......
2 ( x1 x 2 )
)。
统计推断
总体 ——从样本到总体
样本
通过一个或多个样本统计数推断总体相应参数
第一节 统计推断的含义和内容
一、统计推断的概念
按照一定的抽样方法,从所研究的总体中,随机抽 出一个样本或一系列样本,并研究样本的特征,然后根 据对样本特征的研究结果去推断总体的特征 。
拿 3棵 拿 4棵 拿 5棵
推断:一次就猜对5棵的概率是0.03125,概率很小, 亦即猜100次只有5次能把5棵麦苗属何品种全猜对, 在一次试验中几乎不可能发生,所以,他若能一次 就说对,不是凭猜的,是确有鉴别能力。
这里有一个概率标准的问题,这个概率标准
称为显著水平(a)一般为0.05或0.01。 我们是依据“小概率实际不可能性原理”进 行推断的。这个原理是说:概率很小的事件, 在一次试验中几乎不可能发生或可以认为不 可能发生。如果我们假设了一些条件,并在 假设的条件下能够准确地算出事件A出现的 概率很小,但在一次试验中,事件A竟出现 了,那么,我们就可以认为这个假设不正确, 从而否定这个假设。
四、统计假设检验的两类错误
1、第一类错误(first kind error)或I型错误(type I error)。––如果H0是真实的,我们通过检验却否定 了它,就犯了一个否定真实假设的错误。第一类错
误只有在否定H0时才会发生。由于规定显著水平为
a ,故H0为真而被否定的概率最多为a ;因而这类
实际上包括了 0 (或1 2 )和 0 (或1 2 )两种情况, 要在 a显著水平否定无效假设 H 0 : 0 (或1 2 ), 必须 否定区,分别位于 水平 a u ua 或u ua,因而这种检验有两个 表示的概率在曲线两尾
《统计学原理》第5章:抽样推断
![《统计学原理》第5章:抽样推断](https://img.taocdn.com/s3/m/9a1120ea551810a6f5248625.png)
σ
n )
抽样推断的基本原理
抽样推断的优良标准
设θ 为待估计的总体参数, θ为样本统计量,则 θ的优良标 准为: 1若 E(θ ) =θ ,则称 θ为 θ 的无偏估计量(无偏性)
更有效的估计量(有效性) 2若σθ1 < σθ2,则称θ1为比θ2
3若 越大σθ 越小,则称 θ 为θ 的一致估计量(一 致性)
即中选成分相同但中选顺序不同的视为同一样本
抽样推断的一般问题
抽样组织方式
简单随机抽样 类型抽样 整群抽样 等距抽样 多阶段抽样 多重抽样
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示. 考虑顺序的不重复抽样 考虑顺序的重复抽样 不考虑顺序的不重复抽样 不考虑顺序的重复抽样
抽样推断的一般问题
全及总体指标:参数 (未知量) 统计推断 样本总体指标:统计量 (已知量)
抽样推断的一般问题
抽样推断的特点 按随机原则抽取样本 运用概率论的理论和方法,用样本指标来推断 总体指标。 推断的误差可以事先计算和控制。
抽样推断的一般问题
抽样推断的应用 无法或 很难进行全面调查而又需要了解 其全面情况时 某些可以采用全面调查的社会经济现象, 也可采用抽样推断。 可用于生产过程的质量控制 进行假设检验
抽样推断的基本原理
抽样推断的优良标准——有效性 中位数的抽样分布
9 8 7 6 5 4 3 2 1 0 -1 45 50 55 60 65 70 75
平均数的抽样 分布
E(x) =
E ( me ) =
e
σx <σm
抽样推断的基本原理
统计学05第五章抽样推断
![统计学05第五章抽样推断](https://img.taocdn.com/s3/m/1aa1d4576294dd88d1d26b2b.png)
(2)
计算 p
p1 p
n
(3) 根据 F Z 查表 Z
(4) 计算 Z
(5) 写出:P : p , p
2020/11/17
第五章 抽样推断
44
2.3 区间估计
【例5-5】某工厂要估计一批总数5 000件的产品的废品率,于是随机抽 出 400 件产品进行检测,发现有32 件废品。在置信度为 90% 的要求下, 试给出该批产品的废品率的区间估 计。
总体参数和样本统 x计 量x-x2 n
总体参数和样本统计量的计算公式
总体参数
X X1 X2 XN N
样本统计量
x x1 x2 xn n
P N1 N
p n1 n
X X X 2 N
S x x-x 2 n1
P P 1 P
p p 1 p
2020/11/17
2020/11/17
第五章 抽样推断
35
2.3 区间估计
2. 给定 , 已知 X , 总体平均数的估计:
步骤
内
容
(1) 抽样,计算 x 区间的中心
(2) 计算抽样平均误差: X n
(3) 计算 Z 查表F Z
(4) 根据 x 和 : X : x ,x
2020/11/17
参数估计要求:
1. 精确性—适当的极限误差范围; 2. 可靠性—估计结果正确的概率。
参数估计—点估计和区间估计。
2020/11/17
第五章 抽样推断
16
2.2 点估计
点估计就是根据总体参数与样本统计 量之间的内在联系,直接以样本统计量 作为相应总体参数的估计值,点估计又 称为定值估计。
常用的点估计量有:
22
统计学第5章抽样推断
![统计学第5章抽样推断](https://img.taocdn.com/s3/m/8e59aea5cfc789eb172dc8ed.png)
就 是 由 样 本 指 标 直 接 代 替 全 及 指 标 , 不 考 虑
任 何 抽 样 误 差 因 素 。 即 用 x直 接 代 表 X , 用 p 直 接 代 表 P。
例 在 全 部 产 品 中 , 抽 取 100件 进 行 仔 细 检 查 , 得 到 平 均 重 量 x1002克 , 合 格 率 p98% , 我 们 直 接 推 断 全 部 产 品 的 平 均 重 量 X 1002克 , 合 格 率 P 98% 。
(1)
2
n
(1 )
12 2 (1
100
) 1.19 (千克 )
x
n
N
100 10000
(2) 若以概率 95.45%(t 2)保证,该农场 10000 亩小麦的平均
亩产量的可能范围为:
X : x 400 2 1.19 x
X (: 397 .62 ,402.38 ) (3) 若以概率 99.73%(t 3)保证,该农场 10000 亩小麦的平均
在重复抽样情况下:
p (1 p )
p
n
在不重复抽样情况下:
p (1 p ) n
(1 )
p
n
N
例
某玻璃器皿厂某日生产15000只印花玻璃 杯,现按重复抽样方式从中抽取150只进行 质量检验,结果有147只合格,其余3只为不 合格品,试求这批印花玻璃杯合格率(成数) 的抽样平均误差。
N15000n150
二、区间估计
根据样本指标和抽样误差去推断全及 指标的可能范围,它能说清楚估计的准 确程度和把握程度。
总体平均数和总体成数的估计
X :(x x, x x)
1的概率保证下:x tx
P:(pp, pp)
1的概率保证下: p tp
任 何 抽 样 误 差 因 素 。 即 用 x直 接 代 表 X , 用 p 直 接 代 表 P。
例 在 全 部 产 品 中 , 抽 取 100件 进 行 仔 细 检 查 , 得 到 平 均 重 量 x1002克 , 合 格 率 p98% , 我 们 直 接 推 断 全 部 产 品 的 平 均 重 量 X 1002克 , 合 格 率 P 98% 。
(1)
2
n
(1 )
12 2 (1
100
) 1.19 (千克 )
x
n
N
100 10000
(2) 若以概率 95.45%(t 2)保证,该农场 10000 亩小麦的平均
亩产量的可能范围为:
X : x 400 2 1.19 x
X (: 397 .62 ,402.38 ) (3) 若以概率 99.73%(t 3)保证,该农场 10000 亩小麦的平均
在重复抽样情况下:
p (1 p )
p
n
在不重复抽样情况下:
p (1 p ) n
(1 )
p
n
N
例
某玻璃器皿厂某日生产15000只印花玻璃 杯,现按重复抽样方式从中抽取150只进行 质量检验,结果有147只合格,其余3只为不 合格品,试求这批印花玻璃杯合格率(成数) 的抽样平均误差。
N15000n150
二、区间估计
根据样本指标和抽样误差去推断全及 指标的可能范围,它能说清楚估计的准 确程度和把握程度。
总体平均数和总体成数的估计
X :(x x, x x)
1的概率保证下:x tx
P:(pp, pp)
1的概率保证下: p tp
统计学PPT课件
![统计学PPT课件](https://img.taocdn.com/s3/m/5668779b03d276a20029bd64783e0912a2167c24.png)
19世纪初,法国数学家、统计学家拉普拉斯在总结前人成果 的基础上出版了《概率的分析理论》一书,从而形成完整的应用 理论体系。
二、统计学的产生和发 展
3 古典概率论
古典概率论对统计学的贡献可归纳为以下几点:
(1) 总结了古典概率论的研究成果,初步奠定了数理统计学的 理论基础。 (2) 把大数定律作为概率论与政治算术的桥梁。 (3) 提出应以自然科学的方法研究社会现象,为数理统计的产 生提供了必要的理论依据。
统计活动、统计资料和统计学相互依存、相互联系,共同构成一个完 整的整体,这就是人们所说的统计。
二、统计学的产生和发 展
进入资本主义社会以后,随着社会生产力的发展,人们对 统计数据资料的需求增多,专业的统计机构和研究组织逐渐出 现,统计初步发展为社会分工中的一个独立部门。
到了 17世纪中叶,统计学应运而生。
三、统计学的应用
(二) 统计学在经济领域的应用
统计学最初产生于对经济现象的研究。至今,经济领域仍然是统计 学最重要的研究领域。统计学在经济领域的应用形成了经济统计学。经 济学在研究经济现象及其发展变化的规律性时,除要进行规范性的理论 分析外,还离不开对现实经济活动的实证研究。经济学家只有通过对现 实经济活动的运行条件、运行过程和运行结果的数量分析,才能得出真 正符合客观实际的规律性结论。经济现象是人类参与的活动,其影响因 素异常复杂。对社会经济现象规律性的认识,只能被动地对实际的经济 关系和经济活动的运行情况进行观测。因此,无论是宏观经济学研究还 是微观经济学分析,都需要大量地运用统计方法,通过各种调查方法来 收集实际的经济统计数据,并分析其数量规律性。
《不列颠百科全书》将统计学定义为收集、分析、表 述和解释数据的科学。
一、统计的含义
二、统计学的产生和发 展
3 古典概率论
古典概率论对统计学的贡献可归纳为以下几点:
(1) 总结了古典概率论的研究成果,初步奠定了数理统计学的 理论基础。 (2) 把大数定律作为概率论与政治算术的桥梁。 (3) 提出应以自然科学的方法研究社会现象,为数理统计的产 生提供了必要的理论依据。
统计活动、统计资料和统计学相互依存、相互联系,共同构成一个完 整的整体,这就是人们所说的统计。
二、统计学的产生和发 展
进入资本主义社会以后,随着社会生产力的发展,人们对 统计数据资料的需求增多,专业的统计机构和研究组织逐渐出 现,统计初步发展为社会分工中的一个独立部门。
到了 17世纪中叶,统计学应运而生。
三、统计学的应用
(二) 统计学在经济领域的应用
统计学最初产生于对经济现象的研究。至今,经济领域仍然是统计 学最重要的研究领域。统计学在经济领域的应用形成了经济统计学。经 济学在研究经济现象及其发展变化的规律性时,除要进行规范性的理论 分析外,还离不开对现实经济活动的实证研究。经济学家只有通过对现 实经济活动的运行条件、运行过程和运行结果的数量分析,才能得出真 正符合客观实际的规律性结论。经济现象是人类参与的活动,其影响因 素异常复杂。对社会经济现象规律性的认识,只能被动地对实际的经济 关系和经济活动的运行情况进行观测。因此,无论是宏观经济学研究还 是微观经济学分析,都需要大量地运用统计方法,通过各种调查方法来 收集实际的经济统计数据,并分析其数量规律性。
《不列颠百科全书》将统计学定义为收集、分析、表 述和解释数据的科学。
一、统计的含义
统计推断的概要(ppt 共24页)
![统计推断的概要(ppt 共24页)](https://img.taocdn.com/s3/m/a3ec0a2cc281e53a5802ffea.png)
样本均值的分布
从前面的例子可以看出样本大小为2时和30时均值推断的分布如上图。我们为 了解总体的特性,抽取的是样本,所以我们只能得到均值的推断.总体真实的均 值在上面提示的理论分布中的某一位置,样本容量越大,推断的均值越精确.
推断的概要
10
随样本容量变化的平均标准误差(平均值的标准偏差)
平均值的标准偏差称平均的标准误差(SE Mean),如下定义. 一般标准误差越小推断值越好.
统计推断的概要
(分析阶段) (ZTE-GB303-V1.5)
推断的概要
1
主要内容
1. 统计推断 2. 误差的来源 3. 置信统计推断
统计推断是通过抽取样本,然后对样本进行分析,以样本的分析结果 推测出“总体可能是这样”结论,对总体下一个正确判断的行为,即总
体
是否发生了变动。而且,一般以推测总体平均值,总体的比率,总体标 准偏差等显示总体分布特征值的统计程序称为统计推断。
95% Confidence Interval for Median 95% Confidence Interval for Median 49.315 60.494
对总体区间推断值 -95%置信度总体平均值 的置信区间 -95%置信度下总体标准 偏差的置信区间 -95%置信度总体中位 数的置信区间
弯曲点 标 准 误 差
Sx Sx n
Sx = Sx =
平均的标准误差 样本的标准偏差 n = 样本大小
0
10
20
30
标准误差在样本大小为5,6时趋于稳定,样本大小为30时趋于平行.一般样本大
小应为5以上,为了得到更精确的平均推断值,样本大小应为30以上.
推断的概要
11
3. 区间推断
《统计学原理》第5章:抽样推断
![《统计学原理》第5章:抽样推断](https://img.taocdn.com/s3/m/4e3f9697dd3383c4bb4cd292.png)
lim P( x X ) 1
n
抽样推断的基本原理
统计推断的理论基础—样本的概率分布
按一定方法随机抽取样本时,所有可能样本的 特征值及其所对应的概率分布情况
学生 A B C D E F G 成绩 30 40 50 60 70 80 90
按随机原则考虑顺序重复抽样抽选出4名学生。
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示.
考虑顺序的不重复抽样 考虑顺序的重复抽样
M N! (N n)!
M Nn
不考虑顺序的不重复抽样 不考虑顺序的重复抽样
M N! n!(N n)!
全及指标与样本指标
•根据全及总体中各单位的标志值或标志属性计算得 来,反映总体某种特征的指标 •根据样本总体中各单位的标志值或标志属性计算得 来的综合指标.
抽样推断的一般问题
抽样方法
•重复抽样和不重复抽样
•考虑顺序的抽样和不考虑顺序的抽样
抽样推断的一般问题
抽样方法—重复抽样
从总体N个单位中随机抽取一个容量为n的样本,每 次抽取一个单位,把结果登记后再放回到总体中,重新 参加下一次的抽取.
抽出个体
登记特征
放回总体
继续抽取
抽样推断的一般问题
抽样方法—不重复抽样
从总体N个单位中随机抽取一个容量为n的样本, 每次抽取一个单位,把结果登记后不再放回到 总体参加下一次的抽取.
抽出 个体
登记 特征
继续 抽取
抽样推断的一般问题
抽样方法—考虑顺序的抽样
从总体N个单位中抽取n个单位构成样本,不但考虑样本 各单位成分的不同,而且还要考虑样本各单位的中选顺 序.
n
抽样推断的基本原理
统计推断的理论基础—样本的概率分布
按一定方法随机抽取样本时,所有可能样本的 特征值及其所对应的概率分布情况
学生 A B C D E F G 成绩 30 40 50 60 70 80 90
按随机原则考虑顺序重复抽样抽选出4名学生。
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示.
考虑顺序的不重复抽样 考虑顺序的重复抽样
M N! (N n)!
M Nn
不考虑顺序的不重复抽样 不考虑顺序的重复抽样
M N! n!(N n)!
全及指标与样本指标
•根据全及总体中各单位的标志值或标志属性计算得 来,反映总体某种特征的指标 •根据样本总体中各单位的标志值或标志属性计算得 来的综合指标.
抽样推断的一般问题
抽样方法
•重复抽样和不重复抽样
•考虑顺序的抽样和不考虑顺序的抽样
抽样推断的一般问题
抽样方法—重复抽样
从总体N个单位中随机抽取一个容量为n的样本,每 次抽取一个单位,把结果登记后再放回到总体中,重新 参加下一次的抽取.
抽出个体
登记特征
放回总体
继续抽取
抽样推断的一般问题
抽样方法—不重复抽样
从总体N个单位中随机抽取一个容量为n的样本, 每次抽取一个单位,把结果登记后不再放回到 总体参加下一次的抽取.
抽出 个体
登记 特征
继续 抽取
抽样推断的一般问题
抽样方法—考虑顺序的抽样
从总体N个单位中抽取n个单位构成样本,不但考虑样本 各单位成分的不同,而且还要考虑样本各单位的中选顺 序.
第五章 统计推断 《统计学》 ppt课件
![第五章 统计推断 《统计学》 ppt课件](https://img.taocdn.com/s3/m/2ed2a00e6294dd88d0d26be3.png)
必要抽样数目愈多;值愈小,必要抽样数目愈少。 (2)允许误差(极限误差)Δ,即Δ的数值。Δ值大可以
少抽些样本单位,Δ值小则要多抽一些样本单位。Δ是调查 前规定的,是根据调查目的确定的。 (3)概率度t 。t值愈大,要求把握程度愈高,则要多抽 些单位;t值愈小,要求把握程度低,则可少抽些单位。把 握程度也是在抽样之前根据抽样的目的和要求来规定的。 (4)抽样方法。在同等条件下,重置抽样需要多抽一些单 位,不重置抽样可少抽一些样本单位。 (5)抽样的组织方式。简单随机抽样,类型随机抽样, 等距随机抽样,整群随机抽样,阶段随机抽样等都是抽样 的组织方式,由于采用的组织方式不同,必要抽样数目也 不相同。
二、统计推断的几个基本概念
1.总体和样本 在统计推断中存在全及总体和样本总体。
全及总体也叫母体,简称总体,是所要认识的研究对象的 全体,它由具有某种共同性质或特征的单位组成。全及总 体的单位数用N表示。
全及总体按其各单位标志的性质不同可分为变量总体和 属性总体。
样本总体又叫抽样总体、子样,简称样本,是从全及总 体中随机抽选出来的单位所组成的小总体。
样本平均数的抽样分布是由样本平均数的可能取值和与 之相应的概率组成。
例5.3
在不重复抽样时,样本平均数的抽样分布有数学期望
E(x) a
即样本平均数的平均数等于总体平均数
X
在不重复简单随机抽样时,样本平均数的抽样分布有方 差,即
2 x
2
n
(
N N
n) 1
在不重复抽样条件下,用
x
表示抽样平均误差(也称抽样标准误差),则
(
方差σ2 )。
设总体N个单位中,有N1个单位具有某种属性,N0个单 位不具有某种属性,且N1十N0=N ,则: P N1 N
少抽些样本单位,Δ值小则要多抽一些样本单位。Δ是调查 前规定的,是根据调查目的确定的。 (3)概率度t 。t值愈大,要求把握程度愈高,则要多抽 些单位;t值愈小,要求把握程度低,则可少抽些单位。把 握程度也是在抽样之前根据抽样的目的和要求来规定的。 (4)抽样方法。在同等条件下,重置抽样需要多抽一些单 位,不重置抽样可少抽一些样本单位。 (5)抽样的组织方式。简单随机抽样,类型随机抽样, 等距随机抽样,整群随机抽样,阶段随机抽样等都是抽样 的组织方式,由于采用的组织方式不同,必要抽样数目也 不相同。
二、统计推断的几个基本概念
1.总体和样本 在统计推断中存在全及总体和样本总体。
全及总体也叫母体,简称总体,是所要认识的研究对象的 全体,它由具有某种共同性质或特征的单位组成。全及总 体的单位数用N表示。
全及总体按其各单位标志的性质不同可分为变量总体和 属性总体。
样本总体又叫抽样总体、子样,简称样本,是从全及总 体中随机抽选出来的单位所组成的小总体。
样本平均数的抽样分布是由样本平均数的可能取值和与 之相应的概率组成。
例5.3
在不重复抽样时,样本平均数的抽样分布有数学期望
E(x) a
即样本平均数的平均数等于总体平均数
X
在不重复简单随机抽样时,样本平均数的抽样分布有方 差,即
2 x
2
n
(
N N
n) 1
在不重复抽样条件下,用
x
表示抽样平均误差(也称抽样标准误差),则
(
方差σ2 )。
设总体N个单位中,有N1个单位具有某种属性,N0个单 位不具有某种属性,且N1十N0=N ,则: P N1 N
f第五章 统计推断
![f第五章 统计推断](https://img.taocdn.com/s3/m/bf516c3983c4bb4cf6ecd10f.png)
1.82
n
10
PU 1.82 0.03437
P 0.05
若假设成立,则得到实际样本这一事件为小概率事件。 假设不成立,拒绝零假设,接受备择假设。 幻灯片 14 在假设 H0 正确的情况下,计算样本实际发生的概率 P,若 P>α,接受 H0 ;若 P<α,拒绝 H0 ,接受 HA 。在实际应用时,并不直接求出具体的概率值,而是建立在α水平上 H0 的拒 绝域和接受域。 幻灯片 15 拒绝域(rejection region):在上尾、或下尾、或双侧检验中,U > uα、或 U < -u α、或|U| > uα/2 的区域,称为在α水平上 H0 的拒绝域。 接受域(acceptance region):相应的 U < uα,或 U > -uα ,或-uα/2 < U < uα/2 的 区域,称为在α水平上 H0 的接受域。
则1. H0 : 0 (null hypothesis,零假设或无效假设,检验假设) 2. HA:备Hμ1择>:μ假0设,的或提0 (H出aAl是:tμe根r<n据μat具0iv体,e 情或hy况HpA而o:μt定h≠e的sμi。s0,备。择假设;或 research hypothesis,研究假设)
本平均数 y=10.23g。这批动物实际饲养的时间比根据以往经验所需饲养的时间长。问这批
动物能否用于实验。
解: H0: μ=10.00g HA: μ>10.00g 幻灯片 9 (二)统计假设检验原理——小概率原理 小概率的事件(P≤0.05 或 P≤0.01) ,在一次试验中几乎是不会发生的。若根据一定的假 设条件计算出来该事件发生的概率很小,而在一次试验中它竟然发生了,则可以认为假设 的条件不正确,从而否定假设。 幻灯片 10 (二)小概率原理 小概率事件(P≤0.05 或 P≤0.01) ,在一次试验中几乎是不会发生的。若根据一定的假设 条件计算出来该事件发生的概率很小,而在一次试验中它竟然发生了,则可以认为假设的 条件不正确,从而否定假设。 若在 H0 成立的前提下,样本统计量对应的概率很小,如小于等于 0.05,则认为事件在某一 次试验中不会发生,此时拒绝 H0,有足够证据推断差异有统计学意义。 幻灯片 11 显著性检验(significance test):根据小概率原理建立起来的检验方法称为显著性检验。 显著性水平(significance level):拒绝零假设所使用的概率。 生物统计工作中, 通常 规定 5%或 1%以下为小概率, 5%或 1%或其它值称为显著性水平,记为“α”。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
三、 样本容量的确定
p152
一、问题的提出 二、处理问题的原则 三、简单随机抽样下,调查成本既定时样本容 量确定的方法 1. 估计总体均值时样本容量的确定
2. 估计总体比例时样本容量的确定
2014-1-1
版权所有 BY lazhenx
37
样本容量的确定
一、问题的提出
从推断来看,要达到估计所要求的精确程度,
对置信区间的理解注意:
②总体参数是固定的、未知的,而用样本构造的区间则是不 固定的。若抽取不同的样本,用该方法可以可到不同的区 间,从这个意义上说置信区间是随机区间,会因样本的不 同而不同,而且不是所有的区间都包含总体参数的真值。 ③在实际问题中,进行估计时往往只抽取一个样本,此时所 构造的是与该样本相联系的一定置信水平(比如95%)下的 置信区间。由于用该样本所构造的区间是一个特定的区间 ,而不再是随机区间,所以无法知道这个样本所产生的区 间是否包含总体参数的真值。我们只能希望这个区间是大 量包含总体参数真值的区间中的一个,但它也可能是少数 几个不包含参数真值的区间中的一个。
1.
ˆ P q1 #q
{
ˆ q2 = 1- a
}
置信区间
置信水平1-α
样本统计量 (点估计)
置信下限
置信上限
当总体服从正态分布N(μ,σ2)时,(σ2已知)来自该总体 的所有容量为n的样本的均值x也服从正态分布,x 的数 学期望为μ,方差为σ2/n 即x~N(μ,σ2/n) 置信水
平
p(
x
原点矩存在,若不存在则无法估计;矩估计法不能充分地利 用估计时已掌握的有关总体分布形式的信息。
2.最大似然估计法
基本思想:当我们经一次抽样取得一些观测数据(样本值) 后,应给未知参数选取一些数值,使得所观测得到的样本值 出现的概率最大。
要求:知道总体分布类型。
注意:对于正态总体,两种方法所得的估计量在形式上是
x
区间估计练习
一、假定容量n=100的一个随机样本 x 产生均值为81和标准差s=12。要求: ①构造总体均值95%置信水平下的置信区间; ②构造总体均值99% 置信水平下的置信区间。 二、一个容量为400的随机样本取自均值和标准差 均未知的总体。已经计算出下列值: 2 2280 xi =14592要求: xi ①构造总体均值95%置信水平下的置信区间; ②构造总体均值99%置信水平下的置信区间。 81±1.96×1.2 ;81±2.58×1.2 ;(5.7±1.96×2/20)
区间估计的置信水平
1.
2.
将构造置信区间的步骤重复很多次,置信区间 包含总体参数真值的次数所占的比例称为置信 水平 表示为 (1 -
为是总体参数未在区间内的比例
相应的 为: 0.01,0.05,0.10 2.58, 1.96, 1.645 (记住)
3.
常用的置信水平值有 99%, 95%, 90%
统计学家在某种程度上确信这个区间会包含真正 的总体参数,所以给它取名为置信区间
对置信区间的理解注意:
① 如果用某种方法构造的所有区间中有95%的区间中包含
总体参数的真值,5%的区间不包含总体参数的真值,那么 用该方法构造的区间称为置信水平为95%的置信区间。同 理,其他置信水平的区间也可用类似的语言表述。
版权所有 BY lazhenx
30
(四)总体方差的区间估计 p150
1. 估计一个总体的方差或标准差 2. 假设总体服从正态分布 3. 总体方差 2 的点估计量为S2,且
n 1s 2
2
4. 总体方差在1- 置信水平下的置信区间为
n 1 s 2
~ 2 n 1
2
均值
标准差
统计量
x s
比例
p
x
s
2 n 1
为 的无偏、有效、一致估计量; 为 的无偏、有效、一致估计量
2
p 为 的无偏、有效、一致估计量。
二、区间估计(interval estimate) p146
在点估计的基础上,给出总体参数估计的一个区间范 围,该区间由样本统计量加减抽样误差而得到的 在概率意义下计算参数 q 的变化范围,即
或 x zα 2
s n
( σ 未知 )
总体均值的区间估计------例题分析 p148
1.正态总体方差已知;或非正态总体但有大样本;或正态总 体方差未知但有大样本
2014-1-1
版权所有 BY lazhenx
24
总体均值的区间估计(例题分析)
【 例 】一家食品生产企业以生产袋装食品为主,为对产量质 量进行监测,企业质检部门经常要进行抽检,以分析每袋重 量是否符合要求。现从某天生产的一批食品中随机抽取了25 袋,测得每袋重量如下表所示。已知产品重量的分布服从正 态分布,且总体标准差为10g。试估计该批产品平均重量的置 信区间,置信水平为95%.
点估计不考虑估计误差的大小,故不需确定估计量的概率分 布。点估计的主要作用是寻找参数的估计量。
按照构造统计量的方法不同,点估计有很多具体方 法,最经典的是矩估计法和最大似然估计法。
1.矩估计法 p142-145
概念:矩估计法是用样本矩来估计总体矩的方法,如 用样本一阶原点矩(样本均值)估计总体一阶原点 矩(总体均值)。 优点及缺点:矩估计法简便、直观;局限性:要求总体的阶
自然要求样本容量越大越好;但从抽样来看,
增大样本容量,势必增加人力、物力,从而导 致调查成本增大,这无疑是不经济的做法。于 是在抽样推断中,势必要在统计推断的精确度 与调查成本这一对矛盾间进行权衡。
z ) 1
2
/2
1-
/2
n
p( x z
2
) 1 n
-z值
0
统计量 临界值
区间估计的图示
x z 2 x
- 2.58x -1.65 x
x
+1.65x + 2.58x
x
-1.96 x
+1.96x
90%的样本 95% 的样本 99% 的样本
重复抽样 x t
s
2
不重复抽样 N- 1
总体均值的区间估计-------例题分析 p149
2014-1-1
版权所有 BY lazhenx
28
(三)总体成数的区间估计 p149
1.
2.
假定条件(只讨论大样本情形)
可以由正态分布来近似
使用正态分布统计量 z
一致的。但对于其它的总体,两种方法所得的估计量在形式 上并不总是一致的。
(二)点估计量的评价标准 最基本的有三条 : 1、无偏性:E ( ) ,称 是
计量 。
的无偏估
2、有效性:一个具有较小变异的统计量的意义
在于将有更多的机会产生一个更接近于总体参数 的量。 3、一致性:随着样本容量的增大,点估计量的 值越来越接近被估计总体参数。
ˆ P( )
ˆ 1 的抽样分布
B A
ˆ 2
的抽样分布
ˆ
一致性(consistency)
一致性:随着样本容量的增大,估计量的 值越来越接近被估计的总体参数。
ˆ P( )
较大的样本容量
B A
较小的样本容量
ˆ
统计中的几个基本概念及表示符号
总体 样本
参数
区间估计时应考虑的一些具体问题
1.在概率意义下计算参数
q 的变化范围,即 P {qˆ1 #q
ˆ q2 = 1- a
}
2.区间估计中的两个基本要求:
3.Neyman原则 即在保证置信度的前提下,尽可能提高估计的精确度。
1.总体均值的区间估计(大样本)(p147)
1. 假定条件(重复抽样时)
2
n1
2
n 1 s 2
2 1 2
n1
自由度
总体方差的区间估计 例题分析
(五)单侧置信区间
p151
区间估计小结 p152
基本步骤:
(1)依题意确定待估参数;
(2)依题设条件构造与待估参数相对应的估计量;
(3)确定估计量的抽样分布;
(4)依估计量的抽样分布,由给定的置信度计算待 估参数置信区间的上、下限。
25袋食品的重量 112.5 102.6 100.0 116.6 136.8 101.0 107.5 123.5 95.4 102.8 103.0 95.0 102.0 97.8 101.5 102.0 108.8 101.6 108.6 98.4 100.5 115.6 102.2 105.0 93.3
总体服从正态分布,且方差(2) 已知或未知 如果不是正态分布,方差(2) 已知或者未知,大样本 可由正态分布来近似 (n 30)
边际误差
2. 使用正态分布统计量 z(标准化) x z ~ N (0,1) n 3. 总体均值 在1- 置信水平下的置信区间为
x zα 2
σ n
2014-1-1
版权所有 BY lazhenx
3
重点与难点
1.参数区间估计的统计思想 2.估计的可靠程度、平均误差及极限误差的关 系 3.临界值检验法的统计思想 4.P值的计算方法及其含义的理解 5.参数检验中的两类错误及其关系
2014-1-1
版权所有 BY lazhenx
4
第一节
注意:一般将同时满足这三条标准的估计量称为优良估计量。
无偏性(unbiasedness)