第七章假设检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
方差 2已知时,关于均值 的 Z 检验
Z检验
H0
0
检验统计量的观察值z x 0
n
H1
0
H
的拒绝域
0
z : z z 2
0 0
0 0
z : z z z : z z
42
例1
某织物强力指标X的均值0=21公斤. 改
进工艺后生产一批织物,今从中取30件,测 得 X=21.55公斤. 假设强力指标服从正态分
在进行显著性检验时,由于犯第一类
错误的概率是可控的,即概率
P 拒绝H0 H0为真 可控,
这能保证当为H
0
真时,错误地拒绝
H
的可
0
能性很小. 这意味着H0是受到保护的.
因此,在作假设时,应选择 H0 , H1使
得两类错误中后果严重的错误成为第一类
错误.
28
•关于假设
例如, 考虑某种药品是否为真时,可能犯两
8
引例
生产流水线上罐装可乐不断地封装,然 后装箱外运. 怎么知道这批罐装可乐的容量 是否合格呢?
合格标准:罐装可乐的容量按标准应在350 毫升和360毫升之间.
方案一:把每一罐都打开倒入 量杯, 看看容量是否合于标准.
这样做显 然不行!
9
通常的办法是进行抽样检查.
方案二:每隔一定时间,抽查若干罐 . 如每隔一小时,抽查n罐,得到n个容
假设检验 非参数假设检验 总体分布未知时的
假设检验问题
2
第七章 假设检验
❖假设检验 ❖一个正态总体均值与方差的假设检验 ❖两个正态总体均值或方差的比较 ❖置信区间与假设检验
3
小概率事件原理
小概率事件在一次试验中基本上不会发生 设有两个盒子,各装有100个球.
…99个
99个红白球 一个白红球
另一一盒盒中中的的白白球球和和红红球球数数
代入 =1.2, n=30,
并由样本值计算得统计
{U u0.01}是
一小概率事件
量U的实测值
U=2.51>2.33
落入拒绝域
故拒绝原假设H0 .
这认时为可新能生犯产第织一物类比错过误去,的犯织错物误强的力概 率是不有超所过提0高.01..
40
作业
P178 2
41
正态总体均值的假设检验
X1, X2,L , Xn : N , 2 ,
4
小概率事件原理
小概率事件在一次试验中基本上不会发生
现从两盒中随机取出一个盒子,问这个 盒子里是白球99个还是红球99个?
5
小概率事件原理
小概率事件在一次试验中基本上不会发生
不妨假设:这个盒子里有99个白球. 现在从中随机摸出一个球,发现是 此时如何判断这个假设是否成立呢?
6
小概率事件原理
小概率事件在一次试验中基本上不会发生
假设检验 —概述
关于总体分布函数的形式或关于总体 参数值的陈述叫做统计假设.
在一个问题中,提出一对相互对立的 统计假设,其中一个叫做原假设;另一个 叫做备择假设.
根据样本的信息检验关于总体的某个 假设是否正确这一类问题称作假设检验问 题.
1
假设检验 —概述
总体分布类型已知,
参数假设检验 检验关于其未知参 数的某个假设
布N(, 2), 且已知 =1.2公斤, 问在显著性 水平 =0.01下,新生产织物比过去的织物
强力是否有提高?
解 提出假设:
H0 : 21, H1 : 21.
38
取统计量 U X 21 ~ N (0,1)
n
确定k,使得
P
X
21 n
k
,
k z
o k z x
39
拒绝域为 W : U u0.01 =2.33
| t |=2.997<4.0322
没有落入
故不能拒绝H0 .
拒绝域
这并不意味着H0一定对,只是差异
还不够显著, 不足以否定H0 .
23
•假设检验的两类错误
假设检验会不会犯错误呢? 由于作出结论的依据是 不是一定不发生
小概率原理 小概率事件在一次试验中基本上不会发生
24
•假设检验的两类错误
如果H0成立,但统计量的实测值落入 否定域,从而作出否定H0的结论,那就犯 了“弃真”的错误 .
度是32.5毫米. 实际生产的产品,其长度X
假定服从正态分布N , 2 , 2未知,现从
该厂生产的一批产品中抽取6件, 得尺寸数 据如下:
32.56, 29.66, 31.64 30.00, 31.87, 31.03
问这批产品是否合格?

20
分析:这批产品(螺钉长度)的全体组成问题的 总体X. 现在要检验E(X)是否为32.5.
如何处理这两者的关系?假设检验面 对的就是这种矛盾.ຫໍສະໝຸດ Baidu
11
下面,就来讨论这个问题.
在正常生产条件下,由于种种随机因素的 影响,每罐可乐的容量应在355毫升上下波动. 这些因素中没有哪一个占有特殊重要的地位. 因此,根据中心极限定理,假定每罐容量服从 正态分布是合理的.
这样,可以认为X1 ,L
,
X
是取自正态总
还是系统误差. 为给出两者 界限,找一检验统计量T, 在H0成立下其分布已知.)
35
求解参数假设检验问题的步骤
1、根据实际问题的要求,提出原假设 H0 及备选假设.H1
2、给出显著水平 ,选择合适的统计量,
确定拒绝域. 3、根据样本值,求出检验统计量的值. 4、作出决策.
36
假设检验的分类
按照检验所用的统计量的分布, 分为
种错误. (1)将假药误作真药,则冒着伤害病人的健 康甚至生命的风险. (2)将真药误作假药,则冒着造成经济损失 的风险.
显然,犯错误(1)比犯错误(2)的后果 很严重. 所以选取
H0:药品为假,H1 : 药品为真
29
•关于假设
如果在两类错误中,没有那一类错误 的后果更严重而需要避免时,常常取H0为 维持现状,即取H0为“无效益”、“无改 进”、“无价值”等等. 例如:
18
不否定H0并不是肯定H0一定对,而只 是说差异还不够显著,还没有达到足以否 定H0的程度 . 所以假设检验又叫 “显著性检验”
如果显著性水平取得很小,则拒绝
域也会比较小. 其产生的后果是: H0难于
被拒绝. 如果在α很小的情况下H0仍被拒
绝了,则说明实际情况很可能与之有显著 差异.
19
例1
某工厂生产的一种螺钉,标准要求长
量的值X1, X2 ,L , Xn ,根据这些值来判断生 产是否正常.
如发现不正常,就应停产,找出原因, 排除故障,然后再生产;如没有问题,就继 续按规定时间再抽样,以此监督生产,保证 质量.
10
很明显,不能由n 罐容量的数据,在 把握不大的情况下就判断生产不正常,因 为停产的损失是很大的.
当然也不能总认为正常,有了问题不 能及时发现,这也要造成损失.
k
,
n
也就是说,事件“|
U
|
z
”2
2
2
是一个小概率事件.
由标准正态分布的上分位点的定义知:
k z 2 ,
17
故可以取拒绝域为 W: | U | z 2
如果由样本值算得该统计量的实测值落
入区域W,则拒绝H0 ;否则,不能拒绝H0 .
这是因为,如果H0 是对的,那么衡量差 异大小的某个统计量落入区域 W(拒绝域) 是 个小概率事件. 如果该统计量的实测值落入 W,也就是说, H0 成立下的小概率事件发生 了, 那么就认为H0不可信而否定它. 否则就不 能否定H0 (只好接受它).
称为检验统计量. 显著水平
控制 P (拒绝H0 | H0为真 ) 中的 称为检验的显著水平.
32
•假设检验 —基本概念
拒绝域 使原假设H0被拒绝的样本观测值所
组成的区域称为检验的拒绝域. 接受域
保留原假设H0的样本观测值所组成 的区域称为检验的接受域.
33
•假设检验 —基本概念
显著性检验 只对犯第一类错误的概率加以控制,
t 2(5) t0.005(5) 4.0322,
使
P{| t | t 2(5)} 2
2
即“ | t | t 2(5)”
是一个小概率事件 .
x
o k t 2 n 1
小概率事件在
得拒绝域 W: |t |>4.0322 一次试验中基
本上不会发生
22
拒绝域 W: |t |>4.0322
第四步 将样本值代入算出统计量 t 的 实测值,
已知 X~ N (, 2 ), 2 未知.
第一步 提出原假设和备择假设
H0 : 32.5 H1 : 32.5
第二步 取一检验统计量,在H0成立下 求出它的分布
能衡量差
异大小且 分布已知
t X X 32.5 ~ t(5)
Sn S6
21
第三步 对给定的显著性水平 =0.01,查
表确定临界值.
如果H0不成立,但统计量的实测值未 落入否定域,从而没有作出否定H0的结论, 即接受了错误的H0,那就犯了“取伪”的 错误 .
25
•假设检验的两类错误
假设检验的两类错误
实际情况
决定
拒绝H0 接受H0
H0为真 第一类错误
正确
H0不真 正确
第二类错误
犯两类错误的概率
P{第一类错误}= P{拒绝H0|H0为真}= ,
P{第二类错误}= P{接受H0|H0不真}= .
26
•假设检验的两类错误
显著性水平 为犯第一类错误的概率.
两类错误是互相关联的, 当样本容量 固定时,一类错误概率的减少导致另一类 错误概率的增加.
要同时降低两类错误的概率, ,或 者要在 不变的条件下降低 ,需要增加
样本容量.
27
•关于假设
代入 =1.2, n=30,
并由样本值计算得统计
{U u0.01}是
一小概率事件
量U的实测值
U 检验 t 检验
2 检验
用正态分布
用 t 分布 用 2 分布
F 检验 用 F分布
按照对立假设的提法,分为 双侧检验 它的拒绝域取在两侧
单侧检验 它的拒绝域取在左侧或右侧
37
例2
某织物强力指标X的均值0=21公斤. 改
进工艺后生产一批织物,今从中取30件,测 得 X=21.55公斤. 假设强力指标服从正态分
假设其中真有99个白球, 摸出红球的概率只有1/100, 这是小概率事件. 小概率事件在一次试验中竟然发生了,不 能不使人怀疑所作的假设. 这个例子中所使用的推理方法,可以称为 带概率性质的反证法 不妨称为概率反证法.
7
小概率事件原理
小概率事件在一次试验中基本上不会发生
它不同于一般的反证法 一般的反证法要求在原假设成立的条件 下导出的结论是绝对成立的,如果事实与之 矛盾,则完全绝对地否定原假设. 概率反证法的逻辑是:如果小概率事件 在一次试验中居然发生,我们就以很大的把 握否定原假设.
n
体N (, 2 )的样本. 且设是已知常数.
12
现在要检验的假设是:
H0 : 0 (0 355),
它的对立假设是:
H1 : 0,
在实际工作中, 往往把不轻易 否定的命题作 为原假设.
称H0为原假设(或零假设); 称H1为备选假设(或对立假设). 那么,如何判断原假设H0 是否成立呢?
13
H0 : 新技术未提高效益,H1 : 新技术提高效益.
30
•假设检验 —基本概念
原 把需要检验的
假 假设称为原假
关于总体
假 设
分布的某 个命题
设 设,记为H0.
备 在拒绝原假设后,可供 择 选择的一个命题称为
假 备择假设,它是原假设
设 的对立假设,记为H1.
31
•假设检验 —基本概念
检验统计量 用于判断原假设成立与否的统计量
由于是正态分布的期望值,它的估计量是
样本均值X,因此可以根据X与0的差距
X 0 来判断H0 是否成立.

X
0
较小时,可以认为H
是成立的;
0

X
0
较大时,应该认为H
不成立的,
0
即生产已不正常.
较大、较小是一个相对的概念,合理的
界限在何处?应由什么原则来确定?
14
问题是:如何给出这个量的界限?
在原假设为真时, U @X 0 : N 0,1 ,
布N(, 2), 且已知 =1.2公斤, 问在显著性 水平 =0.01下,新生产织物比过去的织物
强力是否有提高?
解 提出假设:
H0 : 21, H1 : 21.
43
取统计量 U X 21 ~ N (0,1)
n
确定k,使得
P
X
21 n
k
,
k z
o k z x
44
拒绝域为 W : U u0.01 =2.33
n
且 x x 0 应该较小.
而衡量
x
0
的大小,可归结为衡量
x
0
n
的大小.
15
选择适当的正数k, 使样本的观察值x满足
x 0 n
k时,就拒绝原假设H

0
反之,若样本的观察值 x满足
x 0 n
k时,就接受原假设H0 .
怎样求数 k 呢?
16
给定一个很小的数:0 1, 使得
P
X
而不考虑犯第二类错误的概率的检验.
双边假设检验
显著性检验 单边假设检验
34
提出 假设
总 结
抽取 样本
P(T W)=
-----犯第一
类错误的概率, W为拒绝域
根据统计调查的目的, 提出 原假设H0 和备选假设H1
检验 假设
显著性 水平
作出 决策
拒绝还是不 能拒绝H0
对差异进行定量的分析, 确定其性质(是随机误差
相关文档
最新文档