统计学 第9章(徐国祥)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
假设检验思想的直观解释
●
●
x 480 500
样本均值
一、假设检验
就是对总体参数所作的一个假设开始,然后搜集样本 数据,计算出样本统计量,进而运用这些数据测定假设的 总体参数在多大程度上是可靠的,并作出承认还是拒绝该 假设的判断。
原假设H0(Null hypothesis) H0 : 80
Ho : 20(千克), H1: 20(千克) 由于重量近似的服从正态分布,故统计量z= x- 在原假设成立的
n
时服从标准的正态分布。
例题讲解 【例9-2】
令 =0.05,由于这是单侧检验,拒绝区域在左尾,所以z = -1.645,
当z z = -1.645时就拒绝Ho。计算z值:
z= x- =19.5-20 = -1.826 n 1.5 30
Ho:μ=250(克), H1:μ 250(克)
(2)建立统计量并确定其分布,由于罐头重量服从正态分布, 即X : N(250,32),因此: x : N(250,32 )
100
z= x- : N(0,1) n
例题讲解 【例9-1】
(3)确定显著水平 =0.05.此题为双侧检验。
(4)根据显著水平找出统计分布的临界值, z = 1.96
解:由于问的是是否得出真正的平均值大于25000的结论,这一结果的陈述应
放在备择假设中,于是适当的假设为:H o
:
25000,H1:
25000
已知:=25000,x=27000,n=15,s=5000, =0.05,得
x-
t= =1.55
sn
本检验为单侧检验,拒绝区域在分布的右尾,t( n-1)=t0.0(5 14)=1.76。由于t<t 所以不能否定H 。由于原假设未被否定,说明这些数据并不支持上述结论。
右单侧检验
病人号码 1 2 3 4 5 6 7 8 9 10
增加睡眠 0.7 - - 1.2 0.1 3.4 3.7 0.8 1.8 2.0
量
1.1 0.2
总体均值的右单假设检验的分析过程
(1)提出假设 H0: μ≤0 H1: μ>0
(3)确定统计量的分布 t~t(10)
(4)确定临界值
拒绝 H0
双侧检验,建立假设如下:
Ho : =9(0 分)H1: 9(0 分) 已知:=90,n=20, x=83,s=12,得:
t= x- = -2.609 sn
在 =0.01时, -t( 19)= -2.86,t> -t = -2.86,故接受原假设,即招工考试的总体
2
2
成绩是90分。
例题讲解 【例9-5】
t x 0
sn
(2)H0:μ≤μ0 H1:μ>μ0
(3)H0:μ ≥μ0 H1:μ<μ0
拒绝域
2
2
t
0 t
t
2
2
0 t
t
t 0
t
22
例题分析:总体均值的右单假设检验
【例题2】某制药厂试制某种安定神 经的新药,给10个病人试服,测 得病人增加睡眠量(单位:小时 )如表所示:
试判断这种新药对病人有无安定神 经的功效?
2
(5)计算观察值结果进行决策:
z= x- = 251-250 =3.33 n 3 100
只要z z 或z -z,就否定原假设。由于标准的正态分布
2
2
是对称的若 z z,则否定原假设Ho。由于z=3.33,远远大于
2
临界值z =1.96,故否定原假设Ho,接受H1,即认为罐头的净
2
重偏高。
例题讲解 【例9-1】
置信区间为:
x 1.96 n 即(250.421,251.588)
由于
=
250未包含在该区间内,所以否定H
,结果与上述结论
o
一致。
例题讲解 【例9-2】
解:如果把平均重量保持不变或者增加作为原假设的内容,那么只 要能否定零假设,就能说明样本数据提供充分的证据说明平均重量的减 少了。这个理由暗示了如下的假设:
12
双侧检验的接受区域和拒绝区域
接受区域
的面积
2
1 的面积
的面积
2
拒绝区域
拒绝区域
13
单侧检验
左侧检验
一般而言,如果假设是: H0: 0 ;H1: 0 就用左侧检验
的面积 拒绝区域
1 的面积
接受区域
14
右侧检验
右侧检验适用于原假设 H0: 0 ,而备择假设 H1: 0 的情 况,只要样本平均数显著地超过假设的总体参数,就拒绝原假设
7
二、第I类错误、第II类错误
越大,就也有可能犯第 I 类错误,即越有可能否定真实的原假设。 越大,就越有可能犯第 II 类错误,即越有可能接受非真的原假设。 我们希望犯这两类错误的概率都尽可能小,但在一定样本容量下,减少 会引起 增大,减少 会引起 增大。
在假设检验中,我们一般事先规定允许犯第 I 类错误的概率 ,然 后尽量减少犯第 II 类错误的概率 。
在本题中,如果假定x=249克,则z= -3.33,小于临界 值-1.96,也拒绝原假设H o ,因此,双侧检测的要求就是要同时 注意估计值偏高或者偏低的倾向。
双侧检验与区间估计有一定的联系,我们可以通过要求的 10(0 1-) 的置信区间来检验该假设。如果求出的区间包括 ,就不否定原假设Ho否则就否定Ho。如例题9-1的的95 的
0.05
0 1.833
(2)选择并检验统计量:
t x 0 1.24 0 2.57
S n 1.525 10
(5)确定检验准则
(6)进行决策 在α= 0.05的水平上应拒绝H0 即可以断定这种新药对病人有 安定神经的功效
三、总体为非正态分布,n ≥30
检验统计量 z x ,近似服从正态分布 n
(1)H0: 0 ;H1: 0 (2)H0: 0 ;H1: 0 (3)H0: 0 ;H1: 0
6
二、第I类错误、第II类错误
对假设H0采取的行
动 接受H0 拒绝H0
自然状态
H0为真
决断正确 第I类错误
H0为伪
第II类错误 决断正确
在假设检验中,犯第 I 类错误(弃真错误)的概率为 ,称其为显著性水平; 犯第 II 类错误(取伪错误)的概率为 。
H0 而接受备择假设 H1。
1 的面积
接受区域
的面积
2
拒绝区域
15
四、假设检验的一般程序
(1)根据研究问题的需要提出假设,包括原假设和备 择假设。
(2)找出检验的统计量及其分布。 (3)规定显著性水平,即选择所允许犯第Ⅰ类错误的 概率。 (4)确定决策规则,根据规定的显著性水平,找出接 受区域或者拒绝区域的临界值,一般 0.05或0.01 。 (5)根据样本数据计算统计量的数值并由此作出决策
z= x- 1.581
sn
本题为单侧左尾检验, =0.05, -z = 1.645,由于z>-z ,即1.581> 1.645,故 不能否定H ,即这些数据不能支持该经纪人的说法。
8
两类错误的实例分析
实际情况 判决结果
无罪
有罪
释放
结论正确 纳伪错误
拘留
弃真错误 结论正确
H0:无罪
两类错误的表格分析
实际情况 决策结果
H0正确
H0错误
接受H0
结论正确 纳伪错误
拒绝H0
弃真错误 结论正确
两类错误的表示与关系
两类错误的表示:
犯第一类错误的概率,用α来表示 犯第二类错误的概率,用β来表示
由于z z = -1.645,所以就拒绝Ho : 20(千克),而接受H1: 20(千克),即
检验结果能提供充分的证据说明这些包装食品的平均重量减少了。
例题讲解 【例9-3】
解:样本平均值130千克,可能是总体平均产量提高了,也可能是从平均产量
不超过120千克的总体中抽出的样本平均数偏高所致。现在用假设检验方法来判断,
条件
总体 为非 正态, n ≥30,
σ2
已知, 或 未知
检验统计量
H0、H1
Z x 0 n
(1)H0:μ=μ0 H1:μ≠μ0
Z x 0
snLeabharlann Baidu
(2)H0:μ≤μ0 H1:μ>μ0
(3)H0:μ ≥μ0 H1:μ<μ0
拒绝域
2
2
z
0 Z
Z
2
2
0 Z
z
0 ZZ
z
25
例题讲解 【例9-1】
(1)提出假设。考虑到双方的经济利益,现在净重为250克, 当净重远远超过250克时,工厂生产成本增加,卖方吃亏; 当净重远远低于250克时,买方如果接受这批罐头就会吃亏。所以, 要求罐头不过于偏重或者偏轻。从而提出的假设为:
条件
正态 总体,
σ2
已知
检验统计量 H0、H1
(1)H0:μ=μ0 H1:μ≠μ0
Z x 0 n
(2)H0:μ≤μ0 H1:μ>μ0
拒绝域
2
2
z
0 Z
Z
2
2
0 Z z
(3) H0:μ≥μ0 H1:μ<μ0
Z 0
z
19
例题分析:总体均值的双侧假设检验
【例题1】某 铁厂的铁水 含碳量服从正态分布 N(4.55,0.1082)。现随机抽查5炉铁水,测得 含 碳 量 分 别 为 4.28 , 4.40 , 4.42 , 4.35 和 4.50。设方差保持不变,能否认为铁水平均 含碳量仍为4.55?(=0.05)
两类错误的关系:
若α减小,则β必增大 若β减小,则α必增大
返回
三、双侧检验和单侧检验
双侧检验
当 H0: 0 ;H1: 0 时,就必须用双侧检验,其目的 是观察在规定的显著性水平下所抽取的样本统计量是 否显著地高于或低于假设的总体参数。
标准正态曲线下两个尾部面积各占 ,这样就有了 2
两个拒绝区域。如果样本统计量落在这两个区域内, 就拒绝原假设。 注意:在双侧检验中差距是不分正负的。
(5)确定检验准则
(6)进行决策 在α= 0.05的水平上应拒绝H0 即不能认为铁水的平均含碳量 仍然为4.55
二、总体为正态分布且n<30,但方差未知
检验统计量 t x ,服从从标准正态分布。
sn
条件
正态 总体,
n<30, 但σ2
未知
检验统计量
H0、H1
(1)H0:μ=μ0 H1:μ≠μ0
备择假设H1(Alternative hypothesis )H1 : 80
5
一、假设检验
原假设H0是关于总体参数的表述,它是接受检验的假 设 ,备择假设H1是当原假设被否定时另一种可成立的假设
原假备择假设是相互对立的,在任何情况下只能有一个成
立就。对如总果体接平受均H数0就的必假须设拒而绝言H有1;三拒种绝情H况0就:必须接受H1
策。
16
2 抽样得到样 本观察值
6 计算检验统 计量的数值
检验步骤
1 建立总体假设
H0,H1
3 选择统计量
确定H0为真
时的抽样分布
7 比较并作出检验判断
4 根据具体决策
要求确定α
5
确定临界点C和
检验规则
17
第二节
总体平均数的假设检验
18
的 分布。
一、总体为正态分布且方差已知
检验统计量 z x n
o
例题讲解 【例9-6】
解:建立假设:Ho : 48000(0 元), H1:<48000(0 元) 由于样本容量足够大,n=40,我们由中心极限定理知道x的抽样分布至少近似服
从正态分布。如果已知,则检验统计量为z= x- 。但由于样本容量大,因此当 n
未知时,可用s代替 从而本题在实际计算时用的检验统计量及其数值为:
双侧检验
总体均值的双侧假设检验的分析过程
(1)提出假设 H0: μ= 4.55 H1: μ 4.55
(3)确定统计量的分布 Z~N(0,1)
(4)确定临界值
拒绝 H0
0.025
拒绝 H0
0.025
-1.96 0 1.96
(2)选择并检验统计量:
z x 0 4.39 4.55 3.31 n 0.108 5
z。若z z,就可以否定原假设Ho,否则就不否定。令此题的 =0.05,z =1.645,若
z
z
=1.645,就拒绝H
。
o
z= x- =6.186 n
由于z=6.18 z =1.645,所以拒绝原假设Ho,接受H1,即这种化肥能使小麦增产。
例题讲解 【例9-4】
解:因为经理所关心的是真实的平均成绩与假设的90分是否有区别,所以应该使用
如把小麦的减产作为原假设的话,只要否定原假设,就可以说明小麦的增产。因此,
可建立如下假设:
H o
:
120(千克),H1:
120(千克)
例题讲解 【例9-3】
由于产量服从正态分布,样本容量足够大,且总体方差已知故统计量z= x- n
在原假设成立时服从标准正态分布。
此题为单侧检验,拒绝区域在右尾。在显著性水平,尾部面积为,临界值为
第九章 假设检验
第一节 第二节 第三节
第四节 第五节
假设检验的基本问题 总体平均数的假设检验 两个总体平均数之差的
假设检验 总体比率的假设检验 总体方差的假设检验
1
第一节
假设检验的基本问题
2
假设检验的基本思想
引例:某企业用自动打包机包装食盐,要求每袋 食盐的重量服从正态分布。当机器工作正常时, 每袋食盐的均值为0.5公斤,标准差为0.015公斤。 每天开工后企业需要检验一次打包机工作是否正 常,即检验打包机是否有系统误差。那么,企业 应该怎样做?