第八章 假设检验 第2讲
第8 假设检验(共80张PPT)
8.1 8.2 8.3 8.4
假设检验的根本问题 一个总体参数的检验 两个总体参数的检验 假设检验中的其他问题
我认为该企业生产的零件的平
均长度为4厘米!
什么是假设? 对总体 参数的一种看法
总体参数包括总 体均值、比例、方 差等
举例说明假设检验的根本思路
某单位职工上月平均收入为210元,这个 月的情况与上月没有大的变化,我们设想平均 收入还是210元.
样本均值的抽样分布
置信水平
拒绝域
1-
接受域
临界值
H0
样本统计量
如果备择假设具有符号“>〞,拒绝域位于抽样分 布的右侧,故称为右侧检验
样本均值的抽样分布
置信水平
1- 接受域
拒绝域
H0
样本统计量
临界值
请判断它们的拒绝域:
〔1〕假设检验的假设为H0:m=m0 ,H1: m≠m0,那么拒绝域为〔 〕。
〔2〕假设检验的假设为H0:m≥m0 ,H1: m < m0,那么拒绝域为〔 〕。
〔3〕假设检验的假设为H0:m≤m0 ,H1: m > m0,那么拒绝域为〔 〕。
检验统计量:Z > Z;
Z > Z/2 或Z <-Z/2 ;
Z <-Z
决策规那么
给定显著性水平 ,查表得出相应的临界 值 将检验统计量的值与 水平下的临界值进 行比较 双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0 得出拒绝或不拒绝原假设的结论
H0:m=10 H1:m≠10
例 6.2
某品牌洗涤剂在它的产品说明书中声称:平均 净含量不少于500g。从消费者的利益出发, 有关研究人员要通过抽检其中的一批产品来验 证该产品制造商的说明是否属实。试陈述用于 检验的原假设与备择假设。
概率论与数理统计(8)假设检验
概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。
由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题1引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?问题2记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题3则问题等价于检验H0成立,还是H1成立.某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题4则问题等价于检验H0成立,还是H1成立.自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5记服从指数分布,不服从指数分布.则问题也等价于检验H0成立,还是H1成立.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。
统计学贾俊平第8章 假设检验
两者都可以被选为null hypothesis
18
All rights reserved
假设的陈述
若FDA 选择以下的方式: H0:新药对于大众没有益处不应该上市 H1:新药对于大众有益处 此时药厂必须举证推翻H0,否则FDA不会核准 新药上市 由于这种假设方式,美国的新药上市过程十 分冗长,但好处为有害药物要上市十分困难
建立的原假设与备择假设应为
H0: 1000
H1: 1000
27
All rights reserved
双侧检验和单侧检验
假设
H0 H1
研究的问题
双侧检验 左侧检验 右侧检验
= 0
0
0
≠0
< 0
> 0
28
All rights reserved
H1: 1500
25
All rights reserved
双侧检验和单侧检验
一项研究表明,改进生产工艺后,会使产品的废 品率降低到2%以下。检验这一结论是否成立
研究者总是想证明自己的研究结论(废品率降 低)是正确的
备择假设的方向为“<”(废品率降低)
建立的原假设与备择假设应为
H0: 2%
13
All rights reserved
假设的陈述
备择假设 (alternative hypothesis)
与原假设对立的假设,也称“研究假设” 这与原假设为互斥 研究者想收集证据予以支持的假设。总是 有不等号: , 或 表示为 H1
例如,H1: < 某特定值 如 H1: < 3.5
4
All rights reserved
第八章----假设检验课件PPT
假设检验的基本问题 一个总体参数的检验 两个总体参数的检验
1
学习目标
假设检验的基本思想和原理 假设检验的步骤 一个总体参数的检验 两个总体参数的检验 P值的计算与应用 用Excel进行检验
2
正常人的平均体温是37oC吗?
37.1 36.9 36.9 37.1 36.4
在一次试验中小概率事件一旦发生,我们就有理 由拒绝原假设
8
原假设
(null hypothesis)
1. 又称“0假设”,研究者想收集证据予以反对的假 设,用H0表示
2. 所表达的含义总是指参数没有变化或变量之间没 有关系
3. 最初被假设是成立的,之后根据样本数据确定是否 有足够的证据拒绝它
4. 总是有符号 , 或
原假设为真时拒绝原假设 会产生一系列后果 第一类错误的概率为
❖被称为显著性水平
❖ 2.第二类错误(取伪错误)
原假设为假时接受原假设 第二类错误的概率为(Beta)
12
两类错误的控制
❖ 一般来说,对于一个给定的样本,如果犯第Ι 类错误的代价比犯第Ⅱ类错误的代价相对较 高,则将犯第Ⅰ类错误的概率定得低些较为 合理;反之,如果犯第Ι类错误的代价比犯第 Ⅱ类错误的代价相对较低,则将犯第Ⅰ类错 误的概率定得高些
H0 : = 某一数值 H0 : 某一数值 H0 : 某一数值
例如, H0 : 10cm
9
备择假设
(alternative hypothesis)
1. 也称“研究假设”,研究者想收集证据予以支持的 假设(期望出现的结论作为备选假设),用H1或Ha表 示
2. 所表达的含义是总体参数发生了变化或变量之间 有某种关系
➢ 我们应该放弃“正常人的平均体温是37oC”这个 共识吗?本章的内容就将提供一套标准统计程序 来检验这样的观点
ch8假设检验课件
2.两个正态总体的参数检验
σ12 =σ22 已知时均值的检验——u检验 σ12 =σ22 =σ2未知时均值的检验——t检验 μ1 ,μ2 未知时方差的检验——
F 检验
单个正态总体均值的检验
设总体 X ~ N ( , 2 ), X 1 , X 2 , X n为样本。 (1) σ2=σ02已知, 关于μ 的检验 —— u检验
思考:
如果例1中检验问题改为“养鸭户送来的鸭子平均重量 是否比“全聚德”要求偏轻?”,如何做出检验?
N ( 0 , 2 ), 0 2.00, 0.20 , 已知 “全聚德” 鸭子重量服从 样本的平均值 x 1.88 ,样本容量 n 100 ,
X N ( , 2 ) , 则 解:设养鸭户送来的鸭子重量 X N ( , 2 n)
2
2方
2 0.202, H 为真时,对于给定 差已知 当 0
的小概率 ,由
P X 0 k | 0
X 0 k P , / n / n
得
k
/ n
z ,
2
即
k
n
z
2
2
不同备择假设形式下的拒绝域示意图
(1)H1:μ≠μ0
u / 2
u / 2
(2)H1:μ>μ0
u
(3)H1:μ<μ0
u
(2) σ2未知, 关于μ 的检验 —— t 检验 ① 提出假设: 0 : 0 , H 1 : 0 H ② 检验统计量
X 0 T ~ t ( n 1) (H 0 真时) S/ n
③ 求临界值。 对水平 ,查 t 分布表求临界值 t ,使
统计学 第8章 假设检验 教学课件ppt
确定适当的检验统计量
什么是检验统计量?
1. 用于假设检验决策的统计量
原假设H0为真 点估计量的抽样分布 (样本均值、样本方差)
比较 3. 作出决策
双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0
利用 P 值 进行决策
什么是P 值?
(P-value)
P值告诉我们: 如果原假设是正确的话,我们得到得到样本观察 结果或更极端结果出现的可能性有多大,如果这 个可能性很小,就应该拒绝原假设
因此,如果在一次抽样中竟然出现了满足
X 0 / n
ห้องสมุดไป่ตู้
的 u /2
X
那么我们就有理由怀疑原假设H0的正确性了,因此会拒
绝H0 。
由于 | U |
X 0 / n
u 2
是一个小概率事件.
故我们可以取拒绝域为:
W: | U | u 2
如果由样本值算得该统计量的实测值落入区域 W,则拒绝H0 ;否则,不能拒绝H0 .
1、生产已不正常
2、生产正常:但属于小概率事件,一次抽样中几乎 不可能发生
因此:在原假设成立(生产正常)的情况下, 若发生小概率事件,则我们有充分的理由怀 疑原假设已不成立。
因此若H0为真,即 0 时,
X
0
/ n
u /2
是一个小概率事件:1%、5%、10%
而小概率事件在一次试验中基本上不应该发生 。
第8章-假设检验全解PPT课件
临界点为: u 及 u
2
2
.
12
3. 两类错误
拒绝H0要承担一定的风险,有可能将正确的假设 误认为是错误的,在统计中称这种“以真为假”的错 误为第一类错误(弃真),犯第一类错误的概率显然是 显著水平α;
不拒绝H0同样要承担风险,这时,可能将错误的 假设误认为是正确的,这种“以假为真”的错误称 为第二类错误(取伪), 犯第二类错误的概率是:
.
3
第一节 假设检验的基本原理与方法 一、假设检验的基本原理 二、假设检验的相关概念 三、假设检验的一般步骤 四、小结
.
4
一、假设检验的基本原理
假设检验问题是统计推断的另一类重要问题.
在总体的分布函数完全未知或只知其形式、但 不知其参数的情况下, 为了推断总体的某些性质, 提出某些关于总体的假设.
对于给定的检验水平
01 由P
U
u
2
得拒绝域为 W {u u }
2
这种利用U统计量来检验的方法称为U检验法.
.
17
(2)检验假设 H 0:0,H 1:0
选择统 U计 X/n量 ~N(0,1)
当H0成立时,P( X u0
/ n
u )
P(Xuuu0
/ n
u)
P(X/unu0/unu)P(X/un u)
第八章
假设检验
第一节 参数假设检验的问题与方法
第二节 第三节
单总体参数的检验 两总体参数检验
第四节 非参数检验
.
1
[本章要求]
1. 理解假设检验的基本思想; 2. 熟练掌握假设检验的基本步骤; 3. 熟练掌握单个正态总体均值与方差的假设检验方法; 4. 掌握双正态总体均值差与方差比的假设检验方法.
第八章 假设检验2PPT课件
(1)待检验假设可设为
H0 : 0 21; H1 : 0 21
10
(2)检验统计量取为
(3)拒绝域为
Z X 0 0 nWLeabharlann {(x1,
...,
xn
)
:
x
0 /
0
n
z }
这n里 3,0 0.0,1
11
查表得,z=2.33, 由样本值计算
x
0
0
/ 30
2.55
2.33
z
落入拒绝域 (4)判断:拒绝原假设H0 . 认为新生产织物比过去的织物强力 有提高.
§2 正态总体均值的假设检验
一 单 个 总 体 N (,2 ) 均 值 的 检 验
设总体X~N (, 2 ),X1,X2,…,Xn为来自总
体X的样本.
12 = 0 2 已 知 , 关 于 均 值 的 检 验 ( Z 检 验 )
H 0:0 , H 1:0
1
构造检验统计量
Z X 0 0 n
W{(x1,x2, ,xn):|t||xs/n0|c}
H0为真时
t X 0 t(n1)
S/ n
14
按照控制第一类错误的原则,有
H0成立时
P
X 0
c
S/ n
由此 ct/2(n1)
拒绝域为 W {(x1,x2, ,xn):|t||x s/ n 0|t/2(n 1 )}
查表t/2(n-1) 计算 | x 0 |
正态分布 N(, 0.0152). 按规定袋装糖果的
重量的均值应为0.5(克).一批袋装糖果出 厂前进行抽样检查,抽查了9袋,重量分别 为, 0.497 0.506 0.518 0.524 0.498
假设检验详细知识PPT课件
解: 用t检验法.
检验假设 H0:112.6(0) H1:112.6(0) Q0.05,n7
t(n1)t0.025(6)2.4469
2
23
返回
第八章 假设检验
概率统计
Q x 1 1 2 .8 ,s7 27 1 1i 7 1(x i 1 1 2 .8 )2 (1 .1 3 6 )2
t x112.6 0.4659 s7 / 7
0.511 0.520 0.515 0.512
问机器是否正常?
7
返回
第八章 假设检验
概率统计
分析:用 和 分别表示这一天袋装糖重总体 X
的均值和标准差.则 X~N (,0.01 2)其 5 , 中 未.知
问题:根据样本值判断 0还 .5 是 0..5
提出两个对立假设 H 0 : 0 0 . 5 和 H 1 : 0 .
返回
第八章 假设检验
(2)检验假设 H 0:0,H 1:0
概率统计
选择统 U计 X/n量 ~N(0,1)
当H
成立时,
0
P( X u0
/ n
u )
P(Xuuu0
/ n
u)
P(X/unu0/unu)
Xu P(
/ n
u)
对于给定的检验水平 01
得拒绝域为 (3)检验假设
W{uu}
其中u X 0 / n
不拒绝H0同样要承担风险,这时,可能将错误的 假设误认为是正确的,这种“以假为真”的错误称 为第二类错误(取伪), 犯第二类错误的概率是:
β=P{当H0不真时 , 不拒绝H0}.
13
返回
第八章 假设检验
概率统计
三、假设检验的基本步骤
假设检验2 PPT课件
(2)计算检验统计量
首先计算差值 d 及 d 2 ,见表 8.1,由此得到
d = 39 , d 2 = 195 ,
d
=
d n
=
39 12
单侧检验与双侧检验
双侧检验 (two-sided test) 单侧检验 (one-sided test)
• 选用双侧检验还是单侧检验需要根据分析目的及专业 知识进行确定
• 在没有充分理由进行单侧检验时,为了稳妥起见,建 议采用双侧检验
• 应该在假设检验的第一步建立检验假设时确定,不应 该在算得检验统计量后主观确定,否则可能得到相反 的结论
两种假设
• 零假设(null hypothesis),也称无效假设或无差 异假设,记为 H0 ,表示目前的差异是由抽样误 差引起的。
• 备择假设(alternative hypothesis)或对立假设, 记为 ,表示两者存在本质不同 。
H1
二、假设检验的基本步骤
•建立检验假设,确定检验水准 • 选定检验方法,计算检验统计量 • 确定P值,作出统计推断
样本A
pA
样本B
pB有两种 : 1. 仅由抽样误差造成 2. 总体率之差造成 ,即体现了两种疗法效果的本质差异
例7.2
已知总体0 ?
3min
未知总体
样本
X 4 min
样本均数不等于已知的总体均数,原因可能有两种
1. 0 3 min,只是由于抽样误差造成样本均数不等
• 若P>时,表示在H0成立的条件下,出现等于及
大于现有统计量的概率不是小概率,现有样本信 息还不足以拒绝H0。
三、t 检验
• 单样本t检验 例7.3和例 7.4 • 配对设计均数的比较 例8.2 • 两样本均数的比较 例8.3
第8部分假设检验PPT课件
第8章 假设检验 第10页/共22页
由于
xy 2017 2.11.645,
12 22
32 42
m n 10 14
所以拒绝H0,即我们有理由相信方法1比方法 2生产出的产品的平均抗拉强度要强.
第8章 假设检验 第11页/共22页
例2 有甲、乙两台机床加工生产相同的产品,从它们生产的产品中分 别随机抽取8件和6件,测得产品直径数据为:
Ø 理解双正态总体参数的假设检验
教
学 要
Ø 掌握双正态总体均值的假设检验
求
与
重
点
、
难
Ø重点:双正态总体均值的假设检验
点
第8章 假设检验 第1页/共22页
8.3 两个正态总体的参数检验
一、方差已知,两个正态总体均值的比较 二、方差未知,两个正态总体均值的比较
三、均值未知,两个正态总体方差的比较 四、小 结
第8章 假设检验
第3页/共22页
一、方差已知时,两个正态总体
均值的比较
1 .H 0 :1 2 ,H 1 :1 2
由于
X
~
N
1
,
2 1
m
,
Y
~
N
2
,
2 2
n
,
且两样本相互独立,于是有
XY~N12,m 12n22,
第8章 假设检验
第4页/共22页
因此,当H0为真时,统计量
X Y
解 该问题即检验假设
H 0 :1 2 2 2 ,H 1 :1 2 2 2 .
检验的拒绝域为
, ,
s s 1 2 2 2 F 1 /2 (m 1 ,n 1 .)或 s s 1 2 2 2 F /2 (m 1 ,n 1 )
概率论与数理统计第八章 假设检验
第八章假设检验第一节概述统计推断中的另一类重要问题是假设检验(Hypothesis testing).当总体的分布函数未知,或只知其形式而不知道它的参数的情况时,我们常需要判断总体是否具有我们所感兴趣的某些特性.这样,我们就提出某些关于总体分布或关于总体参数的假设,然后根据样本对所提出的假设作出判断:是接受还是拒绝.这就是本章所要讨论的假设检验问题.我们先从下面的例子来说明假设检验的一般提法.例8.1某工厂用包装机包装奶粉,额定标准为每袋净重0.5kg.设包装机称得奶粉重量X服从正态分布N(μ,σ2).根据长期的经验知其标准差σ=0.015(kg).为检验某台包装机的工作是否正常;随机抽取包装的奶粉9袋,称得净重(单位:kg)为0.499 0.515 0.508 0.512 0.4980.515 0.516 0.513 0.524问该包装机的工作是否正常?由于长期实践表明标准差比较稳定,于是我们假设X~N(μ,0.0152).如果奶粉重量X 的均值μ等于0.5kg,我们说包装机的工作是正常的.于是提出假设:H0:μ=μ0=0.5;H1:μ≠μ0=0.5.这样的假设叫统计假设.1.统计假设关于总体X的分布(或随机事件之概率)的各种论断叫统计假设,简称假设,用“H”表示,例如:(1)对于检验某个总体X的分布,可以提出假设:H0:X服从正态分布,H1: X不服从正态分布.H0:X服从泊松分布,H1: X不服从泊松分布.(2)对于总体X的分布的参数,若检验均值,可以提出假设:H0:μ=μ0;H1:μ≠μ0.H0:μ≤μ0;H1:μ>μ0.若检验标准差,可提出假设:H0:σ=σ0;H1:σ≠σ0.H0:σ≥σ0;H1:σ<σ0.这里μ0,σ0是已知数,而μ=E(X),σ2=D(X)是未知参数.上面对于总体X的每个论断,我们都提出了两个互相对立的(统计)假设:H0和H1,显然,H0与H1只有一个成立,或H0真H1假,或H0假H1真,其中假设H0,称为原假设(Original hypothesis)(又叫零假设、基本假设),而H1称为H0的对立假设(又叫备择假设).在处理实际问题时,通常把希望得到的陈述视为备择假设,而把这一陈述的否定作为原假设.例如在上例中,H0:μ=μ0=0.5为原假设,它的对立假设是H1:μ≠μ0=0.5.统计假设提出之后,我们关心的是它的真伪.所谓对假设H0的检验,就是根据来自总体的样本,按照一定的规则对H0作出判断:是接受,还是拒绝,这个用来对假设作出判断的规则叫做检验准则,简称检验,如何对统计假设进行检验呢?我们结合上例来说明假设检验的基本思想和做法.2.假设检验的基本思想 在例8.1中所提假设是H 0:μ=μ0=0.5(备择假设H 1:μ≠μ0).由于要检验的假设涉及总体均值μ,故首先想到是否可借助样本均值这一统计量来进行判断.从抽样的结果来看,样本均值x =19(0.499+0.515+0.508+0.512+0.498+0.515+0.516+0.513+0.524)=0.5110,与μ=0.5之间有差异.对于与μ0之间的差异可以有两种不同的解释.(1) 统计假设H 0是正确的,即μ=μ0=0.5,只是由于抽样的随机性造成了与μ0之间的差异;(2) 统计假设H 0是不正确的,即μ≠μ0=0.5,由于系统误差,也就是包装机工作不正常,造成了与μ0之间的差异.对于这两种解释到底哪一种比较合理呢?为了回答这个问题,我们适当选择一个小正数α(α=0.1,0.05等),叫做显著性水平(Level of significance).在假设H0成立的条件下,确定统计量X -μ0的临界值αλ,使得事件{|X -μ0|>αλ}为小概率事件,即P{|X -μ0|>αλ}=α.(8.1)例如,取定显著性水平α=0.05.现在来确定临界值λ0.05.因为X ~N (μ,σ2),当H 0:μ=μ0=0.5为真时,有X ~N (μ0,σ2),于是2011~,n i i X X N n n σμ=⎛⎫= ⎪⎝⎭∑,ZX X =N (0,1),所以 P {|Z |>z α/2}=α.由(8.1)式,有P Z ⎧>⎨⎩=α,因此22,z z αααλ==λ0.05=z 0.0250.015/3=0.0098. 故有P {|X -μ0|>0.0098}=0.05.因为α=0.05很小,根据实际推断原理,即“小概率事件在一次试验中几乎是不可能发生的”原理,我们认为当H 0为真时,事件{|X -μ0|>0.0098}是小概率事件,实际上是不可能发生的.现在抽样的结果是|x -μ0|=|0.5110-0.5|=0.0110>0.0098.也就是说,小概率事件{|X -μ0|>0.0098}居然在一次抽样中发生了,这说明抽样得到的结果与假设H 0不相符,因而不能不使人怀疑假设H 0的正确性,所以在显著性水平α=0.05下, 我们拒绝H 0,接受H 1,即认为这一天包装机的工作是不正常的.通过上例的分析,我们知道假设检验的基本思想是小概率事件原理,检验的基本步骤是: (1) 根据实际问题的要求,提出原假设H 0及备择假设H 1;(2) 选取适当的显著性水平α(通常α=0.10,0.05等)以及样本容量n ;(3) 构造检验用的统计量U ,当H 0为真时,U 的分布要已知,找出临界值αλ使P {|U |>αλ}=α.我们称|U |>αλ所确定的区域为H 0的拒绝域(Rejection region),记作W ; (4) 取样,根据样本观察值,计算统计量U 的观察值U 0;(5) 作出判断,将U 的观察值U 0与临界值αλ比较,若U 0落入拒绝域W 内,则拒绝H 0接受H 1;否则就说H 0相容(接受H 0).3.两类错误由于我们是根据样本作出接受H 0或拒绝H 0的决定,而样本具有随机性,因此在进行判断时,我们可能会犯两个方面的错误:一类错误是,当H 0为真时,而样本的观察值U 0落入拒绝域W 中,按给定的法则,我们拒绝了H 0,这种错误称为第一类错误.其发生的概率称为犯第一类错误的概率或称弃真概率,通常记为α,即P {拒绝H 0|H 0为真}=α;另一种错误是,当H 0不真时,而样本的观察值落入拒绝域W 之外,按给定的检验法则,我们却接受了H 0.这种错误称为第二类错误,其发生的概率称为犯第二类错误的概率或取伪概率,通常记为β,即P {接受H 0|H 0不真}=β.显然这里的α就是检验的显著性水平.总体与样本各种情况的搭配见表8-1.表8-1对给定的一对H 0和H 1,总可以找到许多拒绝域W .当然我们希望寻找这样的拒绝域W ,使得犯两类错误的概率α与β都很小.但是在样本容量n 固定时,要使α与β都很小是不可能的,一般情形下,减小犯其中一类错误的概率,会增加犯另一类错误的概率,它们之间的关系犹如区间估计问题中置信水平与置信区间的长度的关系那样.通常的做法是控制犯第一类错误的概率不超过某个事先指定的显著性水平α(0<α<1),而使犯第二类错误的概率也尽可能地小.具体实行这个原则会有许多困难,因而有时把这个原则简化成只要求犯第一类错误的概率等于α,称这类假设检验问题为显著性检验问题,相应的检验为显著性检验.在一般情况下,显著性检验法则是较容易找到的,我们将在以下各节中详细讨论.在实际问题中,要确定一个检验问题的原假设,一方面要根据问题要求检验的是什么,另一方面要使原假设尽量简单,这是因为在下面将讲到的检验法中,必须要了解某统计量在原假设成立时的精确分布或渐近分布.下面各节中,我们先介绍正态总体下参数的几种显著性检验,再介绍总体分布函数的假设检验.第二节 单个正态总体的假设检验1.单个正态总体数学期望的假设检验(1) σ2已知关于μ的假设检验(Z 检验法(Z -test)) 设总体X ~N (μ,σ2),方差σ2已知,检验假设H 0:μ=μ0;H 1:μ≠μ0 (μ0为已知常数) 由X ~N (μ,n σ)X N (0,1), 我们选取ZX (8.2)作为此假设检验的统计量,显然当假设H 0为真(即μ=μ0正确)时,Z ~N (0,1),所以对于给定的显著性水平α,可求z α/2使P {|Z |>z α/2}=α,见图8-1,即P {Z <-z α/2}+P {Z >z α/2}=α.从而有P {Z >z α/2}=α/2, P {Z ≤z α/2}=1-α/2.图8-1利用概率1-α/2,反查标准正态分布函数表,得双侧α分位点(即临界值)z α/2. 另一方面,利用样本观察值x 1,x 2,…,x n 计算统计量Z 的观察值z 0x (8.3)如果:(a )|z 0|>z α/2,则在显著性水平α下,拒绝原假设H 0(接受备择假设H 1),所以|z 0|>z α/2便是H0的拒绝域.(b ) |z 0|≤z α/2,则在显著性水平α下,接受原假设H 0,认为H 0正确.这里我们是利用H0为真时服从N (0,1)分布的统计量Z 来确定拒绝域的,这种检验法称为Z 检验法(或称U 检验法).例8.1中所用的方法就是Z 检验法.为了熟悉这类假设检验的具体作法,现在我们再举一例.例8.2 根据长期经验和资料的分析,某砖厂生产的砖的“抗断强度”X 服从正态分布,方差σ2=1.21.从该厂产品中随机抽取6块,测得抗断强度如下(单位:kg ·cm -2):32.56 29.66 31.64 30.00 31.87 31.03检验这批砖的平均抗断强度为32.50kg ·cm -2是否成立(取α=0.05,并假设砖的抗断强度的方差不会有什么变化)?解 ① 提出假设H 0:μ=μ0=32.50;H 1:μ≠μ0. ② 选取统计量ZX ,若H 0为真,则Z ~N (0,1).③ 对给定的显著性水平α=0.05,求z α/2使P {|Z |>z α/2}=α,这里z σ/2=z 0.025=1.96.④ 计算统计量Z 的观察值:|z 0| ≈3.05.⑤ 判断:由于|z 0|=3.05>z 0.025=1.96,所以在显著性水平α=0.05下否定H 0,即不能认为这批产品的平均抗断强度是32.50 kg ·cm -2.把上面的检验过程加以概括,得到了关于方差已知的正态总体期望值μ的检验步骤: (a ) 提出待检验的假设H 0:μ=μ0;H 1:μ≠μ0. (b ) 构造统计量Z ,并计算其观察值z 0:ZX ,z 0x(c ) 对给定的显著性水平α,根据P {|Z |>z α/2}=α,P {Z >z α/2}=α/2,P {Z ≤z α/2}=1-α/2查标准正态分布表,得双侧α分位点z α/2. (d ) 作出判断:根据H 0的拒绝域 若|z 0|>z α/2,则拒绝H 0,接受H 1; 若|z 0|≤z α/2,则接受H 0.(2) 方差σ2未知,检验μ(t 检验法(t -test)) 设总体X ~N (μ,σ2),方差σ2未知,检验H 0:μ=μ0;H 1:μ≠μ0.由于σ2X 便不是统计量,这时我们自然想到用σ2的无偏估计量——样本方差S 2代替σ2,由于X t (n -1),故选取样本的函数tX (8.4)图8-2作为统计量,当H 0为真(μ=μ0)时t ~t (n -1),对给定的检验显著性水平α,由P {|t |>t α/2(n -1)}=α, P {t >t α/2(n -1)}=α/2,见图8-2,直接查t 分布表,得t 分布分位点t α/2(n -1).利用样本观察值,计算统计量t 的观察值t 0x 因而原假设H0的拒绝域为|t 0|>t α/2(n -1). (8.5)所以,若|t 0|>t α/2(n -1),则拒绝H 0,接受H 1;若|t 0|≤t α/2(n -1),则接受原假设H 0.上述利用t 统计量得出的检验法称为t 检验法.在实际中,正态总体的方差常为未知,所以我们常用t 检验法来检验关于正态总体均值的问题.例8.3 用某仪器间接测量温度,重复5次,所得的数据是1250°,1265°,1245°,1260°,1275°,而用别的精确办法测得温度为1277°(可看作温度的真值),试问此仪器间接测量有无系统偏差?这里假设测量值X 服从N (μ,σ2)分布. 解 问题是要检验H 0:μ=μ0=1277;H 1:μ≠μ0.由于σ2未知(即仪器的精度不知道),我们选取统计量tX .当H 0为真时,t ~t (n -1),t 的观察值为|t 0|185.399-==>3.对于给定的检验水平α=0.05,由P {|t |>t α/2(n -1)}=α, P {t >t α/2(n -1)}=α/2, P {t >t 0.025(4)}=0.025,查t 分布表得双侧α分位点t α/2(n -1)=t 0.025(4)=2.776.因为|t 0|>3>t 0.025(4)=2.776,故应拒绝H 0,认为该仪器间接测量有系统偏差.(3) 双边检验与单边检验上面讨论的假设检验中,H 0为μ=μ0,而备择假设H 1:μ≠μ0意思是μ可能大于μ0,也可能小于μ0,称为双边备择假设,而称形如H 0:μ=μ0,H 1:μ≠μ0的假设检验为双边检验.有时我们只关心总体均值是否增大,例如,试验新工艺以提高材料的强度,这时所考虑的总体的均值应该越大越好,如果我们能判断在新工艺下总体均值较以往正常生产的大,则可考虑采用新工艺.此时,我们需要检验假设H 0:μ=μ0;H 1:μ>μ0. (8.6)(我们在这里作了不言而喻的假定,即新工艺不可能比旧的更差),形如(8.6)的假设检验,称为右边检验,类似地,有时我们需要检验假设H 0:μ=μ0;H 1:μ<μ0. (8.7)形如(8.7)的假设检验,称为左边检验,右边检验与左边检验统称为单边检验.下面来讨论单边检验的拒绝域. 设总体X ~N (μ,σ2),σ2为已知,x 1,x 2,…,x n 是来自X 的样本观察值.给定显著性水平α,我们先求检验问题H 0:μ=μ0;H 1:μ>μ0.的拒绝域.取检验统计量ZX ,当H 0为真时,Z 不应太大,而在H 1为真时,由于X 是μ的无偏估计,当μ偏大时,X 也偏大,从而Z 往往偏大,因此拒绝域的形式为ZX ≥k ,k 待定.因为当H 0X ~N (0,1),由P {拒绝H 0|H 0为真}=PX k ⎫≥⎬⎭=α得k =z α,故拒绝域为ZX ≥z α. (8.8)类似地,左边检验问题H 0:μ=μ0;H 1:μ<μ0.的拒绝域为ZX ≤-z α. 8.9)例8.4 从甲地发送一个信号到乙地,设发送的信号值为μ,由于信号传送时有噪声迭加到信号上,这个噪声是随机的,它服从正态分布N (0,22),从而乙地接到的信号值是一个服从正态分布N (μ,22)的随机变量.设甲地发送某信号5次,乙地收到的信号值为: 8.4 10.5 9.1 9.6 9.9由以往经验,信号值为8,于是乙方猜测甲地发送的信号值为8,能否接受这种猜测?取α=0.05.解 按题意需检验假设H 0:μ=8;H 1:μ>8.这是右边检验问题,其拒绝域如(8.8)式所示, 即 Z =X ≥z 0.05=1.645.而现在z 0=1.68>1.645,所以拒绝H 0,认为发出的信号值μ>8.2.单个正态总体方差的假设检验(2χ检验法(2χ-test)) (1) 双边检验设总体X ~N (μ,σ2),μ未知,检验假设H 0:σ2=σ02;H 1:σ2≠σ2.其中σ02为已知常数.由于样本方差S 2是σ2的无偏估计,当H 0为真时,比值22S σ一般来说应在1附近摆动,而不应过分大于1或过分小于1,由第六章知当H 0为真时2χ=220(1)n S σ-~2χ(n -1). (8.10)所以对于给定的显著性水平α有(图8-3)图8-3P {21/2αχ-(n -1)≤2χ≤2/2αχ(n -1)}=1-α. (8.11)对于给定的α,查2χ分布表可求得2χ分布分位点21/2αχ-(n -1)与2/2αχ(n -1).由(8.11)知,H 0的接受域是21/2αχ- (n -1)≤2χ≤2/2αχ (n -1); (8.12)H 0的拒绝域为2χ<21/2αχ-(n -1)或2χ>2/2αχ(n -1). (8.13)这种用服从2χ分布的统计量对个单正态总体方差进行假设检验的方法,称为2χ检验法. 例8.5 某厂生产的某种型号的电池,其寿命长期以来服从方差σ2=5000(小时2)的正态分布,现有一批这种电池,从它的生产情况来看,寿命的波动性有所改变,现随机抽取26只电池,测得其寿命的样本方差s 2=9200(小时2).问根据这一数据能否推断这批电池的寿命的波动性较以往有显著的变化(取α=0.02)?解 本题要求在α=0.02下检验假设H 0:σ2=5000;H 1:σ2≠5000.现在n =26,2/2αχ(n -1)=20.01(25)χ=44.314,21/2αχ- (n -1)= 20.99(25)χ=11.524,σ02=5000.由(8.13)拒绝域为2σ>44.314或220(1)n s σ-<11.524由观察值s 2=9200得22(1)n s σ-=46>44.314,所以拒绝H 0,认为这批电池寿命的波动性较以往有显著的变化.(2) 单边检验(右检验或左检验) 设总体X ~N (μ,σ2),μ未知,检验假设H 0:σ2≤σ02;H 1:σ2>σ02.(右检验)由于X ~N (μ,σ2),故随机变量*2χ=22(1)n S σ-~2χ(n -1).当H 0为真时,统计量2χ=22(1)n S σ-≤*2χ.对于显著性水平α,有P {*2χ>2αχ(n -1)}=α图8-4(图8-4).于是有P {2χ>2αχ(n -1)}≤P {*2χ>2αχ(n -1)}=α.可见,当α很小时,{2χ>2αχ(n -1)}是小概率事件,在一次的抽样中认为不可能发生,所以H 0的拒绝域是:2χ=22(1)n S σ->2αχ(n -1)(右检验). (8.14)类似地,可得左检验假设H 0:σ2≥σ02,H 1:σ2<σ2的拒绝域为2χ<21αχ-(n -1)(左检验). (8.15) 例8.6 今进行某项工艺革新,从革新后的产品中抽取25个零件,测量其直径,计算得样本方差为s 2=0.00066,已知革新前零件直径的方差σ2=0.0012,设零件直径服从正态分布,问革新后生产的零件直径的方差是否显著减小?(α=0.05)解 (1) 提出假设H 0:σ2≥σ02=0.0012;H 1:σ2<σ02. (2) 选取统计量2χ=22(1)n S σ-.*2χ=22(1)n S σ-~2χ(n -1),且当H 0为真时,*2χ≤2χ(3) 对于显著性水平α=0.05,查2χ分布表得21αχ-(n -1)=20.95(24)χ=13.848,当H 0为真时,P {2χ<21αχ- (n -1)}≤P 2212(1)(1)n S n αχσ-⎧⎫-<-⎨⎬⎩⎭=α. 故拒绝域为2χ<21αχ- (n -1)=13.848.(4) 根据样本观察值计算2χ的观察值2χ=220(1)240.000660.0012n s σ-⨯==13.2.(5) 作判断:由于2χ=13.2<21αχ- (n -1)=13.848,即2χ落入拒绝域中,所以拒绝H 0:σ2≥σ02,即认为革新后生产的零件直径的方差小于革新前生产的零件直径的方差.最后我们指出,以上讨论的是在均值未知的情况下,对方差的假设检验,这种情况在实际问题中较多.至于均值已知的情况下,对方差的假设检验,其方法类似,只是所选的统计量为2χ=2120()nii Xμσ=-∑.当σ2=σ2为真时,2χ~2χ(n ).关于单个正态总体的假设检验可列表8-2.表8-2注:上表中H0中的不等号改成等号,所得的拒绝域不变.第三节两个正态总体的假设检验上一节介绍了单个正态总体的数学期望与方差的检验问题,在实际工作中还常碰到两个正态总体的比较问题.1.两正态总体数学期望假设检验(1)方差已知,关于数学期望的假设检验(Z检验法)设X~N(μ1,σ12),Y~N(μ2,σ22),且X,Y相互独立,σ12与σ22已知,要检验的是H0:μ1=μ2;H1:μ1≠μ2.(双边检验)怎样寻找检验用的统计量呢?从总体X 与Y 中分别抽取容量为n 1,n 2的样本X 1,X 2,…,1n X 及Y 1,Y 2,…,2n Y ,由于2111~,X N n σμ⎛⎫ ⎪⎝⎭,2222~,Y N n σμ⎛⎫⎪⎝⎭,E (X -Y )=E (X )-E (Y )=μ1-μ2, D (X -Y )=D (X )+D (Y )=221212n n σσ+,故随机变量X -Y 也服从正态分布,即X -Y ~N (μ1-μ2,221212n n σσ+).从而X Y ~N (0,1).于是我们按如下步骤判断.(a ) 选取统计量 ZX Y , (8.16)当H 0为真时,Z ~N (0,1).(b ) 对于给定的显著性水平α,查标准正态分布表求z α/2使P {|Z |>z α/2}=α,或P {Z ≤z α/2}=1-α/2. (8.17) (c ) 由两个样本观察值计算Z 的观察值z 0:z 0x y .(d ) 作出判断:若|z 0|>z α/2,则拒绝假设H 0,接受H 1; 若|z 0|≤z α/2,则与H 0相容,可以接受H 0.例8.7 A ,B 两台车床加工同一种轴,现在要测量轴的椭圆度.设A 车床加工的轴的椭圆度X ~N (μ1,σ12),B 车床加工的轴的椭圆度Y ~N (μ2,σ22),且σ12=0.0006(mm 2),σ22=0.0038(mm 2),现从A ,B 两台车床加工的轴中分别测量了n 1=200,n 2=150根轴的椭圆度,并计算得样本均值分别为=0.081(mm),=0.060(mm).试问这两台车床加工的轴的椭圆度是否有显著性差异?(给定α=0.05)解 ① 提出假设H 0:μ1=μ2;H 1:μ1≠μ2. ② 选取统计量ZX Y ,在H 0为真时,Z ~N (0,1).③ 给定α=0.05,因为是双边检验,α/2=0.025.P {|Z |>z α/2}=0.05, P {Z >z α/2}=0.025,P {Z ≤z α/2}=1-0.025=0.975.查标准正态分布表,得z α/2=z 0.025=1.96.④ 计算统计量Z 的观察值zz 0x y =.⑤ 作判断:由于|z 0|=3.95>1.96=z α/2,故拒绝H 0,即在显著性水平α=0.05下,认为两台车床加工的轴的椭圆度有显著差异.用Z 检验法对两正态总体的均值作假设检验时,必须知道总体的方差,但在许多实际问题中总体方差σ12与σ22往往是未知的,这时只能用如下的t 检验法.(2) 方差σ12,σ22未知,关于均值的假设检验(t 检验法) 设两正态总体X 与Y 相互独立,X ~N (μ1,σ12),Y ~N (μ2,σ22),σ12,σ22未知,但知σ12=σ22,检验假设H 0:μ1=μ2;H 1:μ1≠μ2.(双边检验) 从总体X ,Y 中分别抽取样本X 1,X 2,…,1n X 与Y 1,Y 2,…,2n Y ,则随机变量tX Y μμ---t (n 1+n 2-2),式中S w 2=22112212(1)(1)2n S n S n n -+-+-,S 12,S 22分别是X 与Y 的样本方差.当假设H 0为真时,统计量t ~t (n 1+n 2-2). (8.18)对给定的显著性水平α,查t 分布得t α/2(n 1+n 2-2),使得P {|t |>t α/2(n 1+n 2-2)}=α. (8.19)再由样本观察值计算t 的观察值t 0x y(8.20)最后作出判断:若|t 0|>t α/2(n 1+n 2-2),则拒绝H 0; 若|t 0|≤t α/2(n 1+n 2-2),则接受H 0.例8.8 在一台自动车床上加工直径为2.050毫米的轴,现在每相隔两小时,各取容量都为10的样本,所得数据列表如表8-3所示.12是未知常数.问这台自动车床的工作是否稳定?(取α=0.01)解 这里实际上是已知σ12=σ22=σ2,但σ2未知的情况下检验假设H 0:μ1=μ2;H 1:μ1≠μ2.我们用t 检验法,由样本观察值算得:x =2.063, y =2.059,s 12=0.00000956, s 22=0.00000489,s w 2=2212990.0000860.0000441010218s s ⨯+⨯+=+-=0.0000072.由(8.20)式计算得t 0=3.3.对于α=0.01,查自由度为18的t 分布表得t 0.005(18)=2.878.由于|t 0|=3.3>t 0.005(18)=2.878,于是拒绝原假设H 0:μ1=μ2.这说明两个样本在生产上是有差异的,可能这台自动车床受时间的影响而生产不稳定.2. 两正态总体方差的假设检验(F 检验法(F -test )) (1) 双边检验设两正态总体X ~N (μ1,σ12),Y ~N (μ2,σ22),X 与Y 独立,X 1,X 2,…,1n X 与Y 1,Y 2,…,2n Y 分别是来自这两个总体的样本,且μ1与μ2未知.现在要检验假设H 0:σ12=σ22;H 1:σ12≠σ22.在原假设H 0成立下,两个样本方差的比应该在1附近随机地摆动,所以这个比不能太大又不能太小.于是我们选取统计量F =2122S S . (8.21) 显然,只有当F 接近1时,才认为有σ12=σ22.由于随机变量F *=22112222//S S σσ ~F (n 1-1,n 2-1),所以当假设H 0:σ12=σ22成立时,统计量F =2122S S ~F (n 1-1,n 2-1). 对于给定的显著性水平α,可以由F 分布表求得临界值12a F-(n 1-1,n 2-1)与F α/2(n 1-1,n 2-1)使得 P { 12a F-(n 1-1,n 2-1)≤F ≤F α/2(n 1-1,n 2-1)}=1-α(图8-5),由此可知H 0的接受区域是12aF-(n 1-1,n 2-1)≤F ≤F α/2(n 1-1,n 2-1);而H 0的拒绝域为F <12a F-(n 1-1,n 2-1),或 F >F α/2(n 1-1,n 2-1).然后,根据样本观察值计算统计量F 的观察值,若F 的观察值落在拒绝域中,则拒绝H 0,接受H 1;若F 的观察值落在接受域中,则接受H 0.图8-5例8.9 在例8.8中我们认为两个总体的方差σ12=σ22,它们是否真的相等呢?为此我们来检验假设H 0:σ12=σ22(给定α=0.1).解 这里n 1=n 2=10,s 12=0.00000956,s 22=0.00000489,于是统计量F 的观察值为F =0.00000956/0.00000489=1.95.查F 分布表得F α/2(n 1-1,n 2-1)=F 0.05(9,9)=3.18,F 1-α/2(n 1-1,n 2-1)=F 0.95(9,9)=1/F 0.05(9,9)=1/3.18.由样本观察值算出的F 满足F 0.95(9,9)=1/3.18<F =1.95<3.18=F 0.05(9,9).可见它不落入拒绝域,因此不能拒绝原假设H 0:σ12=σ22,从而认为两个总体的方差无显著差异.注意:在μ1与μ2已知时,要检验假设H 0:σ12=σ22,其检验方法类同均值未知的情况,此时所采用的检验统计量是:F =12211122121()1()n i i n i i X n Y n μμ==--∑∑~F (n 1,n 2). 其拒绝域参看表8-4.表8-4(2) 单边检验可作类似的讨论,限于篇幅,这里不作介绍了.第四节总体分布函数的假设检验上两节中,我们在总体分布形式为已知的前提下,讨论了参数的检验问题.然而在实际问题中,有时不能确知总体服从什么类型的分布,此时就要根据样本来检验关于总体分布的χ检验法.假设.例如检验假设:“总体服从正态分布”等.本节仅介绍2χ检验法是在总体的分布为未知时,根据样本值x1,x2,…,x n来检验关于总体所谓2分布的假设H0:总体X的分布函数为F(x);H1:总体X的分布函数不是F(x)(8.22)的一种方法(这里的备择假设H1可不必写出).注意,若总体X为离散型,则假设(8.22)相当于H0:总体X的分布律为P{X=x i}=p i,i=1,2,…;(8.23)若总体X为连续型,则假设(8.22)相当于H0:总体X的概率密度为f(x). (8.24)在用2χ检验法检验假设H 0时,若在假设H 0下F (x )的形式已知,而其参数值未知,此时需先用极大似然估计法估计参数,然后再作检验.2χ检验法的基本思想与方法如下:(1) 将随机试验可能结果的全体Ω分为k 个互不相容的事件A 1,A 2,…,A k (1ki i A ==Ω,A i A j =∅,i ≠j ;i ,j =1,2,…,k ),于是在H 0为真时,可以计算概率ˆi p =P (A i )(i =1,2,…,k ).(2) 寻找用于检验的统计量及相应的分布,在n 次试验中,事件A i 出现的频率if n与概率ˆi p往往有差异,但由大数定律可以知道,如果样本容量n 较大(一般要求n 至少为50,最好在100以上),在H 0成立条件下ˆii f p n-的值应该比较小,基于这种想法,皮尔逊使用 2χ=21ˆ()ˆki i i if npnp =-∑ (8.25) 作为检验H 0的统计量,并证明了如下的定理.定理8.1 若n 充分大(n ≥50),则当H 0为真时(不论H 0中的分布属什么分布),统计量(8.25)总是近似地服从自由度为k -r -1的2χ分布,其中r 是被估计的参数的个数.(3) 对于给定的检验水平α,查表确定临界值2(1)k r αχ--使P {2χ>2(1)k r αχ--)}=α,从而得到H 0的拒绝域为2χ>2(1)k r αχ--).(4)由样本值x 1,x 2,…,x n 计算2χ的值,并与2(1)k r αχ--比较.(5) 作结论:若2χ>2(1)k r αχ--,则拒绝H 0,即不能认为总体分布函数为F (x );否则接受H 0.例8.10 一本书的一页中印刷错误的个数X 是一个随机变量,现检查了一本书的100页,记录每页中印刷错误的个数,其结果如表8-5所示.i =0.05)?解 由题意首先提出假设:H 0:总体X 服从泊松分布.P {X =i }=!e ii λλ-,i =0,1,2,…,这里H 0中参数λ为未知,所以需先来估计参数.由最大似然估计法得03614061ˆ+70100x λ⨯+⨯++⨯⨯===1.将试验结果的全体分为A 0,A 1,…,A 7两两不相容的事件.若H 0为真,则P {X =i }有估计111ˆˆ{}!!e e i p P X i i i --====,i =0,1,2,….例如10ˆˆ{0},e pP X -=== 11ˆˆ{1},e pP X -=== 12ˆˆ{2},2e pP X -=== ………………166701ˆˆˆ{7}11.!e i i i pP X p i -===≥=-=-∑∑ 计算结果如表8-6所示.将其中有些np i <5的组予以适当合并,使新的每一组内有np i ≥5,如表8-6所示,此处并组后k =4,但因在计算概率时,估计了一个未知参数λ,故24221ˆ()~(411).ˆi i i i f npnp χχ=-=--∑计算结果为2χ=1.460(表8-6).因为220.05(411)(2)αχχ--==5.991>1.46,所以在显著性水平为0.05下接受H 0,即认为总体服从泊松分布. 表8-68-7).n =61ii f=∑=200.要求在给定的检验水平α=0.05下检验假设H 0:抗压强度X ~N (μ,σ2).解 原假设所定的正态分布的参数是未知的,我们需先求μ与σ的极大似然估计值.由第七章知,μ与σ2的极大似然估计值为ˆx μ=, 2211ˆ()ni i x x n σ==-∑. 设*i x 为第i 组的组中值,我们有*1195102052624514200i ii x x f n ⨯+⨯++⨯==∑=221,{}2*222211ˆ()(26)10(16)262414200i ii x x f n σ=-=-⨯+-⨯++⨯∑=152,ˆσ=12.33. 原假设H 0改写成X 是正态N (221,12.332)分布,计算每个区间的理论概率值{}11ˆ()()i i i i i pP a X a μμΦΦ--=≤<=-, i =1,2,…,6, 其中ˆi i a xμσ-=, 22()i t i t μμ--∞=e d Φ. 为了计算出统计量2χ之值,我们把需要进行的计算列表如下(表8-8).表8-8从上面计算得出2χ的观察值为1.35.在检验水平α=0.05下,查自由度m =6-2-1=3的2χ分布表,得到临界值20.05(3)χ=7.815.由于2χ=1.35<7.815=20.05(3)χ,不能拒绝原假设,所以认为混凝土制件的抗压强度的分布是正态分布N (221,152).小 结有关总体分布的未知参数或未知分布形式的种种论断叫做统计假设.一般统计假设分为原假设H 0(在实际问题中至关重要的假设)及与原假设H 0对立假设即是备择假设H 1.假设检验就是人们根据样本提供的信息作出“接受H 0、拒绝H 1”或“拒绝H 0、接受H 1”的判断.假设检验的思想是小概率原理,即小概率事件在一次试验中几乎不会发生.这种原理是人们处理实际问题中公认的原则.由于样本的随机性,当H 0为真时,我们可能会作出拒绝H 0、接受H 1的错误判断(弃当样本容量n 固定时,我们无法同时控制犯二类错误,即减小犯第一类错误的概率,就会增大犯第二类错误的概率,反之亦然.在假设检验中我们主要控制(减小)犯第一类错误的概率.使P {拒绝H 0|H 0为真}≤α,其中α很小.(0<α<1),α称为检验的显著性水平,这种只对犯第一类错误的概率加以控制而不考虑犯第二类错误的概率的检验称为显著性假设检验.单个、两个正态总体的均值、方差的假设检验是本章重点问题,读者需掌握Z 检验法、2χ检验法、t 检验法等.这些检验法中原假设H 0备择假设H 1及H 0的拒绝域分别见表8-2、表8-4.重要术语及主题原假设 备择假设 检验统计量 单边检验 双边检验 显著性水平 拒绝域 显著性检验 一个正态总体的参数的检验 两个正态总体均值差、方差比的检验 总体分布函数的假设检验习 题 八1. 已知某炼铁厂的铁水含碳量在正常情况下服从正态分布N (4.55,0.1082).现在测了5炉铁水,其含碳量(%)分别为4.28 4.40 4.42 4.35 4.37问若标准差不改变,总体平均值有无显著性变化(α=0.05)? 2.某种矿砂的5个样品中的含镍量(%)经测定为:3.24 3.26 3.24 3.27 3.25设含镍量服从正态分布,问在α=0.01下能否接收假设:这批矿砂的含镍量为3.25. 3.在正常状态下,某种牌子的香烟一支平均1.1克,若从这种香烟堆中任取36支作为样本;测得样本均值为1.008(克),样本方差s 2=0.1(克2).问这堆香烟是否处于正常状态.已知香烟(支)的重量(克)近似服从正态分布(取α=0.05).4.某公司宣称由他们生产的某种型号的电池其平均寿命为21.5小时,标准差为2.9小时.在实验室测试了该公司生产的6只电池,得到它们的寿命(以小时计)为19,18,20,22,16,25,问这些结果是否表明这种电池的平均寿命比该公司宣称的平均寿命要短?设电池寿命近似地服从正态分布(取α=0.05).5.测量某种溶液中的水分,从它的10个测定值得出x =0.452(%),s =0.037(%).设测定值总体为正态,μ为总体均值,σ为总体标准差,试在水平α=0.05下检验. (1) H 0:μ=0.5(%);H 1:μ<0.5(%).(2)0H ':σ=0.04(%);1H ':σ<0.04(%). 6.某种导线的电阻服从正态分布N (μ,0.0052).今从新生产的一批导线中抽取9根,测其电阻,得s =0.008欧.对于α=0.05,能否认为这批导线电阻的标准差仍为0.005? 7.有两批棉纱,为比较其断裂强度,从中各取一个样本,测试得到: 第一批棉纱样本:n 1=200,x =0.532kg, s 1=0.218kg ; 第二批棉纱样本:n 2=200,x =0.57kg, s 2=0.176kg .设两强度总体服从正态分布,方差未知但相等,两批强度均值有无显著差异?(α=0.05) 8.两位化验员A ,B 对一种矿砂的含铁量各自独立地用同一方法做了5次分析,得到样本方差分别为0.4322(%2)与0.5006(%2).若A ,B 所得的测定值的总体都是正态分布,其方差分别为σA 2,σB 2,试在水平α=0.05下检验方差齐性的假设H 0:σA 2=σB 2; H 1:σA 2≠σB 2.9.在π的前800位小数的数字中,0,1,…,9相应的出现了74,92,83,79,80,73,77,75,76,91次.试用2χ检验法检验假设H 0:P (X =0)=P (X =1)=P (X =2)=…=P (X =9)=1/10,其中X 为π的小数中所出现的数字,α=0.10.10.在一副扑克牌(52张)中任意抽3张,记录3张牌中含红桃的张数,放回,然后再任抽。
现代心理与教育统计学 第八章-假设检验(张厚粲)
第一节 假设检验的原理
在统计学中,通过样本统计量得出的差异做出一般性 结论,判断总体参数之间是否存在差异,这种推论过 程称作假设检验(hypothesis testing)
假设检验分为参数检验和非参数检验。前者指的是总 体分布已知,需要对总体的未知参数做假设检验。后 者指的是总体分布知之甚少,对总体的函数形式和特 征进行假设检验。
这里取=0.05,因为是Z检验,所以临界值是-1.96
4. 利用显著性水平,建立拒绝H0的规则
0.05时, Z 2 Z0.025 1.96,
接受假设的区域为 : Z 1.96, 拒绝区域为 : 或Z 1.96,或Z 1.96
拒绝H0
0.025
拒绝H0
正解:
1、提出零假设和备择假设 备择假设:用H1表示,即研究假设,希望证实的假设。 H1 : 1 0 (该班智力水平确实与常模有差异) 1100 零假设:用H0表示,即虚无假设、原假设、无差异假 设。 H0: 1=0 1 =100
2、确定适当的检验统计量
用于假设检验问题的统计量称为检验统计量。与参数 估计相同,需要考虑:
Ⅱ型错误
α错误 正确
β 错误
(二)两类错误的关系
1. + ≠ 1 原因:与是两个前提下的概率。 即是拒绝原假设H0时犯错误的概率,这时前提是
H0为真; 是接受原假设H0时犯错误的概率,这时前提是H0
为伪。
H0为真, 即 μ 0=μ 1 的分布
+ ≠ 1
H1为真, 即 μ 0≠μ 1 的分布
总体是否正态分布; 大样本还是小样本; 总体方差已知还是未知。
Z=
X-0 0
n
本例中总体正态,样本容量大于等于30,检验统计量 为Z分布。
统计学:第8章 假设检验
由例8.16可以看出:当将原假设和备择假设交换,检验得到的最终结果 不一定相同。对假设的设定没有固定统一的标准。一般遵循的原则是:
(1)把传统的、被大多数人 所认可的观点或结论放在原假设,意为, 在没有充分证明其错误时,总是被认定为正确的。
(2)将新的、可能的、猜测的假设放在备择假设。 (3)将研究者关注的(要证明的)结论放在备择假设,这样,如果通 过假设检验作出拒绝零假设而选择备择假设的判断,会使检验的结论更具 说服力(拒绝原假设时是有充分的理由的,而接受原假设是在没有充分理 由拒绝它时才作出的决定)。 (4)容易构造统计量的角度来设置原假设和备择假设,因为原假设和 备择假设设置的不同可能会导致使用的统计量不同。
8 - 27
统计学
STATISTICS
(第四版)
右单侧检验
(显著性水平与拒绝域 )
抽样分布
置信水平 拒绝域
1 -
H0值
临界值
样本统计量
8 - 28
统计学
STATISTICS
(第四版)
右单侧检验举例(1)
【例8.16】某批发商欲从厂家购进一批灯泡,根据 合同规定灯泡的使用寿命平均高于1000小时。
建立的原假设与备择假设应为
H0: 10 H1: 10
8 - 20
统计学
STATISTICS
(第四版)
双侧检验
(显著性水平与拒绝域 )
抽样分布
拒绝域
置信水平 拒绝域
/2
1 -
/2
临界值
H0值
临界值
样本统计量
8 - 21
统计学
STATISTICS
(第四版)
左单侧检验 (定义)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
©福建师范大学 福清分校
数学与计算机科学系,2006
23
现考虑两个正态总体均值差的t检验. 若两个正态总体N(m1,12), N(m2,22)中 12=22=2而2未知. 在均值差m1-m2的检验问 题H0:m1-m2=0, H1:m1-m20(或H0:m1-m20, H1:m1-m2>0或H0:m1-m20,H1:m1-m2<0)的t检验 法中, 当分别自两个总体取得的相互独立的样 本其容量n1=n2=n时, 给定a,b以及d=|m1-m2|/ 的值后可以查附表8得到所需样本容量, 使当 |m1-m2|/d时犯第II类错误的概率小于或等于 b.
©福建师范大学 福清分校
数学与计算机科学系,2006
22
在实际过程中经常是未知, 则先做n1次试验, 计算出样本方差S2作为2的估计, 然后根据此 估计值和给定的a,b,|m1-m2|的值查表获得一个 容量数n2, 如果n2小于n1, 则用已经获得的数据 进行检验就足够了, 而如果n2大于n1, 则再补 做n2-n1次试验, 获得的n2个样本的样本方差作 为2的估计, 再去查表获得正确的样本容量n3, 这样重复下去很快就能够找到所求的样本容 量n.
©福建师范大学 福清分校 数学与计算机科学系,2006
20
例2 考虑在显著性水平a=0.05下进行t检验: H0:m68, H1:m>68. (1) 要求在H1中mm1=68+时犯第II类错误的 概率不能超过b=0.05. 求所需的样本容量. (2) 若样本容量为n=30, 问在H1中 m=m1=68+0.75时犯第II类错误的概率是多 少? 解 (1)此处a=b=0.05, m0=68, d=(m1-m0)/=1, 查附表7得n=13. (2) 现在a=0.05, n=30, d=(m1-m0)/=0.75, 查 附表7, 得b=0.01.
©福建师范大学 福清分校
数学与计算机科学系,2006
15
解 检验问题可表达为H0:mm0, H1:m>m0, 拒绝 域为
按(5.3)式得
按给定的数据算得n24.35, 故取n=25. 且算出 当`x129.87时, 买方就拒绝这批产品, 而当`x <129.87时, 买方接受这批产品.
©福建师范大学 福清分校 数学与计算机科学系,2006
©福建师范大学 福清分校 数学与计算机科学系,2006
24
例4 比较两种汽车用燃料的辛烷值, 得数据:
燃料A 81 84 79 76 82 83 84 80 79 82 81 79
燃料B 76 74 78 79 80 79 82 76 81 79 82 78
燃料的辛烷值越高, 燃料的质量越好. 因燃料 B较燃料A价格便宜, 因此, 如果两者辛烷值相 同时, 则使用燃料B. 但若含量的均值差m1-m2 5则使用燃料A. 设两总体的分布可认为是正 态的, 而两个样本相互独立. 问应采用哪种燃 料(取a=0.01, b=0.01)?
©福建师范大学 福清分校 数学与计算机科学系,2006
30
先设H0中所假设的X的分布函数F(x)不含未知 参数. 将在H0下, X可能值的全体W分成k个两 两不相交的子集A1,A2,...,Ak.以fi(i=1,2,...,k)记样 本观察值x1,x2,...,xn中落在Ai中的个数, 这表示 在n次试验中事件Ai发生的频率为fi/n, 另一方 面, 当H0为真时, 我们可以根据H0所假设的X 的分布函数来计算事件Ai的概率, 得到 pi=P(Ai), i=1,2,...,k. 频率fi/n与概率pi会有差异, 但一般来说, 若H0为真, 且试验的次数又甚多 时, 这种差异不应太大, 因此(fi/n-pi)2不应太大.
©福建师范大学 福清分校
数学与计算机科学系,2006
4
定义 若C是参数q的某检验问题的一个检验 法, b(q)=Pq{接受H0} (5.1) 称为检验法C的施行特征函数或OC函数, 其图 形称为OC曲线.
©福建师范大学 福清分校
数学与计算机科学系,2006
5
(5.1) 由定义知, 若此检验法的显著性水平为a, 则 当真值qH0时, b(q)就是作出正确判断(即H0 为真时接受H0)的概率, 故此时b(q)1-a; 而当 qH1时, 则b(q)就是犯第II类错误的概率, 而 1-b(q)是作出正确判断(即H0为不真时拒绝H0) 的概率. 函数1-b(q)称为检验法C的功效函数. 当q*H1时, 值1-b(q*)称为检验法C在点q*的 功效, 它表示当参数q的真值为q*时, 检验法C 作出正确判断的概率. 我们只介绍正态总体均值检验的OC函数.
概率论与数理统计
第13讲(下)
福建师范大学福清分校数计系
©福建师范大学 福清分校 数学与计算机科学系,2006
1
第八章 假设检验
©福建师范大学 福清分校
数学与计算机科学系,2006
2
§5 样本容量的选取
©福建师范大学 福清分校
数学与计算机科学系,2006
3
以上我们在进行假设检验时, 总是根据问题的 要求, 预先给出显著性水平以控制犯第I类错 误的概率. 而犯第II类错误的概率则依赖于样 本的容量的选择. 在一些实际问题中, 我们除 了希望控制犯第I类错误的概率外, 往往还希 望控制犯第II类错误的概率. 在这一节, 我们 将阐明如何选取样本的容量使得犯第II类错 误的概率控制在预先给定的限度之内. 为此, 我们引入施行特征函数.
©福建师范大学 福清分校
数学与计算机科学系,2006
U 检验法中
右边检验 左边检验 双边检验 其 中
b
的计算公式
b ( za - )
b ( za )
b ( z a - ) ( z a ) - 1
2 2
m - m0
n
18
©福建师范大学 福清分校
©福建师范大学 福清分校 数学与计算机科学系,2006
6
b(q)=Pq{接受H0}
1, Z检验法的OC函数 右边检验问题. H0:mm0, H1:m>m0的OC函数是
X - m0 b (m ) Pm (接受H 0 ) Pm { za } / n
m - m0 X -m Pm { za } ( za - ) / n / n m - m0 (5.2) / n
©福建师范大学 福清分校 数学与计算机科学系,2006
25
解 按题意需要在显著性水平a=0.01下检验假 设 H0:mA-mB0, H1:mA-mB>0, 并要求在mA-mB 5时, 犯第II类错误的概率不超过b=0.01. 所取的样本容量为nA=nB=12, 且有`xA=80.83, `xB=78.67, s2A=5.61, s2B=6.06. 经水平为0.1的F 检验知, 可认为两总体的方差相等, 即有
数学与计算机科学系,2006
2, t检验法的OC函数 右边检验问题H0:mm0, H1:m>m0的t检验法的 OC函数是
其中变量
称它服从非中心参数为,自由度为n-1的非中 心t分布.
©福建师范大学 福清分校 数学与计算机科学系,2006
19
若给定a,b以及d>0, 可从书末附表7查得所需 容量n, 使得当mH1且(m-m0)/d时犯第II类 错误的概率不超过b. 若给定a,b及d>0,对于左边检验问题H0:mm0, H1:m<m0的t检验法, 也可从附表7查得所需容 量n, 使得当mH1且(m-m0)/-d时犯第II类错 误的概率不超过b. 对于双边检验问题 H0:m=m0,H1:mm0的t检验法也可从附表7查得 所需容量n, 使得当mH1,且|m-m0|/d时所犯 第II类错误的概率不超过b.
©福建师范大学 福清分校 数学与计算机科学系,2006
21
例3 考虑在显著性水平a=0.05下进行t检验 H0:m=14, H1:m14. 要求在H1中|m-14|/0.4时犯第II类错误的概 率不超过b=0.1, 求所需样本容量. 解 此处a=0.05, b=0.1, d=0.4, 查表得n=68.
©福建师范大学 福清分校
数学与计算机科学系,2006
29
(一)c2拟合检验法 这是在总体未知时, 根据 样本X1,X2,...,Xn来检验关于总体分布的假设 H0:总体X的分布函数为F(x), H1:总体X的分布函数不是F(x), (6.1) 的一种方法.
注意, 若总体X为离散型则(6.1)中的H0相当于 H0:总体X的分布律为P(X=ti)=pi,i=1,2,.... (6.2) 若总体X为连续型, 则(6.1)中的H0相当于 H0:总体X的概率密度为f(x). (6.3)
©福建师范大学 福清分校 数学与计算机科学系,2006
10
d
(5.3)
类似地, 可得左边检验问题H0:mm0, H1:m<m0 的OC函数为
当真值mm0时b(m)为作出正确判断的概率; 当 真值m<m0时, 给出犯第II类错误的概率. 只要 样本容量n满足
m - m0 b (m ) ( za ), / n
©福建师范大学 福清分校 数学与计算机科学系,2006
9
当mm0+d时有 b(m0+d)b(m).
于是只要 b(m0 +d )=( za - nd / ) b
亦即只要n满足 za - nd / - zb
或者说只要
即可
n
( za zb )
则当mH1且mm0+d时, 即真值(mm0+d)时犯 第II类错误的概率不超过b.
©福建师范大学 福清分校
数学与计算机科学系,2006
26
而右边检验的拒绝域为
由样本观察值算得t=2.19<2.5083, 故接受H0, 即采用B种燃料.