第八讲假设检验.

合集下载

假设检验的基本概念

假设检验的基本概念
第五节 检验水准与两类错误
第二章
I型错误和II型错误
假设检验是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立,然后在假定H0成立的条件下计算检验统计量,最后根据P值判断结果,此推断结论具有概率性,因而无论拒绝还是不拒绝H0,都可能犯错误。详见表8-1。
01
P122 例8-3
02
两均数之差的标准误的估计值
03
01
P122 例8-3
02
两均数之差的标准误的估计值
由于u0.05/2=1.96,u0.01/2=2.58,|u|>u0.01/2, 得P<0.01,按α=0.05水准,拒绝H0,接受H1,两组间差别有统计学意义。可以认为试验组和对照组退热天数的总体均数不相等,两组的疗效不同。试验组的平均退热天数比对照组短。例7-7已计算了的95%的可信区间: 天,给出了两总体均数差别的数量大小。
1- :检验效能(power):当两总体确有差别,按检验水准 所能发现这种差别的能力。
a 与 b 间的关系
a
b
减少(增加)I型错误,将会增加(减少)II型错误 增大n 同时降低a 与 b
B
D
A
C
减少I型错误的主要方法:假设检验时设定 值。
提高检验效能的最有效方法:增加样本量。
若 ,不拒绝H0,但不能下“无差别”或“相等”的结论,只能下“根据目前试验结果,尚不能认为有差别”的结论。
第三节 大样本均数的假设检验
单样本数据,每组例数等于或大于60例;两样本数据,两组例数的合计等于或大于60例,而且基本均等。
两总体方差已知。
样本数据不要求一定服从正态分布总体。
另一方面,可信区间不但能回答差别有无统计学意义,而且还能比假设检验提供更多的信息,即提示差别有无实际的专业意义。

第8 假设检验(共80张PPT)

第8 假设检验(共80张PPT)
第 8 章 假设检验
8.1 8.2 8.3 8.4
假设检验的根本问题 一个总体参数的检验 两个总体参数的检验 假设检验中的其他问题
我认为该企业生产的零件的平
均长度为4厘米!
什么是假设? 对总体 参数的一种看法
总体参数包括总 体均值、比例、方 差等
举例说明假设检验的根本思路
某单位职工上月平均收入为210元,这个 月的情况与上月没有大的变化,我们设想平均 收入还是210元.
样本均值的抽样分布
置信水平
拒绝域
1-
接受域
临界值
H0
样本统计量
如果备择假设具有符号“>〞,拒绝域位于抽样分 布的右侧,故称为右侧检验
样本均值的抽样分布
置信水平
1- 接受域
拒绝域
H0
样本统计量
临界值
请判断它们的拒绝域:
〔1〕假设检验的假设为H0:m=m0 ,H1: m≠m0,那么拒绝域为〔 〕。
〔2〕假设检验的假设为H0:m≥m0 ,H1: m < m0,那么拒绝域为〔 〕。
〔3〕假设检验的假设为H0:m≤m0 ,H1: m > m0,那么拒绝域为〔 〕。
检验统计量:Z > Z;
Z > Z/2 或Z <-Z/2 ;
Z <-Z
决策规那么
给定显著性水平 ,查表得出相应的临界 值 将检验统计量的值与 水平下的临界值进 行比较 双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0 得出拒绝或不拒绝原假设的结论
H0:m=10 H1:m≠10
例 6.2
某品牌洗涤剂在它的产品说明书中声称:平均 净含量不少于500g。从消费者的利益出发, 有关研究人员要通过抽检其中的一批产品来验 证该产品制造商的说明是否属实。试陈述用于 检验的原假设与备择假设。

概率论与数理统计(8)假设检验

概率论与数理统计(8)假设检验

概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。

由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题1引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?问题2记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题3则问题等价于检验H0成立,还是H1成立.某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题4则问题等价于检验H0成立,还是H1成立.自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5记服从指数分布,不服从指数分布.则问题也等价于检验H0成立,还是H1成立.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。

假设检验一般概念

假设检验一般概念

x 400 k 时接受原假设H0;
(1)
x 400 k 时拒绝原假设H0接受备择假设H1
(2)
进一步,由于当H0为真时,有
u x400 ~N(0,1) 25/ n
1 |u|要构x造一40个0具有明确k分布的统计量,可将(1)、(2)式转化为
25/ n 25/ n
2 |u|时接x受原40假0设H0 k
2. 拒绝域与接受域 称是检验水平或显著性水平,它是我们
制定检验标准的重要依据。常数u/2把标准正态分布密度曲线下
的区域分成了两大部分,其中一部分
(x1,x2, ,xn)uu/2
称为H0的拒绝域或否定域, 当样本点落入拒绝域时,我们便拒 绝原假设H0(同前述(6)式),另一部分
(x1,x2, ,xn)uu/2
(1)根据问题的要求提出假设,写明原假设H0和备择假设H1的
具体内容。
(2)根据H0的内容,建立(或选取)检验统计量并确定其分布。 (3)对给定(或选定)的显著性水平 ,由统计量的分布查表 或计算确定出临界值,进而得到H0的拒绝域和接受域。
(4)由样本观察值计算出统计量的值。
(5)做出推断:当统计量的值满足“接受H0的条件”时就接受 H0,否则就拒绝H0接受H1 。
u
2
时接受原假设H0 (5)
时拒绝原假设H0,接受备择假设 H1 (6)
分析(5)、(6)两式,可以这 样认为:
拒绝H0,是因为以H0成立 为出发点进行推理时,得到 了不合情理的结论,使小概 率事件在一次试验中发生了。
接受H0,是因为以H0成立 为出发点进行推理时,未发 现异常。
这就是带有概率特征的反证 法,认为小概率事件在一次 试验中不可能发生。
H0:X服从泊松分布;H1:X不服从泊松分布.

第八讲 单总体假设检验

第八讲 单总体假设检验

0
❖ 双边:
0 x
❖ 3)统计量
z
0
❖ 4)拒绝域
n
z z ❖ 单边: 右~ z 左~ z
z z ❖ 双边: z 或 z
2
2
(二)方差未知

1)原假设

H 0 :
0
❖ 2)备择假设 H 1
❖ 单边: 或
0
0
❖ 双边:

3)统计量
0
x
x
t
0
0 ~ tn 1
效 。 0.05
❖ 2、原有资料:某市居民彩电拥有率为60%, 现抽样100户,彩电拥有率为62%,问,能否
认为彩电拥有率有所增长? 0.05
第二节 小样本假设检验
❖ 一、单正态总体均值检验 ❖ (一)方差已知:
H ❖ 1)原假设 0 : 0
❖ 2)备择假设 H 1
❖ 单边:

0
水稻亩产标准差不超过去年数值75公斤?
x
s
❖ 4)拒绝域
n
❖ 单边: 右~ t t
❖ 双边: t t 或 2
左~ t t
t t 2
例:
❖ 1、某厂职工去年月收入服从正态分布,平均为570 元,标准差为8元,今年实行新的分配政策,抽样 10人,结果如下:575 560 565 580 585 586 575 582 570 570。问平均收入是否所有明显改变?
❖ 2、某产品重量服从正态0.0分5布,现随机抽取6件,测
得重量为(公斤):36.4 38.2 36.6 36.9 37.8 37.6。能否认为该产品的平均重量为37公斤?
0.05
二、单正态总体方差检验
❖ 检验步骤:

第八讲假设检验的计算单总体讲课文档

第八讲假设检验的计算单总体讲课文档

差值di 9.5 11.5 8.5 7.5 11 8 9.5 7.5 11 14.5 98.5
第42页,共70页。
t xd 9.85 13.44 sd n1 2.199 9
解:H0: 1 – 2 8.5
查附表5,- t0.05 (9) =-1.833
H1: 1 – 2 < 8.5 = 0.05
.025
拒绝 H0
.025
检验统计量:
z
pˆ p 0
p 0 (1 p 0 )
n
0 .3 4 0 .3 1 .2 3 4 0 .3 0 .7
200
决策: 在 = 0.05的水平上接受H0
-1.96 0 1.96 Z
结论: 从总体来看,研究者的估计可信
第27页,共70页。
2. 小样本总体比例的两端检验
第23页,共70页。
(二)单个总体比例的检验
第24页,共70页。
1. 大样本单总体比例的检验
1. 假定条件
有两类结果 总体服从二项分布
比例检验的 z 统计量
z pˆ p 0 p 0 (1 p 0 ) n
P0为假设的总体比例
pˆ 为样本中计算出来的
比例
第25页,共70页。
例题4
某研究者估计本市居民家庭
第6页,共70页。
3.一端检验与二端检验
在何种情况下选择一端检验还是二端检验? 取决于是否可以确定研究假设(H1)的方向. 如果H1能定出方向,如<或>,则为一端检验. 如果H1定不出方向,如≠,则样本的统计值落在抽样分布
的右端或左端的可能性是相同的,因而要用二端检验.
如果所选定的显著度相同的,二端检验比一端检验更 难否定原假设/虚无假设.

统计学 第8章 假设检验 教学课件ppt

统计学 第8章  假设检验 教学课件ppt
2. 一般来说,发生哪一类错误的后果更为严重,就应 该首要控制哪类错误发生的概率。但由于犯第Ι类错 误的概率是可以由研究者控制的,因此在假设检验 中,人们往往先控制第Ι类错误的发生概率
确定适当的检验统计量
什么是检验统计量?
1. 用于假设检验决策的统计量
原假设H0为真 点估计量的抽样分布 (样本均值、样本方差)
比较 3. 作出决策
双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0
利用 P 值 进行决策
什么是P 值?
(P-value)
P值告诉我们: 如果原假设是正确的话,我们得到得到样本观察 结果或更极端结果出现的可能性有多大,如果这 个可能性很小,就应该拒绝原假设
因此,如果在一次抽样中竟然出现了满足
X 0 / n
ห้องสมุดไป่ตู้
的 u /2
X
那么我们就有理由怀疑原假设H0的正确性了,因此会拒
绝H0 。
由于 | U |
X 0 / n
u 2
是一个小概率事件.
故我们可以取拒绝域为:
W: | U | u 2
如果由样本值算得该统计量的实测值落入区域 W,则拒绝H0 ;否则,不能拒绝H0 .
1、生产已不正常
2、生产正常:但属于小概率事件,一次抽样中几乎 不可能发生
因此:在原假设成立(生产正常)的情况下, 若发生小概率事件,则我们有充分的理由怀 疑原假设已不成立。
因此若H0为真,即 0 时,
X
0
/ n
u /2
是一个小概率事件:1%、5%、10%
而小概率事件在一次试验中基本上不应该发生 。

第8章-假设检验全解PPT课件

第8章-假设检验全解PPT课件
2
临界点为: u 及 u
2
2
.
12
3. 两类错误
拒绝H0要承担一定的风险,有可能将正确的假设 误认为是错误的,在统计中称这种“以真为假”的错 误为第一类错误(弃真),犯第一类错误的概率显然是 显著水平α;
不拒绝H0同样要承担风险,这时,可能将错误的 假设误认为是正确的,这种“以假为真”的错误称 为第二类错误(取伪), 犯第二类错误的概率是:
.
3
第一节 假设检验的基本原理与方法 一、假设检验的基本原理 二、假设检验的相关概念 三、假设检验的一般步骤 四、小结
.
4
一、假设检验的基本原理
假设检验问题是统计推断的另一类重要问题.
在总体的分布函数完全未知或只知其形式、但 不知其参数的情况下, 为了推断总体的某些性质, 提出某些关于总体的假设.
对于给定的检验水平
01 由P
U
u
2
得拒绝域为 W {u u }
2
这种利用U统计量来检验的方法称为U检验法.
.
17
(2)检验假设 H 0:0,H 1:0
选择统 U计 X/n量 ~N(0,1)
当H0成立时,P( X u0
/ n
u )
P(Xuuu0
/ n
u)
P(X/unu0/unu)P(X/un u)
第八章
假设检验
第一节 参数假设检验的问题与方法
第二节 第三节
单总体参数的检验 两总体参数检验
第四节 非参数检验
.
1
[本章要求]
1. 理解假设检验的基本思想; 2. 熟练掌握假设检验的基本步骤; 3. 熟练掌握单个正态总体均值与方差的假设检验方法; 4. 掌握双正态总体均值差与方差比的假设检验方法.

第八讲 心理统计学-假设检验

第八讲 心理统计学-假设检验
3年级学生的ABC记忆考试的平均成绩低于5年 级学生的平均成绩。
1422:16
零假设和相应的研究假设
零假设
3年级学生的ABC记忆 考试的平均成绩和5年 级学生的平均成绩没有 差异。
由社区长期照料老人的 效率和由家庭长期照料 老人的效果没有差异。
无方向研究假设
有方向研究假设
3年级学生的ABC记忆 3年级学生的ABC记忆 考试的平均成绩不同于 考试的平均成绩低于5 5年级学生的平均成绩。 年级学生的平均成绩。
¾需要考虑的条件
总体分布 总体方差 样本容量
46
¾1.总体正态分布,总体方差已知; ¾2.总体正态分布,总体方差未知; ¾3.总体非正态分布。
47
1.总体正态分布,总体方差已知
¾ 大样本和小样本的检验方法与步骤是相同 的。都是用样本平均数分布的标准误差按 正态分布去计算Z值。
¾ 检验方法:Z检验。
1622:16
¾ 举例:某班级进行瑞文智力测验,结果平均分X =100,已知瑞文测验的常模μ0=100;σ0= 16,问该班智力水平(不是这一次测验结果) 是否确实与常模水平有差异。
¾ 样本分布理论:多次抽样,得到多次测验的结 果的总平均为μ
¾ 检验目的是证明H1 :μ≠ μ0
17
二、假设检验的步骤
第1步:提出虚无和对立假设 第2步:确定适当的检验统计量 第3步:规定显著性水平 第4步:计算检验统计量的值 第5步:做出统计决策
1822:16
3
第一步 提出假设
¾定义
虚无假设(H0 ):原假设、无差假设、零假设 对立假设(H1 ):备择假设,研究假设
¾例子 测量女大学生是否有性别歧视的倾向
IV. 作为好的研究者,我们的工作是解释观察到的差异时消除偶然 性因素,并评价其他可能导致群体差异的因素

第八章 统计学 假设检验

第八章  统计学 假设检验

结论:
有证据表明这批灯泡的使用 寿命有显著提高
0
1.645
Z
2 未知大样本均值的检验 (例题分析)
【例】某电子元件批量生产 的质量标准为平均使用寿命 1200 小时。某厂宣称他们采 用一种新工艺生产的元件质 量大大超过规定标准。为了 进行验证,随机抽取了 100 件作为样本,测得平均使用 寿命 1245 小时,标准差 300 小时。能否说该厂生产的电 子元件质量显著地高于规定 标准? (=0.05)
/2
/2
临界值
0
临界值
样本统计量
显著性水平和拒绝域(双侧检验 )
抽样分布
拒绝H0 置信水平 拒绝H0 1-
/2
/2
临界值
0
临界值
样本统计量
单侧检验(显著性水平与拒绝域)
抽样分布
拒绝域 置信水平

1-
临界值
H0值
样本统计量
显著性水平和拒绝域(左侧检验 )
抽样分布
拒绝H0 置信水平
单侧检验
2 未知大样本均值的检验 (例题分析)
H0: 1200 H1: >1200 = 0.05 n = 100 临界值(s):
拒绝域 0.05
检验统计量:
z
x 0

n

1245 1200 300 100
1.5
决策:
在 = 0.05的水平上不拒绝H0
双侧检验
2 已知均值的检验 (例题分析)
H0: = 0.081 H1: 0.081 = 0.05 n = 200
拒绝 H0
.025
检验统计量:
z
x 0

概率论与数理统计第八章 假设检验

概率论与数理统计第八章 假设检验

第八章假设检验第一节概述统计推断中的另一类重要问题是假设检验(Hypothesis testing).当总体的分布函数未知,或只知其形式而不知道它的参数的情况时,我们常需要判断总体是否具有我们所感兴趣的某些特性.这样,我们就提出某些关于总体分布或关于总体参数的假设,然后根据样本对所提出的假设作出判断:是接受还是拒绝.这就是本章所要讨论的假设检验问题.我们先从下面的例子来说明假设检验的一般提法.例8.1某工厂用包装机包装奶粉,额定标准为每袋净重0.5kg.设包装机称得奶粉重量X服从正态分布N(μ,σ2).根据长期的经验知其标准差σ=0.015(kg).为检验某台包装机的工作是否正常;随机抽取包装的奶粉9袋,称得净重(单位:kg)为0.499 0.515 0.508 0.512 0.4980.515 0.516 0.513 0.524问该包装机的工作是否正常?由于长期实践表明标准差比较稳定,于是我们假设X~N(μ,0.0152).如果奶粉重量X 的均值μ等于0.5kg,我们说包装机的工作是正常的.于是提出假设:H0:μ=μ0=0.5;H1:μ≠μ0=0.5.这样的假设叫统计假设.1.统计假设关于总体X的分布(或随机事件之概率)的各种论断叫统计假设,简称假设,用“H”表示,例如:(1)对于检验某个总体X的分布,可以提出假设:H0:X服从正态分布,H1: X不服从正态分布.H0:X服从泊松分布,H1: X不服从泊松分布.(2)对于总体X的分布的参数,若检验均值,可以提出假设:H0:μ=μ0;H1:μ≠μ0.H0:μ≤μ0;H1:μ>μ0.若检验标准差,可提出假设:H0:σ=σ0;H1:σ≠σ0.H0:σ≥σ0;H1:σ<σ0.这里μ0,σ0是已知数,而μ=E(X),σ2=D(X)是未知参数.上面对于总体X的每个论断,我们都提出了两个互相对立的(统计)假设:H0和H1,显然,H0与H1只有一个成立,或H0真H1假,或H0假H1真,其中假设H0,称为原假设(Original hypothesis)(又叫零假设、基本假设),而H1称为H0的对立假设(又叫备择假设).在处理实际问题时,通常把希望得到的陈述视为备择假设,而把这一陈述的否定作为原假设.例如在上例中,H0:μ=μ0=0.5为原假设,它的对立假设是H1:μ≠μ0=0.5.统计假设提出之后,我们关心的是它的真伪.所谓对假设H0的检验,就是根据来自总体的样本,按照一定的规则对H0作出判断:是接受,还是拒绝,这个用来对假设作出判断的规则叫做检验准则,简称检验,如何对统计假设进行检验呢?我们结合上例来说明假设检验的基本思想和做法.2.假设检验的基本思想 在例8.1中所提假设是H 0:μ=μ0=0.5(备择假设H 1:μ≠μ0).由于要检验的假设涉及总体均值μ,故首先想到是否可借助样本均值这一统计量来进行判断.从抽样的结果来看,样本均值x =19(0.499+0.515+0.508+0.512+0.498+0.515+0.516+0.513+0.524)=0.5110,与μ=0.5之间有差异.对于与μ0之间的差异可以有两种不同的解释.(1) 统计假设H 0是正确的,即μ=μ0=0.5,只是由于抽样的随机性造成了与μ0之间的差异;(2) 统计假设H 0是不正确的,即μ≠μ0=0.5,由于系统误差,也就是包装机工作不正常,造成了与μ0之间的差异.对于这两种解释到底哪一种比较合理呢?为了回答这个问题,我们适当选择一个小正数α(α=0.1,0.05等),叫做显著性水平(Level of significance).在假设H0成立的条件下,确定统计量X -μ0的临界值αλ,使得事件{|X -μ0|>αλ}为小概率事件,即P{|X -μ0|>αλ}=α.(8.1)例如,取定显著性水平α=0.05.现在来确定临界值λ0.05.因为X ~N (μ,σ2),当H 0:μ=μ0=0.5为真时,有X ~N (μ0,σ2),于是2011~,n i i X X N n n σμ=⎛⎫= ⎪⎝⎭∑,ZX X =N (0,1),所以 P {|Z |>z α/2}=α.由(8.1)式,有P Z ⎧>⎨⎩=α,因此22,z z αααλ==λ0.05=z 0.0250.015/3=0.0098. 故有P {|X -μ0|>0.0098}=0.05.因为α=0.05很小,根据实际推断原理,即“小概率事件在一次试验中几乎是不可能发生的”原理,我们认为当H 0为真时,事件{|X -μ0|>0.0098}是小概率事件,实际上是不可能发生的.现在抽样的结果是|x -μ0|=|0.5110-0.5|=0.0110>0.0098.也就是说,小概率事件{|X -μ0|>0.0098}居然在一次抽样中发生了,这说明抽样得到的结果与假设H 0不相符,因而不能不使人怀疑假设H 0的正确性,所以在显著性水平α=0.05下, 我们拒绝H 0,接受H 1,即认为这一天包装机的工作是不正常的.通过上例的分析,我们知道假设检验的基本思想是小概率事件原理,检验的基本步骤是: (1) 根据实际问题的要求,提出原假设H 0及备择假设H 1;(2) 选取适当的显著性水平α(通常α=0.10,0.05等)以及样本容量n ;(3) 构造检验用的统计量U ,当H 0为真时,U 的分布要已知,找出临界值αλ使P {|U |>αλ}=α.我们称|U |>αλ所确定的区域为H 0的拒绝域(Rejection region),记作W ; (4) 取样,根据样本观察值,计算统计量U 的观察值U 0;(5) 作出判断,将U 的观察值U 0与临界值αλ比较,若U 0落入拒绝域W 内,则拒绝H 0接受H 1;否则就说H 0相容(接受H 0).3.两类错误由于我们是根据样本作出接受H 0或拒绝H 0的决定,而样本具有随机性,因此在进行判断时,我们可能会犯两个方面的错误:一类错误是,当H 0为真时,而样本的观察值U 0落入拒绝域W 中,按给定的法则,我们拒绝了H 0,这种错误称为第一类错误.其发生的概率称为犯第一类错误的概率或称弃真概率,通常记为α,即P {拒绝H 0|H 0为真}=α;另一种错误是,当H 0不真时,而样本的观察值落入拒绝域W 之外,按给定的检验法则,我们却接受了H 0.这种错误称为第二类错误,其发生的概率称为犯第二类错误的概率或取伪概率,通常记为β,即P {接受H 0|H 0不真}=β.显然这里的α就是检验的显著性水平.总体与样本各种情况的搭配见表8-1.表8-1对给定的一对H 0和H 1,总可以找到许多拒绝域W .当然我们希望寻找这样的拒绝域W ,使得犯两类错误的概率α与β都很小.但是在样本容量n 固定时,要使α与β都很小是不可能的,一般情形下,减小犯其中一类错误的概率,会增加犯另一类错误的概率,它们之间的关系犹如区间估计问题中置信水平与置信区间的长度的关系那样.通常的做法是控制犯第一类错误的概率不超过某个事先指定的显著性水平α(0<α<1),而使犯第二类错误的概率也尽可能地小.具体实行这个原则会有许多困难,因而有时把这个原则简化成只要求犯第一类错误的概率等于α,称这类假设检验问题为显著性检验问题,相应的检验为显著性检验.在一般情况下,显著性检验法则是较容易找到的,我们将在以下各节中详细讨论.在实际问题中,要确定一个检验问题的原假设,一方面要根据问题要求检验的是什么,另一方面要使原假设尽量简单,这是因为在下面将讲到的检验法中,必须要了解某统计量在原假设成立时的精确分布或渐近分布.下面各节中,我们先介绍正态总体下参数的几种显著性检验,再介绍总体分布函数的假设检验.第二节 单个正态总体的假设检验1.单个正态总体数学期望的假设检验(1) σ2已知关于μ的假设检验(Z 检验法(Z -test)) 设总体X ~N (μ,σ2),方差σ2已知,检验假设H 0:μ=μ0;H 1:μ≠μ0 (μ0为已知常数) 由X ~N (μ,n σ)X N (0,1), 我们选取ZX (8.2)作为此假设检验的统计量,显然当假设H 0为真(即μ=μ0正确)时,Z ~N (0,1),所以对于给定的显著性水平α,可求z α/2使P {|Z |>z α/2}=α,见图8-1,即P {Z <-z α/2}+P {Z >z α/2}=α.从而有P {Z >z α/2}=α/2, P {Z ≤z α/2}=1-α/2.图8-1利用概率1-α/2,反查标准正态分布函数表,得双侧α分位点(即临界值)z α/2. 另一方面,利用样本观察值x 1,x 2,…,x n 计算统计量Z 的观察值z 0x (8.3)如果:(a )|z 0|>z α/2,则在显著性水平α下,拒绝原假设H 0(接受备择假设H 1),所以|z 0|>z α/2便是H0的拒绝域.(b ) |z 0|≤z α/2,则在显著性水平α下,接受原假设H 0,认为H 0正确.这里我们是利用H0为真时服从N (0,1)分布的统计量Z 来确定拒绝域的,这种检验法称为Z 检验法(或称U 检验法).例8.1中所用的方法就是Z 检验法.为了熟悉这类假设检验的具体作法,现在我们再举一例.例8.2 根据长期经验和资料的分析,某砖厂生产的砖的“抗断强度”X 服从正态分布,方差σ2=1.21.从该厂产品中随机抽取6块,测得抗断强度如下(单位:kg ·cm -2):32.56 29.66 31.64 30.00 31.87 31.03检验这批砖的平均抗断强度为32.50kg ·cm -2是否成立(取α=0.05,并假设砖的抗断强度的方差不会有什么变化)?解 ① 提出假设H 0:μ=μ0=32.50;H 1:μ≠μ0. ② 选取统计量ZX ,若H 0为真,则Z ~N (0,1).③ 对给定的显著性水平α=0.05,求z α/2使P {|Z |>z α/2}=α,这里z σ/2=z 0.025=1.96.④ 计算统计量Z 的观察值:|z 0| ≈3.05.⑤ 判断:由于|z 0|=3.05>z 0.025=1.96,所以在显著性水平α=0.05下否定H 0,即不能认为这批产品的平均抗断强度是32.50 kg ·cm -2.把上面的检验过程加以概括,得到了关于方差已知的正态总体期望值μ的检验步骤: (a ) 提出待检验的假设H 0:μ=μ0;H 1:μ≠μ0. (b ) 构造统计量Z ,并计算其观察值z 0:ZX ,z 0x(c ) 对给定的显著性水平α,根据P {|Z |>z α/2}=α,P {Z >z α/2}=α/2,P {Z ≤z α/2}=1-α/2查标准正态分布表,得双侧α分位点z α/2. (d ) 作出判断:根据H 0的拒绝域 若|z 0|>z α/2,则拒绝H 0,接受H 1; 若|z 0|≤z α/2,则接受H 0.(2) 方差σ2未知,检验μ(t 检验法(t -test)) 设总体X ~N (μ,σ2),方差σ2未知,检验H 0:μ=μ0;H 1:μ≠μ0.由于σ2X 便不是统计量,这时我们自然想到用σ2的无偏估计量——样本方差S 2代替σ2,由于X t (n -1),故选取样本的函数tX (8.4)图8-2作为统计量,当H 0为真(μ=μ0)时t ~t (n -1),对给定的检验显著性水平α,由P {|t |>t α/2(n -1)}=α, P {t >t α/2(n -1)}=α/2,见图8-2,直接查t 分布表,得t 分布分位点t α/2(n -1).利用样本观察值,计算统计量t 的观察值t 0x 因而原假设H0的拒绝域为|t 0|>t α/2(n -1). (8.5)所以,若|t 0|>t α/2(n -1),则拒绝H 0,接受H 1;若|t 0|≤t α/2(n -1),则接受原假设H 0.上述利用t 统计量得出的检验法称为t 检验法.在实际中,正态总体的方差常为未知,所以我们常用t 检验法来检验关于正态总体均值的问题.例8.3 用某仪器间接测量温度,重复5次,所得的数据是1250°,1265°,1245°,1260°,1275°,而用别的精确办法测得温度为1277°(可看作温度的真值),试问此仪器间接测量有无系统偏差?这里假设测量值X 服从N (μ,σ2)分布. 解 问题是要检验H 0:μ=μ0=1277;H 1:μ≠μ0.由于σ2未知(即仪器的精度不知道),我们选取统计量tX .当H 0为真时,t ~t (n -1),t 的观察值为|t 0|185.399-==>3.对于给定的检验水平α=0.05,由P {|t |>t α/2(n -1)}=α, P {t >t α/2(n -1)}=α/2, P {t >t 0.025(4)}=0.025,查t 分布表得双侧α分位点t α/2(n -1)=t 0.025(4)=2.776.因为|t 0|>3>t 0.025(4)=2.776,故应拒绝H 0,认为该仪器间接测量有系统偏差.(3) 双边检验与单边检验上面讨论的假设检验中,H 0为μ=μ0,而备择假设H 1:μ≠μ0意思是μ可能大于μ0,也可能小于μ0,称为双边备择假设,而称形如H 0:μ=μ0,H 1:μ≠μ0的假设检验为双边检验.有时我们只关心总体均值是否增大,例如,试验新工艺以提高材料的强度,这时所考虑的总体的均值应该越大越好,如果我们能判断在新工艺下总体均值较以往正常生产的大,则可考虑采用新工艺.此时,我们需要检验假设H 0:μ=μ0;H 1:μ>μ0. (8.6)(我们在这里作了不言而喻的假定,即新工艺不可能比旧的更差),形如(8.6)的假设检验,称为右边检验,类似地,有时我们需要检验假设H 0:μ=μ0;H 1:μ<μ0. (8.7)形如(8.7)的假设检验,称为左边检验,右边检验与左边检验统称为单边检验.下面来讨论单边检验的拒绝域. 设总体X ~N (μ,σ2),σ2为已知,x 1,x 2,…,x n 是来自X 的样本观察值.给定显著性水平α,我们先求检验问题H 0:μ=μ0;H 1:μ>μ0.的拒绝域.取检验统计量ZX ,当H 0为真时,Z 不应太大,而在H 1为真时,由于X 是μ的无偏估计,当μ偏大时,X 也偏大,从而Z 往往偏大,因此拒绝域的形式为ZX ≥k ,k 待定.因为当H 0X ~N (0,1),由P {拒绝H 0|H 0为真}=PX k ⎫≥⎬⎭=α得k =z α,故拒绝域为ZX ≥z α. (8.8)类似地,左边检验问题H 0:μ=μ0;H 1:μ<μ0.的拒绝域为ZX ≤-z α. 8.9)例8.4 从甲地发送一个信号到乙地,设发送的信号值为μ,由于信号传送时有噪声迭加到信号上,这个噪声是随机的,它服从正态分布N (0,22),从而乙地接到的信号值是一个服从正态分布N (μ,22)的随机变量.设甲地发送某信号5次,乙地收到的信号值为: 8.4 10.5 9.1 9.6 9.9由以往经验,信号值为8,于是乙方猜测甲地发送的信号值为8,能否接受这种猜测?取α=0.05.解 按题意需检验假设H 0:μ=8;H 1:μ>8.这是右边检验问题,其拒绝域如(8.8)式所示, 即 Z =X ≥z 0.05=1.645.而现在z 0=1.68>1.645,所以拒绝H 0,认为发出的信号值μ>8.2.单个正态总体方差的假设检验(2χ检验法(2χ-test)) (1) 双边检验设总体X ~N (μ,σ2),μ未知,检验假设H 0:σ2=σ02;H 1:σ2≠σ2.其中σ02为已知常数.由于样本方差S 2是σ2的无偏估计,当H 0为真时,比值22S σ一般来说应在1附近摆动,而不应过分大于1或过分小于1,由第六章知当H 0为真时2χ=220(1)n S σ-~2χ(n -1). (8.10)所以对于给定的显著性水平α有(图8-3)图8-3P {21/2αχ-(n -1)≤2χ≤2/2αχ(n -1)}=1-α. (8.11)对于给定的α,查2χ分布表可求得2χ分布分位点21/2αχ-(n -1)与2/2αχ(n -1).由(8.11)知,H 0的接受域是21/2αχ- (n -1)≤2χ≤2/2αχ (n -1); (8.12)H 0的拒绝域为2χ<21/2αχ-(n -1)或2χ>2/2αχ(n -1). (8.13)这种用服从2χ分布的统计量对个单正态总体方差进行假设检验的方法,称为2χ检验法. 例8.5 某厂生产的某种型号的电池,其寿命长期以来服从方差σ2=5000(小时2)的正态分布,现有一批这种电池,从它的生产情况来看,寿命的波动性有所改变,现随机抽取26只电池,测得其寿命的样本方差s 2=9200(小时2).问根据这一数据能否推断这批电池的寿命的波动性较以往有显著的变化(取α=0.02)?解 本题要求在α=0.02下检验假设H 0:σ2=5000;H 1:σ2≠5000.现在n =26,2/2αχ(n -1)=20.01(25)χ=44.314,21/2αχ- (n -1)= 20.99(25)χ=11.524,σ02=5000.由(8.13)拒绝域为2σ>44.314或220(1)n s σ-<11.524由观察值s 2=9200得22(1)n s σ-=46>44.314,所以拒绝H 0,认为这批电池寿命的波动性较以往有显著的变化.(2) 单边检验(右检验或左检验) 设总体X ~N (μ,σ2),μ未知,检验假设H 0:σ2≤σ02;H 1:σ2>σ02.(右检验)由于X ~N (μ,σ2),故随机变量*2χ=22(1)n S σ-~2χ(n -1).当H 0为真时,统计量2χ=22(1)n S σ-≤*2χ.对于显著性水平α,有P {*2χ>2αχ(n -1)}=α图8-4(图8-4).于是有P {2χ>2αχ(n -1)}≤P {*2χ>2αχ(n -1)}=α.可见,当α很小时,{2χ>2αχ(n -1)}是小概率事件,在一次的抽样中认为不可能发生,所以H 0的拒绝域是:2χ=22(1)n S σ->2αχ(n -1)(右检验). (8.14)类似地,可得左检验假设H 0:σ2≥σ02,H 1:σ2<σ2的拒绝域为2χ<21αχ-(n -1)(左检验). (8.15) 例8.6 今进行某项工艺革新,从革新后的产品中抽取25个零件,测量其直径,计算得样本方差为s 2=0.00066,已知革新前零件直径的方差σ2=0.0012,设零件直径服从正态分布,问革新后生产的零件直径的方差是否显著减小?(α=0.05)解 (1) 提出假设H 0:σ2≥σ02=0.0012;H 1:σ2<σ02. (2) 选取统计量2χ=22(1)n S σ-.*2χ=22(1)n S σ-~2χ(n -1),且当H 0为真时,*2χ≤2χ(3) 对于显著性水平α=0.05,查2χ分布表得21αχ-(n -1)=20.95(24)χ=13.848,当H 0为真时,P {2χ<21αχ- (n -1)}≤P 2212(1)(1)n S n αχσ-⎧⎫-<-⎨⎬⎩⎭=α. 故拒绝域为2χ<21αχ- (n -1)=13.848.(4) 根据样本观察值计算2χ的观察值2χ=220(1)240.000660.0012n s σ-⨯==13.2.(5) 作判断:由于2χ=13.2<21αχ- (n -1)=13.848,即2χ落入拒绝域中,所以拒绝H 0:σ2≥σ02,即认为革新后生产的零件直径的方差小于革新前生产的零件直径的方差.最后我们指出,以上讨论的是在均值未知的情况下,对方差的假设检验,这种情况在实际问题中较多.至于均值已知的情况下,对方差的假设检验,其方法类似,只是所选的统计量为2χ=2120()nii Xμσ=-∑.当σ2=σ2为真时,2χ~2χ(n ).关于单个正态总体的假设检验可列表8-2.表8-2注:上表中H0中的不等号改成等号,所得的拒绝域不变.第三节两个正态总体的假设检验上一节介绍了单个正态总体的数学期望与方差的检验问题,在实际工作中还常碰到两个正态总体的比较问题.1.两正态总体数学期望假设检验(1)方差已知,关于数学期望的假设检验(Z检验法)设X~N(μ1,σ12),Y~N(μ2,σ22),且X,Y相互独立,σ12与σ22已知,要检验的是H0:μ1=μ2;H1:μ1≠μ2.(双边检验)怎样寻找检验用的统计量呢?从总体X 与Y 中分别抽取容量为n 1,n 2的样本X 1,X 2,…,1n X 及Y 1,Y 2,…,2n Y ,由于2111~,X N n σμ⎛⎫ ⎪⎝⎭,2222~,Y N n σμ⎛⎫⎪⎝⎭,E (X -Y )=E (X )-E (Y )=μ1-μ2, D (X -Y )=D (X )+D (Y )=221212n n σσ+,故随机变量X -Y 也服从正态分布,即X -Y ~N (μ1-μ2,221212n n σσ+).从而X Y ~N (0,1).于是我们按如下步骤判断.(a ) 选取统计量 ZX Y , (8.16)当H 0为真时,Z ~N (0,1).(b ) 对于给定的显著性水平α,查标准正态分布表求z α/2使P {|Z |>z α/2}=α,或P {Z ≤z α/2}=1-α/2. (8.17) (c ) 由两个样本观察值计算Z 的观察值z 0:z 0x y .(d ) 作出判断:若|z 0|>z α/2,则拒绝假设H 0,接受H 1; 若|z 0|≤z α/2,则与H 0相容,可以接受H 0.例8.7 A ,B 两台车床加工同一种轴,现在要测量轴的椭圆度.设A 车床加工的轴的椭圆度X ~N (μ1,σ12),B 车床加工的轴的椭圆度Y ~N (μ2,σ22),且σ12=0.0006(mm 2),σ22=0.0038(mm 2),现从A ,B 两台车床加工的轴中分别测量了n 1=200,n 2=150根轴的椭圆度,并计算得样本均值分别为=0.081(mm),=0.060(mm).试问这两台车床加工的轴的椭圆度是否有显著性差异?(给定α=0.05)解 ① 提出假设H 0:μ1=μ2;H 1:μ1≠μ2. ② 选取统计量ZX Y ,在H 0为真时,Z ~N (0,1).③ 给定α=0.05,因为是双边检验,α/2=0.025.P {|Z |>z α/2}=0.05, P {Z >z α/2}=0.025,P {Z ≤z α/2}=1-0.025=0.975.查标准正态分布表,得z α/2=z 0.025=1.96.④ 计算统计量Z 的观察值zz 0x y =.⑤ 作判断:由于|z 0|=3.95>1.96=z α/2,故拒绝H 0,即在显著性水平α=0.05下,认为两台车床加工的轴的椭圆度有显著差异.用Z 检验法对两正态总体的均值作假设检验时,必须知道总体的方差,但在许多实际问题中总体方差σ12与σ22往往是未知的,这时只能用如下的t 检验法.(2) 方差σ12,σ22未知,关于均值的假设检验(t 检验法) 设两正态总体X 与Y 相互独立,X ~N (μ1,σ12),Y ~N (μ2,σ22),σ12,σ22未知,但知σ12=σ22,检验假设H 0:μ1=μ2;H 1:μ1≠μ2.(双边检验) 从总体X ,Y 中分别抽取样本X 1,X 2,…,1n X 与Y 1,Y 2,…,2n Y ,则随机变量tX Y μμ---t (n 1+n 2-2),式中S w 2=22112212(1)(1)2n S n S n n -+-+-,S 12,S 22分别是X 与Y 的样本方差.当假设H 0为真时,统计量t ~t (n 1+n 2-2). (8.18)对给定的显著性水平α,查t 分布得t α/2(n 1+n 2-2),使得P {|t |>t α/2(n 1+n 2-2)}=α. (8.19)再由样本观察值计算t 的观察值t 0x y(8.20)最后作出判断:若|t 0|>t α/2(n 1+n 2-2),则拒绝H 0; 若|t 0|≤t α/2(n 1+n 2-2),则接受H 0.例8.8 在一台自动车床上加工直径为2.050毫米的轴,现在每相隔两小时,各取容量都为10的样本,所得数据列表如表8-3所示.12是未知常数.问这台自动车床的工作是否稳定?(取α=0.01)解 这里实际上是已知σ12=σ22=σ2,但σ2未知的情况下检验假设H 0:μ1=μ2;H 1:μ1≠μ2.我们用t 检验法,由样本观察值算得:x =2.063, y =2.059,s 12=0.00000956, s 22=0.00000489,s w 2=2212990.0000860.0000441010218s s ⨯+⨯+=+-=0.0000072.由(8.20)式计算得t 0=3.3.对于α=0.01,查自由度为18的t 分布表得t 0.005(18)=2.878.由于|t 0|=3.3>t 0.005(18)=2.878,于是拒绝原假设H 0:μ1=μ2.这说明两个样本在生产上是有差异的,可能这台自动车床受时间的影响而生产不稳定.2. 两正态总体方差的假设检验(F 检验法(F -test )) (1) 双边检验设两正态总体X ~N (μ1,σ12),Y ~N (μ2,σ22),X 与Y 独立,X 1,X 2,…,1n X 与Y 1,Y 2,…,2n Y 分别是来自这两个总体的样本,且μ1与μ2未知.现在要检验假设H 0:σ12=σ22;H 1:σ12≠σ22.在原假设H 0成立下,两个样本方差的比应该在1附近随机地摆动,所以这个比不能太大又不能太小.于是我们选取统计量F =2122S S . (8.21) 显然,只有当F 接近1时,才认为有σ12=σ22.由于随机变量F *=22112222//S S σσ ~F (n 1-1,n 2-1),所以当假设H 0:σ12=σ22成立时,统计量F =2122S S ~F (n 1-1,n 2-1). 对于给定的显著性水平α,可以由F 分布表求得临界值12a F-(n 1-1,n 2-1)与F α/2(n 1-1,n 2-1)使得 P { 12a F-(n 1-1,n 2-1)≤F ≤F α/2(n 1-1,n 2-1)}=1-α(图8-5),由此可知H 0的接受区域是12aF-(n 1-1,n 2-1)≤F ≤F α/2(n 1-1,n 2-1);而H 0的拒绝域为F <12a F-(n 1-1,n 2-1),或 F >F α/2(n 1-1,n 2-1).然后,根据样本观察值计算统计量F 的观察值,若F 的观察值落在拒绝域中,则拒绝H 0,接受H 1;若F 的观察值落在接受域中,则接受H 0.图8-5例8.9 在例8.8中我们认为两个总体的方差σ12=σ22,它们是否真的相等呢?为此我们来检验假设H 0:σ12=σ22(给定α=0.1).解 这里n 1=n 2=10,s 12=0.00000956,s 22=0.00000489,于是统计量F 的观察值为F =0.00000956/0.00000489=1.95.查F 分布表得F α/2(n 1-1,n 2-1)=F 0.05(9,9)=3.18,F 1-α/2(n 1-1,n 2-1)=F 0.95(9,9)=1/F 0.05(9,9)=1/3.18.由样本观察值算出的F 满足F 0.95(9,9)=1/3.18<F =1.95<3.18=F 0.05(9,9).可见它不落入拒绝域,因此不能拒绝原假设H 0:σ12=σ22,从而认为两个总体的方差无显著差异.注意:在μ1与μ2已知时,要检验假设H 0:σ12=σ22,其检验方法类同均值未知的情况,此时所采用的检验统计量是:F =12211122121()1()n i i n i i X n Y n μμ==--∑∑~F (n 1,n 2). 其拒绝域参看表8-4.表8-4(2) 单边检验可作类似的讨论,限于篇幅,这里不作介绍了.第四节总体分布函数的假设检验上两节中,我们在总体分布形式为已知的前提下,讨论了参数的检验问题.然而在实际问题中,有时不能确知总体服从什么类型的分布,此时就要根据样本来检验关于总体分布的χ检验法.假设.例如检验假设:“总体服从正态分布”等.本节仅介绍2χ检验法是在总体的分布为未知时,根据样本值x1,x2,…,x n来检验关于总体所谓2分布的假设H0:总体X的分布函数为F(x);H1:总体X的分布函数不是F(x)(8.22)的一种方法(这里的备择假设H1可不必写出).注意,若总体X为离散型,则假设(8.22)相当于H0:总体X的分布律为P{X=x i}=p i,i=1,2,…;(8.23)若总体X为连续型,则假设(8.22)相当于H0:总体X的概率密度为f(x). (8.24)在用2χ检验法检验假设H 0时,若在假设H 0下F (x )的形式已知,而其参数值未知,此时需先用极大似然估计法估计参数,然后再作检验.2χ检验法的基本思想与方法如下:(1) 将随机试验可能结果的全体Ω分为k 个互不相容的事件A 1,A 2,…,A k (1ki i A ==Ω,A i A j =∅,i ≠j ;i ,j =1,2,…,k ),于是在H 0为真时,可以计算概率ˆi p =P (A i )(i =1,2,…,k ).(2) 寻找用于检验的统计量及相应的分布,在n 次试验中,事件A i 出现的频率if n与概率ˆi p往往有差异,但由大数定律可以知道,如果样本容量n 较大(一般要求n 至少为50,最好在100以上),在H 0成立条件下ˆii f p n-的值应该比较小,基于这种想法,皮尔逊使用 2χ=21ˆ()ˆki i i if npnp =-∑ (8.25) 作为检验H 0的统计量,并证明了如下的定理.定理8.1 若n 充分大(n ≥50),则当H 0为真时(不论H 0中的分布属什么分布),统计量(8.25)总是近似地服从自由度为k -r -1的2χ分布,其中r 是被估计的参数的个数.(3) 对于给定的检验水平α,查表确定临界值2(1)k r αχ--使P {2χ>2(1)k r αχ--)}=α,从而得到H 0的拒绝域为2χ>2(1)k r αχ--).(4)由样本值x 1,x 2,…,x n 计算2χ的值,并与2(1)k r αχ--比较.(5) 作结论:若2χ>2(1)k r αχ--,则拒绝H 0,即不能认为总体分布函数为F (x );否则接受H 0.例8.10 一本书的一页中印刷错误的个数X 是一个随机变量,现检查了一本书的100页,记录每页中印刷错误的个数,其结果如表8-5所示.i =0.05)?解 由题意首先提出假设:H 0:总体X 服从泊松分布.P {X =i }=!e ii λλ-,i =0,1,2,…,这里H 0中参数λ为未知,所以需先来估计参数.由最大似然估计法得03614061ˆ+70100x λ⨯+⨯++⨯⨯===1.将试验结果的全体分为A 0,A 1,…,A 7两两不相容的事件.若H 0为真,则P {X =i }有估计111ˆˆ{}!!e e i p P X i i i --====,i =0,1,2,….例如10ˆˆ{0},e pP X -=== 11ˆˆ{1},e pP X -=== 12ˆˆ{2},2e pP X -=== ………………166701ˆˆˆ{7}11.!e i i i pP X p i -===≥=-=-∑∑ 计算结果如表8-6所示.将其中有些np i <5的组予以适当合并,使新的每一组内有np i ≥5,如表8-6所示,此处并组后k =4,但因在计算概率时,估计了一个未知参数λ,故24221ˆ()~(411).ˆi i i i f npnp χχ=-=--∑计算结果为2χ=1.460(表8-6).因为220.05(411)(2)αχχ--==5.991>1.46,所以在显著性水平为0.05下接受H 0,即认为总体服从泊松分布. 表8-68-7).n =61ii f=∑=200.要求在给定的检验水平α=0.05下检验假设H 0:抗压强度X ~N (μ,σ2).解 原假设所定的正态分布的参数是未知的,我们需先求μ与σ的极大似然估计值.由第七章知,μ与σ2的极大似然估计值为ˆx μ=, 2211ˆ()ni i x x n σ==-∑. 设*i x 为第i 组的组中值,我们有*1195102052624514200i ii x x f n ⨯+⨯++⨯==∑=221,{}2*222211ˆ()(26)10(16)262414200i ii x x f n σ=-=-⨯+-⨯++⨯∑=152,ˆσ=12.33. 原假设H 0改写成X 是正态N (221,12.332)分布,计算每个区间的理论概率值{}11ˆ()()i i i i i pP a X a μμΦΦ--=≤<=-, i =1,2,…,6, 其中ˆi i a xμσ-=, 22()i t i t μμ--∞=e d Φ. 为了计算出统计量2χ之值,我们把需要进行的计算列表如下(表8-8).表8-8从上面计算得出2χ的观察值为1.35.在检验水平α=0.05下,查自由度m =6-2-1=3的2χ分布表,得到临界值20.05(3)χ=7.815.由于2χ=1.35<7.815=20.05(3)χ,不能拒绝原假设,所以认为混凝土制件的抗压强度的分布是正态分布N (221,152).小 结有关总体分布的未知参数或未知分布形式的种种论断叫做统计假设.一般统计假设分为原假设H 0(在实际问题中至关重要的假设)及与原假设H 0对立假设即是备择假设H 1.假设检验就是人们根据样本提供的信息作出“接受H 0、拒绝H 1”或“拒绝H 0、接受H 1”的判断.假设检验的思想是小概率原理,即小概率事件在一次试验中几乎不会发生.这种原理是人们处理实际问题中公认的原则.由于样本的随机性,当H 0为真时,我们可能会作出拒绝H 0、接受H 1的错误判断(弃当样本容量n 固定时,我们无法同时控制犯二类错误,即减小犯第一类错误的概率,就会增大犯第二类错误的概率,反之亦然.在假设检验中我们主要控制(减小)犯第一类错误的概率.使P {拒绝H 0|H 0为真}≤α,其中α很小.(0<α<1),α称为检验的显著性水平,这种只对犯第一类错误的概率加以控制而不考虑犯第二类错误的概率的检验称为显著性假设检验.单个、两个正态总体的均值、方差的假设检验是本章重点问题,读者需掌握Z 检验法、2χ检验法、t 检验法等.这些检验法中原假设H 0备择假设H 1及H 0的拒绝域分别见表8-2、表8-4.重要术语及主题原假设 备择假设 检验统计量 单边检验 双边检验 显著性水平 拒绝域 显著性检验 一个正态总体的参数的检验 两个正态总体均值差、方差比的检验 总体分布函数的假设检验习 题 八1. 已知某炼铁厂的铁水含碳量在正常情况下服从正态分布N (4.55,0.1082).现在测了5炉铁水,其含碳量(%)分别为4.28 4.40 4.42 4.35 4.37问若标准差不改变,总体平均值有无显著性变化(α=0.05)? 2.某种矿砂的5个样品中的含镍量(%)经测定为:3.24 3.26 3.24 3.27 3.25设含镍量服从正态分布,问在α=0.01下能否接收假设:这批矿砂的含镍量为3.25. 3.在正常状态下,某种牌子的香烟一支平均1.1克,若从这种香烟堆中任取36支作为样本;测得样本均值为1.008(克),样本方差s 2=0.1(克2).问这堆香烟是否处于正常状态.已知香烟(支)的重量(克)近似服从正态分布(取α=0.05).4.某公司宣称由他们生产的某种型号的电池其平均寿命为21.5小时,标准差为2.9小时.在实验室测试了该公司生产的6只电池,得到它们的寿命(以小时计)为19,18,20,22,16,25,问这些结果是否表明这种电池的平均寿命比该公司宣称的平均寿命要短?设电池寿命近似地服从正态分布(取α=0.05).5.测量某种溶液中的水分,从它的10个测定值得出x =0.452(%),s =0.037(%).设测定值总体为正态,μ为总体均值,σ为总体标准差,试在水平α=0.05下检验. (1) H 0:μ=0.5(%);H 1:μ<0.5(%).(2)0H ':σ=0.04(%);1H ':σ<0.04(%). 6.某种导线的电阻服从正态分布N (μ,0.0052).今从新生产的一批导线中抽取9根,测其电阻,得s =0.008欧.对于α=0.05,能否认为这批导线电阻的标准差仍为0.005? 7.有两批棉纱,为比较其断裂强度,从中各取一个样本,测试得到: 第一批棉纱样本:n 1=200,x =0.532kg, s 1=0.218kg ; 第二批棉纱样本:n 2=200,x =0.57kg, s 2=0.176kg .设两强度总体服从正态分布,方差未知但相等,两批强度均值有无显著差异?(α=0.05) 8.两位化验员A ,B 对一种矿砂的含铁量各自独立地用同一方法做了5次分析,得到样本方差分别为0.4322(%2)与0.5006(%2).若A ,B 所得的测定值的总体都是正态分布,其方差分别为σA 2,σB 2,试在水平α=0.05下检验方差齐性的假设H 0:σA 2=σB 2; H 1:σA 2≠σB 2.9.在π的前800位小数的数字中,0,1,…,9相应的出现了74,92,83,79,80,73,77,75,76,91次.试用2χ检验法检验假设H 0:P (X =0)=P (X =1)=P (X =2)=…=P (X =9)=1/10,其中X 为π的小数中所出现的数字,α=0.10.10.在一副扑克牌(52张)中任意抽3张,记录3张牌中含红桃的张数,放回,然后再任抽。

现代心理与教育统计学 第八章-假设检验(张厚粲)

现代心理与教育统计学 第八章-假设检验(张厚粲)

第一节 假设检验的原理
在统计学中,通过样本统计量得出的差异做出一般性 结论,判断总体参数之间是否存在差异,这种推论过 程称作假设检验(hypothesis testing)
假设检验分为参数检验和非参数检验。前者指的是总 体分布已知,需要对总体的未知参数做假设检验。后 者指的是总体分布知之甚少,对总体的函数形式和特 征进行假设检验。
这里取=0.05,因为是Z检验,所以临界值是-1.96
4. 利用显著性水平,建立拒绝H0的规则
0.05时, Z 2 Z0.025 1.96,
接受假设的区域为 : Z 1.96, 拒绝区域为 : 或Z 1.96,或Z 1.96
拒绝H0
0.025
拒绝H0
正解:
1、提出零假设和备择假设 备择假设:用H1表示,即研究假设,希望证实的假设。 H1 : 1 0 (该班智力水平确实与常模有差异) 1100 零假设:用H0表示,即虚无假设、原假设、无差异假 设。 H0: 1=0 1 =100
2、确定适当的检验统计量
用于假设检验问题的统计量称为检验统计量。与参数 估计相同,需要考虑:
Ⅱ型错误
α错误 正确
β 错误
(二)两类错误的关系
1. + ≠ 1 原因:与是两个前提下的概率。 即是拒绝原假设H0时犯错误的概率,这时前提是
H0为真; 是接受原假设H0时犯错误的概率,这时前提是H0
为伪。
H0为真, 即 μ 0=μ 1 的分布
+ ≠ 1
H1为真, 即 μ 0≠μ 1 的分布
总体是否正态分布; 大样本还是小样本; 总体方差已知还是未知。
Z=
X-0 0
n
本例中总体正态,样本容量大于等于30,检验统计量 为Z分布。

2023考研概率统计全考点精讲-第八讲 假设检验(仅数一)

2023考研概率统计全考点精讲-第八讲 假设检验(仅数一)

第八讲 假设检验(仅数一)【考试要求】1.(仅数一)理解显著性检验的基本思想,掌握假设检验的基本步骤.了解假设检验可能产生的两类错误.2.(仅数一)掌握单个及两个正态总体的均值和方差的假设检验.考点:假设检验1.假设检验关于总体分布中未知参数取值所提出的假设称为原假设,记为0H ;对立于原假设的假设称为备择假设,记为1H .假设检验就是根据样本,按照某种检验法则,决定在0H 与1H 之中接受其一. 对总体分布中未知参数提出的假设进行检验的问题,叫做参数假设检验. 【注】理论依据:小概率事件原理. 2.两类错误在0H 为真的情况下,而作出拒绝0H 的选择,称此类错误为第一类错误(弃真错误).在0H 为假(本来就不成立)的情况下,而作出接受0H 的选择,称此类错误为第二类错误(取伪错误).把犯第一类错误和第二类错误的概率分别记为α和β,则00{|}P H H α=拒绝为真,00{|}P H H β=接受不真.3.显著性检验在给定样本容量的情况下,我们总是控制第一类错误的概率,使它不大于α,而不考虑犯第二类错误的概率,这种检验称为显著性检验. 数α称为显著性水平.由样本对原假设进行判断总是通过一个统计量完成的,称该统计量为检验统计量.当检验统计量在某个区域W 上取值时,我们拒绝原假设0H ,称区域W 为拒绝域,拒绝域的边界点称为临界点.4. 双边检验与单边检验设总体X 的分布中有某一未知参数θ.形如00:H θθ=,10:H θθ≠的假设检验称为双边检验;形如00:H θθ≤(或者0θθ=),10:H θθ>的假设检验称为右边检验; 形如00:H θθ≥(或者0θθ=),10:H θθ<的假设检验称为左边检验,右边检验和左边检验统称为单边检验.5. 假设检验的一般步骤(1)根据实际问题的要求,提出原假设0H 和备择假设1H . (2)给出显著性水平α以及样本容量n . (3)确定检验统计量K 及拒绝域的形式;(4)按犯第一类错误的概率等于α求出拒绝域W ;(5)根据样本值计算K 的观察值k ,当k W ∈时,拒绝原假设0H ;否则,接受0H .6. 正态总体均值、方差的假设检验(1)单个正态总体的假设检验法(2)两个正态总体的假设检验法【例1】 某厂生产某种产品,正常生产时,该产品的某项指标服从正态分布2(5038)N ,.,在生产过程中为检验机器生产是否正常,随机抽取50件产品,其平均指标为26.51=x (设生产过程中方差不改变),在显著性水平为05.0=α下,检验生产过程是否正常.【例2】(1998-1)(课后作业)设某次考试的学生成绩服从正态分布,从中随机地抽取36位考生的成绩,算得平均成绩为66.5分,标准差为15分. 问在显著性水平0.05下,是否可以认为这次考试全体考生的平均成绩为70分?给出检验过程.附表:t 分布表 ()(){}p P t n t n p ≤=,。

第八讲假设检验.

第八讲假设检验.

S X=SEX= n n 1
Sn1
例8.4 学生的学习成绩与教师的教学方法有关。
某校一教师采用了一种他认为新式有效的教学
方法。经过一学年的教学后,从该教师所教班
级中随机抽取了6名学生的考试成绩,分别为
48.5, 49.0, 53.5, 49.5,56.0, 52.5, 而在该学年考试
中,全年级的总平均分数为52.0, 试分析采用这
0
n
3、指定检验中的显著性水平;
用样本推断H0是否正确,必有犯错误的可能。
原假设H0正确,而被我们拒绝,犯这种错误
的概率用表示。把称为假设检验中的显著 性水平( Significant level), 即决策中的风险。显 著性水平就是指当原假设正确时人们却把它拒 绝了的概率或风险。
通常取=0.05或=0.01或=0.001, 那么, 接受
•假设检验的目的在于检验差异,所以,又叫 差异的显著性检验
2、确定适当的检验统计量 用于假设检验问题的统计量称为检验统计量。与参数 估计相同,需要考虑: •总体是否正态分布; •大样本还是小样本; •总体方差已知还是未知。
由于本例中总体正态,样本容量大于等于30, 所以检验统计量为Z分布。
Z=
X- 0
以认为受过良好早期教 育的儿童智力高于一般 水平。
8.2.2 总体正态分布,总体方差未知的均值检验
Z统计量中包含已知参数2,当总体方差2未知 时,不能选择Z统计量。这时需要用样本方差S2 代替2,检验统计量
X 0 t S n
服从自由度df=n-1的t分布,此时的检验叫做t 检验。而不是Z检验。标准误为:
例8.1 某校一个班进行比奈智力测验, X =110, 班级人数 n=50, 该测验常模0=100, 0=16。该班智力水平1(不是这一 次测验结果)是否与常模水平有显著差异?

《假设检验的概念及》PPT课件

《假设检验的概念及》PPT课件
2. 假设检验( test of
hypothesis)
实例
通过以往大规模调查,已知某地一般新生 儿的头围均数为34.50cm。为研究某矿区 新生儿的发育状况,现从该地某矿区随机 抽取新生儿55人,测得其头围均数为 33.89cm,问该矿区新生儿的头围总体均 数与一般新生儿头围总体均数是否不同?
假设检验的步骤及有关概念
按α=0.05 水准,不拒绝H0 ,两者的差别无统计学意义
附表2 t界值表
二、配对资料的比较
两种情况:1.随机配对设计(randomized
paired design)是将受试对象按某些混杂因素(如性 别、年龄、窝别等)配成对子,每对中的两个个体随 机分配给两种处理(如处理组与对照组);2.或者同 一受试对象作两次不同的处理(自身对照)。
怀疑H0的正确性,从而接受H1。通常选择后 者。本例,可认为该矿区新生儿总体均数与
一般新生儿头围总体均数不同。
例8-2:1995年,某地20岁应征男青年平 均身高为168.5cm。2003年在当地20岁 应征男青年中随机抽取85人,平均身高 为171.2cm,标准差为5.3cm,问这两年 身高是否不同。
t | d | 0.112 0.817, n 1 12 1 11
Sd / n 0.475 / 12
3. 查相应界值表,确定P 值,下结论。 查表t0.05/ 2,11 2.201,t P t , 0.05/ 2,11 >0.05,按α=0.05 水准, 不拒绝 H 0 ,两种方法的测量结果差值无统计学意义。
第八章 假设检验的概念及t检验
统计推断
statistical inference
内容:
总体
抽取部分观察单位 样本
1. 参数估计 (estimation of
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


2
Z 0.025 1.96, 接受假设的区域为 : n , 0 1.96 0 n , 或 Z 1.96,

0 1.96 /
n
0
1.96 / n
5、计算样本统计量的值
Z= X- 0
0
n
110 100 50 2 4.42 16 16 50
6、作出统计决策
Z=4.42>1.96, 所以Z落入拒绝区域,应推 翻H0,接受H1。即该班的智力水平与常模
有显著差异。
8.1.2 假设检验中的小概率原理
小概率原理:指发生概率很小的随机事件在一次试 验中是几乎不可能发生的。小概率指p<5% 假设检验的基本思想是应用小概率原理.

例如某厂产品合格率为99%,从一 批(100件)产品中随机抽取一件,恰 好是次品的概率为1%。随机抽取 一件是次品几乎是不可能的, 但 是这种情况发生了,我们有理由怀 疑该厂的合格率为99%.这时我们 犯错误的概率是1%
为68分,问该校成绩与全市平均差异是否显著。
( 取 =0.05)
解:
(1)建立检验假设 H 0 : 1 62 H1 : 1 62 (2)计算统计量值 ,由已知 0 62, 0 10.2, X 68, n 90, X 0 68 62 Z 5.58 0 n 10.2 / 90 (3)由已给出的显著性水平 0.05, 查表得到Z 2 1.96 (4)显然 Z 5.58 1.96, 即拒绝原假设 H0 可以认为该校的学生考 试成绩与全市的平均成 绩有 显著差异。
2、单侧检验(单尾):强调某一方向性的检验。 左侧检验 右侧检验
H 0 : 1 H 1 : 1 H 0 : 1 H 1 : 1
0
0
8.2 平均数的显著性检验
8.2.1 总体服从正态分布,总体方差已知 设x1,x2,…,xn是来自正态总体N(0, 2)的样本容 量为n的随机样本,则将均值是否等于已知值作 出检验.则此时的假设检验称为Z检验。 (1)假设检验的问题是:H0: 1 =0 H1: 10 (2)由于2已知,且样本来自正态总体,故 X~N( 0, 2/n), 检验统计量为:
•备择假设:用H1表示,即研究假设,希望证实的假设。H1 : 1 0 (该班智力水平确实与常模有差异)
1100
•统计学中不能对H1的真实性直接检验,而是 要建立与之对立的假设H0 。若证明为H0为真,
则H1为假; H0为假,则H1为真。
•虚无假设是统计推论的出发点。总是作为直
接被检验的假设。
种教学方法与未采用新教学方法的学生成绩有
无显著的差异(已知考试成绩服从正态分布,取
=0.05)
解: 依题意知 :
48.5 49.0 53.5 49.5 56.0 52.5 51.5, 6 S 2.98, X (1)建立假设 H 0 : 1 0 H 1 : 1 0 ( 2)总体正态, 2 未知, 且为小样本 , n 6, 则应用t检验方法, 计算统计量t X 0 S n 51.5 52.0 2.98 6 0.41
X 0 Z n
(3) 对于给定的显著性水平,查标准正态分布表得到 临界值Z /2; (4)比较统计量Z与Z /2的值,若
Z Z 2 , 则拒绝假设H 0 ; Z Z 2 , 则接受假设H 0
例8.2 全市统一考试的数学平均分0=62分, 标准差
0=10.2,一个学校的90名学生该次考试的平均成绩
X SEX
0
n

15 70
1.793 ,
X 0 103.3 100 Z 1.84, SEX 1.793 从标准正态分布表查得 , 单侧检验中 0.05时 的临界值Z 1.645, 而Z 1.84 1.645 Z , p 0.05, Z落入拒绝区内 , 说明在0.05水平上1与 0 的差异显著 .推翻原假设H 0 , 接受备择假设 H 1 , 即可
相符(或大于)的结论?(=0.05)
解: H 0 : 40000 H1 : 40000
这是一个单侧假设 (右侧),总体方差未知 , 用t统计量 X 0 41000 40000 t 2.91, 查t分布表知 , S n 5000 120 t (119) 1.658,由于t t , 落入拒绝区域 , 故拒绝H 0 , 接受H1 , 可以认为该制造商的声 称是可信的 , 其生产 的轮胎的平均寿命显著 地大于40000 公里。
第八讲 假设检验
• 参数估计和参数假设检验的共同之处 都是利用样本信息对总体进行某种推 断,且使用的统计量也一样。 • 参数估计:用样本统计量估计总体参 数; • 假设检验:先对总体参数提出一个假 设,然后利用样本信息检验这个假设 是否成立。
8.1 假设检验中的基本问题念
• • • • • • • • • 8.1.1 假设检验的步骤: 1. 建立原假设H0和备择假设H1; 2. 确定适当的检验统计量; 3. 指定检验中的显著性水平; 4.利用显著性水平根据检验统计量的值建立拒绝原假 设的规则; 5.搜集样本数据,计算检验统计量的值; 6.作出统计决策:(两种方法) (1) 将检验统计量的值与拒绝规则所指定的临界值相 比较,确定是否拒绝原假设; (2)由步骤5的检验统计量计算p值,利用p值确定是否 拒绝原假设.
例8.3 有人研究早期教育对儿童智力发 展的影响,从受过良好教育的儿童中随机 抽取70人进行韦氏儿童智力测验(0=100, 0=15)结果X=103.3, 能否认为受过良好
早期教育的儿童智力高于一般水平。
解:由题意,应该用单侧假设(总体正态分布), 建立假设
H 0 : 1 0 H 1 : 1 0
例8.1 某校一个班进行比奈智力测验, X =110, 班级人数 n=50, 该测验常模0=100, 0=16。该班智力水平1(不是这一 次测验结果)是否与常模水平有显著差异?
解:1、提出原假设和备择假设 •原假设:用H0表示,即虚无假设、零假设、无差异假设。 H0: 1=0 1 =100
总体非正态,n 30(或n 50): 1、 0已知时X的分布
X 0 , SEX
0
n S n
,Z
X 0
0
n
2、 0 未知时X的分布
X 0 , SEX
, Z'
X 0 S n
例8.6 某省进行数学竞赛,结果分数的分布不是正态,总 平均分43.5。其中某县参加竞赛的学生168人,X= 45.1, S=18.7, 该县平均分与全省平均分有否显著差异? 解:n=168>50,
若采用Z作为检验统计量,其临界值Z=1.645, Z与 t非常接近,主要原因是样本容量很大。因为t分布的 极限分布是正态分布,所以当样本容量n很大时,选择t 统计量与Z统计量的差别不大。但在小样本情况下, 两个统计量的临界值存在明显的差异,这时要特别 注意不能误用。
思考题1、某市场研究有限公司假定电话调查可在 15分钟以内结束,并据此向客户收费。如果调查 所需时间超过该值,则需要加收额外费用。假定 由35个电话调查所组成的一个样本表明,其样本 均值为17分钟,样本标准差为4分钟。取显著性水 平=0.01,问是否需要额外收费?
(3)由 0.05,自由度df 6 1 5, 查t分布表得 到临界值t (5) 2.571 ,
2
( 4)由 t 0.40 0.41 2.571 t (5), 所以X 落
2
入接受区域 , 应接受假设H 0 , 即认为两种教学方 法并没有显著的差异。
例8.5 一个汽车制造商声称,某一等级的轮胎 的平均寿命在一定的汽车重量和正常行驶 条件下大于40000公里,对一个由120个组成 的随机样本作了试验,测得平均值和标准差 为 X=41000,S=5000。已知轮胎寿命的公里 数近似服从正态分布。我们能否根据这些 数据作出该制造商的产品同他所说的标准
原假设时正确的可能性(概率)为:95%, 99%, 99.9%
4.利用显著性水平根据检验统计量的值建 立拒绝原假设的规则
0.05时, Z
X 0 1.96 0 拒绝区域为: X 0 1.96 0 n 或 X 0 1.96 0 n, 或Z 1.96, 或Z 1.96
若增大n,在样本平均数的分布 X ~N ( , 变小,
2

)中, 就会 n n
2
n 概率与。
变小,则分布就瘦长, 从而减少了两种错误的
8.1.4 单侧检验和双侧检验
1、双侧检验(双尾) 指只强调差异而不强调方向性的检验
H 0 : 1 0 H1 : 1 0 只关注1,0是否有差异,不关心 1比0大还是小
以认为受过良好早期教 育的儿童智力高于一般 水平。
8.2.2 总体正态分布,总体方差未知的均值检验
Z统计量中包含已知参数2,当总体方差2未知 时,不能选择Z统计量。这时需要用样本方差S2 代替2,检验统计量
X 0 t S n
服从自由度df=n-1的t分布,此时的检验叫做t 检验。而不是Z检验。标准误为:
•假设检验的目的在于检验差异,所以,又叫 差异的显著性检验
2、确定适当的检验统计量 用于假设检验问题的统计量称为检验统计量。与参数 估计相同,需要考虑: •总体是否正态分布; •大样本还是小样本; •总体方差已知还是未知。
由于本例中总体正态,样本容量大于等于30, 所以检验统计量为Z分布。
Z=
X- 0
8.1.3 假设检验中的两类错误

假设检验是依据样本提供的信息进行推断的, 即由部分来推断总体,因而假设检验不可能绝 对准确,是可能犯错误的。
两类错误: 错误(I型错误): H0为真时却被拒绝,弃真错误; 错误(II型错误): H0为假时却被接受,取伪错误。 假设检验中各种可能结果的概率 接受H0 H0为真 1- (正确决策) 拒绝H0,接受H1 (弃真错误)
相关文档
最新文档