数理统计与随机过程8--假设检验
概率论与数理统计课件:假设检验
假设检验
首页 返回 退出
五、假设检验的两类错误
由于样本具有随机性,因此,当我们利用样本判断时, 可能会犯两类错误:
所作决策
真实情况
(未知)
样本未落入拒绝域 样本落入拒绝域
接受H0
拒绝H0
H0为真
正确
第一类错误
H0不真
第二类错误
正确
第一类(弃真): 第二类(取伪):
假设检验
P{拒绝H0|H0为真}= , P{接受H0|H0不真}= .
(α=0.05)
解:正态总体X~N(μ,σ2),已知σ=2
要检验的假设为
H0 : 40, H1 : 40
选择检验统计量
Z X 0 ~ N (0,1) / n
假设检验
首页 返回 退出
解:正态总体X~N(μ,σ2),已知σ=2
要检验的假设为
H0 : 40, H1 : 40
选择检验统计量
由样本数据计算,得 x 100.104 计算统计量Z的观测值,得
Z 100.104 100 0.658 1.96 0.5 / 10
没有落入 拒绝域
结论:不拒绝原假设,认为内径的值符合设计要求.
假设检验
首页 返回 退出
要检验的假设为
H0 : 100, H1 : 100
(2)未知σ2 ,选择检验统计量
没有落入 拒绝域
结论:不拒绝原假设,认为内径的值符合设计要求.
假设检验
首页 返回 退出
例2 某厂生产的固体燃料推进器的燃烧率服从正态分 布X~N(40,22),现在采用技术研发部设计的新方法 生产了一批推进器,随机测试25只,测得燃烧率的 样本均值为 x 41.25 ,假设在新方法下σ=2,问用 新方法生产的推进器的燃烧率是否有显著的提高?
概率论与数理统计(8)假设检验
概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。
由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题1引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?问题2记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题3则问题等价于检验H0成立,还是H1成立.某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题4则问题等价于检验H0成立,还是H1成立.自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5记服从指数分布,不服从指数分布.则问题也等价于检验H0成立,还是H1成立.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。
概率论与数理统计 8.1(假设检验的思想方法和基本概念)
x 0 当观察值 x 满足 k时, 拒绝假设H 0 , / n x 0 反之, 当观察值 x 满足 k时, 接受假设H 0 . / n
X 0 因为当H 0为真时 Z ~ N (0,1), / n
于是,当原假设 H0:μ =0.5 成立时,有:
带概率性质的反证法的逻辑是: 即如果假设H0是正确的话,出现一个概率很 小的事件,则以很大的把握否定假设H0.
8.1.1 假设检验的思想方法
下面分别推出这两种检验的拒绝域: (1) 右边检验: H0: 0 H1: > 0
对于给定的小概率 , 由图8-2易知
/ n
由于X~N(, 2) ,所以 Z X ~ N (0,1)
左侧检验
(显著性水平与拒绝域 )
抽样分布
拒绝域
置信水平
1- 接受域
临界值
H0值
样本统计量
观察到的样本统计量
8.1.1 假设检验的思想方法
再考察下面的例子. 【例8.2】一台包装机包装洗衣粉,额定标准重量为500g, 根据以往经验,包装机的实际装袋重量服从正态N(,2), 其中 = 15g通常不会变化
H0 : p 0.03
1 [(1 p)10 10 p(1 p)9 ]
d f ( p) 8 90 p(1 p) 0 dp
当 p 0.03 时,f ( p)单调增加
当 p 0.03 时,
f ( p) P{Y 2; p} 1 [(1 p)10 10 p(1 p)9 ] f (0.03) P{Y 2; 0.03} 0.035 0.05
当样本容量固定时 , 选定后, 数 k 就可以确 x 0 定, 然后按照统计量 Z 的观察值的绝对 / n 值大于等于 k 还是小于 k 来作决定.
概率论与数理统计-假设检验
14
若
取伪的概率较大.
15
/2
0.12 0.1
0.08 0.06 0.04 0.02
/2 H0 真
60 62.5 65 67.5 70 72.5 75
0.12 0.1
0.08 0.06 0.04 0.02
H0 不真
67.5 70 72.5 75 77.5 80 82.5
16
现增大样本容量,取n = 64, = 66,则
41
两个正态总体
设 X ~ N ( 1 1 2 ), Y ~ N ( 2 2 2 )
两样本 X , Y 相互独立, 样本 (X1, X2 ,…, Xn ), ( Y1, Y2 ,…, Ym ) 样本值 ( x1, x2 ,…, xn ), ( y1, y2 ,…, ym )
显著性水平
42
(1) 关于均值差 1 – 2 的检验
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布拒绝域 Nhomakorabea1 – 2 = 1 – 2
1 – 2 1 – 2 <
1 – 2 1 – 2 > ( 12,22 已知)
43
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布
1 – 2 = 1 – 2
拒绝域
1 – 2 1 – 2 <
1 – 2 1 – 2 >
12, 22未知
12
=
2 2
其中
44
(2)
关于方差比
2 1
/
2 2
的检验
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布
概率论与数理统计第八章假设检验
较大、较小是一个相对的概念,合理的界限在何 处?应由什么原则来确定?
问题是:如何给出这个量的界限? 这里用到人们在实践中普遍采用的一个原则:
小概率事件在一次试验 中基本上不会发生(若发 生了则认为假设是错 )
在假设检验中,称这个小概率为显著性水平,用表示. 如假 H 0:设 0,小概率 P {X 事 0u 件 } 为
查找 0 .9得 5 表分 中 xz0 位 .0 51 .6 点 4现 5 x010.4 6 1301 5 7.4 6 10
当Zz时拒H绝 0,Z
x0
1071.42.78 81
z
1.645
n
在 拒 绝 域,拒 内绝H0 ,接 受H1,即 抗 拉 强 度 提
(另:P182 例2 Z检验,单侧)
第二节 正态总体均值的假设 检验
单个正态总体 均值的检验 两个正态总体均值差的检验 小结
一、单个总体 N ( , 2 ) 参数的检验 设 X ~ N ( 总 ,2 ) 样 ; ( X 体 1 ,X 2 , 本 ,X n )
1.2已知, 未知,检 验
(1)检H 验 0:0;备 择H 1 检 :验 0 检 验, 水双 平侧 检 验
假设进行 即判 判假 断 断 H 设 0:0;备择H 假 1:设 0
小概率 :样 事本 件 X 与 均 是所 值假设 0相的 X 差 期 0 望
不能,若 太相 大差太 H 0 大则拒绝
小概P 率 {X 事 0件 u}
u 是 2
所选取合适U 的的 2统 分 计位 量点
2
1
P{X0u}x0u为拒绝 2 区域
z z 0 . 0 , 2 ( z 0 . 0 5 ) 2 P ( Z 5 z 0 . 0 ) 2 1 5 P ( Z z 0 . 0 ) 2 1 5 0 . 0 0 . 2 95 7 2 分位点的定义
统计学中的随机过程和假设检验
统计学中的随机过程和假设检验统计学是一门关于数据收集、分析、解释和推断的学科。
主要目的是通过概率模型来描述现象并进行推断、预测和决策。
在统计学的几个基本领域中,随机过程和假设检验是两个非常重要的概念。
这篇文章将分别从随机过程和假设检验两个方面来介绍它们在统计学中的作用。
随机过程随机过程是一系列随机事件的序列,它可以用来描述随时间变化的随机现象。
随机过程在金融学、通信工程、环境科学、物理学等领域中都有广泛的应用。
在统计学中,随机过程可以用来描述和分析随机数据的动态性质,包括变化率、趋势、周期性等。
统计学中最常用的随机过程是马尔可夫过程。
马尔可夫过程是一种随机过程,其下一个状态只与当前状态有关,与历史状态无关。
这个概念有助于描述一些自然和社会现象,如股票价格、疾病传播模型等。
马尔可夫过程在统计学中的应用有很多,比如在经济预测中建立经济模型,分析市场的价格走势。
此外,马尔可夫过程还可以用于建模声音、图像和视频等数学模型,用于图像和视频的压缩、去噪和分割。
其他的随机过程比如布朗运动、泊松过程、扩散过程也在实际中经常被使用。
比如布朗运动模型可以用于研究股票价格的变化;泊松过程可以用于研究交通拥堵的情况;而扩散过程则可以用于研究化学反应速率的变化。
假设检验假设检验也是统计学中非常重要的一个概念,它是通过对数据进行推断来检验一个假设是否成立的方法。
在科学研究中,我们经常需要对一个或多个假设进行测试,如新药是否有效、广告效果是否显著等等。
在这些情况下,我们需要使用假设检验方法来对这些假设进行验证。
假设检验需要依据特定的假设、样本数据,并进行统计分析,从而得到假设的可靠程度。
假设检验分为两类:参数检验和非参数检验。
参数检验是指假设检验过程中所依赖的模型是参数化的,需要依据参数来计算概率值。
非参数检验是不依赖参数,通常使用分布自由度(degree of freedom)或自由度(degree of order)来计算概率值。
概率论与数理统计第八章假设检验
为判断所作的假设是否正确, 从总体中抽取 样本, 根据样本的取值, 按一定的原则进行检 验, 然后, 作出接受或拒绝所作假设的决定.
整理课件
2
我们主要讨论的假设检验的内容有
参数检验 总体均值、均值差的检验 总体方差、方差比的检验
H0: Θ0 vs H1: Θ1,
根据样本,构造一个检验统计量T 和检验法则: 若与T的取值有关的一个小概率事件W发生,则 否定H0,否则接受H0,而且要求
P(W|H0)
此时称W为拒绝域,整为理课检件 验水平。
11
例 3. 某厂生产的螺钉,按标准强度为68克/mm2,
而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 E ( X ) = = 68, 则认为这批螺钉符合要求,否
7
所以我们否定H0, 认为隧道南的路面发生交 通事故的概率比隧道北大.
做出以上结论也有可能犯错误。这是因为 当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯 错误。这一概率正是P=0.043.
于是, 我们判断正确的概率是1-0.043=95.7%
整理课件
8
假设检验中的基本概念和检验思想 (1) 根据问题的背景, 提出原假设
再作一个备择假设
H1: p> 0.35. 在本问题中,如果判定H0不对,就应当承认H1.
检验: 三起交通事故的发生是相互独立的, 他们
之间没有联系.
如果H0为真, 则每一起事故发生在隧道南的 概率都是0.35, 于是这三起交通事故都发生在隧
道南的概率是
P= 0.353 ≈ 0.043.
数理统计之假设检验
数理统计之假设检验概述在统计学中,假设检验是一种常用的统计推断方法,用于验证关于总体或总体参数的某个假设。
通过采集样本数据,计算统计量,并将其与理论上的期望值进行比较,我们可以对原假设是否成立进行推断。
本文将介绍假设检验的基本概念、步骤和常见假设检验方法。
基本概念原假设和备择假设在进行假设检验时,我们需要先提出原假设(null hypothesis,H0)和备择假设(alternative hypothesis,H1)。
原假设通常是我们希望通过统计推断得到支持的假设,而备择假设则是与原假设相反或者需要进一步验证的假设。
类型I错误和类型II错误在假设检验中,可能会犯两种类型的错误。
类型I错误是在原假设为真的情况下,拒绝了原假设的错误推断。
而类型II错误则是在备择假设为真的情况下,接受了原假设的错误推断。
通常我们会设定显著性水平(significance level),用于控制类型I错误的概率。
P值P值是指在原假设为真的情况下,观察到的统计量或更极端结果出现的概率。
当P值小于预设的显著性水平时,我们有足够的证据拒绝原假设。
P值越小,我们对原假设的拒绝程度越大。
假设检验步骤进行假设检验通常包括以下几个步骤:1.提出原假设和备择假设。
2.选择适当的假设检验方法。
3.采集样本数据,并计算统计量。
4.根据计算得到的统计量,计算P值。
5.将P值与预设的显著性水平进行比较。
6.根据比较结果,作出关于原假设的结论。
常见假设检验方法单样本t检验单样本t检验用于检验一个样本平均值是否与已知的总体平均值有显著差异。
在进行单样本t检验时,我们首先提出原假设,即样本平均值等于总体平均值。
然后采集样本数据,计算出样本平均值和标准误差,最后计算出t值和P值,判断样本平均值是否显著不同于总体平均值。
双样本t检验双样本t检验用于检验两个独立样本的平均值是否有显著差异。
在进行双样本t检验时,我们首先提出原假设,即两个样本的平均值相等。
数理统计中的假设检验方法
数理统计中的假设检验方法在数理统计中,假设检验方法是一种重要的统计推断方法,旨在通过对样本数据进行统计分析,对总体参数的假设进行验证。
本文将介绍假设检验的基本概念和步骤,并介绍几种常见的假设检验方法。
一、假设检验的基本概念和步骤假设检验是基于样本数据对总体参数进行推断的方法,其基本思想是通过假设检验来判断总体参数是否符合某种特定的假设。
例如,我们可以对一个总体的均值是否等于某个特定值进行假设检验。
假设检验的基本步骤如下:1. 建立原假设(H0)和备择假设(H1):原假设是我们要进行检验的假设,备择假设是原假设的对立假设。
例如,原假设可以是总体均值等于某个特定值,备择假设可以是总体均值不等于该特定值。
2. 选择适当的显著性水平(α):显著性水平是我们在进行假设检验时所允许的犯第一类错误的概率,通常取0.05或0.01。
3. 根据样本数据计算检验统计量:检验统计量是用来判断原假设是否成立的量,其选择取决于具体的假设检验方法。
4. 设置拒绝域:拒绝域是指当检验统计量的取值落入该域时,我们拒绝原假设。
拒绝域的划定依赖于显著性水平和假设检验方法。
5. 做出统计判断:根据对样本数据的分析以及检验统计量是否落入拒绝域,我们可以判断是否拒绝原假设。
6. 得出结论:根据统计判断,我们可以得出关于总体参数的统计结论,并对其进行解释。
二、常见的假设检验方法1. 单样本 t 检验:单样本t 检验用于判断一个样本的均值是否与某个已知的数值相等。
它常用于样本容量较小(小于30)且总体标准差未知的情况。
2. 独立样本 t 检验:独立样本 t 检验用于比较两个独立样本的均值是否相等。
它常用于独立样本间的均值差异的比较。
3. 配对样本 t 检验:配对样本 t 检验用于比较同一组样本在两个时间点或两个条件下的均值是否相等,常用于配对样本的差异性分析。
4. 卡方检验:卡方检验用于检验两个或多个分类变量之间的关联性。
它可用于判断观察到的频数与期望的频数是否有显著差异。
概率论与数理统计(假设检验的思想方法和基本概念)
= {| z | z0.025}={| z |1.96}
由样本数据计算得到
x 0 z / n
(497 506 518 524 488 517 510 515 516) / 9 500 2.02 15 / 9
因此,假设检验问题可能会犯如下两类错误:
第一类错误(“弃真”):实际情况是H0成立,而检验 的结果表明H0不成立,拒绝了H0. 第二类错误(“存伪”):实际情况是H0不成立,H1成 立,而检验的结果表明H0成立,接受了H0.
下面我们来研究一下犯这两类错误的概率.
8.1.2 假设检验的两类错误
犯第一类错误的概率:
X
H1: < 0
~ N (0,1)
/ n 对于给定的小概率 , 由图8-3知
X P z , / n X X 0 , 当原假设成立时,由于 / n / n X 0 所以 P z , / n X 0 即 z 是小概率事件. / n
8.1.1 假设检验的思想方法
根据上例可以看到假设检验的思想方法是:
(1) 提出假设; (2) 在假设成立的条件下构造一个小概率事件; (3) 由样本数据判断小概率事件是否发生了,如果小 概率事件发生了,根据“小概率原理”,作出否定原 假设的推断.
8.1.1 假设检验的思想方法
再考察下面的例子. 【例8.2】一台包装机包装洗衣粉,额定标准重量为500g, 根据以往经验,包装机的实际装袋重量服从正态N(,2), 其中 = 15g通常不会变化
x 0
这违背了小概率原理, 原因是原假设出了问 题
/ n
概率论与数理统计第八章 假设检验
第八章假设检验第一节概述统计推断中的另一类重要问题是假设检验(Hypothesis testing).当总体的分布函数未知,或只知其形式而不知道它的参数的情况时,我们常需要判断总体是否具有我们所感兴趣的某些特性.这样,我们就提出某些关于总体分布或关于总体参数的假设,然后根据样本对所提出的假设作出判断:是接受还是拒绝.这就是本章所要讨论的假设检验问题.我们先从下面的例子来说明假设检验的一般提法.例8.1某工厂用包装机包装奶粉,额定标准为每袋净重0.5kg.设包装机称得奶粉重量X服从正态分布N(μ,σ2).根据长期的经验知其标准差σ=0.015(kg).为检验某台包装机的工作是否正常;随机抽取包装的奶粉9袋,称得净重(单位:kg)为0.499 0.515 0.508 0.512 0.4980.515 0.516 0.513 0.524问该包装机的工作是否正常?由于长期实践表明标准差比较稳定,于是我们假设X~N(μ,0.0152).如果奶粉重量X 的均值μ等于0.5kg,我们说包装机的工作是正常的.于是提出假设:H0:μ=μ0=0.5;H1:μ≠μ0=0.5.这样的假设叫统计假设.1.统计假设关于总体X的分布(或随机事件之概率)的各种论断叫统计假设,简称假设,用“H”表示,例如:(1)对于检验某个总体X的分布,可以提出假设:H0:X服从正态分布,H1: X不服从正态分布.H0:X服从泊松分布,H1: X不服从泊松分布.(2)对于总体X的分布的参数,若检验均值,可以提出假设:H0:μ=μ0;H1:μ≠μ0.H0:μ≤μ0;H1:μ>μ0.若检验标准差,可提出假设:H0:σ=σ0;H1:σ≠σ0.H0:σ≥σ0;H1:σ<σ0.这里μ0,σ0是已知数,而μ=E(X),σ2=D(X)是未知参数.上面对于总体X的每个论断,我们都提出了两个互相对立的(统计)假设:H0和H1,显然,H0与H1只有一个成立,或H0真H1假,或H0假H1真,其中假设H0,称为原假设(Original hypothesis)(又叫零假设、基本假设),而H1称为H0的对立假设(又叫备择假设).在处理实际问题时,通常把希望得到的陈述视为备择假设,而把这一陈述的否定作为原假设.例如在上例中,H0:μ=μ0=0.5为原假设,它的对立假设是H1:μ≠μ0=0.5.统计假设提出之后,我们关心的是它的真伪.所谓对假设H0的检验,就是根据来自总体的样本,按照一定的规则对H0作出判断:是接受,还是拒绝,这个用来对假设作出判断的规则叫做检验准则,简称检验,如何对统计假设进行检验呢?我们结合上例来说明假设检验的基本思想和做法.2.假设检验的基本思想 在例8.1中所提假设是H 0:μ=μ0=0.5(备择假设H 1:μ≠μ0).由于要检验的假设涉及总体均值μ,故首先想到是否可借助样本均值这一统计量来进行判断.从抽样的结果来看,样本均值x =19(0.499+0.515+0.508+0.512+0.498+0.515+0.516+0.513+0.524)=0.5110,与μ=0.5之间有差异.对于与μ0之间的差异可以有两种不同的解释.(1) 统计假设H 0是正确的,即μ=μ0=0.5,只是由于抽样的随机性造成了与μ0之间的差异;(2) 统计假设H 0是不正确的,即μ≠μ0=0.5,由于系统误差,也就是包装机工作不正常,造成了与μ0之间的差异.对于这两种解释到底哪一种比较合理呢?为了回答这个问题,我们适当选择一个小正数α(α=0.1,0.05等),叫做显著性水平(Level of significance).在假设H0成立的条件下,确定统计量X -μ0的临界值αλ,使得事件{|X -μ0|>αλ}为小概率事件,即P{|X -μ0|>αλ}=α.(8.1)例如,取定显著性水平α=0.05.现在来确定临界值λ0.05.因为X ~N (μ,σ2),当H 0:μ=μ0=0.5为真时,有X ~N (μ0,σ2),于是2011~,n i i X X N n n σμ=⎛⎫= ⎪⎝⎭∑,ZX X =N (0,1),所以 P {|Z |>z α/2}=α.由(8.1)式,有P Z ⎧>⎨⎩=α,因此22,z z αααλ==λ0.05=z 0.0250.015/3=0.0098. 故有P {|X -μ0|>0.0098}=0.05.因为α=0.05很小,根据实际推断原理,即“小概率事件在一次试验中几乎是不可能发生的”原理,我们认为当H 0为真时,事件{|X -μ0|>0.0098}是小概率事件,实际上是不可能发生的.现在抽样的结果是|x -μ0|=|0.5110-0.5|=0.0110>0.0098.也就是说,小概率事件{|X -μ0|>0.0098}居然在一次抽样中发生了,这说明抽样得到的结果与假设H 0不相符,因而不能不使人怀疑假设H 0的正确性,所以在显著性水平α=0.05下, 我们拒绝H 0,接受H 1,即认为这一天包装机的工作是不正常的.通过上例的分析,我们知道假设检验的基本思想是小概率事件原理,检验的基本步骤是: (1) 根据实际问题的要求,提出原假设H 0及备择假设H 1;(2) 选取适当的显著性水平α(通常α=0.10,0.05等)以及样本容量n ;(3) 构造检验用的统计量U ,当H 0为真时,U 的分布要已知,找出临界值αλ使P {|U |>αλ}=α.我们称|U |>αλ所确定的区域为H 0的拒绝域(Rejection region),记作W ; (4) 取样,根据样本观察值,计算统计量U 的观察值U 0;(5) 作出判断,将U 的观察值U 0与临界值αλ比较,若U 0落入拒绝域W 内,则拒绝H 0接受H 1;否则就说H 0相容(接受H 0).3.两类错误由于我们是根据样本作出接受H 0或拒绝H 0的决定,而样本具有随机性,因此在进行判断时,我们可能会犯两个方面的错误:一类错误是,当H 0为真时,而样本的观察值U 0落入拒绝域W 中,按给定的法则,我们拒绝了H 0,这种错误称为第一类错误.其发生的概率称为犯第一类错误的概率或称弃真概率,通常记为α,即P {拒绝H 0|H 0为真}=α;另一种错误是,当H 0不真时,而样本的观察值落入拒绝域W 之外,按给定的检验法则,我们却接受了H 0.这种错误称为第二类错误,其发生的概率称为犯第二类错误的概率或取伪概率,通常记为β,即P {接受H 0|H 0不真}=β.显然这里的α就是检验的显著性水平.总体与样本各种情况的搭配见表8-1.表8-1对给定的一对H 0和H 1,总可以找到许多拒绝域W .当然我们希望寻找这样的拒绝域W ,使得犯两类错误的概率α与β都很小.但是在样本容量n 固定时,要使α与β都很小是不可能的,一般情形下,减小犯其中一类错误的概率,会增加犯另一类错误的概率,它们之间的关系犹如区间估计问题中置信水平与置信区间的长度的关系那样.通常的做法是控制犯第一类错误的概率不超过某个事先指定的显著性水平α(0<α<1),而使犯第二类错误的概率也尽可能地小.具体实行这个原则会有许多困难,因而有时把这个原则简化成只要求犯第一类错误的概率等于α,称这类假设检验问题为显著性检验问题,相应的检验为显著性检验.在一般情况下,显著性检验法则是较容易找到的,我们将在以下各节中详细讨论.在实际问题中,要确定一个检验问题的原假设,一方面要根据问题要求检验的是什么,另一方面要使原假设尽量简单,这是因为在下面将讲到的检验法中,必须要了解某统计量在原假设成立时的精确分布或渐近分布.下面各节中,我们先介绍正态总体下参数的几种显著性检验,再介绍总体分布函数的假设检验.第二节 单个正态总体的假设检验1.单个正态总体数学期望的假设检验(1) σ2已知关于μ的假设检验(Z 检验法(Z -test)) 设总体X ~N (μ,σ2),方差σ2已知,检验假设H 0:μ=μ0;H 1:μ≠μ0 (μ0为已知常数) 由X ~N (μ,n σ)X N (0,1), 我们选取ZX (8.2)作为此假设检验的统计量,显然当假设H 0为真(即μ=μ0正确)时,Z ~N (0,1),所以对于给定的显著性水平α,可求z α/2使P {|Z |>z α/2}=α,见图8-1,即P {Z <-z α/2}+P {Z >z α/2}=α.从而有P {Z >z α/2}=α/2, P {Z ≤z α/2}=1-α/2.图8-1利用概率1-α/2,反查标准正态分布函数表,得双侧α分位点(即临界值)z α/2. 另一方面,利用样本观察值x 1,x 2,…,x n 计算统计量Z 的观察值z 0x (8.3)如果:(a )|z 0|>z α/2,则在显著性水平α下,拒绝原假设H 0(接受备择假设H 1),所以|z 0|>z α/2便是H0的拒绝域.(b ) |z 0|≤z α/2,则在显著性水平α下,接受原假设H 0,认为H 0正确.这里我们是利用H0为真时服从N (0,1)分布的统计量Z 来确定拒绝域的,这种检验法称为Z 检验法(或称U 检验法).例8.1中所用的方法就是Z 检验法.为了熟悉这类假设检验的具体作法,现在我们再举一例.例8.2 根据长期经验和资料的分析,某砖厂生产的砖的“抗断强度”X 服从正态分布,方差σ2=1.21.从该厂产品中随机抽取6块,测得抗断强度如下(单位:kg ·cm -2):32.56 29.66 31.64 30.00 31.87 31.03检验这批砖的平均抗断强度为32.50kg ·cm -2是否成立(取α=0.05,并假设砖的抗断强度的方差不会有什么变化)?解 ① 提出假设H 0:μ=μ0=32.50;H 1:μ≠μ0. ② 选取统计量ZX ,若H 0为真,则Z ~N (0,1).③ 对给定的显著性水平α=0.05,求z α/2使P {|Z |>z α/2}=α,这里z σ/2=z 0.025=1.96.④ 计算统计量Z 的观察值:|z 0| ≈3.05.⑤ 判断:由于|z 0|=3.05>z 0.025=1.96,所以在显著性水平α=0.05下否定H 0,即不能认为这批产品的平均抗断强度是32.50 kg ·cm -2.把上面的检验过程加以概括,得到了关于方差已知的正态总体期望值μ的检验步骤: (a ) 提出待检验的假设H 0:μ=μ0;H 1:μ≠μ0. (b ) 构造统计量Z ,并计算其观察值z 0:ZX ,z 0x(c ) 对给定的显著性水平α,根据P {|Z |>z α/2}=α,P {Z >z α/2}=α/2,P {Z ≤z α/2}=1-α/2查标准正态分布表,得双侧α分位点z α/2. (d ) 作出判断:根据H 0的拒绝域 若|z 0|>z α/2,则拒绝H 0,接受H 1; 若|z 0|≤z α/2,则接受H 0.(2) 方差σ2未知,检验μ(t 检验法(t -test)) 设总体X ~N (μ,σ2),方差σ2未知,检验H 0:μ=μ0;H 1:μ≠μ0.由于σ2X 便不是统计量,这时我们自然想到用σ2的无偏估计量——样本方差S 2代替σ2,由于X t (n -1),故选取样本的函数tX (8.4)图8-2作为统计量,当H 0为真(μ=μ0)时t ~t (n -1),对给定的检验显著性水平α,由P {|t |>t α/2(n -1)}=α, P {t >t α/2(n -1)}=α/2,见图8-2,直接查t 分布表,得t 分布分位点t α/2(n -1).利用样本观察值,计算统计量t 的观察值t 0x 因而原假设H0的拒绝域为|t 0|>t α/2(n -1). (8.5)所以,若|t 0|>t α/2(n -1),则拒绝H 0,接受H 1;若|t 0|≤t α/2(n -1),则接受原假设H 0.上述利用t 统计量得出的检验法称为t 检验法.在实际中,正态总体的方差常为未知,所以我们常用t 检验法来检验关于正态总体均值的问题.例8.3 用某仪器间接测量温度,重复5次,所得的数据是1250°,1265°,1245°,1260°,1275°,而用别的精确办法测得温度为1277°(可看作温度的真值),试问此仪器间接测量有无系统偏差?这里假设测量值X 服从N (μ,σ2)分布. 解 问题是要检验H 0:μ=μ0=1277;H 1:μ≠μ0.由于σ2未知(即仪器的精度不知道),我们选取统计量tX .当H 0为真时,t ~t (n -1),t 的观察值为|t 0|185.399-==>3.对于给定的检验水平α=0.05,由P {|t |>t α/2(n -1)}=α, P {t >t α/2(n -1)}=α/2, P {t >t 0.025(4)}=0.025,查t 分布表得双侧α分位点t α/2(n -1)=t 0.025(4)=2.776.因为|t 0|>3>t 0.025(4)=2.776,故应拒绝H 0,认为该仪器间接测量有系统偏差.(3) 双边检验与单边检验上面讨论的假设检验中,H 0为μ=μ0,而备择假设H 1:μ≠μ0意思是μ可能大于μ0,也可能小于μ0,称为双边备择假设,而称形如H 0:μ=μ0,H 1:μ≠μ0的假设检验为双边检验.有时我们只关心总体均值是否增大,例如,试验新工艺以提高材料的强度,这时所考虑的总体的均值应该越大越好,如果我们能判断在新工艺下总体均值较以往正常生产的大,则可考虑采用新工艺.此时,我们需要检验假设H 0:μ=μ0;H 1:μ>μ0. (8.6)(我们在这里作了不言而喻的假定,即新工艺不可能比旧的更差),形如(8.6)的假设检验,称为右边检验,类似地,有时我们需要检验假设H 0:μ=μ0;H 1:μ<μ0. (8.7)形如(8.7)的假设检验,称为左边检验,右边检验与左边检验统称为单边检验.下面来讨论单边检验的拒绝域. 设总体X ~N (μ,σ2),σ2为已知,x 1,x 2,…,x n 是来自X 的样本观察值.给定显著性水平α,我们先求检验问题H 0:μ=μ0;H 1:μ>μ0.的拒绝域.取检验统计量ZX ,当H 0为真时,Z 不应太大,而在H 1为真时,由于X 是μ的无偏估计,当μ偏大时,X 也偏大,从而Z 往往偏大,因此拒绝域的形式为ZX ≥k ,k 待定.因为当H 0X ~N (0,1),由P {拒绝H 0|H 0为真}=PX k ⎫≥⎬⎭=α得k =z α,故拒绝域为ZX ≥z α. (8.8)类似地,左边检验问题H 0:μ=μ0;H 1:μ<μ0.的拒绝域为ZX ≤-z α. 8.9)例8.4 从甲地发送一个信号到乙地,设发送的信号值为μ,由于信号传送时有噪声迭加到信号上,这个噪声是随机的,它服从正态分布N (0,22),从而乙地接到的信号值是一个服从正态分布N (μ,22)的随机变量.设甲地发送某信号5次,乙地收到的信号值为: 8.4 10.5 9.1 9.6 9.9由以往经验,信号值为8,于是乙方猜测甲地发送的信号值为8,能否接受这种猜测?取α=0.05.解 按题意需检验假设H 0:μ=8;H 1:μ>8.这是右边检验问题,其拒绝域如(8.8)式所示, 即 Z =X ≥z 0.05=1.645.而现在z 0=1.68>1.645,所以拒绝H 0,认为发出的信号值μ>8.2.单个正态总体方差的假设检验(2χ检验法(2χ-test)) (1) 双边检验设总体X ~N (μ,σ2),μ未知,检验假设H 0:σ2=σ02;H 1:σ2≠σ2.其中σ02为已知常数.由于样本方差S 2是σ2的无偏估计,当H 0为真时,比值22S σ一般来说应在1附近摆动,而不应过分大于1或过分小于1,由第六章知当H 0为真时2χ=220(1)n S σ-~2χ(n -1). (8.10)所以对于给定的显著性水平α有(图8-3)图8-3P {21/2αχ-(n -1)≤2χ≤2/2αχ(n -1)}=1-α. (8.11)对于给定的α,查2χ分布表可求得2χ分布分位点21/2αχ-(n -1)与2/2αχ(n -1).由(8.11)知,H 0的接受域是21/2αχ- (n -1)≤2χ≤2/2αχ (n -1); (8.12)H 0的拒绝域为2χ<21/2αχ-(n -1)或2χ>2/2αχ(n -1). (8.13)这种用服从2χ分布的统计量对个单正态总体方差进行假设检验的方法,称为2χ检验法. 例8.5 某厂生产的某种型号的电池,其寿命长期以来服从方差σ2=5000(小时2)的正态分布,现有一批这种电池,从它的生产情况来看,寿命的波动性有所改变,现随机抽取26只电池,测得其寿命的样本方差s 2=9200(小时2).问根据这一数据能否推断这批电池的寿命的波动性较以往有显著的变化(取α=0.02)?解 本题要求在α=0.02下检验假设H 0:σ2=5000;H 1:σ2≠5000.现在n =26,2/2αχ(n -1)=20.01(25)χ=44.314,21/2αχ- (n -1)= 20.99(25)χ=11.524,σ02=5000.由(8.13)拒绝域为2σ>44.314或220(1)n s σ-<11.524由观察值s 2=9200得22(1)n s σ-=46>44.314,所以拒绝H 0,认为这批电池寿命的波动性较以往有显著的变化.(2) 单边检验(右检验或左检验) 设总体X ~N (μ,σ2),μ未知,检验假设H 0:σ2≤σ02;H 1:σ2>σ02.(右检验)由于X ~N (μ,σ2),故随机变量*2χ=22(1)n S σ-~2χ(n -1).当H 0为真时,统计量2χ=22(1)n S σ-≤*2χ.对于显著性水平α,有P {*2χ>2αχ(n -1)}=α图8-4(图8-4).于是有P {2χ>2αχ(n -1)}≤P {*2χ>2αχ(n -1)}=α.可见,当α很小时,{2χ>2αχ(n -1)}是小概率事件,在一次的抽样中认为不可能发生,所以H 0的拒绝域是:2χ=22(1)n S σ->2αχ(n -1)(右检验). (8.14)类似地,可得左检验假设H 0:σ2≥σ02,H 1:σ2<σ2的拒绝域为2χ<21αχ-(n -1)(左检验). (8.15) 例8.6 今进行某项工艺革新,从革新后的产品中抽取25个零件,测量其直径,计算得样本方差为s 2=0.00066,已知革新前零件直径的方差σ2=0.0012,设零件直径服从正态分布,问革新后生产的零件直径的方差是否显著减小?(α=0.05)解 (1) 提出假设H 0:σ2≥σ02=0.0012;H 1:σ2<σ02. (2) 选取统计量2χ=22(1)n S σ-.*2χ=22(1)n S σ-~2χ(n -1),且当H 0为真时,*2χ≤2χ(3) 对于显著性水平α=0.05,查2χ分布表得21αχ-(n -1)=20.95(24)χ=13.848,当H 0为真时,P {2χ<21αχ- (n -1)}≤P 2212(1)(1)n S n αχσ-⎧⎫-<-⎨⎬⎩⎭=α. 故拒绝域为2χ<21αχ- (n -1)=13.848.(4) 根据样本观察值计算2χ的观察值2χ=220(1)240.000660.0012n s σ-⨯==13.2.(5) 作判断:由于2χ=13.2<21αχ- (n -1)=13.848,即2χ落入拒绝域中,所以拒绝H 0:σ2≥σ02,即认为革新后生产的零件直径的方差小于革新前生产的零件直径的方差.最后我们指出,以上讨论的是在均值未知的情况下,对方差的假设检验,这种情况在实际问题中较多.至于均值已知的情况下,对方差的假设检验,其方法类似,只是所选的统计量为2χ=2120()nii Xμσ=-∑.当σ2=σ2为真时,2χ~2χ(n ).关于单个正态总体的假设检验可列表8-2.表8-2注:上表中H0中的不等号改成等号,所得的拒绝域不变.第三节两个正态总体的假设检验上一节介绍了单个正态总体的数学期望与方差的检验问题,在实际工作中还常碰到两个正态总体的比较问题.1.两正态总体数学期望假设检验(1)方差已知,关于数学期望的假设检验(Z检验法)设X~N(μ1,σ12),Y~N(μ2,σ22),且X,Y相互独立,σ12与σ22已知,要检验的是H0:μ1=μ2;H1:μ1≠μ2.(双边检验)怎样寻找检验用的统计量呢?从总体X 与Y 中分别抽取容量为n 1,n 2的样本X 1,X 2,…,1n X 及Y 1,Y 2,…,2n Y ,由于2111~,X N n σμ⎛⎫ ⎪⎝⎭,2222~,Y N n σμ⎛⎫⎪⎝⎭,E (X -Y )=E (X )-E (Y )=μ1-μ2, D (X -Y )=D (X )+D (Y )=221212n n σσ+,故随机变量X -Y 也服从正态分布,即X -Y ~N (μ1-μ2,221212n n σσ+).从而X Y ~N (0,1).于是我们按如下步骤判断.(a ) 选取统计量 ZX Y , (8.16)当H 0为真时,Z ~N (0,1).(b ) 对于给定的显著性水平α,查标准正态分布表求z α/2使P {|Z |>z α/2}=α,或P {Z ≤z α/2}=1-α/2. (8.17) (c ) 由两个样本观察值计算Z 的观察值z 0:z 0x y .(d ) 作出判断:若|z 0|>z α/2,则拒绝假设H 0,接受H 1; 若|z 0|≤z α/2,则与H 0相容,可以接受H 0.例8.7 A ,B 两台车床加工同一种轴,现在要测量轴的椭圆度.设A 车床加工的轴的椭圆度X ~N (μ1,σ12),B 车床加工的轴的椭圆度Y ~N (μ2,σ22),且σ12=0.0006(mm 2),σ22=0.0038(mm 2),现从A ,B 两台车床加工的轴中分别测量了n 1=200,n 2=150根轴的椭圆度,并计算得样本均值分别为=0.081(mm),=0.060(mm).试问这两台车床加工的轴的椭圆度是否有显著性差异?(给定α=0.05)解 ① 提出假设H 0:μ1=μ2;H 1:μ1≠μ2. ② 选取统计量ZX Y ,在H 0为真时,Z ~N (0,1).③ 给定α=0.05,因为是双边检验,α/2=0.025.P {|Z |>z α/2}=0.05, P {Z >z α/2}=0.025,P {Z ≤z α/2}=1-0.025=0.975.查标准正态分布表,得z α/2=z 0.025=1.96.④ 计算统计量Z 的观察值zz 0x y =.⑤ 作判断:由于|z 0|=3.95>1.96=z α/2,故拒绝H 0,即在显著性水平α=0.05下,认为两台车床加工的轴的椭圆度有显著差异.用Z 检验法对两正态总体的均值作假设检验时,必须知道总体的方差,但在许多实际问题中总体方差σ12与σ22往往是未知的,这时只能用如下的t 检验法.(2) 方差σ12,σ22未知,关于均值的假设检验(t 检验法) 设两正态总体X 与Y 相互独立,X ~N (μ1,σ12),Y ~N (μ2,σ22),σ12,σ22未知,但知σ12=σ22,检验假设H 0:μ1=μ2;H 1:μ1≠μ2.(双边检验) 从总体X ,Y 中分别抽取样本X 1,X 2,…,1n X 与Y 1,Y 2,…,2n Y ,则随机变量tX Y μμ---t (n 1+n 2-2),式中S w 2=22112212(1)(1)2n S n S n n -+-+-,S 12,S 22分别是X 与Y 的样本方差.当假设H 0为真时,统计量t ~t (n 1+n 2-2). (8.18)对给定的显著性水平α,查t 分布得t α/2(n 1+n 2-2),使得P {|t |>t α/2(n 1+n 2-2)}=α. (8.19)再由样本观察值计算t 的观察值t 0x y(8.20)最后作出判断:若|t 0|>t α/2(n 1+n 2-2),则拒绝H 0; 若|t 0|≤t α/2(n 1+n 2-2),则接受H 0.例8.8 在一台自动车床上加工直径为2.050毫米的轴,现在每相隔两小时,各取容量都为10的样本,所得数据列表如表8-3所示.12是未知常数.问这台自动车床的工作是否稳定?(取α=0.01)解 这里实际上是已知σ12=σ22=σ2,但σ2未知的情况下检验假设H 0:μ1=μ2;H 1:μ1≠μ2.我们用t 检验法,由样本观察值算得:x =2.063, y =2.059,s 12=0.00000956, s 22=0.00000489,s w 2=2212990.0000860.0000441010218s s ⨯+⨯+=+-=0.0000072.由(8.20)式计算得t 0=3.3.对于α=0.01,查自由度为18的t 分布表得t 0.005(18)=2.878.由于|t 0|=3.3>t 0.005(18)=2.878,于是拒绝原假设H 0:μ1=μ2.这说明两个样本在生产上是有差异的,可能这台自动车床受时间的影响而生产不稳定.2. 两正态总体方差的假设检验(F 检验法(F -test )) (1) 双边检验设两正态总体X ~N (μ1,σ12),Y ~N (μ2,σ22),X 与Y 独立,X 1,X 2,…,1n X 与Y 1,Y 2,…,2n Y 分别是来自这两个总体的样本,且μ1与μ2未知.现在要检验假设H 0:σ12=σ22;H 1:σ12≠σ22.在原假设H 0成立下,两个样本方差的比应该在1附近随机地摆动,所以这个比不能太大又不能太小.于是我们选取统计量F =2122S S . (8.21) 显然,只有当F 接近1时,才认为有σ12=σ22.由于随机变量F *=22112222//S S σσ ~F (n 1-1,n 2-1),所以当假设H 0:σ12=σ22成立时,统计量F =2122S S ~F (n 1-1,n 2-1). 对于给定的显著性水平α,可以由F 分布表求得临界值12a F-(n 1-1,n 2-1)与F α/2(n 1-1,n 2-1)使得 P { 12a F-(n 1-1,n 2-1)≤F ≤F α/2(n 1-1,n 2-1)}=1-α(图8-5),由此可知H 0的接受区域是12aF-(n 1-1,n 2-1)≤F ≤F α/2(n 1-1,n 2-1);而H 0的拒绝域为F <12a F-(n 1-1,n 2-1),或 F >F α/2(n 1-1,n 2-1).然后,根据样本观察值计算统计量F 的观察值,若F 的观察值落在拒绝域中,则拒绝H 0,接受H 1;若F 的观察值落在接受域中,则接受H 0.图8-5例8.9 在例8.8中我们认为两个总体的方差σ12=σ22,它们是否真的相等呢?为此我们来检验假设H 0:σ12=σ22(给定α=0.1).解 这里n 1=n 2=10,s 12=0.00000956,s 22=0.00000489,于是统计量F 的观察值为F =0.00000956/0.00000489=1.95.查F 分布表得F α/2(n 1-1,n 2-1)=F 0.05(9,9)=3.18,F 1-α/2(n 1-1,n 2-1)=F 0.95(9,9)=1/F 0.05(9,9)=1/3.18.由样本观察值算出的F 满足F 0.95(9,9)=1/3.18<F =1.95<3.18=F 0.05(9,9).可见它不落入拒绝域,因此不能拒绝原假设H 0:σ12=σ22,从而认为两个总体的方差无显著差异.注意:在μ1与μ2已知时,要检验假设H 0:σ12=σ22,其检验方法类同均值未知的情况,此时所采用的检验统计量是:F =12211122121()1()n i i n i i X n Y n μμ==--∑∑~F (n 1,n 2). 其拒绝域参看表8-4.表8-4(2) 单边检验可作类似的讨论,限于篇幅,这里不作介绍了.第四节总体分布函数的假设检验上两节中,我们在总体分布形式为已知的前提下,讨论了参数的检验问题.然而在实际问题中,有时不能确知总体服从什么类型的分布,此时就要根据样本来检验关于总体分布的χ检验法.假设.例如检验假设:“总体服从正态分布”等.本节仅介绍2χ检验法是在总体的分布为未知时,根据样本值x1,x2,…,x n来检验关于总体所谓2分布的假设H0:总体X的分布函数为F(x);H1:总体X的分布函数不是F(x)(8.22)的一种方法(这里的备择假设H1可不必写出).注意,若总体X为离散型,则假设(8.22)相当于H0:总体X的分布律为P{X=x i}=p i,i=1,2,…;(8.23)若总体X为连续型,则假设(8.22)相当于H0:总体X的概率密度为f(x). (8.24)在用2χ检验法检验假设H 0时,若在假设H 0下F (x )的形式已知,而其参数值未知,此时需先用极大似然估计法估计参数,然后再作检验.2χ检验法的基本思想与方法如下:(1) 将随机试验可能结果的全体Ω分为k 个互不相容的事件A 1,A 2,…,A k (1ki i A ==Ω,A i A j =∅,i ≠j ;i ,j =1,2,…,k ),于是在H 0为真时,可以计算概率ˆi p =P (A i )(i =1,2,…,k ).(2) 寻找用于检验的统计量及相应的分布,在n 次试验中,事件A i 出现的频率if n与概率ˆi p往往有差异,但由大数定律可以知道,如果样本容量n 较大(一般要求n 至少为50,最好在100以上),在H 0成立条件下ˆii f p n-的值应该比较小,基于这种想法,皮尔逊使用 2χ=21ˆ()ˆki i i if npnp =-∑ (8.25) 作为检验H 0的统计量,并证明了如下的定理.定理8.1 若n 充分大(n ≥50),则当H 0为真时(不论H 0中的分布属什么分布),统计量(8.25)总是近似地服从自由度为k -r -1的2χ分布,其中r 是被估计的参数的个数.(3) 对于给定的检验水平α,查表确定临界值2(1)k r αχ--使P {2χ>2(1)k r αχ--)}=α,从而得到H 0的拒绝域为2χ>2(1)k r αχ--).(4)由样本值x 1,x 2,…,x n 计算2χ的值,并与2(1)k r αχ--比较.(5) 作结论:若2χ>2(1)k r αχ--,则拒绝H 0,即不能认为总体分布函数为F (x );否则接受H 0.例8.10 一本书的一页中印刷错误的个数X 是一个随机变量,现检查了一本书的100页,记录每页中印刷错误的个数,其结果如表8-5所示.i =0.05)?解 由题意首先提出假设:H 0:总体X 服从泊松分布.P {X =i }=!e ii λλ-,i =0,1,2,…,这里H 0中参数λ为未知,所以需先来估计参数.由最大似然估计法得03614061ˆ+70100x λ⨯+⨯++⨯⨯===1.将试验结果的全体分为A 0,A 1,…,A 7两两不相容的事件.若H 0为真,则P {X =i }有估计111ˆˆ{}!!e e i p P X i i i --====,i =0,1,2,….例如10ˆˆ{0},e pP X -=== 11ˆˆ{1},e pP X -=== 12ˆˆ{2},2e pP X -=== ………………166701ˆˆˆ{7}11.!e i i i pP X p i -===≥=-=-∑∑ 计算结果如表8-6所示.将其中有些np i <5的组予以适当合并,使新的每一组内有np i ≥5,如表8-6所示,此处并组后k =4,但因在计算概率时,估计了一个未知参数λ,故24221ˆ()~(411).ˆi i i i f npnp χχ=-=--∑计算结果为2χ=1.460(表8-6).因为220.05(411)(2)αχχ--==5.991>1.46,所以在显著性水平为0.05下接受H 0,即认为总体服从泊松分布. 表8-68-7).n =61ii f=∑=200.要求在给定的检验水平α=0.05下检验假设H 0:抗压强度X ~N (μ,σ2).解 原假设所定的正态分布的参数是未知的,我们需先求μ与σ的极大似然估计值.由第七章知,μ与σ2的极大似然估计值为ˆx μ=, 2211ˆ()ni i x x n σ==-∑. 设*i x 为第i 组的组中值,我们有*1195102052624514200i ii x x f n ⨯+⨯++⨯==∑=221,{}2*222211ˆ()(26)10(16)262414200i ii x x f n σ=-=-⨯+-⨯++⨯∑=152,ˆσ=12.33. 原假设H 0改写成X 是正态N (221,12.332)分布,计算每个区间的理论概率值{}11ˆ()()i i i i i pP a X a μμΦΦ--=≤<=-, i =1,2,…,6, 其中ˆi i a xμσ-=, 22()i t i t μμ--∞=e d Φ. 为了计算出统计量2χ之值,我们把需要进行的计算列表如下(表8-8).表8-8从上面计算得出2χ的观察值为1.35.在检验水平α=0.05下,查自由度m =6-2-1=3的2χ分布表,得到临界值20.05(3)χ=7.815.由于2χ=1.35<7.815=20.05(3)χ,不能拒绝原假设,所以认为混凝土制件的抗压强度的分布是正态分布N (221,152).小 结有关总体分布的未知参数或未知分布形式的种种论断叫做统计假设.一般统计假设分为原假设H 0(在实际问题中至关重要的假设)及与原假设H 0对立假设即是备择假设H 1.假设检验就是人们根据样本提供的信息作出“接受H 0、拒绝H 1”或“拒绝H 0、接受H 1”的判断.假设检验的思想是小概率原理,即小概率事件在一次试验中几乎不会发生.这种原理是人们处理实际问题中公认的原则.由于样本的随机性,当H 0为真时,我们可能会作出拒绝H 0、接受H 1的错误判断(弃当样本容量n 固定时,我们无法同时控制犯二类错误,即减小犯第一类错误的概率,就会增大犯第二类错误的概率,反之亦然.在假设检验中我们主要控制(减小)犯第一类错误的概率.使P {拒绝H 0|H 0为真}≤α,其中α很小.(0<α<1),α称为检验的显著性水平,这种只对犯第一类错误的概率加以控制而不考虑犯第二类错误的概率的检验称为显著性假设检验.单个、两个正态总体的均值、方差的假设检验是本章重点问题,读者需掌握Z 检验法、2χ检验法、t 检验法等.这些检验法中原假设H 0备择假设H 1及H 0的拒绝域分别见表8-2、表8-4.重要术语及主题原假设 备择假设 检验统计量 单边检验 双边检验 显著性水平 拒绝域 显著性检验 一个正态总体的参数的检验 两个正态总体均值差、方差比的检验 总体分布函数的假设检验习 题 八1. 已知某炼铁厂的铁水含碳量在正常情况下服从正态分布N (4.55,0.1082).现在测了5炉铁水,其含碳量(%)分别为4.28 4.40 4.42 4.35 4.37问若标准差不改变,总体平均值有无显著性变化(α=0.05)? 2.某种矿砂的5个样品中的含镍量(%)经测定为:3.24 3.26 3.24 3.27 3.25设含镍量服从正态分布,问在α=0.01下能否接收假设:这批矿砂的含镍量为3.25. 3.在正常状态下,某种牌子的香烟一支平均1.1克,若从这种香烟堆中任取36支作为样本;测得样本均值为1.008(克),样本方差s 2=0.1(克2).问这堆香烟是否处于正常状态.已知香烟(支)的重量(克)近似服从正态分布(取α=0.05).4.某公司宣称由他们生产的某种型号的电池其平均寿命为21.5小时,标准差为2.9小时.在实验室测试了该公司生产的6只电池,得到它们的寿命(以小时计)为19,18,20,22,16,25,问这些结果是否表明这种电池的平均寿命比该公司宣称的平均寿命要短?设电池寿命近似地服从正态分布(取α=0.05).5.测量某种溶液中的水分,从它的10个测定值得出x =0.452(%),s =0.037(%).设测定值总体为正态,μ为总体均值,σ为总体标准差,试在水平α=0.05下检验. (1) H 0:μ=0.5(%);H 1:μ<0.5(%).(2)0H ':σ=0.04(%);1H ':σ<0.04(%). 6.某种导线的电阻服从正态分布N (μ,0.0052).今从新生产的一批导线中抽取9根,测其电阻,得s =0.008欧.对于α=0.05,能否认为这批导线电阻的标准差仍为0.005? 7.有两批棉纱,为比较其断裂强度,从中各取一个样本,测试得到: 第一批棉纱样本:n 1=200,x =0.532kg, s 1=0.218kg ; 第二批棉纱样本:n 2=200,x =0.57kg, s 2=0.176kg .设两强度总体服从正态分布,方差未知但相等,两批强度均值有无显著差异?(α=0.05) 8.两位化验员A ,B 对一种矿砂的含铁量各自独立地用同一方法做了5次分析,得到样本方差分别为0.4322(%2)与0.5006(%2).若A ,B 所得的测定值的总体都是正态分布,其方差分别为σA 2,σB 2,试在水平α=0.05下检验方差齐性的假设H 0:σA 2=σB 2; H 1:σA 2≠σB 2.9.在π的前800位小数的数字中,0,1,…,9相应的出现了74,92,83,79,80,73,77,75,76,91次.试用2χ检验法检验假设H 0:P (X =0)=P (X =1)=P (X =2)=…=P (X =9)=1/10,其中X 为π的小数中所出现的数字,α=0.10.10.在一副扑克牌(52张)中任意抽3张,记录3张牌中含红桃的张数,放回,然后再任抽。
[课件]浙大概率论与数理统计_第八章假设检验PPT
原则:保护原假设,即限制的前提下,使尽可能的小。
第二节 正态总体均值的假设检验
单个正态总体的均值检验
两个正态总体的均值检验
一、单个正态总体的均值检验 U检验法 1、方差已知 问题:总体 X~N(,2),2已知 假设 H0:=0;H1:≠0 双边检验
X 0 构造U统计量 U ~ N(0,1) H0为真的前提下 n X 0 由 P u 确定拒绝域 U u 2 2 n x 0 如果统计量的观测值 U u 2 n
则拒绝原假设;否则接受原假设
例1 由经验知某零件的重量X~N(,2),=15, =0.05;技术革新后,抽出6个零件,测得重量为 (单位:克)14.7 15.1 14.8 15.0 15.2 14.6,已 知方差不变,试统计推断,平均重量是否仍为15克? (=0.05)
解 由题意可知:零件重量X~N(,2),且技术 革新前后的方差不变2=0.052,要求对均值进行 检验,采用U检验法。 假设 H0:=15; H1: ≠15
则拒绝原假设;否则接受原假设
例2 化工厂用自动包装机包装化肥,每包重量服从正态 分布,额定重量为100公斤。某日开工后,为了确定包 装机这天的工作是否正常,随机抽取9袋化肥,称得平 均重量为99.978,均方差为1.212,能否认为这天的包 装机工作正常?(=0.1) 解 由题意可知:化肥重量X~N(,2),0=100 方差未知,要求对均值进行检验,采用T检验法。 假设 H0:=100; H1: ≠100
总体分布已 知,检验关 于未知参数 的某个假设
总体分布未知时的假设检验问题
二、基本原理
假设检验原理
假设检验所以可行,其理论背景为实际推断原理, 即“小概率原理”
概率论与数理统计PPT课件(共8章)第八章 假设检验
概
率
论
与
数 理
8.3
统
计 两个正态总体的假设检验
8.3.1 两个正态总体均值差的检验
1、σ12,σ22已知,关于μ1-μ2的检验
(1)提出原假设 H0 :1 2 及备择假设 H1 :1 2 .
(2)构造检验统计量 Z
(X Y)
12
2 2
,当 H0
成立时,
n1 n2
Z (X Y ) ~N (0 ,1) .
12
2 2
n1 n2
8.3.1 两个正态总体均值差的检验
1、σ12,σ22已知,关于μ1-μ2的检验
(3)对于给定的显著性水平 ,由 P{ | z | z /2} 确定 拒绝域 | z | z /2 . (4)利用样本值计算检验统计量 Z 的观测值.若| z | z /2 , 则拒绝 H0 ;若| z | z /2 ,则接受 H0 .
构造检验统计量 t
X 0 S/ n
.当 H0 成立时,由定理 6.2
可知 t X 0 ~t(n 1) . S/ n
8.2.1 单个正态总体均值的检验
2、σ2未知,关于μ的检验(t检验法)
(3)对于给定的显著性水平 ,利用 t 分布表求临界值 t/2 (n 1) , 使得 P{| t | t /2 (n 1)} ,从而确定拒绝域| t | t /2 (n 1) .
(4)利用样本值 x1 ,x2
,
,xn
计算检验统计量 t
X 0 S/ n
观测值,若 t 的观测值落在拒绝域内,则拒绝 H0 ,否则接受 H0 .
8.2.1 单个正态总体均值的检验
例 8.3 在例 8.2 中假定 2 未知,问这批瓷砖的平均抗断强度为 3.250 MPa 是否成立?
概率论与数理统计课件:8-2 假设检验
方法B:80.02 79.94 79.98 79.97 79.97 80.03
79.95 78.97
设这两个样本相互独立,且分别来自正态总体
N (1, 2 )和N (2 , 2 ),1,2 , 2均未知。
试求检验假设(取显著性水平α=0.05)
1.7921.
故拒绝原假设,认为方法A比方法B测得的 热融化要大。
(三)基于成对数据的检验(t检验)
• 为了比较两种产品、两种仪器或者两种方法的差 异,在相同的条件下做对比试验,得到一批成对 的观察值。然后分析观察数据作出推断。这种方
法称为逐对比较法。
设有n对相互独立的观察结果:( X1,Y1),( X2,Y2 ), ,( Xn,Yn ),
红光(x) 0.30 0.23 0.41 0.53 0.24 0.36 0.38 0.51
绿光(y) 0.43 0.32 0.58 0.46 0.27 0.41 0.38 0.61
D=x-y -0.13 -0.09 -0.17 0.07 -0.03 -0.05 0.0 -0.10
设 Di Xi Yi (i 1, 2,
P{| X 0 | k}
S/ n 由此 k t/2(n 1)
拒绝域为
W
{( x1,...,
xn ) :
|
x S
/
0
n
|
t / 2 (n
1)}
查表t/2(n-1), 计算
| x 0 |
S/ n
若其大于t/2(n-1) ,拒绝原假设。 否则,接受原假设。
例8.2.1 某工厂生产的一种螺钉,标准要求长度是
概率论与数理统计PPT课件第八章假设检验01.ppt
H0: p=0.35 vs H1: p>0.35. 其中的vs是versus的缩写.
10
参数检验的一般提法
一般来讲, 设X1, X2,…,Xn是来自总体X的样
本, 是总体X的未知参数, 但是已知 Θ0 Θ1,
它们是互不相交的参数集合. 对于假设
H0: Θ0 vs H1: Θ1,
根据样本,构造一个检验统计量T 和检验法则: 若与T的取值有关的一个小概率事件W发生,则 否定H0,否则接受H0,而且要求
P(W | H0 )
此时称W为拒绝域,为检验水平。
11
例 3. 某厂生产的螺钉,按标准强度为68克/mm2,
而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 E ( X ) = = 68, 则认为这批螺钉符合要求,否
H1: p> 0.35. 在本问题中,如果判定H0不对,就应当承认H1.
检验: 三起交通事故的发生是相互独立的, 他们 之间没有联系.
如果H0为真, 则每一起事故发生在隧道南的 概率都是0.35, 于是这三起交通事故都发生在隧 道南的概率是
P= 0.353 ≈ 0.043.
这是一个很小的概率, 一般不容易发生.
这不是 小概率事件, 没理由拒绝原假设。在不 准备继续抽样的情况下,作出接受原假设的决 定, 即该批产品可以出厂.
5
例2: 一条新建的南北交通干线全长10公里.公路 穿过一个隧道(长度忽略不计),隧道南面3.5公里, 北面6.5公里. 在刚刚通车的一个月中, 隧道南 发生了3起交通事故, 而隧道北没有发生交通事 故,能否认为隧道南的路面更容易发生交通事故?
则认为不符合要求.为此提出如下原假设
数理统计8-假设检验
并称此为实际推断原理, 其为判断假设的根据。 在假设检验时,若一次试验中小概率事件发生了,就
认为是不合理的。 小概率事件在一次试验中发生的概率 记为α,一般取 在假设检验中,称小概率α为显著水平、检验水平。
假设检验使用的方法是概率论的反证法:
即先对所关心的问题提出原假设 H0 , 然后运用样本 最后对H0成立 信息看在H0成立下会不会发生矛盾。 与否作出判断: 若小概率事件发生了, 则否定H0。 并称 H0相容。 若不发生,则接受H0, 概率反证法的逻辑是:如果小概率事件在一次试验 中居然发生, 我们就以很大的把握否定原假设.
很明显,不能由5罐容量的数据,在把握不大的情 况下就判断生产 不正常,也不能总认为正常,
有了问题不能及时发现,这也要造成损失.
如何处理这两者的关系,假设检验面对的就 是这种矛盾.
现在我们就来讨论这个问题.
在正常生产条件下,由于种种随机因素 的影响,每罐可乐的容量应在355毫升上下波 动. 这些因素中没有哪一个占有特殊重要的 地位. 因此,根据中心极限定理,假定每罐 容量服从正态分布是合理的.
第五步:判断 则H0相容,接受H0 则否定H0,接受H1 由于取用的统计量服从 Z(U)分布, 故称其为 Z(U) 检验法。 选择假设H1 表示Z可能大于μ0,也可能小于μ0。 这称为双边假设检验。
0
例1
铜丝的主要质量指标是折断力 某车间生产铜丝,
由资料可认为 今换了一批原料, X的大小。 从性能上看, 估计折断力的方差不会有变换, 但不知 折断力的大小有无差别。 (=0.05) 抽出10个样品,测得其折断力(斤)为 进行检验。 解 方差已知 第一步: 提出假设
不否定H0并不是肯定H0一定对,而只是 说差异还不够显著,还没有达到足以否定H0 的程度 . 所以假设检验又叫 “显著性检验”
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
解:问题归结为检验如下假设 H0: μ=15; H1: μ>15 (2未知)
已知:n 50, 0 15, X 15.8, S 0.5, 0.01 .
X 0 15.8 15 0.8, S 0.5 0.5 t n -1 ( ) t 49 (0.01) 2.4049 0.17, n 50 50 S 所以, X 0 tn -1 ( ) . n
总体分布未知情形 下的假设检验问题
例1:某车间用一台包装机包装葡萄糖, 包得的袋装糖 重是一个随机变量, 它服从正态分布。当机器正常时, 其均值为0.5kg, 标准差为0.015 kg。某日开工后为检 验包装机是否正常, 随机地抽取它所包装的糖9袋, 称 得净重量 (kg)为: 0.497, 0.506, 0.518, 0.524, 0.498, 0.511, 0.520, 0.515, 0.512。问: 从样本看机器是否正常?
现在我们来分析一下 : 取上述 c 后,犯第 一类错误的概率是多少?即,如果 H0 是正确 的,其被拒绝的概率是多少?
分析: 因为当 H0:μ=0.5 成立时,有
X 0.5 ~ N (0, 1) . 0.015 / 9
从而,P | X 0.5 | (0.015 / 9 ) z / 2 .
主讲: 路永钢 E-mail: ylu@
兰州大学信息科学与工程学院
Hale Waihona Puke •1第八节假设检验
下面,我们讨论不同于参数估计问题的 另一类统计推断问题—— 根据样本提供的信息,检验总体的某个 假设是否成立的问题。
这类问题称为假设检验。
假设检验
非参数检验
参数检验
总体分布已知情 形下,检验未知 参数的某个假设
用以上检验准则来处理我们的问题:
经计算, X 0.511 , c (0.015 / 9 ) z / 2 (0.015 / 9 ) 1.96 0.0098.
| X 0.5 | 0.011 c.
所以,拒绝 H0:μ=0.5,认为机器异常。
III. 方法原理
因为,当 H0:μ =0.5 成立时,
通常分别用 α 和 β 记犯第一、第二类错误 的概率,即
P{ 拒绝H 0 | H 0为真 }, P{ 接受H 0 | H 0为假 } .
在检验问题中,犯“弃真”和“取伪”两类错误 都总是不可避免的,并且减少犯第一类错误的概 率,就会增大犯第二类错误的概率;反之亦然。
问题: 犯两类错误的概率不能同时得到控制。
P拒绝接受 H 0 | H 0 为真 .
可见:用该方法进行检验时,犯第一类 错误的概率等于 ,即等于显著性水平。
§8.2 正态总体均值的假设检验
8.2.1 单正态总体 N(, 2) 均值 的检验 1. 双边检验 H0: μ = μ0;H1: μ≠μ0
X 0 ~ N (0, 1) . / n
建立假设:上面的任务是要通过样本检验 “ =0.5”的假设是否成立。
在数理统计中,把“ =0.5” 这样一个待 检验的假设记为“原假设”或“零假设”, 记成 “ H0: =0.5”。由Fisher提出。 原假设的对立面是“ ≠0.5”,称为 “对立假 设”或“备择假设”,记成 “ H1: ≠ 0.5”。 Neyman-Pearson 理论:把原假设和对立假设 合写在一起,就可以对不同的检验进行比较: H0: =0.5; H1: ≠0.5.
设X1, X2, „, Xm与Y1, Y2, „, Yn 分别为抽 自正态总体 N(1, 12)和 N(2, 22)的样本,记
X 和 S 分别为 X 1 , X 2 ,, X m 的均值和方差;
其中c (0.015 / 9 ) z / 2 .
X 0.5 称 | X 0.5 | 或 U 为检验统计量; 0.015 / 9
称 | X 0.5 | (0.015 / 9 ) z / 2 , 或
| X 0.5 | | U | z / 2 0.015 / 9
为 H0 的拒绝域。
以μ和σ分别表示这一天袋装葡萄糖重量总 体的均值和标准差。
检验“机器是否正常”等价于检验“X是 否服从正态分布N(0.5, 0.0152)”。
I. 如何建立检验模型
●
确定总体:记 X 为该车间包装机包装的袋装 葡萄糖的重量,则 X ~ N(, 0.0152);
●
●
明确任务:通过样本推断“是否等于0.5”;
例如:工厂生产的某产品的数量指标服 从正态分布,均值为 μ0; 采用新技术或新配 方后,产品质量指标还服从正态分布,但均 值为 。
我们想了解 “是否显著地大于μ0”, 即 采用新技术或新配方后产品的质量指标是否 显著地增加了。
单边检验 H0: μ =μ0; H1: μ >μ0 H0中的μ比H1小,即原假设成立,则 X 0 就不应太大;反之,如果 X 0 过大,就认 为原假设不成立。 在2已知情况下,根据定理6.4.1,知: 当原假设 成立时, X 0 ~ N (0, 1) . / n 由此可推出 P X 0 z .
n
所以, H 0的拒绝域为 X 0
n
z .
在2未知情况下,当原假设 成立时, X 0 ~ tn1 . S/ n 由此,可推出
S P X 0 tn1 ( ) . n
S 所以,H 0 的拒绝域为 X 0 tn-1 ( ) . n
II. 解决问题的思路
因样本均值是 μ 的一个很好的估计。所以, 当原假设 H0 成立,即 =0.5时, | X 0.5 | 应比较小;如果该值过大, H0 就可能不成立。 于是,我们就用| X 0.5 | 的大小来判定 H0 是否成立。 合理的做法应该是:找出一个界限 c,
当 | X 0.5 | c 时, 接受原假设 H 0 ; 当 | X 0.5 | c 时, 拒绝原假设 H 0 .
2. 单边检验 H0: μ =μ0; H1: μ >μ0
上一段中, H0:μ=μ0 的对立假设为 H1: μ ≠μ0 , 该假设称为双边对立假设。
而现在要处理的对立假设为H1:μ >μ0, 称 为右边对立假设。 类似地, H0: μ =μ0; H1: μ <μ0 中的对立假设 H1: μ <μ0 称为左边对立假设。 右边对立假设和左边对立假设统称为单边 对立假设,其检验为单边检验。
9 ) z / 2
发生, 就认为 H0不正确。
IV. 两类错误与显著性水平
当我们检验一个假设 H0 时,有可能犯以 下两类错误之一: Type I Error: H0 正确,但我们认为其 不正确,这就犯了“弃真”的错误。 Type II Error: H0 不正确,但却被误认 为正确,这就犯了“取伪”的错误。 因为检验统计量是随机的,所以,我们 总是以一定的概率犯以上两类错误。
| X 0.5 | P z / 2 , 0.015 / 9
小概率事件
即 P | X 0.5 | (0.015 / 9 ) z / 2 .
故, 取 c (0.015 / 9 ) z / 2 .
于是,我们就得到如下检验准则:
当 | X 0.5 | c 时, 接受原假设 H 0 ; 当 | X 0.5 | c 时, 拒绝原假设 H 0 .
在实际应用上, 2未知的情况是常见的。 此时常用样本方差 S 2代替未知的 2 ,这时要用 t 检验法
当 2未知时,根据基本定理 6.4.1 ,当 X H0: μ = μ0 成立时,有 ~t . S/ n X 0 所以, P tn1 ( / 2) , S/ n S 即 P X 0 tn1 ( / 2) . n
通过计算,得 X 241.5, S 98.725,
| X 0 || 241.5 225 | 16.5,
S 98.7259 t n 1 ( / 2) 2.1315 52.6086, n 16 S | X 0 | t n 1 ( / 2). n
所以,接受原假设为真,即认为元件 平均寿命 为225小时。
从而,拒绝原假设H0,即认为新的原材料 确实提高了绳子所能承受的最大拉力。
判断以下说法是否正确:
A、假设检验接受原假设H0说明H0是正确的概率很大 B、假设检验拒绝原假设H0说明H0是错误的概率很大
8.2.2 两个正态总体 N(1, 12) 和 N(2, 22) 均值的比较 在应用上,经常会遇到两个正态总体均 值的比较问题。 例如:比较甲、乙两厂生产的某种产品的 质量。将两厂生产的产品的质量指标分别看成 正态总体 N(1, 12) 和 N(2, 22)。 比较它们的产品质量指标的问题,就变为比 较这两个正态总体的均值 1和 2的的问题。
在统计学中, 通常选择控制犯第一类错误的概概率。 一般事先选定一个数 (0<<1),要求犯第一类 错误的概率不超过 。 称 为假设检验的显著性水平(Significance Level),简称水平。
例1(续):分析该例的显著性水平。
因为当 | X 0.5 | c 时,我们拒绝了原假设 H0:μ=0.5, 其中c (0.015 / 9 ) z / 2 .
例 2:某厂生产一种工业用绳,其质量指标是绳子所 承受的最大拉力,假定该指标服从正态分布,且该厂 原来生产的绳子指标均值μ0 =15公斤,采用一种新原 材料后,厂方称这种原材料提高了绳子的质量,也就 是说绳子所承受的最大拉力 μ比15公斤增大了。 为检验该厂的结论是否真实,从其新产品中随 机抽取50件,测得它们所承受的最大拉力的平均值为 15.8公斤,样本标准差 S=0.5公斤。