概率论与数理统计(8)假设检验
概率论与数理统计(8)假设检验
概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。
由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题1引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?问题2记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题3则问题等价于检验H0成立,还是H1成立.某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题4则问题等价于检验H0成立,还是H1成立.自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5记服从指数分布,不服从指数分布.则问题也等价于检验H0成立,还是H1成立.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。
概率论与数理统计-假设检验
14
若
取伪的概率较大.
15
/2
0.12 0.1
0.08 0.06 0.04 0.02
/2 H0 真
60 62.5 65 67.5 70 72.5 75
0.12 0.1
0.08 0.06 0.04 0.02
H0 不真
67.5 70 72.5 75 77.5 80 82.5
16
现增大样本容量,取n = 64, = 66,则
41
两个正态总体
设 X ~ N ( 1 1 2 ), Y ~ N ( 2 2 2 )
两样本 X , Y 相互独立, 样本 (X1, X2 ,…, Xn ), ( Y1, Y2 ,…, Ym ) 样本值 ( x1, x2 ,…, xn ), ( y1, y2 ,…, ym )
显著性水平
42
(1) 关于均值差 1 – 2 的检验
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布拒绝域 Nhomakorabea1 – 2 = 1 – 2
1 – 2 1 – 2 <
1 – 2 1 – 2 > ( 12,22 已知)
43
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布
1 – 2 = 1 – 2
拒绝域
1 – 2 1 – 2 <
1 – 2 1 – 2 >
12, 22未知
12
=
2 2
其中
44
(2)
关于方差比
2 1
/
2 2
的检验
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布
北京工业大学《概率论与数理统计》课件 第8章 正态总体均值的假设检验
在数理统计中,把 “ X 的均值 μ =10” 这样
的一个欲检验的假设称为 “原假设” 或 “零 假设”,记成 “ H0:μ =10”。这里的“H”是 从英文“ hypothesis ”的字头而来,“ 0 ” 是从 “null”或“zero” 含义而生。
该检验称为两样本 t 检验。
说明
上面,我们假定 12=22。当然,这是个 不得已而强加上去的条件。因为,如果不加 这个条件,就无法使用简单易行的 t 检验。
在实用中,只要我们有理由认为12和22 相差不是太大,就可使用上述方法。通常的 做法是:如果方差比检验未被拒绝(见下节), 就认为12和22相差不是太大。
又如:考察一项新技术对提高产品质量是 否有效,就把新技术实施前后生产的产品质量
指标分别看成正态总体 N(1, 12)和 N(2, 22)。
这时,所考察的问题就归结为检验这两个正态
总体的均值 1和 2是否相等的问题。
设X1, X2, …, Xm与Y1, Y2, …, Yn 分别为抽
自正态总体 N(1, 12) 和N(2, 22) 的样本,记
的大小检验 H0 是否
成立。
合理的做法应该是:找出一个界限 c,
这里的问题是:如何确定常数 c 呢? 细致地分析:根据定理 6.3.1,有
于是,当原假设 H0:μ =10 成立时,有
为确定常数 c,我们考虑一个很小的正数, 如 =0.05。当原假设H0:μ =10 成立时,有
于是,我们就得到如下检验准则:
即新技术或新配方对提高产品质量确实有效。
单边检验 H0: μ =μ0 ‹–› H1: μ >μ0
概率论与数理统计 第8章
现在的问题就是要判别新产品的寿命是服从 μ >1500 的
正态分布,还是服从 μ ≤1500的正态分布? 若是前者,我们 就说新产品的寿命有显著性提高;若是后者,就说新产品的 寿命没有显著性提高。
定义 1 将对总体提出的某种假设称为原假设,记为 H 0 ; 将与原假设矛盾的假设称为备择假设,记为 H 1 。
在例 8-1 中,我们把涉及的两种情况用假设的形式表示
出来,第一个假设 μ ≤1500 表示采用新工艺后产品平均寿命没 有显著性提高,第二个假设 μ >1500 表示采用新工艺后产品平
均寿命有显著性提高。第一个假设为原假设,即“ H 0 :μ
定义 8 给定犯第一类错误的概率不大于 α 所作的假设 检验称为显著性检验,称 α 为显著性水平。 例 8-2 某车间用一台包装机包装食盐,每袋食盐的净 重是一个随机变量,它服从正态分布。当包装机正常时,其 均值为 0.5kg ,标准差为 0.015kg 。某日开工后为检查包装 机工作是否正常,随机地抽取它所包装的食盐 9 袋,称得样 本均值 ������ X =0. 511kg ,问在显著性水平 α =0.05 下,这 天包装机工作是否正常。
由于无论是第一类错误还是第二类错误都是作假设检验 时的随机事件,因此在假设检验中它们都有可能发生。我们 当然希望尽可能使犯两类错误的概率都很小,但一般来说, 当样本的容量固定时,若刻意地减少犯一类错误的概率,则 犯另一类错误的概率往往会增大。若要使两类错误的概率都 减小,就需增大样本的容量。在给定样本容量的情况下,我 们总是对犯第一类错误的概率加以控制,使它不大于 α , 而不关心犯第二类错误的概率 β是增大了还是减小了,这样 的假设检验就是显著性检验。
概率论与数理统计:假设检验
教学内容一、引入新课:假设检验能解决什么问题呢?它能解决的问题分为两大类,第一类是参数假设检验,如果总体的分布已知,但是某个参数未知,对未知参数进行检验称为参数假设检验。
第二类是非参数假设检验,这时总体的分布未知,对未知分布的类型提出假设并检验,这时非参数假设检验。
二、讲授新课:1、假设检验的基本原理:假设检验的基本过程是,对于一个统计模型,先提出一个假设,然后根据抽取的样本对假设进行检验,然后做出接受或者拒绝假设的决策。
下面通过一个例子具体地看一下假设检验的基本原理。
在一次社交聚会中,一位女士宣称,她能区分熬好的咖啡中是先加的奶还是先加的糖,并当场试验,结果8杯中判断正确7杯,问这位女士真的具有这样的鉴别能力吗?解:假设该女士不具备鉴别能力,也就是她的判断是会乱猜的,因此,每杯咖啡猜正确的概率为21。
那么,8杯中猜对7杯的以上的概率可以利用古典概型的方法计算出来,其值为0.0352这个值较小,我们认为是小概率事件。
又因为一般认为在一次试验中,小概率事件是不可能发生的,但是这个事件发生了,从而产生了矛盾。
因此,认为是假设错误,拒绝假设,也就是该女士应该是具有鉴别咖啡的能力的。
这个问题的解决就是经历了,假设、检验、决策这三个环节。
其中假设就是女士不具备鉴别能力。
检验就是在假设的条件下,计算出发生事件的概率,发现这个概率是个小概率事件,在一次试验中不可能发生。
所以,最后的决策是拒绝假设。
(1)假设检验的推理依据:小概事件在一次试验中几乎不可能发生。
因此给出小概率事件的标准记为α,一般为发生概率小于为0.05或0.01,称为叫小概率事件。
(2)假设检验的基本思想是具有概率性质的反证法。
2、假设检验的例题:例 1 某单位新购进一台设备进行测试,已知该设备的误差服从正态分布,方差为0.01,正常情况下,系统误差为0,现在实际测试16次,误差值为x1,…,xn, 计算得出样本均值为0.072,问,能否认为该设备工作正常?首先,看看本题的已知条件:机器正常时,均值0=μ,方差为0.01,抽取的样本均值为0.072,样本容量为16,最后给出小概率的标准05.0=α,这也是小概率事件的标准,也就是事件的概率小于0.05是小概率事件,否则就不是小概率事件。
概率论与数理统计教案第八章
例8为比较新老品种的肥料对作物的效用有无显著差别,选用了各方面条件差不多的10个地块种上此作物.随机选用其中5块施上新肥料,而剩下的5块施上老肥料.等到收获时观察到施新肥的地块,平均年产333(单位:千斤),样本方差为32,施老肥的地块平均年产330,样本方差为40.假设作物产量服从正态分布,检验新肥是否比老肥效用上有显著提高(显著性水平 ).
点面朝上
1
2
3
4
5
6
出现次数
23
26
21
20
15
15
在 水平下,请问,这颗骰子是否是均匀的
例2在某细纱机上进行断点率测定,测验锭子总数为440,测得断头次数记录如下表:
每锭断头数
0
1
2
34Βιβλιοθήκη 5678
锭数(实测)
269
112
38
19
3
1
0
0
3
试问在显著性水平 下能否认为锭子的断头数服从泊松分布
例3某高校研究在校学生的体重,现随机抽取了100位学生,测得他们的体重(单位:kg)为
检验参数
原假设与备择假设
检验统计量
拒绝域
方差
已知
;
当 时,
或
;
;
未知
;
当 时,
或
;
;
3、两个正态总体均值差的假设检验问题可汇总如下表
检验参数
抽样分布
检验统计量
拒绝域
均值差
已知
;
当 时,
;
;
未知
;
当 时,
;
;
4、两个正态总体方差比的假设检验问题可汇总如下表
概率论与数理统计第八章假设检验
为判断所作的假设是否正确, 从总体中抽取 样本, 根据样本的取值, 按一定的原则进行检 验, 然后, 作出接受或拒绝所作假设的决定.
整理课件
2
我们主要讨论的假设检验的内容有
参数检验 总体均值、均值差的检验 总体方差、方差比的检验
H0: Θ0 vs H1: Θ1,
根据样本,构造一个检验统计量T 和检验法则: 若与T的取值有关的一个小概率事件W发生,则 否定H0,否则接受H0,而且要求
P(W|H0)
此时称W为拒绝域,整为理课检件 验水平。
11
例 3. 某厂生产的螺钉,按标准强度为68克/mm2,
而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 E ( X ) = = 68, 则认为这批螺钉符合要求,否
7
所以我们否定H0, 认为隧道南的路面发生交 通事故的概率比隧道北大.
做出以上结论也有可能犯错误。这是因为 当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯 错误。这一概率正是P=0.043.
于是, 我们判断正确的概率是1-0.043=95.7%
整理课件
8
假设检验中的基本概念和检验思想 (1) 根据问题的背景, 提出原假设
再作一个备择假设
H1: p> 0.35. 在本问题中,如果判定H0不对,就应当承认H1.
检验: 三起交通事故的发生是相互独立的, 他们
之间没有联系.
如果H0为真, 则每一起事故发生在隧道南的 概率都是0.35, 于是这三起交通事故都发生在隧
道南的概率是
P= 0.353 ≈ 0.043.
《概率论与数理统计》第八章1假设检验的基本概念
2. 从某批矿砂中,抽取10样本,检验这批砂矿的含 铁量是否为3%?
双侧检验 H0 : 0 3%, H1 : 3%
3.某学校学生英语平均分65分, 先抽取某个班的平均 分,看该成绩是否显著高于全校整体水平?
单侧检验 H0 : 0 65, H1 : 65
0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512, 问机器是否正常?
分析 以 和 分别表示这一天袋装糖的净重
总体X 的均值和标准差,
由长期实践表明标准差比较稳定, 我们就设
0.015,于是 X ~ N(, 0.0152 ),这里 未知. 问题 问题是根据样本值判断 0.5 还是 0.5 .
所
以,原假
设H
不正确
0
。
对于这两种解释,哪种解释比较合理呢?
我们需要判断以上两种假设谁对谁错,并给出判断的理由
以上例子属于参数检验(parametric test) 的问题,(如针对总体均值,总体方差等参数的假 设检验)。
另外还有非参数检验(Nonparametric test) 的问题,如关于总体服从某种分布(如正态分布, 泊松分布)的假设检验。
4. 拒绝域与临界点
拒绝域W1: 拒绝原假设 H0 的所有样本值 (x1, x2, ···, xn)所组成的集合.
W1 W1 :拒绝原假设H0的检验统计量的取值范围.
临界点(值):拒绝域的边界点(值) (相应于检验统计量的值).
如: 在前面例4中,拒绝域 {u :| u | u / 2 }.
5. 双边备择假设与双边假设检验
之 下 做 出 的.
2. 检验统计量
概率论与数理统计第八章假设检验习题解答
1.[一]某批矿砂的5个样品中的镍含量,经测定为(%)3.25 3.27 3.24 3.26 3.24。
设测定值总体服从正态分布,问在α = 0.01下能否接受假设:这批矿砂的含镍量的均值为3.25.解:设测定值总体X~N (μ,σ 2),μ,σ 2均未知步骤:(1)提出假设检验H 0:μ=3.25; H 1:μ≠3.25 (2)选取检验统计量为)1(~25.3--=n t nS X t(3)H 0的拒绝域为| t |≥).1(2-n t α(4)n=5, α = 0.01,由计算知01304.0)(11,252.3512=--==å=i iX Xn S x查表t 0.005(4)=4.6041, )1(343.0501304.025.3252.3||2-<=-=n t t α(5)故在α = 0.01下,接受假设H 02.[二] 如果一个矩形的宽度ω与长度l 的比618.0)15(21»-=l ω,这样的矩形称为黄金矩形。
这种尺寸的矩形使人们看上去有良好的感觉。
现代建筑构件(如窗架)、工艺品(如图片镜框)、甚至司机的执照、商业的信用卡等常常都是采用黄金矩型。
下面列出某工艺品工厂随机取的20个矩形的宽度与长度的比值。
设这一工厂生产的矩形的宽度与长短的比值总体服从正态分布,其均值为μ,试检验假设(取α = 0.05)H 0:μ = 0.618H 1:μ≠0.6180.693 0.749 0.654 0.670 0.662 0.672 0.615 0.606 0.690 0.628 0.668 0.611 0.606 0.609 0.601 0.553 0.570 0.844 0.576 0.933. 解:步骤:(1)H 0:μ = 0.618; H 1:μ≠0.618 (2)选取检验统计量为)1(~618.0--=n t nS X t(3)H 0的拒绝域为| t |≥).1(2-n t α (4)n=20 α = 0.05,计算知0925.0)(11,6605.01121=--===åå==ni ini ix xn S xnx ,)1(055.2200925.0618.06605.0||,0930.2)1(22-<=-==-n t t n t αα(5)故在α = 0.05下,接受H 0,认为这批矩形的宽度和长度的比值为0.6183.[三] 要求一种元件使用寿命不得低于1000小时,今从一批这种元件中随机抽取25件,测得其寿命的平均值为950小时,已知这种元件寿命服从标准差为σ =100小时的正态分布。
概率论与数理统计(假设检验的思想方法和基本概念)
= {| z | z0.025}={| z |1.96}
由样本数据计算得到
x 0 z / n
(497 506 518 524 488 517 510 515 516) / 9 500 2.02 15 / 9
因此,假设检验问题可能会犯如下两类错误:
第一类错误(“弃真”):实际情况是H0成立,而检验 的结果表明H0不成立,拒绝了H0. 第二类错误(“存伪”):实际情况是H0不成立,H1成 立,而检验的结果表明H0成立,接受了H0.
下面我们来研究一下犯这两类错误的概率.
8.1.2 假设检验的两类错误
犯第一类错误的概率:
X
H1: < 0
~ N (0,1)
/ n 对于给定的小概率 , 由图8-3知
X P z , / n X X 0 , 当原假设成立时,由于 / n / n X 0 所以 P z , / n X 0 即 z 是小概率事件. / n
8.1.1 假设检验的思想方法
根据上例可以看到假设检验的思想方法是:
(1) 提出假设; (2) 在假设成立的条件下构造一个小概率事件; (3) 由样本数据判断小概率事件是否发生了,如果小 概率事件发生了,根据“小概率原理”,作出否定原 假设的推断.
8.1.1 假设检验的思想方法
再考察下面的例子. 【例8.2】一台包装机包装洗衣粉,额定标准重量为500g, 根据以往经验,包装机的实际装袋重量服从正态N(,2), 其中 = 15g通常不会变化
x 0
这违背了小概率原理, 原因是原假设出了问 题
/ n
概率论与数理统计 --- 第八章{假设检验} 第六节:假设检验的两类错误
假设检验的两类错误
实际情况
数理统计
决定 拒绝H0
接受H0
H0为真
H0不真
第一类错误
正确
正确
第二类错误
犯两类错误的概率: P{拒绝H0|H0为真}=α, P{接受H0|H0不真}=β. 显著性水平 α为犯第一类错误(Type I error)的概率; β为犯第二类错误(Type II error)的概率.
X 0
n
u0.05 1.645
否定域为W : u u0.05 =1.645
代入 σ=2, n=25, 并由样本值计算得统计量U的实测值: u=3.125>1.645
落入否定域
故拒绝H0 , 即认为这批燃料率较以往生产的有显著的提高。
例2: 某织物强力指标X的均值 μ0=21公斤. 改进工艺后生产一批织物, 今从中取30件, 测得 X =21.55公斤.
u=2.51>2.33
落入否定域
故拒绝原假设H0 , 即新生产织物比过去的织物的强力有提高。
小结:
提出 假设
根据统计调查的目的, 提出原假设H0 和备选假设H1 作出 决策
数理统计
拒绝还是 不能拒绝H0
抽取 样本
检验 假设
P(T∈W)=α
α--犯第一类错误 的概率, W--为拒绝域
对差异进行定量的分析, 确定其性质 (是随机误差还是系统误差. 为给出两者界限, 找一检验统计量T, 在H0成立下其分布已知.)
两类错误的概率的关系
两类错误是互相关联的, 当样本容量固定时, 一类错误概率的减少导致另一类错误概率的增加. 要同时降低两类错误的概率 α, β 或者 要在 α不变的条件下降低 β, 需要增加样本容量.
概率论与数理统计第八章
上式也可记为 PH0 {拒绝H 0}
本例中,上式应为
(x)
PH 0
X
/
0
n
u
2
/2
1
/2
u / 2 O
u / 2
x
b)第二类错误(取伪)
原假设H0事实上是假的,但是由于检验统计量的 观察值没有落在拒绝域中,从而导致接受H0.这时犯了 “取伪”的错误,即接受了错误的假设,这一类错误我
(2) 当H0不真时,作出接受H0的决策——称为第二 类错误(或称“存伪”错误)。
a)第一类错误(弃真)
原假设H0事实上是真的,但是由于检验统计量的观 察值落入拒绝域中,从而导致拒绝H0.这时犯了“弃真” 的错误,即将正确的假设摒弃了,将这一类错误称之为第
一类错误.记犯第一类错误的概率为 ,则有
PH0 {拒绝H0 H0为真}
们称之为第二类错误.记犯第二类错误的概率为 ,则
P{接受H0 | H0为假}
或者 PH1 {接受H 0} P{接受H 0 | H1为真}
在本例中,
PH1
X
/
0
n
u
2
(x)
/2
1
/2
u / 2 O
u / 2
x
可以看出假设检验中包含的两个重要的思想:
1)反证法思想
为了确定是否要拒绝原假设H0,首先是假定H0真,看
当然也不能总认为正常,有了问题不能及时 发现,这也要造成损失.
如何处理这两者的关系,假设检验面对的就 是这种矛盾.
一般可以认为X1,…,X5是取自正态总体 N (, 2 ) 的样本,当生产比较稳定时, 2 是一个常数.
现在要检验的假设是:
H0: 0( 0 = 355)
概率论与数理统计第八章假设检验
对于(a)小概率P{X 0 u }
u是所选取合适的统计量 U 的分位点
1
单侧检验
P{ X 0 u } x 0 u为拒绝区域
其含义是依这样本x所推断的
小
概率
事
件H
发生
0
了
,
拒
绝H
0
u
拒绝
1
u 拒绝
对于(b)小概率P{X 0 u } (密度函数为对称时)
由 经 验 知 0.015公 斤 , 为 了 检 验 某 天 机器 工 作 是 否 正 常 , 抽 取其 所
包 装 的9袋 称 得 重 量 分 别 为0:.497,0.506,0.518,0.524,0.488,0.511,0.510,0.515,0.519; 问这天机器正常否?
现在另一天任然抽取9袋得样本均值x 0.511公斤,推断这天机器是否工作正常?
小 概 率 事 件 是: 样 本 均 值X与 所 假 设 的 期 望0相 差 X 0
不 能 太 大, 若 相 差 太 大 则 拒 绝H0
小概率事件P{ X 0 u }
u
是
2
所
选
取
合
适
的
统
计
量U
2
的
2
分
位
点
1
P{ X 0 u } x 0 u 为拒绝区域 2
较大、较小是一个相对的概念,合理的界限在何 处?应由什么原则来确定?
问题是:如何给出这个量的界限? 这里用到人们在实践中普遍采用的一个原则:
小概率事件在一次试验 中基本上不会发生(若发 生了则认为假设是错 )
在假设检验中,称这个小概率为显著性水平,用 表示.
《概率论与数理统计教学课件》8第八章—正态总体均值和方差的假设检验
真)
P1 2
(
x y
11
k)
k t (n1 n2 2)
sw
n1 n2
2
概率统计
在显著性水平 下, H0 的拒绝域:
x y
sw
11
t (n1 n2 2)
2
n1 n2
注:
当
2 1
2 2
2
未知时
检验假设
或
H0 : 1 -2 (或1 2 ), H0 : 1 2 (或1 2 ),
2
概率统计
所以拒绝H 0 ,可认为这两种轮胎的耐磨性有显著差异。
注: ▲ 用两种不同的方法得到了两种不同的结论,那么
究竟应该采取哪一个结论比较合理呢?
显然,应该采取第二种方法得出的结论是合理的
因为数据配对的方法是针对同一架飞机的,它是 排除了因飞机之间的试验条件的不同而对数据产 生的干扰,所以它是直接反映了这两种轮胎的耐 磨性的显著差异的情况,因此,应采取第二种方 法得出的结论,即可认为这两种轮胎的耐磨性有 显著差异。
概率统计
按单个正态总体中当 2 未知时,关于 的假设检验
的计算公式,可得 H0 的拒绝域为:
C { t t t (n 1)}
2
经计算 d 320 , s2 89425 ,
t
d s
320 2.83 89425
n
8
t (n 1) t0.05 (7) 2.365
2
2
因为: t 2.83 t0.05 (7) 2.365
为已知常数,显著水平为
概率统计
Q 检验统计量
(X Y)
~ N (0,1)
2 1
2 2
n1 n2
《概率论与数理统计教学课件》8第八章置信区间与假设检验之间的关系及p值
H0 : 0, H1 : 0 也有类似的对应关系 . 若已求得单侧置信区间 ( ( X1, X2, , Xn ), ), 则当0 ( ( x1, x2, , xn ), ) 时接受 H0;
当0 ( ( x1, x2, , xn ), ) 时拒绝 H0 . 反之, 若已求得检验问题 H0 : 0 , H1 : 0
若 0 ( , ), 则接受 H0; 若 0 ( , ), 则拒绝 H0 .
反之 ,对于任意的0 , 考虑显著性水平为 的假设检验问题:
H0 : 0, H1 : 0 .
假设它的接受域为
( x1, x2, , xn ) 0 ( x1, x2, , xn ). 即有 P0 { ( X1, X2 , , Xn ) 0 ( X1, X2 , , Xn )} 由0 的任意性,
要
拒绝H
,再
0
取
0.01也要拒绝H0,但不
能知道将再降低一些是否也要拒绝H0. 而p值法
给出了拒绝 H0的最小显著性水平 . 因此p值法比
临界值法给出了有关拒绝域的更多的信息.
二、典型例题
例2 用p值法检验本章第一节例2 的检验问题
H 0 : 0 0.545, H1 : 0 0.05 解 用Z检验法 , 现在检验统计量Z x 0 的观察
(, ( X1, X2 , , Xn ))与显著水平为 的左边检 验问题 H0 : 0, H1 : 0 有类似的对应关系. 若已求得单侧置信区间 (, ( X1 , X2 , , Xn )),
则当0 (, ( x1, x2, , xn ))时接受 H0; 当0 (, ( x1, x2, , xn ))时拒绝 H0.
那么在检验问题
H0 : 0, H1 : 0中 p值 P0 {t t0 } t0右侧尾部面积, 如图3;
概率论与数理统计第8章假设检验习题及答案
62第8章 假设检验一、填空题1、 对正态总体的数学期望m 进行假设检验,如果在显著性水平0.05下,接受假设00:m m =H ,那么在显著性水平0.01下,必然接受0H 。
2、在对总体参数的假设检验中,若给定显著性水平为a ,则犯第一类错误的概率是a 。
3、设总体),(N ~X 2s m ,样本n 21X ,X ,X ,2s未知,则00:H m =m ,01:H m <m 的拒绝域为 )}1(/{0--<-n t nS X a m ,其中显著性水平为a 。
4、设n 21X ,X ,X 是来自正态总体),(N 2s m 的简单随机样本,其中2,sm 未知,记å==n1i i X n 1X ,则假设0:H 0=m 的t 检验使用统计量=T Qn n X )1(-.二、计算题1、某食品厂用自动装罐机装罐头食品,规定标准重量为250克,标准差不超过3克时机器工作 为正常,每天定时检验机器情况,现抽取16罐,测得平均重量252=X 克,样本标准差4=S 克,假定罐头重量服从正态分布,试问该机器工作是否正常?解:设重量),(~2s m N X05.016==a n 4252==S X(1)检验假设250:0=m H 250:1¹m H , 因为2s 未知,在0H 成立下,)15(~/250t nS X T -=拒绝域为)}15(|{|025.0tT >,查表得1315.2)5(025.0=¹t由样本值算得1315.22<=T ,故接受0H (2)检验假设9:20=s H9:201>s H因为m 未知,选统计量 222)1(s S n x -=在0H 成立条件下,2x 服从)15(2x 分布,拒绝域为)}15({205.02x x >,查表得996.24)15(205.0=x ,现算得966.24667.26916152>=´=x 拒绝0H ,综合(1)和(2)得,以为机器工作不正常2、一种电子元件,要求其使用寿命不得低于1000小时,现在从一批这种元件中随机抽取25 件,测得其寿命平均值为950小时,已知该种元件寿命服从标准差100=s 小时正态分布, 试在显著性水平0.05下确定这批产品是否合格. 解:设元件寿命),(~2s m N X ,2s 已知10002=s,05.0,950,25===a X n检验假设1000:0=m H1000:1<m H在2s 已知条件下,设统计量)1,0(~/1000N nX s m -=拒绝域为}{05.0mm<,查表得645.195.005.0-=-=m m而645.15.2205025/1001000950-<-=-=-=m拒绝假设0H 选择备择假设1H ,所以以为这批产品不合格.3. 对 显 著 水 平 a , 检 验假 设 H 0 ; m = m 0, H 1 ; m ¹ m 0, 问当 m 0, m , a 一定 时 , 增大样本量 n 必 能 使 犯 第 二 类 错 误 概 率 b减 少 对 吗 ?并 说 明 理 由 。
2014年自考 概率论与数理统计串讲讲义 第八章 假设检验
第八章 假设检验
1. 假设检验的基本思想:小概率事件在一次抽样中是几乎不可能发生的
例1 设总体X ~)1,(μN ,其中μ未知,n x x x ,,,21 为其样本
试在显著性水平α下检验假设
00:μμ=H ;01:μμ≠H
这里,α即为小概率事件的概率,当00:μμ=H 真时,n x n x u /1/00μσμ-=-=
~)1,0(N
则 αα=≥)(2/u u P
即事件)(2/αu u ≥即为小概率事件,当它发生时,即认为原假设0H 不真,从而接受对立假设01:μμ≠H
2. 两类错误
以例1为例,上述n x u /10
μ-=的取值完全由样本n x x ,,1 所决定,由于样本的随机性,
假设检验可能犯以下两类错误:
第一类错误:P =α(拒00H H 真),也即检验的显著性水平
第二类错误:P =β(接受00H H 不真)P =(接受10H H 真)
在样本容量n 固定时,βα,相互制约,当减小α时,β的值会增大,反之亦然。
3.正态总体),(2σμN 参数的假设检验
(1)首先要会判断所讨论问题是否为假设检验问题
例2 从一批灯泡中随机抽取50个,分别测得其寿命,算得其平均值1900=x (小时),样本标准差490=s (小时),问可否认为这批灯泡的平均寿命(μ)为2000小时。
分析:本题中虽然没说总体(寿命)服从什么分布,但由于样本容量50≥n ,可按正态总体处理,“可否认为平均寿命为2000小时”等价于作检验2000:0=μH
(2)检验问题主要是对提出的假设检验确定出检验的拒绝域,这可参考指定教材第八章正态总体检验一览表。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。
由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题1引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?问题2记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题3则问题等价于检验H0成立,还是H1成立.某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题4则问题等价于检验H0成立,还是H1成立.自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5记服从指数分布,不服从指数分布.则问题也等价于检验H0成立,还是H1成立.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。
在总体的概率分布已知情形下,对分布中的未知参数作假设并进行检验,称为参数假设检验.若总体的分布未知,对总体的分布形式或参数作假设并进行检验,称为非参数假设检验.如上述问题1~4为参数假设检验问题,问题5为非参数假设检验问题.值得注意的是,当给定原假设后,其对立假设的形式可以有多个,如H0: 其对立形式有在假设检验问题中,常把一个被检验的假设称为原假设或零假设,而其对立面就称为对立假设.上述各问题中,H0为原假设,H1为对立假设.当H0不成立时,就拒绝接受H0而接受其对立假设H1.选择哪一种需根据实际问题确定,因而对立假设往往也称为备选假设,即在拒绝原假设后可供选择的假设.在假设检验问题中,必须同时给出原假设和对立假设.在参数假设中,不论是原假设还是对立假设,若其中只含有一个参数值,则称为简单假设,否则称为复合假设,如H0: ,H1: 为简单假设;而H0: ,H1: 为复合假设.二、假设检验的思想方法如何利用从总体中抽取的样本来检验一个关于总体的假设是否成立呢?由于样本与总体同分布,样本包含了总体分布的信息,因而也包含了假设H0是否成立的信息,如何来获取并利用样本信息是解决问题的关键.统计学中常用“概率反证法”和“小概率原理”来解决这个问题.小概率原理概率很小的事件在一次试验中不会发生.如果小概率事件在一次试验中竟然发生了,则事属反常,定有导致反常的特别原因,有理由怀疑试验的原定条件不成立.概率反证法欲判断假设H0的真假,先假定H0真,在此前提下构造一个能说明问题的小概率事件A.试验取样,由样本信息确定A是否发生,若A发生,这与小概率原理相违背,说明试验的前定条件H0不成立,拒绝H0,接受H1;若小概率事件A 没有发生,没有理由拒绝H0,只好接受H0.反证法的关键是通过推理,得到一个与常理(定理、公式、原理)相违背的结论.“概率反证法”依据的是“小概率原理”.那么多小的概率才算小概率呢?这要由实际问题的不同需要来决定.以后用符号记小概率,一般取等.在假设检验中,若小概率事件的概率不超过,则称为检验水平或显著性水平.已知某炼铁厂的铁水含碳量X~N(4.55,0.062),现改变了工艺条件,又测得10炉铁水的平均含碳量,假设方差无变化,问总体的均值是否有明显改变?(取 =0.05)下面举例说明以上检验的思想与方法。
例1则与4.55应很接近事件较大,待定)不太可能发生解由问题提出假设H0: ,H1:若H0成立由于未知用其无偏估计来代替用来衡量与4.55之间的差异如果较大则可认为所以在H0成立的前提下即P(A)很小令P(A)= ,确定9><>d是解决问题的关键由此确定了小概率事件由可知因此在H0成立的前提下,统计量显然因此即由标准正态分布上分位点的定义可知由 =0.05,得由于说明小概率事件A未发生,因此接受假设H0即认为总体均值等于4.55在随机试验中,小概率事件有许多,关键是要找一个能说明问题的小概率事件.,由P(A)= 同样可确定<>d本例中,若取最后的检验将出现这样一种倾向越与4.55接近,越要拒绝这样的判别方法显然不合理,错误在于:在H0成立的前提下,这样取小概率事件A不合理.在本例中,若设则A:( X1,X2, (X10)<>D是使小概率事件A发生的所有10维样本值(x1,…,x10)构成的集合则拒绝接受H0等价于一般地,若拒绝接受其中<>D是n维空间Rn中的区域,则称<>D为假设H0的拒绝域或否定域、临界域.检验中所用的统计量称为检验统计量样本观测值(x1,x2, (x10)样本观测值(x1,x2,…,xn)称<>D的补集为H0的接受域执行统计判决:求统计量的值,并查表求出有关数据,判断小概率事件是否发生,由此作出判决.提出假设:根据问题的要求,提出原假设H0与对立假设H1,给定显著水平及样本容量n.总结前面例1处理问题的思想与方法,可得处理参数假设检验问题的步骤如下:(1)(2)(3)确定拒绝域:用参数的一个好的估计量 (通常取为的无偏估计)来代替 ,分析拒绝域<>D的形式,构造检验统计量g( ),在H0成立的前提下确定g( )的概率分布,通过等式确定<>D.其中确定拒绝域是关键.拒绝域的形式一般由原假设与对立假设共同确定,对同一原假设H0,不同的对立假设所得到的H0的拒绝域可能不同.请看下例。
例2数据同前面例1,问总体的均值是否明显大于4.55?在统计学中,只有当与4.55的偏差大到一定程度时才可认为在本例中,拒绝H0时接受的是,因而H0的拒绝取为较合理此问题的合理假设为解的无偏估计是的一个很好的近似值用代替在例8.1中,拒绝H0时接受的是H1:两个数的偏差用其差的绝对值来衡量因而其拒绝域设为较合理与例1中的拒绝域不同在H0成立的条件下,事件发生的概率应很小设P(A)= ,统计量由得所以拒绝域为所以判决结果为:接受H0三、参数假设检验与区间估计的关系参数的区间估计则是找一个随机区间I,使I包含待估参数是个大概率事件.参数假设检验的关键是要找一个确定性的区域(拒绝域),使得当H0成立时,事件是一个小概率事件一旦抽样结果使小概率事件发生,就否定原假设H0对此两类问题,都是利用样本对参数作判断:一个是由小概率事件否定参数属于某范围,另一个则是依大概率事件确信某区域包含参数的真值.两者本质上殊途同归,一类问题的解决,导致解决另一类问题类比方案的形成.为的置信区间如设总体已知,给定容量n的样本则参数的置信度为样本均值为的置信区间为假设检验问题的拒绝域为接受域为时,接受也就是说,当即在区间内,此区间正是的置信度习题8-11.何谓统计假设?2.试述普通反证法与概率反证法的异同点.3.试述检验统计假设的步骤.4.设总体,为未知参数,为其一个样本,对下述假设检验问题取拒绝域为:试求常数c,使得该检验的显著水平为0.05.m第二节正态总体均值的假设检验本节讨论有关正态总体的均值的假设检验问题.构造合适的检验统计量并确定其概率分布是解决检验问题的关键.若检验统计量服从标准正态分布(分布,F分布)则所得到的相应检验法称为U 检验法( 检验法,F 检验法)一、 U 检验法(方差已知)在方差已知的条件下,对一个正态总体的均值或两个正态总体均值差的假设检验常用U 检验法.若X1,X2,…,Xn为取自总体X的样本设总体已知,给定显著水平检验以下不同形式的假设问题:下面我们来求H03的拒绝域前两个为简单假设检验问题,我们已在例1及例2中求出其拒绝域分别为和其中(1)H03的拒绝域形式为等价形式为(k待定)若H03成立,则要控制只需令由此得此处所以H03的拒绝域为(2)比较两种假设检验问题:对于后面将要讨论的有关正态总体的参数假设检验问题也有类似结果.可以看出尽管两者原假设形式不同,实际意义也不一样,但对于相同的显著水平,它们的拒绝域是相同的。
因此,遇到H03与H13的检验问题,可归结为H02与H12来讨论.下面求两个正态总体均值差检验的拒绝域。
设总体X与Y相互独立已知从两总体中分别取容量为n1、n2的样本用,分别表示样本均值、给定显著水平检验假设的无偏估计分别为显然,H0的拒绝形式应为(k待定)由于若H0真,则统计量由得拒绝域为(3)例 1 一种燃料的辛烷等级服从正态分布,其平均等级,标准差.现抽取25桶新油,测试其等级,算得平均等级为97.7.假定标准差与原来一样,问新油的辛烷平均等级是否比原燃料的辛烷平均等级偏低?()解按题意需检验假设检验统计量拒绝域(参阅表8-1)查正态分布表得计算统计值执行统计判决故拒绝H0,即认为新油的辛烷平均等级比原燃料辛烷的平均等级确实偏低.二、 t 检验法(方差未知)设总体未知对显著水平检验假设拒绝域形式(k待定)注意到S2是的无偏估计,用S代替由于未知,现在不能用来作为检验统计量采用作为检验统计量当H0真时,由得所以拒绝域为(4)类似可给出假设的拒绝域为(5)对正态总体关于的各种形式的假设检验的拒绝域列于表8-1.例 2 一手机生产厂家在其宣传广告中声称他们生产的某种品牌的手机的待机时间的平均值至少为71.5小时,一质检部门检查了该厂生产的这种品牌的手机6部,得到的待机时间为69,68,72,70,66,75设手机的待机时间,由这些数据能否说明其广告有欺骗消费者之嫌疑?()解问题可归结为检验假设由于方差未知,用t 检验。