概率论与数理统计 假设检验的概念
概率论与数理统计课件:假设检验
假设检验
首页 返回 退出
五、假设检验的两类错误
由于样本具有随机性,因此,当我们利用样本判断时, 可能会犯两类错误:
所作决策
真实情况
(未知)
样本未落入拒绝域 样本落入拒绝域
接受H0
拒绝H0
H0为真
正确
第一类错误
H0不真
第二类错误
正确
第一类(弃真): 第二类(取伪):
假设检验
P{拒绝H0|H0为真}= , P{接受H0|H0不真}= .
(α=0.05)
解:正态总体X~N(μ,σ2),已知σ=2
要检验的假设为
H0 : 40, H1 : 40
选择检验统计量
Z X 0 ~ N (0,1) / n
假设检验
首页 返回 退出
解:正态总体X~N(μ,σ2),已知σ=2
要检验的假设为
H0 : 40, H1 : 40
选择检验统计量
由样本数据计算,得 x 100.104 计算统计量Z的观测值,得
Z 100.104 100 0.658 1.96 0.5 / 10
没有落入 拒绝域
结论:不拒绝原假设,认为内径的值符合设计要求.
假设检验
首页 返回 退出
要检验的假设为
H0 : 100, H1 : 100
(2)未知σ2 ,选择检验统计量
没有落入 拒绝域
结论:不拒绝原假设,认为内径的值符合设计要求.
假设检验
首页 返回 退出
例2 某厂生产的固体燃料推进器的燃烧率服从正态分 布X~N(40,22),现在采用技术研发部设计的新方法 生产了一批推进器,随机测试25只,测得燃烧率的 样本均值为 x 41.25 ,假设在新方法下σ=2,问用 新方法生产的推进器的燃烧率是否有显著的提高?
概率论与数理统计(8)假设检验
概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。
由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题1引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?问题2记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题3则问题等价于检验H0成立,还是H1成立.某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题4则问题等价于检验H0成立,还是H1成立.自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5记服从指数分布,不服从指数分布.则问题也等价于检验H0成立,还是H1成立.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。
概率论与数理统计-假设检验
14
若
取伪的概率较大.
15
/2
0.12 0.1
0.08 0.06 0.04 0.02
/2 H0 真
60 62.5 65 67.5 70 72.5 75
0.12 0.1
0.08 0.06 0.04 0.02
H0 不真
67.5 70 72.5 75 77.5 80 82.5
16
现增大样本容量,取n = 64, = 66,则
41
两个正态总体
设 X ~ N ( 1 1 2 ), Y ~ N ( 2 2 2 )
两样本 X , Y 相互独立, 样本 (X1, X2 ,…, Xn ), ( Y1, Y2 ,…, Ym ) 样本值 ( x1, x2 ,…, xn ), ( y1, y2 ,…, ym )
显著性水平
42
(1) 关于均值差 1 – 2 的检验
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布拒绝域 Nhomakorabea1 – 2 = 1 – 2
1 – 2 1 – 2 <
1 – 2 1 – 2 > ( 12,22 已知)
43
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布
1 – 2 = 1 – 2
拒绝域
1 – 2 1 – 2 <
1 – 2 1 – 2 >
12, 22未知
12
=
2 2
其中
44
(2)
关于方差比
2 1
/
2 2
的检验
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布
北京工业大学《概率论与数理统计》课件 第8章 正态总体均值的假设检验
在数理统计中,把 “ X 的均值 μ =10” 这样
的一个欲检验的假设称为 “原假设” 或 “零 假设”,记成 “ H0:μ =10”。这里的“H”是 从英文“ hypothesis ”的字头而来,“ 0 ” 是从 “null”或“zero” 含义而生。
该检验称为两样本 t 检验。
说明
上面,我们假定 12=22。当然,这是个 不得已而强加上去的条件。因为,如果不加 这个条件,就无法使用简单易行的 t 检验。
在实用中,只要我们有理由认为12和22 相差不是太大,就可使用上述方法。通常的 做法是:如果方差比检验未被拒绝(见下节), 就认为12和22相差不是太大。
又如:考察一项新技术对提高产品质量是 否有效,就把新技术实施前后生产的产品质量
指标分别看成正态总体 N(1, 12)和 N(2, 22)。
这时,所考察的问题就归结为检验这两个正态
总体的均值 1和 2是否相等的问题。
设X1, X2, …, Xm与Y1, Y2, …, Yn 分别为抽
自正态总体 N(1, 12) 和N(2, 22) 的样本,记
的大小检验 H0 是否
成立。
合理的做法应该是:找出一个界限 c,
这里的问题是:如何确定常数 c 呢? 细致地分析:根据定理 6.3.1,有
于是,当原假设 H0:μ =10 成立时,有
为确定常数 c,我们考虑一个很小的正数, 如 =0.05。当原假设H0:μ =10 成立时,有
于是,我们就得到如下检验准则:
即新技术或新配方对提高产品质量确实有效。
单边检验 H0: μ =μ0 ‹–› H1: μ >μ0
假设检验的概述及单总体均值的假设检验
一、问题的提出
[例1] 某厂有一批产品,共 200 件,须经检验合格 才能出厂,按国家标准,次品率不得超过 1%,今 在其中任意抽取 5 件,发现这 5 件中含有次品,问 这批产品是否能出厂?
[例2] 至 1984 年底,南京市开办了有奖储蓄以 来,13 期对奖号码中诸数码的频数汇总如下:
t /2 (n 1)
右边检验问题 H 0 : 0 , H1 : 0
拒绝域
x 0
s/ n
t
(n 1)
左边检验问题 H 0 : 0 , H1 : 0
拒绝域
x 0
s/ n
t (n 1)
[例5] 某部门对当前市场的价格情况进行调查。以鸡 蛋为例,所抽查的全省20个集市上,售价分别为(单 位:元/500克) 3.05 3.31 3.34 3.82 3.30 3.16 3.84 3.10 3.90 3.18 3.88 3.22 3.28 3.34 3.62 3.28 3.30 3.22 3.54 3.30 已知往年的平均售价一直稳定在3.25元/500克左右, 全省鸡蛋价格服从正态分布 N(, 2 ) ,在显著性水 平 0.05下,能否认为全省当前的鸡蛋售价明显高 于往年?
本方差,下面讨论未知参数 的假设检验问题。
1、已知方差 ,检验假设
(Z检验)
一个正态总体 N , 2 , 2 已知, 未知。
检验目标是 H0 : 0 。 我们可以提出如下三个假设检验问题:
H0 : 0, H1 : 0 H0 : 0, H1 : 0 H0 : 0, H1 : 0
是否成立?
表 8-2
x 8 9 10 11 12 13 14 15 16 17 18 19 20
频数 4 1 7 8 6 12 9 10 17 7 19 14 22
概率论与数理统计 第8章
现在的问题就是要判别新产品的寿命是服从 μ >1500 的
正态分布,还是服从 μ ≤1500的正态分布? 若是前者,我们 就说新产品的寿命有显著性提高;若是后者,就说新产品的 寿命没有显著性提高。
定义 1 将对总体提出的某种假设称为原假设,记为 H 0 ; 将与原假设矛盾的假设称为备择假设,记为 H 1 。
在例 8-1 中,我们把涉及的两种情况用假设的形式表示
出来,第一个假设 μ ≤1500 表示采用新工艺后产品平均寿命没 有显著性提高,第二个假设 μ >1500 表示采用新工艺后产品平
均寿命有显著性提高。第一个假设为原假设,即“ H 0 :μ
定义 8 给定犯第一类错误的概率不大于 α 所作的假设 检验称为显著性检验,称 α 为显著性水平。 例 8-2 某车间用一台包装机包装食盐,每袋食盐的净 重是一个随机变量,它服从正态分布。当包装机正常时,其 均值为 0.5kg ,标准差为 0.015kg 。某日开工后为检查包装 机工作是否正常,随机地抽取它所包装的食盐 9 袋,称得样 本均值 ������ X =0. 511kg ,问在显著性水平 α =0.05 下,这 天包装机工作是否正常。
由于无论是第一类错误还是第二类错误都是作假设检验 时的随机事件,因此在假设检验中它们都有可能发生。我们 当然希望尽可能使犯两类错误的概率都很小,但一般来说, 当样本的容量固定时,若刻意地减少犯一类错误的概率,则 犯另一类错误的概率往往会增大。若要使两类错误的概率都 减小,就需增大样本的容量。在给定样本容量的情况下,我 们总是对犯第一类错误的概率加以控制,使它不大于 α , 而不关心犯第二类错误的概率 β是增大了还是减小了,这样 的假设检验就是显著性检验。
《概率论与数理统计》第七章假设检验.
《概率论与数理统计》第七章假设检验.第七章假设检验学习⽬标知识⽬标:理解假设检验的基本概念⼩概率原理;掌握假设检验的⽅法和步骤。
能⼒⽬标:能够作正态总体均值、⽐例的假设检验和两个正态总体的均值、⽐例之差的假设检验。
参数估计和假设检验是统计推断的两种形式,它们都是利⽤样本对总体进⾏某种推断,然⽽推断的⾓度不同。
参数估计是通过样本统计量来推断总体未知参数的取值范围,以及作出结论的可靠程度,总体参数在估计前是未知的。
⽽在假设检验中,则是预先对总体参数的取值提出⼀个假设,然后利⽤样本数据检验这个假设是否成⽴,如果成⽴,我们就接受这个假设,如果不成⽴就拒绝原假设。
当然由于样本的随机性,这种推断只能具有⼀定的可靠性。
本章介绍假设检验的基本概念,以及假设检验的⼀般步骤,然后重点介绍常⽤的参数检验⽅法。
由于篇幅的限制,⾮参数假设检验在这⾥就不作介绍了。
第⼀节假设检验的⼀般问题关键词:参数假设;检验统计量;接受域与拒绝域;假设检验的两类错误⼀、假设检验的基本概念(⼀)原假设和备择假设为了对假设检验的基本概念有⼀个直观的认识,不妨先看下⾯的例⼦。
例7.1 某⼚⽣产⼀种⽇光灯管,其寿命X 服从正态分布)200 ,(2µN ,从过去的⽣产经验看,灯管的平均寿命为1550=µ⼩时,。
现在采⽤新⼯艺后,在所⽣产的新灯管中抽取25只,测其平均寿命为1650⼩时。
问采⽤新⼯艺后,灯管的寿命是否有显著提⾼?这是⼀个均值的检验问题。
灯管的寿命有没有显著变化呢?这有两种可能:⼀种是没有什么变化。
即新⼯艺对均值没有影响,采⽤新⼯艺后,X 仍然服从)200 ,1550(2N 。
另⼀种情况可能是,新⼯艺的确使均值发⽣了显著性变化。
这样,1650=X 和15500=µ之间的差异就只能认为是采⽤新⼯艺的关系。
究竟是哪种情况与实际情况相符合,这需要作检验。
假如给定显著性⽔平05.0=α。
在上⾯的例⼦中,我们可以把涉及到的两种情况⽤统计假设的形式表⽰出来。
概率论与数理统计:假设检验
教学内容一、引入新课:假设检验能解决什么问题呢?它能解决的问题分为两大类,第一类是参数假设检验,如果总体的分布已知,但是某个参数未知,对未知参数进行检验称为参数假设检验。
第二类是非参数假设检验,这时总体的分布未知,对未知分布的类型提出假设并检验,这时非参数假设检验。
二、讲授新课:1、假设检验的基本原理:假设检验的基本过程是,对于一个统计模型,先提出一个假设,然后根据抽取的样本对假设进行检验,然后做出接受或者拒绝假设的决策。
下面通过一个例子具体地看一下假设检验的基本原理。
在一次社交聚会中,一位女士宣称,她能区分熬好的咖啡中是先加的奶还是先加的糖,并当场试验,结果8杯中判断正确7杯,问这位女士真的具有这样的鉴别能力吗?解:假设该女士不具备鉴别能力,也就是她的判断是会乱猜的,因此,每杯咖啡猜正确的概率为21。
那么,8杯中猜对7杯的以上的概率可以利用古典概型的方法计算出来,其值为0.0352这个值较小,我们认为是小概率事件。
又因为一般认为在一次试验中,小概率事件是不可能发生的,但是这个事件发生了,从而产生了矛盾。
因此,认为是假设错误,拒绝假设,也就是该女士应该是具有鉴别咖啡的能力的。
这个问题的解决就是经历了,假设、检验、决策这三个环节。
其中假设就是女士不具备鉴别能力。
检验就是在假设的条件下,计算出发生事件的概率,发现这个概率是个小概率事件,在一次试验中不可能发生。
所以,最后的决策是拒绝假设。
(1)假设检验的推理依据:小概事件在一次试验中几乎不可能发生。
因此给出小概率事件的标准记为α,一般为发生概率小于为0.05或0.01,称为叫小概率事件。
(2)假设检验的基本思想是具有概率性质的反证法。
2、假设检验的例题:例 1 某单位新购进一台设备进行测试,已知该设备的误差服从正态分布,方差为0.01,正常情况下,系统误差为0,现在实际测试16次,误差值为x1,…,xn, 计算得出样本均值为0.072,问,能否认为该设备工作正常?首先,看看本题的已知条件:机器正常时,均值0=μ,方差为0.01,抽取的样本均值为0.072,样本容量为16,最后给出小概率的标准05.0=α,这也是小概率事件的标准,也就是事件的概率小于0.05是小概率事件,否则就不是小概率事件。
概率论与数理统计教案第八章
例8为比较新老品种的肥料对作物的效用有无显著差别,选用了各方面条件差不多的10个地块种上此作物.随机选用其中5块施上新肥料,而剩下的5块施上老肥料.等到收获时观察到施新肥的地块,平均年产333(单位:千斤),样本方差为32,施老肥的地块平均年产330,样本方差为40.假设作物产量服从正态分布,检验新肥是否比老肥效用上有显著提高(显著性水平 ).
点面朝上
1
2
3
4
5
6
出现次数
23
26
21
20
15
15
在 水平下,请问,这颗骰子是否是均匀的
例2在某细纱机上进行断点率测定,测验锭子总数为440,测得断头次数记录如下表:
每锭断头数
0
1
2
34Βιβλιοθήκη 5678
锭数(实测)
269
112
38
19
3
1
0
0
3
试问在显著性水平 下能否认为锭子的断头数服从泊松分布
例3某高校研究在校学生的体重,现随机抽取了100位学生,测得他们的体重(单位:kg)为
检验参数
原假设与备择假设
检验统计量
拒绝域
方差
已知
;
当 时,
或
;
;
未知
;
当 时,
或
;
;
3、两个正态总体均值差的假设检验问题可汇总如下表
检验参数
抽样分布
检验统计量
拒绝域
均值差
已知
;
当 时,
;
;
未知
;
当 时,
;
;
4、两个正态总体方差比的假设检验问题可汇总如下表
概率论和数理统计假设检验
05
非参数假设检验
Wilcoxon秩和检验
总结词
用于检验两个独立样本是否来自同一 分布,特别是当样本量较小或总体分 布未知时。
详细描述
Wilcoxon秩和检验通过将每个样本的 观测值替换为其在所有观测值中的秩, 然后比较两组的秩和来进行检验。如 果两个样本来自同一分布,则它们的 秩和应该接近相等。
THANKS
感谢观看
确定检验水准
根据研究目的和样本量等因素,确定检验 水准,如α和β。
计算统计量
根据数据和选择的统计方法,计算出相应 的统计量。
选择合适的统计方法
根据数据类型和假设,选择合适的统计方 法进行检验。
单侧与双侧检验
单侧检验
只考虑一个方向的假设检验,如只考虑增加或只考虑减少。
双侧检验
同时考虑两个方向的假设检验,即同时考虑增加和减少。
检验效能
检验效能是指假设检验能够正确拒绝一个错误假设的能力。在给定样本大小的情况下,提高检验效能 可以提高假设检验的准确性。
假设检验的误用与避免
误用
假设检验的误用通常包括不恰当的假设、错 误的解读、过度推断等。这些错误可能导致 错误的结论,影响科学研究的可靠性和有效 性。
避免方法
为了避免假设检验的误用,研究者应确保假 设合理、解读准确,并避免过度推断。同时, 应采用多种方法进行验证,以提高研究的可 靠性和准确性。
方差齐性检验
01
方差齐性检验
用于检验两组数据或多个组数据的方差是否具有齐性。常 见的方差齐性检验方法包括Bartlett检验、Levene检验等 。
02
总结词
方差齐性检验是假设检验中的重要步骤,它有助于判断不 同组数据之间是否存在显著差异。
概率论与数理统计第八章假设检验
为判断所作的假设是否正确, 从总体中抽取 样本, 根据样本的取值, 按一定的原则进行检 验, 然后, 作出接受或拒绝所作假设的决定.
整理课件
2
我们主要讨论的假设检验的内容有
参数检验 总体均值、均值差的检验 总体方差、方差比的检验
H0: Θ0 vs H1: Θ1,
根据样本,构造一个检验统计量T 和检验法则: 若与T的取值有关的一个小概率事件W发生,则 否定H0,否则接受H0,而且要求
P(W|H0)
此时称W为拒绝域,整为理课检件 验水平。
11
例 3. 某厂生产的螺钉,按标准强度为68克/mm2,
而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 E ( X ) = = 68, 则认为这批螺钉符合要求,否
7
所以我们否定H0, 认为隧道南的路面发生交 通事故的概率比隧道北大.
做出以上结论也有可能犯错误。这是因为 当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯 错误。这一概率正是P=0.043.
于是, 我们判断正确的概率是1-0.043=95.7%
整理课件
8
假设检验中的基本概念和检验思想 (1) 根据问题的背景, 提出原假设
再作一个备择假设
H1: p> 0.35. 在本问题中,如果判定H0不对,就应当承认H1.
检验: 三起交通事故的发生是相互独立的, 他们
之间没有联系.
如果H0为真, 则每一起事故发生在隧道南的 概率都是0.35, 于是这三起交通事故都发生在隧
道南的概率是
P= 0.353 ≈ 0.043.
概率论与数理统计 南京大学 6 第六章假设检验 (6.1.1) 假设检验的基本概念
客观 主观
H0真
H0不真
拒绝H0
第一类错 误(弃真)
不 H0真) P(第一类错误)= P(不拒绝H0 | H0不真) P(第二类错误)=
一般情况下,犯两类错误的概率存在此消彼 长的关系,不能同时达到最小,我们通常的 做法是首先控制犯第一类错误的概率,然后 尽量降低犯第二类错误的概率。 (奈曼-皮 尔逊原则)
假设检验的基本概念
2019/1/6
假设检验=假设+检验。
首先对总体提出某种推断或猜测,即假设;
然后通过试验,抽取样本,根据样本信息 对“假设”的正确性进行判断,即检验。
例1 :某厂生产的一种保健食品。已知在正常的情况 下,每瓶保健品的重量(单位:千克)服从均值为 25.0的正态分布(方差为0.01 )。某天开工后, 随机抽取9瓶,测得其平均重量为24.94,试问 该天生产是否正常?
H0: =25;
H1: 25
例2 :某厂生产一批产品,要求次品率不超过5%。 随机抽取50件,发现有4件次品,问产品能 否出厂?
H0:p0.05;
H1: p>0.05
原假设:记为H0 备择假设(或对立假设):记为H1 。
简单假设:只含一个结论。 复合假设:包含多个结论。
假设检验中的两类错误
《概率论与数理统计》第八章1假设检验的基本概念
2. 从某批矿砂中,抽取10样本,检验这批砂矿的含 铁量是否为3%?
双侧检验 H0 : 0 3%, H1 : 3%
3.某学校学生英语平均分65分, 先抽取某个班的平均 分,看该成绩是否显著高于全校整体水平?
单侧检验 H0 : 0 65, H1 : 65
0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512, 问机器是否正常?
分析 以 和 分别表示这一天袋装糖的净重
总体X 的均值和标准差,
由长期实践表明标准差比较稳定, 我们就设
0.015,于是 X ~ N(, 0.0152 ),这里 未知. 问题 问题是根据样本值判断 0.5 还是 0.5 .
所
以,原假
设H
不正确
0
。
对于这两种解释,哪种解释比较合理呢?
我们需要判断以上两种假设谁对谁错,并给出判断的理由
以上例子属于参数检验(parametric test) 的问题,(如针对总体均值,总体方差等参数的假 设检验)。
另外还有非参数检验(Nonparametric test) 的问题,如关于总体服从某种分布(如正态分布, 泊松分布)的假设检验。
4. 拒绝域与临界点
拒绝域W1: 拒绝原假设 H0 的所有样本值 (x1, x2, ···, xn)所组成的集合.
W1 W1 :拒绝原假设H0的检验统计量的取值范围.
临界点(值):拒绝域的边界点(值) (相应于检验统计量的值).
如: 在前面例4中,拒绝域 {u :| u | u / 2 }.
5. 双边备择假设与双边假设检验
之 下 做 出 的.
2. 检验统计量
概率论和数理统计 假设检验
2、在H0成立的前提下,构造一个适当的检验统计量V,
3、按给定的显著性水平,在原假设为真的条件下, 求出临界值点,从而求出拒绝域。 结合备择假设
4、根据样本的观察值算出V的值,确定是否拒绝H0。
临界值点
注:
前两步乃解决问题的关键点!
拒绝域
-k
0
k
五、检验的分类
14
1、按检验对象分类:参数检验,非参数检验。 2、按拒绝域形成分类:
总体方差2已知时,
18 ① H0 := 0 ② H0 := 0 ③ H0 : = 0
检验统计量 U
X
0
~ N ( 0 ,1 )
—U检验法
n
H1 : ≠ 0 H1 : >0
U z
2
U z U z
X S n
0
拒绝域
H1 : <0
17
=0.05下检验假设:
H0: 0 =40; H1: >0=40 哪一个成立? 用单侧分位点 (2)取统计量: U X 0 X 40
则U~N(0,1)。
0
n
2
25
(3)由P{ U>Z0.05 } = 0.05 查表Z0.05=1.65, (4)而U 的数值: u =(40.75-40)/(2/5)=1.865>1.65
由 x 1582 ; s 129 ; t 0 . 44
得 t 0 . 44 t 0 . 025 9 2 . 262
统计量的观测值未落入拒绝域中,从而接受H0 . 即在显著性水平0.05下,可认为灯泡的平均寿命为 =1600。
问题:区间估计与假设检验有何关系?
概率论与数理统计(假设检验的思想方法和基本概念)
= {| z | z0.025}={| z |1.96}
由样本数据计算得到
x 0 z / n
(497 506 518 524 488 517 510 515 516) / 9 500 2.02 15 / 9
因此,假设检验问题可能会犯如下两类错误:
第一类错误(“弃真”):实际情况是H0成立,而检验 的结果表明H0不成立,拒绝了H0. 第二类错误(“存伪”):实际情况是H0不成立,H1成 立,而检验的结果表明H0成立,接受了H0.
下面我们来研究一下犯这两类错误的概率.
8.1.2 假设检验的两类错误
犯第一类错误的概率:
X
H1: < 0
~ N (0,1)
/ n 对于给定的小概率 , 由图8-3知
X P z , / n X X 0 , 当原假设成立时,由于 / n / n X 0 所以 P z , / n X 0 即 z 是小概率事件. / n
8.1.1 假设检验的思想方法
根据上例可以看到假设检验的思想方法是:
(1) 提出假设; (2) 在假设成立的条件下构造一个小概率事件; (3) 由样本数据判断小概率事件是否发生了,如果小 概率事件发生了,根据“小概率原理”,作出否定原 假设的推断.
8.1.1 假设检验的思想方法
再考察下面的例子. 【例8.2】一台包装机包装洗衣粉,额定标准重量为500g, 根据以往经验,包装机的实际装袋重量服从正态N(,2), 其中 = 15g通常不会变化
x 0
这违背了小概率原理, 原因是原假设出了问 题
/ n
概率论与数理统计第八章假设检验
对于(a)小概率P{X 0 u }
u是所选取合适的统计量 U 的分位点
1
单侧检验
P{ X 0 u } x 0 u为拒绝区域
其含义是依这样本x所推断的
小
概率
事
件H
发生
0
了
,
拒
绝H
0
u
拒绝
1
u 拒绝
对于(b)小概率P{X 0 u } (密度函数为对称时)
由 经 验 知 0.015公 斤 , 为 了 检 验 某 天 机器 工 作 是 否 正 常 , 抽 取其 所
包 装 的9袋 称 得 重 量 分 别 为0:.497,0.506,0.518,0.524,0.488,0.511,0.510,0.515,0.519; 问这天机器正常否?
现在另一天任然抽取9袋得样本均值x 0.511公斤,推断这天机器是否工作正常?
小 概 率 事 件 是: 样 本 均 值X与 所 假 设 的 期 望0相 差 X 0
不 能 太 大, 若 相 差 太 大 则 拒 绝H0
小概率事件P{ X 0 u }
u
是
2
所
选
取
合
适
的
统
计
量U
2
的
2
分
位
点
1
P{ X 0 u } x 0 u 为拒绝区域 2
较大、较小是一个相对的概念,合理的界限在何 处?应由什么原则来确定?
问题是:如何给出这个量的界限? 这里用到人们在实践中普遍采用的一个原则:
小概率事件在一次试验 中基本上不会发生(若发 生了则认为假设是错 )
在假设检验中,称这个小概率为显著性水平,用 表示.
东华大学《概率论与数理统计》课件 第七章 假设检验
1. 2为已知, 关于的检验(U 检验 )
在上节中讨论过正态总体 N ( , 2 ) 当 2为已知时, 关于 = 0的检验问题 :
假设检验 H0 : = 0 , H1 : 0 ;
我们引入统计量U
=
− 0 0
,则U服从N(0,1)
n
对于给定的检验水平 (0 1)
由标准正态分布分位数定义知,
~
N (0,1),
由标准正态分布分位点的定义得 k = u1− / 2 ,
当 x − 0 / n
u1− / 2时, 拒绝H0 ,
x − 0 / n
u1− / 2时,
接受H0.
假设检验过程如下:
在实例中若取定 = 0.05, 则 k = u1− / 2 = u0.975 = 1.96, 又已知 n = 9, = 0.015, 由样本算得 x = 0.511, 即有 x − 0 = 2.2 1.96,
临界点为 − u1− / 2及u1− / 2.
3. 两类错误及记号
假设检验是根据样本的信息并依据小概率原
理,作出接受还是拒绝H0的判断。由于样本具有 随机性,因而假设检验所作出的结论有可能是错
误的. 这种错误有两类:
(1) 当原假设H0为真, 观察值却落入拒绝域, 而 作出了拒绝H0的判断, 称做第一类错误, 又叫弃
设 1,2, ,n 为来自总体 的样本,
因为 2 未知, 不能利用 − 0 来确定拒绝域. / n
因为 Sn*2 是 2 的无偏估计, 故用 Sn* 来取代 ,
即采用 T = − 0 来作为检验统计量.
Sn* / n
当H0为真时,
− 0 ~ t(n −1),
Sn* / n
由t分布分位数的定义知
概率论与数理统计:第七章 假设检验
得拒绝域为 W = {u u }
其中, u = x μ0 σ/ n
U
=
X
σ
μ0
/n
ua/2
,则称 X 与m0的
差异是显著的,则拒绝H0
如果
U
ห้องสมุดไป่ตู้
=
X μ0 σ/ n
< ua/ 2
,则称 X 与m0的
差异是不显著的,则接受H0
x与μ 0有无显著差异的判断,
是在显著性水平α之下做出的。
厦大经院-国贸-2012秋季学期
关于显著性水平
是一个概率值,弃真概率;在后面“假设 检验的两类错误”再具体介绍;
H0称为原假设, H1称为备择假设
厦大经院-国贸-2012秋季学期
原假设
试图推翻的假设,又称“零假设”
表示为 H0
指定为 = , ,
如,H0:m = 3190
厦大经院-国贸-2012秋季学期
备择假设
通常是试图支持的假设
指定为: , > , <
表示为 H1,如 H1 : m < 3910 H1 : m ≠ 3910 H1 : m > 3910
2. 原假设H0不真, 观察值却落入接受域, 从而作出接受H0的判断,
这类错误“以假为真”,记为 错误 ,
犯第Ⅱ类错误的概率:
= P { 接受H0 | H0不正确 }
厦大经院-国贸-2012秋季学期
错误和 错误的关系
小, 就大
大, 就小
不能 同时减少 两类错误
当样本容量 n 一定,若减少第I类错误的概率, 第Ⅱ类错误的概率往往增大; 要使两类错误的概率都减小,只能增加样本容量。
在一次试验中, 小概率事件不会发生 。
2014年自考 概率论与数理统计串讲讲义 第八章 假设检验
第八章 假设检验
1. 假设检验的基本思想:小概率事件在一次抽样中是几乎不可能发生的
例1 设总体X ~)1,(μN ,其中μ未知,n x x x ,,,21 为其样本
试在显著性水平α下检验假设
00:μμ=H ;01:μμ≠H
这里,α即为小概率事件的概率,当00:μμ=H 真时,n x n x u /1/00μσμ-=-=
~)1,0(N
则 αα=≥)(2/u u P
即事件)(2/αu u ≥即为小概率事件,当它发生时,即认为原假设0H 不真,从而接受对立假设01:μμ≠H
2. 两类错误
以例1为例,上述n x u /10
μ-=的取值完全由样本n x x ,,1 所决定,由于样本的随机性,
假设检验可能犯以下两类错误:
第一类错误:P =α(拒00H H 真),也即检验的显著性水平
第二类错误:P =β(接受00H H 不真)P =(接受10H H 真)
在样本容量n 固定时,βα,相互制约,当减小α时,β的值会增大,反之亦然。
3.正态总体),(2σμN 参数的假设检验
(1)首先要会判断所讨论问题是否为假设检验问题
例2 从一批灯泡中随机抽取50个,分别测得其寿命,算得其平均值1900=x (小时),样本标准差490=s (小时),问可否认为这批灯泡的平均寿命(μ)为2000小时。
分析:本题中虽然没说总体(寿命)服从什么分布,但由于样本容量50≥n ,可按正态总体处理,“可否认为平均寿命为2000小时”等价于作检验2000:0=μH
(2)检验问题主要是对提出的假设检验确定出检验的拒绝域,这可参考指定教材第八章正态总体检验一览表。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
于是可以选定一个适当的正数k, 于是可以选定一个适当的正数
x − µ0 当观察值 x 满足 ≥ k时, 拒绝假设 H 0 , σ/ n x − µ0 反之, 当观察值 x 满足 < k时, 接受假设 H 0 . σ/ n
X − µ0 ~ N (0,1), 因为当H 0为真时 Z = σ/ n
由标准正态分布分位点的定义得 k = zα / 2 ,
观测数 据情况
( x1 ,L , xn ) ∈W
( x1 , L , x n ) ∈ W
c
总体情况
H 0为真
H 1为真
犯第一类 错误 正确
正确 犯第二类 错误
当α 减小时,必导致β的增大; 当β 减小时,必导致α 的增大; 说明:在样本量一定的条件下不可能找到一 个使α 和β 都小的检验。 英国统计学家 Neyman 和 Pearson 提出水平 为α 的显著性检验的概念。
假设检验的基本步骤 一、建立假设
在假设检验中,常把一个被检验的假设称为 原假设,用 H 0 表示,通常将不应轻易加以否 定的假设作为原假设。当 H 0 被拒绝时而接收 的假设称为备择假设,用 H1 表示,它们常常 成对出现。 在上例中,我们可建立如下两个假设: vs H1 : θ < 110 H 0 : θ ≥ 110
检验假设H0 : µ = µ0 , H1 : µ ≠ µ0 .
或称为“ . 或称为“在显著性水平 α下, 针对 H 1检验 H 0”
H0称为原假设或零假设 1 称为备择假设 称为原假设或零假设H , .
4. 拒绝域与临界点
当检验统计量取某个区域C中的值时 当检验统计量取某个区域 中的值时, 我们 中的值时 拒绝原假设H 则称区域C为拒绝域, 拒绝原假设 0, 则称区域 为拒绝域 拒绝域的边 界点称为临界点 临界点. 界点称为临界点 如在前面实例中, 如在前面实例中
显著性检验:控制第一类错误,让它不大于 不考虑第二类错误概率。 数 α 称之为显著性水平。
α ;而
四、给出拒绝域
确定显著性水平后,可以定出检验的拒绝域W。 在上例,若取α=0.05,
x − 110 若令 u = 4/5
则拒绝域有一种表示:
W = {u ≤ u0.05 } = {u ≤ −1.645}
7. 双边备择假设与双边假设检验
在 H 0 : µ = µ0 和 H1 : µ ≠ µ0 中, 备择假设 H1 表示 µ可能大于µ0 , 也可能小于 µ0 , 称为双边备择 假设, 形如 H 0 : µ = µ0 , H1 : µ ≠ µ0 的假设检验称 为双边假设检验.
8. 右边检验与左边检验
形如 H 0 : µ = µ 0 , H 1 : µ > µ 0 的假设检验 称为右边检验 .
(2) 当原假设 H0 不真 而观察值却落入接受域 不真, 而观察值却落入接受域, 的判断, 称做第二类错误 第二类错误, 而作出了接受 H0 的判断 称做第二类错误 又叫 取伪错误, 这类错误是“以假为真”. 取伪错误 这类错误是“以假为真” 犯第二类错误的概率记为
P{当 H 0 不真接受 H 0 } 或 Pµ∈H1 { 接受 H 0 } .
x − µ0 在一次试验中, 得到了满足不等式 ≥ zα / 2 σ/ n 的观察值 x , 则我们有理由怀疑原来 的假设 H 0的 正确性 , 因而拒绝 H 0 .
x − µ0 若出现观察值 x 满足不等式 < zα / 2 , 则 σ/ n 没有理由拒绝假设 H 0 , 因而只能接受 H 0 .
装糖重总体 X 的均值和标准差 ,
由长期实践可知, 标准差较稳定, 由长期实践可知 标准差较稳定 设 σ = 0.015,
则 X ~ N ( µ , 0.0152 ), 其中µ 未知.
问题: 问题 根据样本值判断 µ = 0.5 还是 µ ≠ 0.5 . 提出两个对立假设H 0 : µ = µ 0 = 0.5 和 H 1 : µ ≠ µ 0 . 再利用已知样本作出判断是接受假设 H0 ( 拒绝 假设 H1 ) , 还是拒绝假设 H0 (接受假设 H1 ). 接受假设 如果作出的判断是接受 H0, 则 µ = µ 0 , 即认为机器工作是正常的, 否则, 认为是不正常的. 即认为机器工作是正常的 否则 认为是不正常的
x − µ0 x − µ0 , 当 ≥ zα / 2时,拒绝H0 , < zα / 2时 接受H0 . σ/ n σ/ n
假设检验过程如下: 假设检验过程如下
在实例中若取定 α = 0.05,
则 k = zα / 2 = z0.025 = 1.96,
又已知 n = 9, σ = 0.015,
x − µ0 由样本算得 x = 0.511, 即有 = 2.2 > 1.96, σ/ n
拒绝域为 | z |≥ zα / 2 ,
临界点为 z = − zα / 2 , z = zα / 2 .
5. 两类错误及记号
假设检验的依据是: 假设检验的依据是 小概率事件在一次试验 中很难发生, 但很难发生不等于不发生, 中很难发生 但很难发生不等于不发生 因而假 设检验所作出的结论有可能是错误的. 设检验所作出的结论有可能是错误的 这种错误 有两类: 有两类 (1) 当原假设 0为真 观察值却落入拒绝域 而 当原假设H 为真, 观察值却落入拒绝域, 第一类错误, 作出了拒绝H 的判断, 称做第一类错误 又叫弃 作出了拒绝 0的判断 称做第一类错误 又叫弃 真错误, 这类错误是“以真为假” 真错误 这类错误是“以真为假”. 犯第一类错 误的概率是显著性水平. α
于是拒绝假设H 认为包装机工作不正常. 于是拒绝假设 0, 认为包装机工作不正常
以上所采取的检验法是符合实际推断原理的. 以上所采取的检验法是符合实际推断原理的
由于通常 α总是取得很小 , 一般取 α = 0.01, α = 0.05,
X − µ0 因而当 H 0为真, 即µ = µ 0时, ≥ zα / 2 是一个 σ / n 小概率事件 , 根据实际推断原理 , 就可以认为如果 x − µ0 H 0为真 ,由一次试验得到满足不 等式 ≥ zα / 2 σ/ n 的观察值 x , 几乎是不会发生的 .
形如 H 0 : µ = µ 0 , H 1 : µ < µ 0 的假设检验 称为左边检验 .
右边检验与左边检验统称为单边检验 右边检验与左边检验统称为单边检验. 单边检验
9. 单边检验的拒绝域
设总体 X ~ N ( µ , σ 2 ), σ为已知, X 1 , X 2 ,L, X n 是来自总体 X 的样本 , 给定显著性水平 α ,
参数检验 非参数检验 总体均值, 总体均值 均值差的检验 总体方差, 总体方差 方差比的检验 分布拟合检验 符号检验 秩和检验
假设检验的理论依据
假设检验所以可行,其理论背景为实际 假设检验所以可行, 推断原理, 推断原理,即“小概率原理” 小概率原理”
通常借助于直观分析和理 论分析相结合的做法,其基本原 论分析相结合的做法 其基本原 理就是人们在实际问题中经常 采用的所谓实际推断原理:“ 采用的所谓实际推断原理 “一 个小概率事件在一次试验中几 乎是不可能发生的” 乎是不可能发生的”.
某车间用一台包装机包装葡萄糖, 实例 某车间用一台包装机包装葡萄糖 包得的 袋装糖重是一个随机变量, 它服从正态分布. 袋装糖重是一个随机变量 它服从正态分布.当 机器正常时, 其均值为0.5千克, 标准差为0.015 0.5千克 机器正常时 其均值为0.5千克 标准差为0.015 千克.某日开工后为检验包装机是否正常, 千克.某日开工后为检验包装机是否正常 随机 地抽取它所包装的糖9 称得净重为(千克): 地抽取它所包装的糖9袋, 称得净重为(千克): 0.497 0.506 0.518 0.524 0.498 0.511 问机器是否正常? 0.520 0.515 0.512, 问机器是否正常? 分析: 分析 用 µ 和 σ 分别表示这一天袋
一定时, 当样本容量 n 一定时 若减少犯第一类错误 的概率, 则犯第二类错误的概率往往增大. 的概率 则犯第二类错误的概率往往增大 若要使犯两类错误的概率都减小, 若要使犯两类错误的概率都减小 除非增加 样本容量. 样本容量
6. 显著性检验
只对犯第一类错误的概率加以控制 只对犯第一类错误的概率加以控制, 而不考 犯第一类错误的概率加以控制 显著性检验. 虑犯第二类错误的概率的检验, 称为显著性检验 虑犯第二类错误的概率的检验 称为显著性检验
正如在数学上我们不能用一个例子去证明一个 结论一样,用一个样本(例子)不能证明一个 命题(假设)是成立的,但可以用一个例子 (样本)推翻一个命题。因此,从逻辑上看, 注重拒绝域是适当的。事实上,在“拒绝原假 设”和“拒绝备择假设(从而接收原假设)” 之间还有一个模糊域,如今我们把它并入接收 域,所以接收域是复杂的,将之称为保留域也 许更恰当,但习惯上已把它称为接收域,没有 必要再进行改变,只是应注意它的含义。
二、假设检验的相关概念
1. 显著性水平
数α 称为显著性水平.
上述关于 x 与 µ 0 有无显著差异的判断是 在显 著性水平 α 之下作出的 .
2. 检验统计量
X − µ0 . 统计量 Z = 称为检验统计量 σ/ n
3. 原假设与备择假设
假设检验问题通常叙述为: 在显著性水平 下 假设检验问题通常叙述为 α ,
二、选择检验统计量,给出拒绝域形式
由样本对原假设进行判断总是通过一个统计量 完成的,该统计量称为检验统计量。使原假设 被拒绝的样本观测值所在区域称为拒绝域,一 般用W 表示,在上例中,样本均值 x 愈大,意 味着总体均值θ 也大,因此,合理的拒绝域形 如 W = {( x1 ,L , xn ) : x ≤ c} = {x ≤ c}
(1) 是参数估计问题吗? (2) 回答“是”还是“否” ,假设检验问题。 (3) 命题“合金平均强度不低于110Pa”正确 与 H 0 = {θ : θ ≥ 110} H1 = {θ : θ 否仅涉及如下两个参数集合: < 110} 这两个非空参数集合都称作统计假设, 简称假设。 (4) 我们的任务是利用样本去判断假设(命题) θ “ ∈ H 0 ”是否成立。这里的“判断”在统 计学中 称为检验或检验法则。