第8章 假设检验8.1 假设检验
假设检验的基本思想与步骤
§8.1 假设检验的基本思想与步骤
第1页
第8章 假设检验
假设检验是对总体的未知参数或总体服从的分布等,首先 提出某种假设,例如假设未知参数为某一常数或总体服从某 已知分布等,然后由样本提供的信息,对所做假设的“真实性” 做出否定还是不否定,即拒绝还是接受的判定。 假设检验问题分为如下两大类: 参数假设检验:对总体中某个数字特征或分布中的参数提 出假设检验。 非参数假设检验:对总体的分布、总体间的独立性以及是 否同分布等方面的检验。 本章主要介绍假设检验的基本概念、思想方法,讨论正态 总体参数的检验、频率检验、分布拟合检验(非参数假设检验) 等。
2
第 8) 章 一个例子 §8.1 假设检验的基本思想与步骤 ( 一
第3页
例1 某工厂生产10欧姆的电阻.根据以往生产的电阻 实际情况,可以认为其电阻值X~N( , 2), 标准差 σ=0.1.现在随机抽取10个电阻,测得它们的电阻值为: 9.9, 10.1, 10.2, 9.7, 9.9, 9.9, 10, 10.5, 10.1, 10.2. 试问:从这些样本,我们能否认为该厂生产的电阻的平 均值为10欧姆? 问题怎么建立: 确定总体:记X为该厂生产的电阻的测量值.根据假 设,X~N( , 2),这里=0.1. 明确任务:通过样本推断X的均值μ是否等于10欧姆. Hypothesis:上面的任务就是要通过样本去检验“X的 均值μ=10”这样一个假设是否成立.(在数理统计中把 “X的均值μ=10”这样一个待检验的假设记作 “H0:μ=10”称为 “原假设”或 “零假设”) 3
4
第8章
§8.1 假设检验的基本思想与步骤
第5页
合理的思路是找出一个界限c, 当 X 10 c 时,我们就接受原假设H0 , 而当 X 10 c 时,我们就拒绝原假设H0 .
假设检验一般概念
x 400 k 时接受原假设H0;
(1)
x 400 k 时拒绝原假设H0接受备择假设H1
(2)
进一步,由于当H0为真时,有
u x400 ~N(0,1) 25/ n
1 |u|要构x造一40个0具有明确k分布的统计量,可将(1)、(2)式转化为
25/ n 25/ n
2 |u|时接x受原40假0设H0 k
2. 拒绝域与接受域 称是检验水平或显著性水平,它是我们
制定检验标准的重要依据。常数u/2把标准正态分布密度曲线下
的区域分成了两大部分,其中一部分
(x1,x2, ,xn)uu/2
称为H0的拒绝域或否定域, 当样本点落入拒绝域时,我们便拒 绝原假设H0(同前述(6)式),另一部分
(x1,x2, ,xn)uu/2
(1)根据问题的要求提出假设,写明原假设H0和备择假设H1的
具体内容。
(2)根据H0的内容,建立(或选取)检验统计量并确定其分布。 (3)对给定(或选定)的显著性水平 ,由统计量的分布查表 或计算确定出临界值,进而得到H0的拒绝域和接受域。
(4)由样本观察值计算出统计量的值。
(5)做出推断:当统计量的值满足“接受H0的条件”时就接受 H0,否则就拒绝H0接受H1 。
u
2
时接受原假设H0 (5)
时拒绝原假设H0,接受备择假设 H1 (6)
分析(5)、(6)两式,可以这 样认为:
拒绝H0,是因为以H0成立 为出发点进行推理时,得到 了不合情理的结论,使小概 率事件在一次试验中发生了。
接受H0,是因为以H0成立 为出发点进行推理时,未发 现异常。
这就是带有概率特征的反证 法,认为小概率事件在一次 试验中不可能发生。
H0:X服从泊松分布;H1:X不服从泊松分布.
第八章 假设检验
(一)问题的提出
例1.1 体重指数BMI是目前国际上常用的衡量人体胖 瘦程度以及是否健康的一个标准. 专家指出, 健康 成年人的BMI 取值应在 18.55- 24.99 之间.某种 减肥药广告宣称, 连续使用该种减肥药一个星期便 可达到减肥的效果.为了检验其说法是否可靠,随机 抽取9位试验者(要求BMI 指数超过25,年龄在20-25 岁女生),
x 0.522 0.465, 依然拒绝H0;
那么,拒绝H0的最小的值 是多少?最小的显 著水平又是多少?
(一)问题的提出
先让每位女生记录没有服用减肥药前的体重, 然后 让每位女生服用该减肥药, 服药期间, 要求每位女 生保持正常的饮食习惯, 连续服用该减肥药1周后, 再次记录各自的体重.测得服减肥药前后的体重差 值X(服药前体重-服药后体重) (单位: kg): 1.5,0.6,-0.3,1.1,-0.8,0,2.2,-1.0,1.4 设X~N(μ,0.36), μ未知,根据目前的样本资料能否 认为该减肥药广告中的宣称是可靠的?
n i1
Xi
~
N(,
1 ), n
H0 : 0, H1 : 1( 0 ), 拒绝域:X c.
P1 (X c)
P0 (X c)
0
c
1
犯两类错误的 概率相互制约
11
例1.1中,犯第I类错误的概率
(c) P{拒绝H0|H0是真的} P{X c| 0}
P{ X c | 0} / n / n
例1.2 一种饼干的包装盒上标注净重200g,假 设包装盒的重量为定值,且设饼干净重服从N (μ,σ2), μ, σ2均未知.现从货架上取来3盒,称 得毛重(单位:g)为 233,215,221,根据这 些数据是否可以认为这种包装饼干的标准差超 过6g?
概率论与数理统计第八章假设检验
为判断所作的假设是否正确, 从总体中抽取 样本, 根据样本的取值, 按一定的原则进行检 验, 然后, 作出接受或拒绝所作假设的决定.
整理课件
2
我们主要讨论的假设检验的内容有
参数检验 总体均值、均值差的检验 总体方差、方差比的检验
H0: Θ0 vs H1: Θ1,
根据样本,构造一个检验统计量T 和检验法则: 若与T的取值有关的一个小概率事件W发生,则 否定H0,否则接受H0,而且要求
P(W|H0)
此时称W为拒绝域,整为理课检件 验水平。
11
例 3. 某厂生产的螺钉,按标准强度为68克/mm2,
而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 E ( X ) = = 68, 则认为这批螺钉符合要求,否
7
所以我们否定H0, 认为隧道南的路面发生交 通事故的概率比隧道北大.
做出以上结论也有可能犯错误。这是因为 当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯 错误。这一概率正是P=0.043.
于是, 我们判断正确的概率是1-0.043=95.7%
整理课件
8
假设检验中的基本概念和检验思想 (1) 根据问题的背景, 提出原假设
再作一个备择假设
H1: p> 0.35. 在本问题中,如果判定H0不对,就应当承认H1.
检验: 三起交通事故的发生是相互独立的, 他们
之间没有联系.
如果H0为真, 则每一起事故发生在隧道南的 概率都是0.35, 于是这三起交通事故都发生在隧
道南的概率是
P= 0.353 ≈ 0.043.
8.1 假设检验的基本思想与步骤
如在工件直径的假设检验问题中,设α1 < α2 < α3, 对不同的分位数
电子科技大学
假设检验基本思想
(x)
显著性水 平α3下拒
绝H0
- u1 - u2- u3
u3 u2 u1
显著性水平α2下接受H0
α1 < α2 < α3
电子科技大学
假设检验基本思想
注2 在确定H0的拒绝域时应遵循有利准则: 将检验统计量对H0有利的取值区域确定为接受 域,对H1成立有利的区域作为拒绝域. 如在工件直径假设检验问题中
1.提出原假设:根据实际问题提出原假设
H0和备选假设H1;
电子科技大学
假设检验基本思想
2. 建立检验统计量:寻找参数的一个良好 估计量,据此建立一个不带任何未知参数的统
计量U作为检验统计量,并在H0成立的条件下,
确定U的分布(或近似分布);
2
3.确定H0的否定域:根据实际问题选定显
著性水平α,依据检验统计量的分布与H0的内
给定α,H1的否定域为:
x
-
0
-
0
n
uα
例中
x
-
2
-0.022
-
0
n
u0.05
-0.0165
拒绝H0,即认为新工艺使工件直径偏小.
大样本假设检验例
电子科技大学
假设检验基本思想
四、两类错误 1)假设检验的主要依据是“小概率事件原 理”,而小概率事件并非绝对不发生. 2)假设检验方法是依据样本去推断总体,样 本只是总体的一个局部,不能完全反映整体 特性.
统计学 第8章 假设检验 教学课件ppt
确定适当的检验统计量
什么是检验统计量?
1. 用于假设检验决策的统计量
原假设H0为真 点估计量的抽样分布 (样本均值、样本方差)
比较 3. 作出决策
双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0
利用 P 值 进行决策
什么是P 值?
(P-value)
P值告诉我们: 如果原假设是正确的话,我们得到得到样本观察 结果或更极端结果出现的可能性有多大,如果这 个可能性很小,就应该拒绝原假设
因此,如果在一次抽样中竟然出现了满足
X 0 / n
ห้องสมุดไป่ตู้
的 u /2
X
那么我们就有理由怀疑原假设H0的正确性了,因此会拒
绝H0 。
由于 | U |
X 0 / n
u 2
是一个小概率事件.
故我们可以取拒绝域为:
W: | U | u 2
如果由样本值算得该统计量的实测值落入区域 W,则拒绝H0 ;否则,不能拒绝H0 .
1、生产已不正常
2、生产正常:但属于小概率事件,一次抽样中几乎 不可能发生
因此:在原假设成立(生产正常)的情况下, 若发生小概率事件,则我们有充分的理由怀 疑原假设已不成立。
因此若H0为真,即 0 时,
X
0
/ n
u /2
是一个小概率事件:1%、5%、10%
而小概率事件在一次试验中基本上不应该发生 。
第八章 假设检验
第八章 假设检验参数估计和假设检验是统计推断中的两类重要问题。
在前一章中我们讨论了用样本统计量来推断总体未知参数的方法—参数的点估计与区间估计,本章我们将讨论正态总体分布中的未知参数的假设检验以及总体分布函数的假设检验。
§8.1 假设检验的基本概念§8.1.1 问题的提出在实际工作中,我们经常要面对这样的问题:总体的分布函数的类型或分布函数中的一些参数是未知的,需要对总体分布函数的类型或分布函数中的未知参数提出某种"假设",然后通过已经获得的一个样本对提出的“假设”作出成立还是不成立的判断(或决策)。
为了介绍假设检验的基本思想,我们先来看一个例子:例8.1 某食品厂生产的罐头规定每听的标准重量为500克,这些罐头由一条生产线自动包装,在正常的情况下,由经验知道生产出的罐头重量(单位:克)服从正态分布N (500,22)。
质量管理中规定每隔一定时间要抽测5听罐头。
若某次抽测的5听罐头的重量为501,507,498,502,504(克),假定方差不变,这时我们是否可以得出生生产线运转正常(即这段时间生产的罐头的平均重量为500克)的判断呢?由题意知,罐头重量),2N(μ~X 2,记μ0=500,则要回答的问题是:μ=μ0吗? 我们可以先假定μ=μ0,并称之为待检假设或原假设,记为H 0:μ=μ0这个原假设可能成立也可能不成立。
当原假设不成立时,称μ的取值为备选假设,这里取“μ≠μ0”为备选假设,记为H 1:μ≠μ0所谓假设检验问题就是要利用样本提供给我们的信息,在原假设H 0与备选假设H 1之间作出拒绝哪一个、接受哪一个的判断,简称为H 0对H 1的检验问题。
在例8.1中,我们把问题归结成统计假设:H 0:μ=500,对H 1:μ≠500。
那么,如何来解决H 0对H 1的检验问题呢?由参数估计知,x 是μ的一个"好"估计量。
如果原假设H 0成立,即μ=500,那么,x 通常应很接近500,即|x -500|通常应很小;否则,就认为原假设H 0不成立,也即μ≠500。
概率论第八章8.1 假设检验的基本原理
0.12 0.1 0.08 0.06
α/2
0.04 0.02 60 62.5 65 67.5 70 72.5 75
α/2
H0 真
0. 12 0. 1 0. 08 0. 06 0. 04 0. 02
β
H0 不真
67 .5 70 72 .5 75 77 .5 80 82 .5
注 1º 一般,作假设检验时,先控制犯第一 一般,作假设检验时, 类错误的概率α,在此基础上使 β 尽量 一般要增大样本容量. 地小. 地小.要降低 β 一般要增大样本容量. 不真时,参数值越接近真值, 越大. 当H0不真时,参数值越接近真值,β 越大. 注 2º 备择假设可以是单侧,也可以双侧. 备择假设可以是单侧,也可以双侧. 引例2中的备择假设是双侧的. 引例2中的备择假设是双侧的.若根据以 往生产情况, =68.现采用了新工艺 现采用了新工艺, 往生产情况,µ0=68.现采用了新工艺,关 心的是新工艺能否提高螺钉强度, 心的是新工艺能否提高螺钉强度,µ越大 越好.此时可作如下的右边假设检验: 越好.此时可作如下的右边假设检验: H0 : µ = 68; H1 : µ > 68
拒绝 H0
第一类错误
(弃真) 弃真)
正确
犯第一类错误的概率通常记为 α 犯第二类错误的概率通常记为 β
任何检验方法都不能完全排除犯错 误的可能性. 误的可能性.理想的检验方法应使犯两类 错误的概率都很小, 错误的概率都很小,但在样本容量给定的 情形下,不可能使两者都很小,降低一个, 情形下,不可能使两者都很小,降低一个, 往往使另一个增大. 往往使另一个增大. 假设检验的指导思想是控制犯第一类 然后,若有必要, 错误的概率不超过α, 然后,若有必要,通 过增大样本容量的方法来减少 β .
第八章假设检验
若过分大,则有理由 怀疑H0的正确性
7/51
§8.1 假设检验
当观察值 x 满足 x 0
此即假定H0正确 时的小概率事件
/ n
k时, 拒绝假设 H0 ,
反之, 当观察值 x 满足
x 0
/ n
k时, 接受假设 H0 .
如何选取k呢,先看以下事实: 由于作出决策的依据是一个样本,当实际 上H0为真时,仍可能作出拒绝H0的决策,这种 可能性是无法消除的,这是一种错误。
24/51
第八章 假设检验
§8.1 假设检验 §8.2 正态总体均值的假设检验 §8.3 正态总体方差的假设检验
§8.6 分布拟合检验
25/51
§8.2 正态总体均值的假设检验
假设检验是针对弃真这一可能犯的错误人为设定一个界限, 如果在这个界限内,认为原假设成立,否则的话,由于显 著性水平取得很小,表明小概率事件发生,根据实际推断 原理,原假设不成立。 尽管也可能犯第II类取伪的错误,这时尽管总体的性质发 生了改变但没有发现,往往影响较小。 正态总体均值的检验分为三种情况
/ n
若|z|= X 0 k,则称 x 与μ0的差异是显著的,以至
于小概率事件发生了,这时拒绝H0, 否则则称 x与μ0的差异是不显著的,这时接受H0, 选定的数α称为显著性水平,在α下对显著性判断
X 0 统计量Z= 称为检验统计量 / n
13/51
/ n
§8.1 假设检验
假设检验的相关定义: 像上例中的假设检验问题可叙述成: “在显著性水平α下,检验假设H0:μ=μ0,H1:μ≠μ0” 或“在显著性水平α下,针对H1检验H0”
例如:提出总体期望服从泊松分布的假设,然后进行判断 提出正态总体期望为μ0的假设,然后进行判断
第8章 平均数的假设检验
重点
• 根据样本平均数的抽样分布,可以对总体 平均数进行差异显著性检验,需考虑总体 方差是否已知,总体是否服从正态分布, 是大样本还是小样本等问题。
• 根据两个独立样本平均数之差的抽样分布, 可以检验两个总体的平均数有无显著差异, 需考虑两总体的方差是否已知,两总体是 否服从正态分布,方差是否齐性,是大样 本还是小样本等问题。
• 显著性水平和可靠性程度(置信水平)之间 的关系是:两者之和为1。
双侧检验与单侧检验
• 双侧检验(two-tailed test,twosided test):将α等分为左右两个部分,
左右两边各设置一个拒绝域,中间是接受域。 每个拒绝域相应的概率为α/2. 零假设为无显著 差异的情况;
• 单侧检验(one-tailed test):要么将与α
– 备择假设(alternative hypothesis,或称 研究假设、对立假设),用H1表示。
假设检验是从零假设出发,视其被拒绝的概 率,从而得出决断。
假设检验的步骤
• 2.确定适当的检验统计量并计算其值
• 确定检验统计量时,要根据抽样分布做出 选择。不同类型的问题涉及到的抽样分布 不同,要选择不同的检验统计量。
假设检验的基本思想
设(X1,X2,…,Xn)
是抽自正态分布总体 X~N(μ, σ2)的一个容 量为n的简单随机样 本,则其样本均值也 是一个正态分布随机 变量,且有
E(X) X
D(
X
)
2 X
2
n
X ~ N(, 2 )
n
Z X ~ N (0,12 ) / n
假设检验
§8.1假设检验的基本概念(上)
上面的推导过程反映了一般假设检验的思想方法。
假设检验又称显著性检验,其中 称Z X 0 为检验统计量;
0 n
称z/2为临界值; 称W={|z|z/2}为(原假设H0的)拒绝域。
当样本观察值代入检验统计量,小概率事件发生了, 则样本观察值所落入的区域就是(原假设H0的)拒绝域, 此时拒绝H0成立,从而接受H1成立。 当样本观察值代入检验统计量,小概率事件没有发生, 则不拒绝(或接受)H0成立。此时样本观察值所落入的 区域就是(原假设H0的)接受域。
第八章 假设检验
§8.1 假设检验的基本概念 §8.2 正态总体下参数的假设检验
【导言】在上一章,我们讨论了求未知参数的点估计和
区间估计的方法。但这并不能解决完总体中有关未知
参数的基本问题。在第六章,我们曾提出判断电器平 均寿命是否有“>5万小时” 的问题。解决这样问题的
方法是数理统计的另一个基本内容,称为假设检验。
Z X 0 0 n
凑分布
的相对大小一致,从而就是判断Z取值的相对大小。
这就需要一个临界值,以判断|Z|取值的相对大小。
下面来寻求这样一个临界值。
我们取一个很小的正数,比如=0.01, =0.05, 称为
(x)
显著性水平,并且假定H0成立,此时有
Z X 0 ~ N (0,1), 0 n
/2 -z/2
这个问题的一般形式是:当总体X~N(, 02),其中02
已知,取得样本X1, X2, …, Xn及其观测值x1, …, xn后,
要判断H0: =0,H1: 0中哪一个成立.
这时我们掌握的数据是:x=508,这与0=500有差异。
一般情形下,x500,但是它与500是否足够地接近是
假设检验的基本思想
㈡ 检验的逻辑过程 例3. 设某考试成绩X~N(m , 202), 从中任抽36人的成绩, 算得 平均分为75, 问在显著性水平a = 0.05下, 是否可以认为全体考生 的平均成绩为70分? 要点: 某考试 (所有) 成绩是总体, 任意抽取的36人的成绩为 样本. 欲通过样本信息推断总体分布中的 m 是否为70分? 检验依据: 小概率事件在一次试验中一般不发生,若发生了,则认为
② 选择统计量
③ 确定拒绝域
选统计量 U
X m
/
~ N ( 0 ,1) .
n
由 P { | U | u a } a 0 .0 5, 查 表 得 拒 绝 域 为
2
U< -1.96 或 U>1.96 . ④ 计算统计量的值 统 计 量 的 值 为
U x m
完整解答…
/
75 70 20 / 6 1 .5 . n
《概率统计》 返回 下页 结束
例3. 设某考试成绩X~N(m , 202), 从中任抽36人的成绩, 算得 平均分为75, 问在显著性水平a = 0.05下, 是否可以认为全体考生 的平均成绩为70分? 检验过程(形而下): ① H0: m =m0=70, 即总体X~N(70 , 202), 从而知
一、假设检验的基本思想 例1. 设某厂生产一种灯管, 其寿命 X~N (m , 200 2), 原来灯管
的平均寿命为m = 1500小时. 现在采用新工艺后, 在所生产的灯管 中抽取25只, 测得平均寿命为1675小时. 问采用新工艺后, 灯管寿
命是否有显著提高 ?
问题表现为:判断 m >1500 ? 例2. 某种农作物的农药残留量 X 是否服从正态分布 ?
第8章 假设检验
关于建立假设的几点认识:
❖ 1.原假设和备择假设是一个完备事件组,且相互对 立,即必有一个成立,而且只有一个成立。
❖ 2.在假设检验中,通常将符号≤ ≥ =放在原假设上。 ❖ 3. 不同的研究者出于不同的研究目的或角度,可能
根据计算的检验统计 量与临界值进行比较, 得出拒绝或不拒绝原 假设的结论
检验统计量与拒绝域
拒绝原假设的检验统计量的所有可能取 值的集合,称为拒绝域。
若 绝对值Z临界值,拒绝原假设
拒绝域的大小与我们事先选定的显著性 水平有关。
根据选定的显著性水平确定的拒绝域的 边界值,称为临界值。
选定的显著性水平后,查阅书后的附表 就可以得到具体的临界值,将检验统计 量与之比较,就可以作出拒绝或接受原 假设的决策。
H0 H1
研究的问题 双侧检验 左侧检验 右侧检验
= 0
8.1.4 用P 值进行假设检验
❖ P 值是一个概率值(194页) 左侧检验时,P值为曲线左边小于等于检
验统计量部分的面积
右侧检验时,P值为曲线右边大于等于检
验统计量部分的面积
双侧检验时P值为曲线两边大于等于或小于 等于检验统计量部分的面积检验统计量部
什么是原假设?
1. 待检验的假设,又称“0假设”
为什么叫0 假设?
2. 研究者想收集证据予以反对的假设
3. 总是有等号 , 或
4. 表示为 H0 例如, H0: 3190(克)
什么是备择假设?
1. 与原假设对立的假设,也称“研究假设”
2. 研究者想收集证据予以支持的假设,总 是有不等号: , 或
假设检验的基本概念.ppt
这样,原假设不会被轻易拒绝,一旦结果为拒绝 原假设,其结果也是可以信赖的,而且我们还知道此
时犯第一类错误的概率不超过;
如果结果为不能拒绝原假设,考虑到原假设为以 往的经验,做出接受原假设的推断也是比较合理的.
8.1.4 假设检验的步骤
因此,假设检验问题可能会犯如下两类错误:
第一类错误(“弃真”):实际情况是H0成立,而检验 的结果表明H0不成立,拒绝了H0.
第二类错误(“取伪”):实际情况是H0不成立,H1成 立,而检验的结果表明H0成立,接受了H0. 下面我们来研究一下犯这两类错误的概率.
8.1.3 假设检验的两类错误
犯第一类错误的概率:
没有足够的理由拒绝H0,应认可H0.
8.1.2 假设检验的基本思想
看来,是否拒绝 H0的关键是看U
因此
x 0
/ n
z
2
X
/
0
n
的取值是否满足
称
x 0
/ n
z
2 即{|
U
|
z/2}称为H0的拒绝域.
称–z/2和z/2为H0的拒绝域的临界点(值).
称 U X 0 为检验统计量.
/ n
0.499 0.515 0.508 0.512 0.498 0.515 0.516 0.513 0.524
问这台包装机工作是否正常? 通过分析知道: 要检验包装机工作是否正常,就是要检验总体均值
= 0.5kg是否成立.
Hale Waihona Puke 8.1.1 假设检验的思想方法
具体思路是:
首先提出两个对立的假设:
H0: = 0.5
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
假设检验
一、假设检验的基本原理 二、假设检验的相关概念 三、假设检验的一般步骤 四、小结
一、假设检验的基本原理
在总体的分布函数完全未知或只知其形式、 在总体的分布函数完全未知或只知其形式、 但不知其参数的情况下, 但不知其参数的情况下 为了推断总体的某些性 提出某些关于总体的假设. 质, 提出某些关于总体的假设 例如, 提出总体服从泊松分布的假设 又如, 例如 提出总体服从泊松分布的假设;
三、假设检验的一般步骤
1. 根据实际问题的要求 , 提出原假设 H 0 及备择假
设 H1 ;
2. 给定显著性水平 α 以及样本容量 n ;
确定检验统计量以及拒绝域形式; 3. 确定检验统计量以及拒绝域形式;
4. 按 P{ H 0 为真拒绝 H 0 } ≤ α 求出拒绝域 ; 5. 取样 , 根据样本观测值确定接 受还是拒绝 H 0 .
形如 H 0 : µ = µ 0 , H 1 : µ ≥ µ 0 的假设检验
称为右边检验 .
形如 H 0 : µ = µ 0 , H 1 : µ ≤ µ 0 的假设检验
称为左边检验 .
右边检验与左边检验统称为单边检验. 右边检验与左边检验统称为单边检验
9. 单边检验的拒绝域
设总体 X ~ N ( µ , σ 2 ), σ为已知 , X 1 , X 2 ,L, X n
3. 原假设与备择假设
, 下 检验假设 H 0 : µ = µ0 ,
H 1 : µ ≠ µ0 .
. “ 也常说成 在显著性水平 α下, 针对 H 1 检验 H 0 ”
H 0 称为原假设或零假设 , H 1 称为备择假设 .
4. 拒绝域与临界点
当检验统计量取某个区域C中的值时 当检验统计量取某个区域 中的值时, 我们拒 中的值时 则称区域C为拒绝域 为拒绝域, 绝原假设 H 0 , 则称区域 为拒绝域 拒绝域的边界 点称为临界点. 点称为临界点 如在上例中, 如在上例中,
拒绝域为 | z |≥ zα / 2 ,
临界点为 z = zα / 2 , z = − zα / 2 .
5. 两类错误及记号
假设检验的依据是: 假设检验的依据是 小概率事件在一次试验 中很难发生, 但很难发生不等于不发生, 中很难发生 但很难发生不等于不发生 因而假设 检验所作出的结论有可能是错误的. 检验所作出的结论有可能是错误的 这种错误有 两类: 两类: (1) 当原假设 0为真, 观察值却落入拒绝域 而 当原假设H 为真, 观察值却落入拒绝域, 第一类错误 作出了拒绝H 的判断, 称做第一类错误, 又叫弃 作出了拒绝 0的判断 称做第一类错误 又叫弃 犯第一类错误 真错误, 这类错误是“以真为假” 真错误 这类错误是“以真为假”. 的概率是显著性水平α .
因此拒绝域的形式为 x ≥ k , (k是某一正常数 )
由 P{ H 0 为真拒绝 H 0 } = Pµ∈H 0 {X ≥ k }
X − µ0 k − µ0 = Pµ ≤ µ0 ≥ σ / n σ / n X − µ k − µ0 ≥ ≤ Pµ ≤ µ0 σ / n σ / n
(2) 当原假设 H0 不真, 而观察值却落入接受域 不真, 而观察值却落入接受域, 的判断, 称做第二类错误 而作出了接受 H0 的判断 称做第二类错误 又叫 第二类错误, 取伪错误, 这类错误是“以假为真” 取伪错误 这类错误是“以假为真”. 犯第Ⅱ 犯第Ⅱ类错误的概率记为
P{当H 0不真接受 H 0 } 或 Pµ∈H1 { 接受H 0 }.
上式不等号成立的原因: 上式不等号成立的原因:
X − µ X − µ0 , 因为 µ ≤ µ 0 , 所以 ≥ σ/ n σ/ n
X − µ0 k − µ0 X − µ k − µ0 ≥ ≥ 事件 ⊂ . σ / n σ / n σ / n σ / n
要控制 P { H 0 为真拒绝 H 0 } ≤ α , 只需令 X − µ k − µ0 Pµ ≤ µ0 ≥ =α. σ / n σ / n
则称 x 与µ 0的差异是不显著的, 则我们接受H0 .
1. 显著性水平
. 数α 称为显著性水平 上述关于 x 与 µ 0 有无显著差异的判断是 在显
则我们接受 H 0 .
2. 检验统计量
X − µ0 . 称为检验统计量 统计量 Z = σ/ n
前面的检验问题通常叙述成:在显著性水平 α 前面的检验问题通常叙述成:
和
H 1 : µ ≠ µ0 .
我们给出一个合理的法则, 我们给出一个合理的法则, 然后, 根据这一法 然后,
则, 利用已知样本作出决策 是接受假设 H 0 (即拒绝
假设H 1 ) , 还是拒绝假设 H 0 (即接受假设 H 1 ) . 如果
作出的决策是接受 H 0 , 则认为 µ = µ 0, 即认为机器 工作是正常的, 否则, 认为是不正常的. 工作是正常的 否则 认为是不正常的
点温度 (0°C ). 测得生产商提交的 批牛奶的冰点 测得生产商提交的5批牛奶的冰点
温度, 温度, 其均值 x = −0.535°C , 问是否可以认为生产 商在牛奶中掺了水? 商在牛奶中掺了水? α = 0.05. 取
解
按题意需检验假设
H0 :
µ ≤ µ 0 = −0.545 µ > µ0
(即设牛奶未掺水 即设牛奶未掺水) 即设牛奶未掺水
分析 以 µ 和 σ 分别表示这一天袋装糖 的净 重总体X 重总体 的均值和标准差, 由长期实践表明标准差比较稳定, 由长期实践表明标准差比较稳定 我们就设
于是 X ~ N ( µ , 0.015 2 ), 这里µ 未知. σ = 0.015, 问题 问题是根据样本值判断 µ = 0.5 还是
µ ≠ 0.5 .为此, 为此, 我们提出两个相互对立的假设 H 0 : µ = µ 0 = 0.5
x − µ0 ≥ k时, 拒绝假设 H 0 , 当观测值 x满足 σ/ n x − µ0 反之, 反之, 若 < k时, 就接受假设 H 0 . σ/ n X − µ0 为真时, 由于当 H 0为真时, Z = ~ N (0,1), σ/ n
k 由标准正态分布分位点的定义得: 由标准正态分布分位点的定义得: = zα / 2 ,
是一个小概率事件 , 根据实际推断原理 , 就可以认
由一次试验得到满足不 等式 为如果 H 0为真 ,
x − µ0 ≥ zα / 2 的观察值 x , 几乎是不会发生的 . σ/ n
x − µ0 在一次观测中竟出 现了满足 ≥ zα / 2的 x , σ/ n
我们有理由怀疑原来的 假设H 0的正确性 , 因而拒
x − µ0 x − µ0 < zα / 2时, 接受H 0 . ≥ zα / 2时, 拒绝 H 0 , 当 σ/ n σ/ n
假设检验过程如下: 假设检验过程如下:
在实例中若取定 α = 0.05,
则 k = zα / 2 = z0.025 = 1.96,
又已知 n = 9, σ = 0.015, x − µ0 由样本算得 x = 0.511, 即有 = 2.2 > 1.96, σ/ n
7. 双边备择假设与双边假设检验
在 H 0 : µ = µ 0 和 H 1 : µ ≠ µ 0 中, 备择假设 H 1
表示 µ可能大于 µ 0 , 也可能小于 µ 0 , 称为双边备择
假设 , 形如 H 0 : µ = µ 0 , H 1 : µ ≠ µ 0 的假设检验称
为双边假设检验 .
8. 右边检验与左边检验
于是拒绝假设H 认为包装机工作不正常. 于是拒绝假设 0,认为包装机工作不正常
以上所采取的检验法是符合实际推断原理的. 以上所采取的检验法是符合实际推断原理的. 因通常 α总是取得很小, 一般取 α = 0.01,0.05.
X − µ0 因而当H 因而当 0为真, 即µ = µ 0时, ≥ zα / 2 σ / n
H1 :
(即设牛奶已掺水 即设牛奶已掺水) 即设牛奶已掺水
这是右边检验问题, 其拒绝域为 这是右边检验问题, x − µ0 z= ≥ z 0.05 =1.645. σ n 现在
某车间用一台包装机包装葡萄糖, 例1 某车间用一台包装机包装葡萄糖 袋装糖的 净重是一个随机变量, 它服从正态分布. 净重是一个随机变量 它服从正态分布 当机器正 常时, 其均值为0.5kg, 标准差为 常时 其均值为 标准差为0.015kg. 某日开工 后为检验包装机是否正常, 后为检验包装机是否正常 随机地抽取它所包装 的糖9袋 称得净重为(kg): 的糖 袋, 称得净重为 0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512, 问机器是否正常? 问机器是否正常
由于 所以
X−µ ~ N (0, 1), σ/ n σ k − µ0 k = µ0 + zα , = zα , n σ/ n
故右边检验的拒绝域为
x ≥ µ0 +
即 类似证, 类似证,
σ
n
zα ,
x µ0 ≤ − zα . 左边检验的拒绝域为 z = σ/ n
对于正态总体提出数学 期望等于 µ 0 的假设等.
假设检验就是根据样本对所提出的假设作出 判断: 是接受, 还是拒绝. 判断 是接受 还是拒绝. 假设检验问题是作出这一决策的过程. 假设检验问题是作出这一决策的过程.
假设检验问题是统计推断的另一类重要问题. 假设检验问题是统计推断的另一类重要问题. 如何利用样本值对一个具体的假设进行检验? 如何利用样本值对一个具体的假设进行检验? 通常借助于直观分析和理论 分析相结合的做法, 分析相结合的做法 其基本原理就 是人们在实际问题中经常采用的 所谓实际推断原理:“一个小概率 所谓实际推断原理 一个小概率 事件在一次试验中几乎是不可 能发生的”. 能发生的” 下面结合实例来说明假设检验的基本思想. 下面结合实例来说明假设检验的基本思想.