补充内容:P值检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
n
u1
n [(u
u1 ) ]2
比如0 =0, =0.05, =1,希望当 1时,
这个检验二类风险不大于0.10 n ,8.57
最大功效检验
Neyman Pearson最有检验原则: 在控制第一类风险满足显著性水平下使得第二类风险尽可能小: () , 0 ()尽可能大, 1
定义,给定一个参数型统计问题,其总体参数 ,要检验假设 H0 : 0 , H1 : 1
接受 H0 拒绝 H0
通过上述分析可知,本例中由样本信息确定的 0.0179是一个重要的值,它是能用观测值2.1做出 “拒绝H0 ”的最小的显著性水平,这个值就是此
检验法的p值.
一般在一个假设检验中,利用观测值能够做出的 拒绝原假设的最小显著性水平称为该检验的 p 值. 按
p 值的定义,对于任意指定的显著性水平α,有以下
习题8-5
1、 一农场 10 年前在一鱼塘中按比例 20:15:40: 25 投放四种鱼:鲑鱼、鲈鱼、竹夹鱼和鲇鱼的鱼苗, 现在在鱼塘里获得一样本如下:
序号 种类
1
2
3
4
鲑鱼 鲈鱼 竹夹鱼 鲇鱼
数量/条 132 100 200 168 600 试取 0.05 ,用 p 值检验法检验各类鱼数量的比例 较 10 年前是否有显著的改变.
结论
(1)若 p 值,则在显著性水平α下接受 H0 . (2)若 p 值,则在显著性水平α下拒绝 H0 .
有了这两条结论就能方便地确定 H0 的拒绝域. 这 种利用p值来检验假设的方法称为p值检验法.
p 值反映了样本信息中所包含的反对原假设 H0 的依据的强度,p 值是已经观测到的一个小概率事件 的概率, p 值越小, H0 越有可能不成立,说明样本 信息中反对 H0 的依据的强度越强、越充分.
将两类错误概率用统一的函数表示出来:
定义 若 是 参数的某检验问题的一个检验法,
( ) P{拒绝H0}
称 ( )为检验法 的功效函数
当H0真时, ( )表示弃真的概率 当H0假时,1- ( )表示取伪的概率
一个优良的检验法 ,应使 ( )在H0真时尽可能小,
在H0假时尽可能大. 这两方面的要求是矛盾的,正如在区间估计问题中, “置信度高”与“估计精确”是矛盾的.
8.05 8.15 8.2 8.1 8.25
给定显著性水平α=0.05,试利用 p 值检验法检验假设检验问
题 H0 : 8, H1 : 8 .
解 这是一个有关正态总体下方差已知时对总体均值 的双边假设检验问题,采用u检验法,检验统计量 为
U X 0 / n
拒绝域的形式为
| u | c
由已知数据可算得检验统计量的观测值
其中
n
(0
)
弃真概率 ()
取伪概率(记为 h())
1 () ( u 2 ) ( u 2 ) ˆ h()
由于
h( )
1 2π
exp
(
u 2
2 )2
exp
(
u 2
2)
2
当 0时 h() 0
当 0时 h() 0
当 0时 h() 取最大值
hmax (u 2 ) (u 2 ) 1
给定显著水平 ,由于
P(拒绝H0|H0真)=P(小概率事件)≤ 所以弃真概率不超过显著水平
第Ⅱ类错误(取伪) 当H0假时,抽样结果表明小概率事件没有发生, 按检验法将接受H0,这样就犯了所谓“取伪”的 错误. 取伪概率为P(接受H0 | H1真)
例1 设总体 X ~ N(, 2 ) , 2 未知,求关于假设 H0 : 0 H1 : 0
由于
u0
x
0
/n
8.15 8 0.2 / 5
1.68
P值= P(| U || u0 |) 2[1 (| u0 |)] 0.093
α=0.05<0.093= p 值
故接受 H0 .
例3 用p值检验法检验本章第二节例3的检验问题
H0 : 1 2 , H1 : 1 2, 0.05
解 用t 检验法,检验统计量T X Y
只要使
|
|
n
|
0
|
足够大
有两种方法可使 | |增大
(1)减小试验误差;
(2)取样本数目n很大.
在实际中,试验误差不可能无限小,因而一般采用 加大样本容量n的方法来控制取伪概率,但这是以 消耗大量人力、物力、财力为代价的.
在实际应用中,要根据“弃真”或“取伪”所造成
的有害程度来确 定 , 的值.
样本容量的选取
时,u N(0,1) ,此时可算得 P(u 2.1) 0.0179,当α
以 0.0179 为基准做比较时,则上述检验问题的结 论如表 8-3 所示.
表 8-3 以 0.0179 为基准的检验问题的结论
显著性水平
拒绝域
检验结论
0.0179
0.0179
u u , (u 2.1) u u , (u 2.1)
其中
0
n
, 的真值
0
二、两类错误概率的控制
前面我们处理参数假设检验问题时,实际上 只考虑了控制第I类(弃真)错误概率不超过显著
水平 .在一些实际问题中,如果错误地接受了
某个假设可能造成重大损失,或由此带来灾难性 的结果,因而在接受这类假设时要特别慎重,也 就是要控制第Ⅱ类(取伪)错误概率.自然希望 选择一个优良的检验方法,使得出现两类错误的 概率都很小.
t(22)
Sw 1 / n1 1 / n2
拒绝域的形式为 | t | c
观测值
t0
31075 28.67 2.85 1/12 1/12
2.647
由计算机软件算得
p值 P(| T || t0 |) P(| T | 2.647) 0.014725
由于
α=0.05 > 0.014725= p值
故拒绝 H0
解 按题意,需要检验假设 H0 : 1.5, H1 : 1.5
这是一个有关正态总体下方差已知时对总体均值的单
边假设检验问题,采用
u
检验法得拒绝域为
u
x
/
0
n
u
由已知数据可算得
u x 0 1.97 1.5 2.1 / n 1/ 20
在以下表中列出了显著性水平α取不同值时相应
的拒绝域和检验结论.
一般,若 p 0.01,称拒绝 H0 的依据很强或称检 验是高度显著的;若 0.01 p 0.05 ,称拒绝 H0 的依据 是强的或称检验是显著的;若 0.05 p 0.1,称拒绝 H0 的依据是弱的或称检验是不显著的;若 p 0.1,一般 来说,没有理由拒绝 H0 .
P值的计算
用X表示检验用的统计量,样本数据算出的统计量的 值记为C.当H0为真时,可算出P值。 左侧检验: p P{X C}
的U 检验法的两类错误概率.
解 检验统计量 U X 0 / n
拒绝域
|
u
|
|
x
0
n
|
u
2
弃真概率P(拒绝H0|H0真)=P(|U|≥ ) = u 2
取伪概率P(接受H0|H1真)=P(|U|< u|H1真) 2
P
X
n
0
n
u 2
(0 0)
P
u
2
X
n
u
2
( u 2 ) ( u 2 )
p 值检验法
前面讨论的假设检验方法称为临界值法,此法 得到的结论是简单的,在给定的显著性水平下,不是 拒绝原假设,就是接受原假设. 但应用中可能会出现
这样的情况:在一个较大的显著性水平(如α=0.05)
下得到拒绝原假设的结论,而在一个较小的显著性水
平(如α=0.01)下却得到接受原假设的结论.
这种情况在理论上很容易解释:因为显著性水平 变小后会导致检验的拒绝域变小,于是原来落在拒绝 域内的观测值就可能落在拒绝域之外(即落入接受域 内),这种情况在实际应用中可能会带来一些不必要的 麻烦.
右侧检验:p P{X C}
双侧检验:X落在以C为端点的尾部区域概率的两倍
2P{X C},C在分布的右侧 p 2P{X C},C在分布的左侧 (如果分布对称) P{| X || C |}
例 2 从甲地发送一个讯号到乙地,设乙地受到的讯号是一个 随机变量 X,且 X N(,0.22 ) ,其中 是甲地发送的真实讯号 值,现从甲地发送同一讯号 5 次,乙地受到的讯号值为
例:对双边U检验:H0:=0,H1: 0 对给定的显著性水平,为了使第二类风险不大于,如何选取样本容量?
解百度文库此时 = 1 ()
[
n
( 0 ) u
2 ] [
n
( 0 ) u
2]
由于 依赖于真值,无论n去多大,不能指望对所有的, 对 进行控制。 但可以对| -0 |>时,选取n对 进行控制
2、考察生长在老鼠身上的肿块大小.以 X 表示在老 鼠身上生长了 15 天的肿块的直径(以 mm 计),设
X N , 2 , , 2 均未知.今随机地取 9 只老鼠(在
他们身上的肿块都长了 15 天),测得 x 4.3, s 1.2, 试 取 0 . 用0 5p ,值 检 验 法 检 验 假 设 H0 : 4.0, H1 : 4.0, 求出 p 的值.
那里,我们采用在保证一定的置信度下使区间长度尽 可能小的原则.
选择一种优良检验的策略思想与此类似,即先保证弃
真的概率不超过指定值 ,再设法控制取伪概率.
为便于说明,继续前面例9的讨论.检验的功效函数
() P {拒绝H0}
P (| U | u 2 )
1 P (| U | u 2 )
1 ( u 2 ) ( u 2 )
第六节 假设检验的功效函数
用概率反证法检验一个假设的推理依据是小概率原理.
在一次抽样中,若小概率事件发生了,则拒绝原假设; 若小概率事件没有发生,拒绝原假设的理由不充分, 因而只好接受原假设.
这样的检验结果可能出现以下两种类型的错误.
一、犯两类错误的概率
第Ⅰ类错误(弃真) 当原假设H0真时,抽样结果表明小概率事件发生了, 按检验法将拒绝H0,这样就犯了所谓“弃真”的错 误. 弃真概率为P(拒绝H0 | H0真)
表 8-2 显著性水平
α=0.05 α=0.025 α=0.01 α=0.005
例 1 中的拒绝域
拒绝域 检验结论
u 1.645 拒绝 H0
u 1.96 u 2.33 u 2.58
拒绝 H0 接受 H0 接受 H0
由此可以看出,对同一个假设检验问题,不同的 α可能有不同的检验结论.
假设检验依据的是样本信息,样本信息中包 含了支持或反对原假设的证据,因此需要我们来 探求一种定量表述样本信息中证据支持或反对原 假设的强度. 现在换一个角度分析例 1,在 1.5
u <u1 2
(u n[ 2
u 1
)
]2
例:对右边U检验:H0: 0,H1: 0 对给定的显著性水平,为了使第二类风险不大于,如何选取样本容量?
解:此时拒绝域:W={
n
x
0
>u },
P(
n
x
0
<u
)
(u
n( 0))
当-0 时,
(u
n(
0 ))
(u
n )
u
此时 最大值=(-
n
u ) (2
n
u ) 2
此时 最大值=(-
n
u ) (2
n
u ) 2
此时 最大值=(-
n
u ) (2
n
u ) 2
此时要使
只需(-
n
u ) (2
n
u ) 2
由于当n很大时,(-
n
u ) 2
0
只需(-
n
u ) 2
=(u1 )
-
n
如果存在一个显著性水平的检验 *,使得对于任意一个 显著性水平的检验,均有
(* ) ( ), 1 则称检验 *为这个假设检验问题在一个显著性水平 下的一致最大功效检验, 当H1为简单假设时,则称 *为最大功效检验。
定理(奈曼-皮尔逊)设总体的分布密度或概率函数为f(x, ), ={0,1},
( X1, X 2, , X n )为样本。要检验假设
其含义为:
当 0与 的偏差越大,取伪的概率越小; 当 0与 非常接进时,取伪的概率几乎等于 1 此时,越小, 越大,见图8-1
由此可知,当 与n都给定时
不可能同时控制两类错误概率都很小
下面先控制弃真的概率为
再来考虑如何减小取伪概率
由于 lim h() 0
要控制取为伪概率 1 () h() ( 很小)
假如这时一个人主张选显著性水平 α=0.05,而另 一个人主张选显著性水平 α=0.01,则第一个人的结论 是拒绝 H0 ,而第二个人的结论是接受 H0 ,如何处理这 一问题呢?
例 1 一支香烟中的尼古丁含量 X N(,1) ,质量标准规定 不 能超过 1.5mg,现从某厂生产的香烟中随机地抽取 20 支,测 得平均每支香烟尼古丁含量为 x 1.97 mg,试问该厂生产的 香烟尼古丁含量是否符合标准的规定?