基于单个均值检验的第二类错误成因及计算
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
期末研究学习论文
基于单个均值检验
的第Ⅱ类错误成因及计算
姓名:
教师:
时间:2013.12
基于单个均值检验 的第Ⅱ类错误成因及计算
摘要
在统计假设检验中,不可避免会遭遇两种类型的错误:第Ⅰ类错误(拒真错误)与第Ⅱ类错误(纳伪错误)。可以认为,第一类错误由检验中的实际推断原理引起,第二类错误由检验中的逻辑谬误引起。第一类错误出现的概率为显著性水平α,即小概率事件发生的概率。第二类错误的计算方法是阐述的重点,也是在解决这一问题上与目前的方法不一致的地方。本文基于对单个均值的检验,着重分析了第Ⅱ类错误的成因、能否计算及如何计算。
本文发现,犯第Ⅰ类错误的概率为α, 是可以控制的;而另一方面,由于0H 非真状态不唯一,真实分布的未知,β的数值通常是不可控制。
一般地,β的数值也与显著性水平α,样本容量n ,真实参数μ的值有密切关系。特别地,β的数值随着真实1μμ=和原假设中0μ的偏离程度而变化,01μμμ∆=-越小,犯第Ⅱ类错误β的值会显著增大。
本文倾向于认为β的数值在实际情况中是不能计算的。事实上,当且仅当真实μ已知,才能计算得到β的精确值,这与样本方差s 是否看作一个统计量相关性不大(这种情况可用t 检验解决)。而在这种情况下, μ已然是个已知数,那么也无从谈起进行假设检验。
对于将S 作为一个统计量,我们得到了其分布,可求得其方差为(n c 为修偏系数)
2
211n DS c σ⎛⎫
=- ⎪⎝⎭
当n →∞时,随着修偏系数1n c →,0DS →,用样本数据s 代替S 误差将越来越小
关键词:假设检验,第Ⅱ类错误,修偏系数,成因,计算
目录
一、问题重述 (1)
二、基本命题 (2)
三、第Ⅱ类错误成因分析 (2)
四、第Ⅱ类错误概率值的计算 (3)
五、第Ⅱ类错误概率值影响因素分析 (5)
六、第Ⅱ类错误概率值计算的反思 (6)
七、结论 (9)
八、参考文献 (9)
一、问题重述
考虑方差末知时正态总体2~(,)X N μσ的假设检验
00110:,:()H H μμμμμ==>
若检验的显著水平为α,易知其拒绝域为
X 01(1)X t n α-⎫
=>-⎬⎭
显然,拒绝域所犯第I 类错误的概率为α。若考虑第Ⅱ类错误,则由基本公式 {
}
0111011111(1)(1)(1)X P X H P t n P X n X P X P t n αααβμμμμμμμμμ---⎧⎫
==≤-=⎬
⎭⎧⎫=≤+-=⎨⎬
⎩⎭
⎧⎫⎪⎪⎪=≤=⎬
⎪
⎪⎪⎩⎭⎧⎫=≤+-=⎬
⎭
由于在11:H μμ=
~(1)X t n -,所以部分同学认为,获得抽样数据(样本
根方差s )后,第II 类错误的概率β是可求的。
但另一部分同学则认为,由于右端表达式S 是一统计量,是随机变量,
不能用样本数据s 来代替,此问应从长计宜。
更多的同学了解了以上两种思想后,认为β的表达式是不确定的,不能计算。由此认为该检验犯第II 类错误的概率β是不存在的。
请进行深入的分析思考,推断验证,尽力对这个问题作出全面恰当的回答。
二、基本命题
A 、 作为一个总体的大多数样本的统计量的值,将会落在一个被指定的区域(接受域).
B 、某一样本的统计量的值落在一个被指定的区域.
C 、若A 为真,且推断过程无误,则B 可能为真;若B 为真,且推断过程无误,则A 为真.
D 、在检验中,我们要根据实际推断原理,即概率很小的事件在一次试验中实际上几乎不会发生.
三、第Ⅱ类错误成因分析
统计检验中为什么会出现第Ⅰ类错误与第Ⅱ类错误呢?一般认为,那是因为“弃真”与“纳伪”。显然,本文所追求的回答不能这样简洁,停留于此,无疑是在问题的外围打转。当然,也无意于更不可能追溯至问题最初源头,而只能在较有高度的地方停下来去看问题的来源,进而弄清问题的实质。
回顾统计假设检验中的一般步骤:
第一步,根据问题的需要提出原假设0H ,即写出所要检验假设0H 的具体内容,如假设0000:()H μμμμμμ=≥<或,;
第二步,根据原假设0H 的内容,建立合适的样本函数12(,,...,)n W X X X (也称为检验函数),它在原假设0H 为真的条件下为一统计量,并且其分布为已知;
第三步,选取显著性水平α (通常取0.1,0.05,0.01α=),在0H 为真的条件下,寻找区域0X ,使得12{(,,...,)}n P W X X X α∈=0X ,由于α较小,所以12{(,,...,)}n W X X X ∈0X 是个小概率事件;
第四步,检验小概率事件12{(,,...,)}n W X X X ∈0X 是否发生,若12{(,,...,)}n W X X X ∈0X 发生,则拒绝原假设0H ;若12{(,,...,)}n W X X X ∈0X 发生,则接受原假设0H .
通常称0X 为拒绝域,0X 称为接受域。
上述第四步作出统计推断的依据便是命题D ,即“小概率事件实际不可能”原理。然而小概率事件并非不可能事件,我们只抽了一个样本,如果这个样本确实来自某个指定的总体,但不排除它的统计量的值刚好落在否定域内,即小概率事件发生了。但在检验中,我们并不知道这个事件是小概率事件,而依据实际推断原理拒绝了原假设场,或认为这个样本不是来自那个总体。因此,我们犯了“弃真”的错误——α错误。换言之,α错误由实际推断原理引起的。
相比之下,分析β错误出现的原因较前者复杂,究其根本原因便在于,命题A 到命题B 的演绎推理,命题C 是我们在检验中所依据的原则。如果A 是真的,且我们从A 到B 演绎推论如果也是正确的,那么B 可能是真实的。相反,果结果B 是真实的,那么能否就此得出A 必定是真实的结论呢?我们的回答是不能。如果我们这么做,就会犯逻辑学家称之为以推论结果来证实前提的谬误。如果B 是真实的,我们可以说A 也许是真的。因为可以有许多备择的假设,也都能推出B 的正确来。