工程数学-关于假设检验的两类错误问题的分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
研究生课程论文
论文题目:关于假设检验的两类错误问题的分析
课程名称:全日制专业学位工程数学
任课教师:
研究生姓名:
学号:
专业(领域):
研究生类别:专业型硕士研究生
注:请任课教师用红色笔批阅论文。
关于假设检验的两类错误问题的分析
摘要:本文对假设检验的两类错误问题进行分析,阐述了两类错误问题的基本概念,讨论了两类错误的产生的原因和它们之间的关系,并给出了减少统计假设检验中两类错误发生的方法。
关键词:假设检验,两类错误,关系,控制
统计学知识具有理论丰富、应用广泛的特征,在生产实践中具有强烈的应用背景[1],由于受到人力、物力、财力、时间等的限制,以及某些实验与检测的破坏性,人们在实践中对总体的某一数量特征进行评估时,常常采取从总体中抽取若干数量的随机样本,然后,依据“小概率原理”和样本信息,用假设检验方法对总体数量特征做出判断。例如,商业银行对企业进行信用评估问题[2],产品生产线工作是否异常的判断问题,炮弹质量检测问题等都要用到统计学中假设检验方面的知识。人们总是希望能够依据样本信息做出关于总体特征的正确判断或决策。然而,由于样本是从总体中随机抽取的,用少量的随机样本信息来对总体的某些特征进行假设检验难免不犯错误,这些错误我们通常称为假设检验的两类错误问题。本文对假设检验的两类错误问题进行分析,阐述了两类错误问题的基本概念,讨论了两类错误的产生的原因和它们之间的关系,并给出了减少统计假设检验中两类错误发生的方法。
1问题引入
由下例引出的问题[3]:
例1:已知罐头番茄汁中维生素C含量服从正态分布,按规定,维生素C的平均含量不得少于21毫克,现在从一批罐头中抽取17罐。算得维生素C含量的平均值X=23,S2=31982,问该批罐头维生素c含量是否合格? (α=0.05)。
解:维生素c含量X~N(μ,α2),检验假设:H0:μ<21,当H0成立时,则有
查表得t0.05=1.746,即P{T>1.746}=0.05,经计算T=2.07>1.746,于是否定H0,认为μ≥21,即该批罐头合格。在本例中,罐头是否合格,在解答之前并不知道,那么,为什么要设为H0<21而不设为H0>21呢?如果说两种地位均等,取哪一个都行,那么将会得出什么结论。请看下例:
例2:例1中将平均值改为X=22,其它不变。
解:(1)检验假设H0:<21,经计算T=1.036,由于1.036<1.746,所以接受H0,即认为该批罐头不合格。
(2)检验假设H0:μ≥21,计算同上,由于P{T<-1.746}=0.05,而1.036>1.746,所以接受,即认为该批罐头合格。在同一个检验标准下会有相反的结论,这样的检验是不能付诸现实的。上面的例子是所谓单边检验,单边检验因为要有说明,所以理解起来似乎更困难一些,但是,在理论上对单边检验的研究却是对双边检验研究的基础,同时单边检验在实际中有许多应用[4]。事实上,对于形如那样的双边检验也会遇到类似的问题。
例3:某砖厂生产的砖抗断强度服从正态分布,已知α2=1.21,今从一批砖中随便地抽取6块,测得抗断强度平均值=31.88公斤/平方厘米,现在问:这批转的平均抗断强度可否认为是32.50公斤/平方厘米(α=0.05)
解:(1)抗断强度X N(32.50,1.12),检验假设H0:μ=32.50,当H0成立时,
.
查表知P{U>1.96}=0.05,但现在U=1.38<1.96,因此下结论不能否定H0,即认为这批产品的平均抗断强度是32.50公斤/平方厘米。
(2)又根据反证法的思想也可检验<32.50或>32.50,于是有检验假设H1:μ>32.50,当H1成立时,
查表得μ0.05=1.65,由于P{<-1.65}0.05,经计算U=-1.38>-1.65,所以不能否定H1,当然H0不能成立[5]。问题究竟出在哪里呢?
2假设检验的两类错误
2.1假设检验的基本原理
假设检验的最基本原理是显著性原理,是根据样本观测值来判断是否有显著差异,这个差异是由两种可能因素引起的,一是系统性因素,一是偶然性因素。问题的关键在于:这个差异是否可以仅以偶然性这个因素去解释,也就是说是否有充分的理由来否定这种解释。如果有,就否定原假设,如果没有,就只能接受它。假设检验的基本思想是应用小概率原理,所谓小概率原理就是认为小概率事件在一次试验中是几乎不可能发生的,如果发生了,就有充分的理由怀疑原假设
为真,也即拒绝原假设[6]。
2.2两类错误
如果原假设H0成立,而观察值落入否定域,从而作出拒绝H0的错误结论,称作第一类错误,第一类错误是“以真当假”,犯第一类错误的概率不超过显著性水平α。
如果原假设H0不成立,而观察值未落入否定域,从而作出接受H0的错误结论,称作第二类错误,第二类错误是“以假当真”,犯第二类错误的概率记作β[7]。
两类错误的分类见表1[8]。
表 1 显著性检验判断结果分类
犯“弃真”错误的前提条件是H0为真,犯“取伪”错误的前提条件是H0为假,由于犯两类错误的前提条件不同,故犯“弃真”错误与“取伪”错误不是对立事件,因而,在一般情况下α+β≠1。关于犯“取伪”错误的概率β的计算问题,以及犯两类错误的概率α与β以及样本数量n 之间的数量关系问题,比较复杂,需要知道总体的分布及其相关参数[9]。然而,由中心极限定理知,无论总体X 服从什么分布,来自总体X 的独立同分布随机样本Xi(i =1,2,…,n)在样本容量n较大时(n≥30),其均值都近似服从正态分布。因而,以正态总体为例研究犯两类错误的概率与样本容量之间的数量关系具有一般性。
2.3两类错误产生的原因
在实践中.检验者往往确定允许犯第一类错误概率的最大值,称为检验的显著性水平(一般选择0.01或0.05)。结果是,在拒绝H0时,要么结论正确,要么犯第一类错误(小慨率事件)。因此,当样本数据支持H0时,犯错误的可能性大小(概率α)是可控的。但是,当样本数据不支持拒绝H0时,我们只好接受H0,这时就有可能犯第二类错误,而第二类错误并不是总能控制的,也即在决定接受H0时,其决策正确的概率是不确定的。因此,在样本数据不支持拒绝H0时,应使用“不能拒绝H0”而非“接受H0”的结论。显然,当样本数据拒绝H0时,采取任何相应的行动都是恰当的(这就是要选择对被择假没进行检验的理由);当样本数据不能拒绝H0时,在研究性和陈述正确性检验中不必采取行动,但在决策情况下,必须接受H0并采取相应行动,此时就会冒犯第二类错误的风险[9]。3假设检验中两种类型错误之间的关系
(一)α与β是在两个前提下的概率。α是拒绝H0时犯错误的概率(这时