关于假设检验的两类错误问题的分析--论文
关于假设检验的两类错误问题的分析--论文
![关于假设检验的两类错误问题的分析--论文](https://img.taocdn.com/s3/m/b0be97582b160b4e767fcff3.png)
关于假设检验的两类错误问题的分析摘要:本文对假设检验的两类错误问题进行分析,阐述了两类错误问题的基本概念,讨论了两类错误的产生的原因和它们之间的关系,并给出了减少统计假设检验中两类错误发生的方法。
关键词:假设检验,两类错误,关系,控制统计学知识具有理论丰富、应用广泛的特征,在生产实践中具有强烈的应用背景[1],由于受到人力、物力、财力、时间等的限制,以及某些实验与检测的破坏性,人们在实践中对总体的某一数量特征进行评估时,常常采取从总体中抽取若干数量的随机样本,然后,依据“小概率原理”和样本信息,用假设检验方法对总体数量特征做出判断。
例如,商业银行对企业进行信用评估问题[2],产品生产线工作是否异常的判断问题,炮弹质量检测问题等都要用到统计学中假设检验方面的知识。
人们总是希望能够依据样本信息做出关于总体特征的正确判断或决策。
然而,由于样本是从总体中随机抽取的,用少量的随机样本信息来对总体的某些特征进行假设检验难免不犯错误,这些错误我们通常称为假设检验的两类错误问题。
本文对假设检验的两类错误问题进行分析,阐述了两类错误问题的基本概念,讨论了两类错误的产生的原因和它们之间的关系,并给出了减少统计假设检验中两类错误发生的方法。
1问题引入由下例引出的问题[3]:例1:已知罐头番茄汁中维生素C含量服从正态分布,按规定,维生素C的平均含量不得少于21毫克,现在从一批罐头中抽取17罐。
算得维生素C含量的平均值X=23,S2=31982,问该批罐头维生素c含量是否合格? (α=0.05)。
解:维生素c含量X~N(μ,α2),检验假设:H0:μ<21,当H0成立时,则有查表得t0.05=1.746,即P{T>1.746}=0.05,经计算T=2.07>1.746,于是否定H0,认为μ≥21,即该批罐头合格。
在本例中,罐头是否合格,在解答之前并不知道,那么,为什么要设为H0<21而不设为H0>21呢?如果说两种地位均等,取哪一个都行,那么将会得出什么结论。
假设检验的论文
![假设检验的论文](https://img.taocdn.com/s3/m/8c60faf01b37f111f18583d049649b6648d70907.png)
假设检验的论文摘要本文旨在介绍假设检验的基本概念、原理及应用。
首先,我们将详细解释什么是假设检验,并介绍其在统计学中的重要性。
然后,我们将讨论假设检验的基本步骤,包括设置原假设和备择假设、选择合适的检验统计量以及确定显著性水平。
接着,我们将介绍两类常见的假设检验:单样本检验和双样本检验,并通过示例来说明如何进行假设检验。
最后,我们还将探讨一些常见的假设检验错误类型和如何降低错误的风险。
通过本文的阅读,读者将能够充分理解假设检验的概念和应用,并在实际问题中灵活运用。
引言假设检验是统计学中一个重要的方法,用于评估样本数据与某种假设之间的一致性。
在研究过程中,我们往往需要根据样本数据来推断总体的特征,并对一些假设进行验证。
假设检验可以帮助我们确定样本数据是否支持特定的假设,从而对总体进行推断,并做出相应的决策。
假设检验的基本步骤1.设置原假设和备择假设:原假设(H0)是我们想要进行验证的假设,备择假设(H1)是与原假设对立的假设。
通常情况下,原假设是一种基本的假设,而备择假设是我们想要证明的假设。
2.选择合适的检验统计量:根据问题的特点和样本数据的性质选择合适的检验统计量。
常见的检验统计量有Z检验、T检验、卡方检验等。
3.确定显著性水平:显著性水平(α)是我们设定的一个界限值,用于判断样本数据是否能否拒绝原假设。
通常情况下,显著性水平是一个小于1的数值,常见的显著性水平有0.05和0.01。
4.计算检验统计量的值:根据样本数据和所选择的检验统计量计算出实际的检验统计量的数值。
5.做出决策:根据检验统计量的数值和显著性水平,判断样本数据是否支持或拒绝原假设。
如果检验统计量的数值落在拒绝域内,那么我们可以拒绝原假设;如果检验统计量的数值没有落在拒绝域内,那么我们无法拒绝原假设。
单样本检验单样本检验是假设检验中最基本的一种形式,用于比较一个样本的特征与某个已知值或总体特征之间的差异。
常见的单样本检验包括单样本均值检验和单样本比例检验。
统计学中的假设检验中的类型I和类型II错误
![统计学中的假设检验中的类型I和类型II错误](https://img.taocdn.com/s3/m/57b3d7845ebfc77da26925c52cc58bd6318693f1.png)
统计学中的假设检验中的类型I和类型II错误统计学中的假设检验是一种推断性统计方法,用于评估样本数据与所假设的总体参数之间的关系。
在进行假设检验时,我们通常会做出两种可能的错误判断,即类型I错误和类型II错误。
本文将详细介绍这两种错误及其在假设检验中的作用。
一、类型I错误类型I错误是指在原假设为真的情况下,拒绝原假设的错误判断。
换句话说,当实际上不存在显著差异时,我们错误地得出了存在显著差异的结论。
类型I错误的发生概率称为显著性水平(α),通常设置在0.01或0.05。
在假设检验中,我们会首先建立一个零假设(H0),即假设两个样本或总体没有差异。
然后通过计算样本数据的p值(或计算出来的显著性水平)来判断是否拒绝零假设。
如果p值小于设定的显著性水平,我们将拒绝零假设,并得出结论有显著差异。
然而,这种结论可能是错误的,即发生了类型I错误。
类型I错误的概率在理论上是可以控制的,通常通过设定显著性水平来控制。
较小的显著性水平可以减少类型I错误的概率,但也会增加类型II错误的概率。
二、类型II错误类型II错误是指在原假设为假的情况下,接受原假设的错误判断。
换句话说,当实际上存在显著差异时,我们未能得出存在显著差异的结论。
类型II错误的概率称为β,通常难以确定。
类型II错误的概率与样本大小、效应大小以及显著性水平等因素有关。
当样本大小较小时,可能存在较高的类型II错误概率。
当效应较小或显著性水平较高时,也会增加类型II错误的概率。
为了最小化类型II错误的概率,可以通过增加样本大小、明确效应大小以及适当选择显著性水平来进行调整。
三、平衡类型I和类型II错误在进行假设检验时,我们希望能够在保证控制类型I错误概率的同时,尽量减少类型II错误概率。
通常情况下,类型I错误概率(α)和类型II错误概率(β)是相互制约的。
当我们降低显著性水平以减少类型I错误时,往往会增加类型II错误的概率。
相反,若提高显著性水平以减少类型II错误,则可能会增加类型I错误的概率。
关于参数假设检验中两类错误的思考
![关于参数假设检验中两类错误的思考](https://img.taocdn.com/s3/m/d42450c0195f312b3169a54a.png)
商业文化·学术探讨 2008年2月319关于参数假设检验中两类错误的思考谢 铭 翟 彬(西安交通大学经济与金融学院,西安,710061)中图分类号:O212.1 文献标识码:A 文章编号:1006—4117(2008)02—0319—01一、参数假设检验中的两类错误在参数假设检验问题中首先根据实际问题的先验信息,确定参数的可能取值范围,再根据需判断的实际问题,将Θ分成互不相交的两部分0Θ和1Θ。
参数假设检验就是根据样本所携带的信息,推断参数的实际值究竟在哪个集合中。
0Θ称为原假设,用H0表示。
参数集的另一部分1Θ称为备选假设,用H 1表示。
在对总体参数进行假设检验时,我们期望的结果是:当H 0中所作的假设为真时,接受H 0;反之当H 1为真时,接受H 1,拒绝H 0,这时的判断与实际相符,没有错误发生。
但是由于客观上存在抽样的随机性,推断的结果也可能是完全相反的,H 0中所作的假设为真,却拒绝了H 0,或者H 0为假时,接受了H 0,这与实际的结果截然相反,发生了两类错误。
将上述结果列示如下:总体的情况 H0为真 H 0为假 接受H 0 结论正确 第二类错误(取伪错误) 拒绝H 0第一类错误(拒真错误)结论正确二、两类错误的计算方法在一般场合下,拒绝域和接受域要由α决定,α为事件“H 0为真但被拒绝”的概率,这个概率又称为显著性水平。
()1P X c α=>=−Φ(假设是一个右侧检验,c 为临界值)。
α值在一般情况下都是事先给定的。
当我们根据根据抽样的结果拒绝了H 0时,其结果要么正确,要么犯第一类错误,犯第一类错误得概率为α,进一步说,根据这一决定作出得行动有1-α的信心,所以当使用一个更小的α水平时,就可以持有更大的信心,控制α水平的意义即在于此。
在大多数假设检验中,人们一般只慎重考虑α的取值,而较少的关心β值的大小。
并且认为β值是不可计算,不能控制的。
果真如此吗?支持这一结论的观点是:总体的“未知性”。
假设检验中两类错误分析与实验
![假设检验中两类错误分析与实验](https://img.taocdn.com/s3/m/070285641eb91a37f1115c4c.png)
本 质 . 文 拟 通 过 理 论 推 导 并 结 合 图 形 分 析 , 出犯 两 类 错 误 的 概 率 、 以及 样 本 数 量 n之 间 的 数 量 关 系 表 达 式 , 设 计 显 本 给 卢 并 著性 检 验 的 数 值 实 验 对 本 文 给 出 的 理 论 公 式 加 以验 证 .
1 两 类 错 误 分 析
两类 错 误 的 分 类 见 表 1 犯 “ 真 ” 误 的 前 提 条 件 是 . 弃 错
为 真 , “ 伪 ” 误 的 前 提 条 件 是 犯 取 错
为 假 , 于 犯 两 类 错 误 的 由
前 提 条件 不 同 , 犯 “ 真 ” 误 与 “ 伪 ” 误 不 是 对 立 事 件 , 故 弃 错 取 错 因而 , 一 般 情 况 下 十 在 卢≠1 关 于 犯 “ 伪 ” 误 的概 率 卢的 计 . 取 错 算 问题 , 以及 犯 两 类 错 误 的 概 率 n与 口 以及 样 本 数 量 n之 间 的数 量 关 系 问 题 , 较 复 杂 , 要 知 道 总 体 的 分 布 及 其 相 关 参 数. 比 需
策 , 类 错 误 称 为 “ 真 ” 误 , 发 生 的概 率 通 常 用 表 示 ( 即显 著 性 水 平 ) 另 一 类 是 在 原 假 设 为 假 时 没 有 拒 绝 原 假 设 , 这 弃 错 其 也 ; 这 类 错 误 称 为 “ 伪 ” 误 , 发 生 的概 率 通 常 用 卢表 示 . 两 类 错 误 的概 率 、 以及 样 本 数 量 n之 间 具 有 什 么 样 的 数 量 关 系 ? 取 错 其 犯 卢 与 口的 和 等 于 1 ? 有 学 者 对 假设 检 验 中两 类 错 误 及 相 关 问 题 做 过 一 些研 究 吗 , 关 于犯 两类 错 误 的 概 率 、 以及 样 本 但 卢
假设检验中控制第二类错误的探讨
![假设检验中控制第二类错误的探讨](https://img.taocdn.com/s3/m/5f7f9c6a9b6648d7c1c746bb.png)
统计与决策2011年第22期(总第346期)假设检验中控制第二类错误的探讨甘伦知(四川理工学院经管学院,四川自贡643000)摘要:总体参数假设检验中犯第二类错误的概率受到检验水平、参数真值和样本容量等因素的影响。
花费过多的成本(样本容量很大)去检验总体参数与待检值是否还存在细小的差距往往是不必的,因而,在给定“辨别差距”的情况下,可以通过选择样本容量在一定程度上实际实现对两类错误的控制。
关键词:假设检验;第二类错误;控制中图分类号:F224.9文献标识码:A文章编号:1002-6487(2011)22-0035-030引言假设检验是一种实际应用非常广泛的统计推断方法。
由于抽样的随机性,假设检验中存在犯两类错误的可能。
其中,由于犯第二类错误的概率与总体参数的真实水平有关,因而对它的研究和讨论一直停留在理论上,难以在实践中实现对它的控制。
郭宝才(2010)[1]、励晶晶(2010)[2]等都对该问题展开过有益的讨论,但仍都未能提出实际可行的控制办法。
本文尝试提出一种“辨别差距”,在假设检验时给定“辨别差距”的情况下,可以通过选择样本容量实际实现对两类错误的控制。
本文将主要针对单总体参数的假设检验来讨论,涉及样本均为简单随机样本。
1β的影响因素在假设检验中,依据“小概率事件原理”作出的判断可能导致两类错误。
当原假设为真时,却错误地拒绝了它,于是犯了“弃真”的错误,称为第一类错误。
当原假设不真时,却错误地接受了它,于是犯了“取伪”的错误,称为第二类错误。
犯第二类错误的概率通常记为β。
我们以对单总体均值的右单尾Z 检验为例来认识β的影响因素。
设总体ξ~N (μ,σ2),σ2已知,原假设为H 0:μ μ0, H 1:μ>μ0。
检验水平为α,样本容量为n,则样本均值x ˉ~N (μ,σ2n ),检验统计量为Z有β=P (接受H 0|H 0为假)=P (Z <z α|μ>μ0)=Pz α|μ>μ0)=P z α>μ0)=Φ(zα(1)其中,Φ( ⋅ )为标准正态分布的分布函数,临界值z α满足Φ(z α)=1-α。
假设检验中几种常见的误区分析
![假设检验中几种常见的误区分析](https://img.taocdn.com/s3/m/b058171fbb68a98271fefabf.png)
假设检验中几种常见的误区分析摘要:概率统计是广大理工科院校的必修课程,也是研究生入学考试的全国统考的课程,假设检验是概率统计的一个重要问题,不少学生对其有理解误区。
本文通过例题对困扰广大同学的三个假设检验问题问题进行分析。
关键词:概率统计假设检验错误分析《概率论与数理统计》作为大学数学的一个重要组成部分,是广大理工科院校的必修课程,也是研究生入学考试的全国统考的课程。
与其他学科不同的是,概率论与数理统计是研究自然界,人类社会中大量出现的随机显现规律性的一门数学分支。
它具有独特的理论和思想方法,别开生面的研究课题,并且随着现代科学技术的发展而迅速发展。
随着社会和经济的发展,它在自然科学,金融,经济管理,社会科学等方面的应用也越来越广泛,因此,概率统计的学习受到了同学和老师的高度重视。
统计推断是由样本推断总体,其中一个重要问题是假设检验问题,有关总体分布的未知参数或未知分布形式的种种论断叫统计假设,人们根据样本所提供的信息对所考虑的假设做出接受或拒绝的决策,做出这一决策的过程就是假设检验。
在假设检验这一章节的授课过程中,笔者发现学生对这一部分内容的学习,有点吃力,不少学生反映,不太理解这部分的内容,做题目时只能按照书上的例题照搬照抄,不理解为什么要这样做,特别是双边检验和单边检验的区分,左边检验还是右边检验,显著性水平不同时,结论卫生么有不同等问题很困惑,本文对这样几个误区的进行了探讨。
一、单边检验和双边检验的区分在教学过程中,绝大部分教材都会讲到双边检验和单边检验问题,无论是单正态总体的均值方差检验,还是两个正态总体的均值差方差比的检验,还是非正态总体的检验,双边和单边的区分在于原假设和备则假设H1的形式。
如果原假设H0和备则假设H1是形如“ = ”和“=”的形式,则该假设检验是双边假设检验,反之,该假设检验是单边假设检验。
例 1 某车间用一台包装机包装葡萄糖。
袋装糖的净重是一个随机变量,它服从正态分布。
统计学中的假设检验错误类型分析
![统计学中的假设检验错误类型分析](https://img.taocdn.com/s3/m/b8c2f250f08583d049649b6648d7c1c709a10b67.png)
统计学中的假设检验错误类型分析假设检验是统计学的重要理论之一,用于判断样本数据对某个总体假设的支持度。
在假设检验过程中,我们会遇到两种类型的错误,即第一类错误和第二类错误。
本文将对这两种错误类型进行分析,并探讨如何降低错误率。
1. 第一类错误第一类错误也被称为显著性水平(Significance Level)或α错误。
它指的是在原假设为真的情况下,拒绝原假设的错误判断。
在假设检验中,我们通常会设定一个显著性水平来进行决策,常见的显著性水平有0.05和0.01。
当结果的p值小于设定的显著性水平时,我们将拒绝原假设。
然而,这种判断并不是绝对准确的,存在一定概率犯下错误。
第一类错误的概率通常用α表示。
当我们将显著性水平设定为0.05时,即α=0.05,意味着有5%的可能犯下第一类错误。
如果显著性水平设定得较低,例如α=0.01,那么犯第一类错误的概率将更小,但同时也会增加犯第二类错误的概率。
2. 第二类错误第二类错误是在原假设为假的情况下,接受原假设的错误判断。
与第一类错误相反,第二类错误常用β表示。
第二类错误的概率与样本大小、效应大小和显著性水平等因素有关。
当样本大小较小时,相同效应大小下犯第二类错误的概率较高;当效应大小较小时,相同样本大小下犯第二类错误的概率也较高;而当显著性水平设定较低时,犯第二类错误的概率也会增加。
3. 降低错误率的方法在实际应用中,我们希望尽可能降低第一类错误和第二类错误的概率,提高假设检验的准确性。
以下是一些常用的方法:3.1 增加样本容量通过增加样本容量,可以降低第一类错误和第二类错误的概率。
较大的样本容量能够提供更充分的信息,减小抽样误差,提高判断结果的准确性。
在样本容量不足时,可能会导致犯下更多的错误。
3.2 提高显著性水平设定较低的显著性水平可以降低第一类错误的概率。
但需要注意的是,过低的显著性水平会增加犯第二类错误的概率,因此需要权衡选择适当的显著性水平。
3.3 增大效应大小提高研究中的效应大小可以降低第二类错误的概率。
假设检验中的两类错误及其控制方法
![假设检验中的两类错误及其控制方法](https://img.taocdn.com/s3/m/6d8e9ba880c758f5f61fb7360b4c2e3f572725cf.png)
假设检验中的两类错误及其控制方法假设检验是统计学中常用的一种推断方法,用于判断关于总体参数的假设是否成立。
在进行假设检验时,我们一般会面临两类错误,即第一类错误和第二类错误。
本文将介绍这两类错误的含义、造成原因以及控制方法。
一、第一类错误的含义及控制方法第一类错误,也被称为α错误,指的是当原假设为真时,却错误地拒绝了原假设的情况。
换句话说,第一类错误意味着我们得出了一个错误的结论,即在事实上不存在的关系。
控制第一类错误的方法主要是通过控制显著性水平α来实现。
1. 显著性水平的控制显著性水平α定义了我们在进行假设检验时拒绝原假设的临界值。
通常情况下,α的取值为0.05或0.01,代表了我们容忍犯第一类错误的概率。
较小的α值会降低犯第一类错误的风险,但同时也增加了犯第二类错误的概率。
2. 样本容量的控制样本容量对于控制第一类错误也至关重要。
较大的样本容量可以提供更多的信息,从而降低犯第一类错误的概率。
因此,在进行假设检验时,我们应尽可能选择足够大的样本容量来增加推断的准确性。
二、第二类错误的含义及控制方法第二类错误,也被称为β错误,指的是当原假设为假时,却错误地接受了原假设的情况。
换句话说,第二类错误意味着我们未能发现事实上存在的关系。
控制第二类错误的方法主要是通过改进实验设计或增大样本容量来实现。
1. 实验设计的改进良好的实验设计可以降低发生第二类错误的概率。
例如,在两组样本进行比较时,我们可以增加处理组与对照组的差异,从而提高检测到显著差异的能力。
此外,合理的随机分组和对照设计也能够有效地控制第二类错误。
2. 样本容量的增大与控制第一类错误类似,增大样本容量也是控制第二类错误的一种方法。
较大的样本容量可以提高检测到真实差异的概率,从而减少第二类错误的发生。
在做出假设检验计划时,我们应考虑到研究资金、时间和实验设计等方面的限制,尽可能选择足够大的样本容量。
总结:在假设检验中,我们需要控制两类错误,即第一类错误和第二类错误。
假设检验中的第一类错误和第二类错误
![假设检验中的第一类错误和第二类错误](https://img.taocdn.com/s3/m/9477a361abea998fcc22bcd126fff705cc175cbe.png)
假设检验中的第一类错误和第二类错误假设检验是统计学中常用的一种方法,用于评估研究者对于一个假设的推断是否正确。
在进行假设检验时,我们常常会面临两种类型的错误,即第一类错误和第二类错误。
了解这两种错误的含义和影响,对于正确理解假设检验的结果和取得可靠的研究结论非常重要。
一、第一类错误第一类错误,又被称为显著性水平α水平的错误,是指在实际情况为真的情况下,拒绝了原假设的错误判断。
换句话说,第一类错误意味着我们错误地推断出了一种不存在的效应或关系。
在假设检验中,我们通常会设置一个显著性水平(α)作为拒绝原假设的标准。
常见的显著性水平为0.05或0.01。
如果计算得出的p值小于设定的显著性水平,我们就会拒绝原假设。
然而,这样的判断并不意味着我们完全排除了第一类错误的风险。
事实上,在大量研究中使用统计显著性水平为0.05的情况下,仍有5%的概率犯下第一类错误。
举个例子来说,假设我们正在研究一个新的药物对于疾病的治疗效果,我们的原假设是该药物无效。
经过数据分析后,我们得到了一个p 值为0.03,小于我们设定的显著性水平0.05。
根据这一结果,我们拒绝了原假设,认为该药物具有疗效。
然而,事实上,该药物可能并没有真正的治疗效果,我们此时实际上犯下了第一类错误。
第一类错误的发生可能会导致严重的后果。
例如,一个错误地认为某种药物有治疗效果,导致该药物被广泛应用,却最终证明该药物的副作用或无效,由此给患者带来不良影响。
因此,我们在进行假设检验时,需要权衡显著性水平的选择,降低第一类错误的风险。
二、第二类错误第二类错误是指在实际情况为假的情况下,接受了原假设的错误判断。
换句话说,第二类错误意味着我们无法检测到真实存在的效应或关系。
在假设检验中,我们设定了拒绝原假设的显著性水平,但并没有设定接受原假设的显著性水平。
因此,在数据分析中,我们不能直接得出不存在关系的结论,而只能得到数据不足以拒绝原假设的结论。
因此,第二类错误的概率通常由实验者根据研究设计确定。
6.3 假设检验的两类错误及注意事项
![6.3 假设检验的两类错误及注意事项](https://img.taocdn.com/s3/m/f119fd0eddccda38376bafac.png)
˙注意单侧检验与双侧检验的选择 ˙理解参数估计与假设检验的异同点
值越小,说明越有理由拒绝零假设,而非说明差异越大。 有统计学意义并不等于有实际临床意义,还应结合专业知识来分析,应
考虑差值的平均水平是否达到或超过有临床实际意义的差值。 所有假设检验的结论都是在一定概率下得到的,因此,在作推断结论时
都有可能犯错误(I型错误或者II型错误),假设检验的结论不能绝对化。
如何减小α 及 β ?
二、假设检验需注意的问题
(1)要有严密的研究设计
样本资料应具有代表性,即样本的获取必 须遵循随机化原则;
比较的组间应具有可比性,即各对比组间 除了要比较的主要因素外,其他可能影响结果 的因素应尽可能相同或相近。
二、假设检验需注意的问题
(2)正确理解P值和统计结论的意义
P 值指当零假设成立时,出现当前样本结果以及更极端结果的概率。P
二、假设检验需注意的问题
(3)单侧检验与双侧检验的选择
如果有信息(如专业知识)知某个偏离方向不会发生,那么备选假设就 只有一个偏离方向,就是单侧检验。
双侧检验:
H0 : 0
H1 : 0
单侧检验:
①HH01: :
0 0
或
②
HH01: :
0 0
二、假设检验需注意的问题
(4)参数估计与假设检验的异同点
˙ 两者均可用于统计学推断,两者的统 计结论具有同等的效力。 ˙置信区间能够提供包含参数的范围宽 窄的信息。
˙ 假设检验提供具体的P 值,P 值越小,
代表越有理由去拒绝零假设。
小结
一、假设检验的两类错误 ˙Ⅰ型错误 ˙Ⅱ型错误 ˙检验效能 二、假设检验的注意事项 ˙要有严密的研究设计
假设检验的两类错误
![假设检验的两类错误](https://img.taocdn.com/s3/m/f52ce162daef5ef7bb0d3cd5.png)
一、假设检验的两类错误
例1: 某厂生产的固体燃料推进器的燃烧率服从正态分布:
解:提出假设:
两类错误的概率的关系
数理统计
两类错误是互相关联的, 当样本容量固定时, 新生产织物比过去的织物强力是否有提高?
一类错误概率的减少导致另一类错误概率的增加. 如果H0不成立, 但统计量的实测值未落入否定域,
要在 α不变的条件下降低 β, 需要增加样本容量. 解:提出假设:
这批推进器的燃烧率是否较以往生产的推进器的燃烧率有显著的提高?取显著性水平 α=0. 设在新方法下总体均方差仍为 2cm/s, 两类错烧率服从正态分布: β为犯第二类错误(Type II error)的概率. 假设强力指标服从正态分布 N(μ,σ2), 现在用新方法生产了一批推进器。
如果H0不成立, 但统计量的实测值未落入否定域, β为犯第二类错误(Type II error)的概率. 即新生产织物比过去的织物的强力有提高。
假设强力指标服从正态分布 N(μ,σ2),
例1: 某厂生产的固体燃料推进器的燃烧率服从正态分布: 数理统计 N (,2 ) , 4 0 c m /s , 2 c m /s .
00
故拒绝原假设H0 , 现在用新方法生产了一批推进器。 假设强力指标服从正态分布 N(μ,σ2),
P{接受H0|H0不真}=β.
显著性水平 α为犯第一类错误(Type I error)的概率; 从中随机取 n=25只, 测得燃烧率的样本均值为:
假设强力指标服从正态分布 N(μ,σ2),
β为犯第二类错误(Type II error)的概率. 设在新方法下总体均方差仍为 2cm/s,
假设检验应注意的若干问题1(论文)
![假设检验应注意的若干问题1(论文)](https://img.taocdn.com/s3/m/6bbbc27fa417866fb84a8ea4.png)
上饶师范学院本科毕业论文论文题目:假设检验应注意的若干问题系别:数学与计算机科学学院专业:数学与应用数学班级:09 级(3)班学号:09010302学生姓名:陈福英指导教师姓名:徐健上饶师范学院教务处2013年4 月假设检验应注意的若干问题摘要:了解理清假设检验中注意的问题对解决关于假设检验的数学问题和实际问题很有帮助。
假设检验的基本思想,基本概念以及它的相关步骤都是学习假设检验的重要内容。
两类错误的分析,假设的确立,检验统计量的选择,假设检验与置信区间的联系都是需要注意的问题。
关键词:假设检验;原假设;两类错误Some problems that have to pay attention in hypothesis testing Abstract:Get to know the problem in Hypothesis testing problem is help for solving math problem or reality problem.Its basic thought ,basic conceptions and steps are important contents of learning Hypothesis testing problem.Its tow kinds of errors,how to radicate hypothesis,how to choose the test statistic, the connections between hypothesis testing and confidence interval are all problems that have to be taken care.Key words:hypothesis testing ; null hypothesis; tow kinds of errors;目录1.预备知识 (1)1.1 假设检验问题 (1)1.2 假设检验基本思想 (1)1.3 参数假设检验问题 (1)1.4 两类错误的概念 (1)2.原假设的设立原则 (1)H的基本依据 (2)2.1建立原假设2.2 单边或双边检验的选择 (2)3.两类错误的分析 (3)3.1 犯两类错误概率(α和β)的关系 (3)3.2减少两类错误风险的途径 (4)4.检验统计量的选择 (5)5.假设检验与置信区间的关系 (6)致谢 (7)参考文献 (8)1.预备知识1.1 假设检验问题.假设检验是数理统计的基本知识,与参数估计构成数理统计的基本内容.对总体的分布或分布参数作某种假设,然后根据所得的样本,运用统计分析的方法来检验这一假设是否正确,从而作出接受或拒绝的决定,这就是假设检验问题.]1[学习和应用假设检验时,需要注意假设检验的基本思想,基本概念,基本步骤. 1.2 假设检验基本思想.假设检验依据小概率原理(或实际推断原理),即“概率很小的事件在一次试验中几乎不发生”.如果概率很小的事件在一次试验中发生了,有理由怀疑假设的正确性.]2[原理和数学逻辑证明中的反证法类似,如果命题是错误的,只需要一个反例就可以推翻它.1.3 参数假设检验问题.可以用一个参数(如正态总体的均值,方差)的集合表示的假设,称为参数假设检验问题.否则如对假设“总体为正态分布”作出的检验问题就是一个非参数假设检验,非参数假设检验有分布拟合检验,秩和检验等.1.4 两类错误及概念.在假设检验中,由于样本信息的局限性,势必会产生错误.在统计学中,当原假设0H 为真但由于随机性使样本观测值落在拒绝域中,从而拒绝原假设0H ,这种错误称为第一类错误,也称“拒真错误”,通常称犯这个错误的概率叫拒真概率,记为α,即α=P (拒绝0H |0H 为真)=()W X P ∈θ,∈θ0Θ.第二类错误是指备择假设1H 为真,但随机样本观测值落入接受域中,从而接受原假设0H ,其发生的概率称为受伪概率,记为β,即β=P (接受0H |1H 为真)=()W X P ∈θ,∈θ1Θ.]3[2.原假设的设立原则.假设检验问题,顾名思义,包括两大方面,即“假设”和“检验”,其具体的步骤分为四步:Ⅰ.根据给定问题,提出原假设0H 和备择假设;Ⅱ.由假设构造检验统计量,并在0H 为真的条件下得出统计量的分布;Ⅲ.给定显著性水平α,按P{拒绝0H |0H 为真}=α,求出拒绝域W ;Ⅳ.根据样本观测值作出决策,若(n x x x ⋯,,21)W ∈,拒绝0H ,若(n x x x ⋯,,21)W ∉,接受0H .假设检验首先要考虑的是如何设立假设.2.1建立原假设0H 的基本依据.解决假设检验问题的第一步就是建立假设,正确地确定原假设与备择假设.对检验结果的正确与否起到很大的作用.因此正确建立假设是解决问题的关键.在解决假设检验问题时, 在假设检验中原假设和备则假设地位是不平等的,原假设是受到保护的.明确说就是,如果没有充分的证据来否定原假设,就要接受它.根据实践经验建立原假设0H 的依据有:1、依据经验事实,历史资料,设计需要设立0H .2、专业知识等初步可以认可的结论定为原假设,或者把相等、符合性质的结论作为原假设.3、对有待观察的新事物,一般不宜作为原假设0H .例1.一种零件的生产标准是直径应为10cm ,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求.如果零件的平均直径大于或小于10cm ,则表明生产过程不正常,必须进行调整.试陈述用来检验生产过程是否正常的原假设和被择假设.分析:研究者想收集证据予以证明的假设应该是“生产过程不正常”.建立的原假设和备择假设为H 0 : =μ10cm vs H 1 :=μ10cm例2.某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克.从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实.试陈述用于检验的原假设与备择假设.分析:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述.建立的原假设和备择假设为H 0:≤μ 500 H 1 : >μ 5002.2单边或双边检验的选择.双侧检验问题. 当备择假设1H 分散在原假设0H 两侧时称为双侧检验,如果检验的目的是检验抽样的样本统计量与假设参数的差数是否过大(无论是正方向还是负方向),就把风险平分在右侧和左侧,这就是用双侧检验.如0H :0θθ= vs 1H :0θθ≠单侧检验问题.当备择假设1H 在原假0H 的一侧时称为单侧检验..如0H :0θθ≤ vs 1H :θ>0θ单侧检验方向的选择可以依据信息原则.就是将一个不以本次检验为改变的一个先验的信息作为选择方向的基础.先验信息有两种:一种是自然的先验信息,我们都认为先验信息是正确,普遍成立的,因此将其作为代表的情况放入原假设.另一种是样本的统计量提供的先验信息,它表明了样本支持和反对的结论,若样本反对的结论出现在备择中,则备择假设必然不会成立,检验不必进行.若样本支持的结论出现在备择假设中,则备择假设成立与否依赖于选取的显著性水平.]4[在单侧检验中,一般将研究者想收集证据予以支持的假设作为备择假设1H ,将研究者想收集证据证明其不正确的假设作为原假设0H .例 3.一项研究表明,采用新技术生产后,会使产品的使用寿命明显延长到1500小时以上,检验这种结论成立,按照前面的理论,研究者想要证明结论是正确的(寿命延长),于是备择假设的方向为“>”,即建立假设0H :≤μ vs 1H :1500>μ 在作假设检验时,应事先根据专业知识和问题的要求在设计时确定采用单侧还是双侧检验.不能在计算检验统计量后才主观确定.对同一资料检验时,有可能双侧检验无统计意义,而单侧有统计意义.因此,当我们报告结论时,应列出所采用的是单侧还是双侧检验、检验方法、检验水准和P 值的确切范围,然后结合专业作出专业结论.3.两类错误的分析.3.1 犯两类错误概率(α和β)的关系.犯两类错误概率可以用一个函数表示,即势函数.定义3.1.1 ]3[设检验问题0H :0Θ∈θ vs 11Θ∈H的拒绝域为W ,则观测值X 落在拒绝域W 内的概率称为该检验的势函数.10),()(ΘΘ∈∈= θθθW X P g势函数是)(θg 是定义在参数空间0Θ上的一个函数,由上述α和β的概念知,当0Θ∈θ时,)()(θααθ==g ,当1Θ∈θ时,)(1)(θββθ=-=g .也就是,犯两类错误的概率都是参数θ的函数,并可由势函数得到,即:⎩⎨⎧Θ∈-Θ∈=.),(1),()(1,0θθβθθαθg我们用一个实例,通过势函数)(θg 来考查两类错误概率之间的关系.例1,某厂生产的合金强度服从正态分布N(θ,16),其中θ的设计值为不低于110(Pa ).为保证质量,该厂每天都要对生产情况做例行检查,以判断生产是否正常进行,即该合金的平均强度不低于110(Pa ).某天从生产中随机抽取25块合金,测得强度值为,21,x x …,25x ,其均值为x =108(Pa ),问当日生产是否正常.分析:原假设0H :0Θ∈θ={110:≥θθ} 和备择假设11Θ∈H ={110<θ} ,拒绝域为W={c x ≤},则可算出该检验的势函数)5/4()5/45/4()()(θθθθθθ-Φ=-≤-=≤=c c x P c x P g , 利用这个势函数,可以写出两类错误的概率分别为 0),5/4()(Θ∈-Φ=θθθαc , 1),5/4(1)(Θ∈-Φ-=θθθβc . 从上述例子看出,在样本量给定的条件下,α与β中一个减小会导致另一个增加.也就是,在一定条件下,α与β不能同时增加或减小.3.2 减少两类错误风险的途径.犯拒真错误可能的原因是样本中极端数值或采用决策标准比较宽松.而犯受伪错误的原因是试验设计不灵敏,样本数据变异性过大,或者处理效应本身比较小.犯第一类错误的风险较大,由于报告了本来不存在的现象,则因此现象而衍生出的后续研究、应用是不可估量的.相对而言,第二类错误的风险相对较小,因为研究者如果对自己的假设很有信心,可能会重新设计检验,再次来过,直到得到自己满意的结果.降低风险的方法有:首先控制犯第一类错误的概率,控制犯第一类错误的概率α的条件下,尽量使犯第二类错误的概率β小,因为根据反证法思想,拒绝0H 比错误地接受0H 更重要,这类方法即我们常用的显著性检验.其次增加样本容量n ,来减少犯第二类错误的概率.增加样本容量可以减少数据选取的偶然性,减轻极端数据对结果的影响.但是一味地增加样本容量会使计算更复杂,计算量大,所以这种方法有利也有弊.应该根据以上说犯两类错误产生的原因注意选择恰当的数值,试验设计严密等.在进行假设检验时,我们希望α与β尽量小,通俗地讲希望买卖双方的风险都要小,这是不可能实现的,否则会导致样本容量n 的无限增大,这又是不实际的.因此,英国统计学家Neyman 和Pearson 提出水平为α的显著性检验.即控制犯第一类错误的概率的条件下,尽量使犯第二类错误的概率β小,也就是通常说的只考虑卖方风险,因为很据反证法思想,拒绝原假0H 设比错误地接受0H 更重要,这就是常用的显著性检验.常用α的可以0.05,0.01或0.1.]4[4.检验统计量的选择.影响检验统计量的选择因素有:① 未知参数的特征;② 统计量的抽样分布例如:要求一种元件平均使用寿命不得低于1000小时,生产者从一批这种元件中随机地抽取25件,测得其寿命的平均值为950小时,已知该元件寿命从标准差=σ100小时的正态分布,试在显著性水平=σ0.05下确定这批元件是否合格.分析:这是均值μ的检验,σ已知,采用u 检验,检验统计量为n X u /1001000-=,在0H 成立时,)1,0(~N u .而如果上述问题方差未知时,则采用t 检验.又如:某类钢板每块的重量X 服从正态分布,其一项质量指标是钢板重量的方差不得超过20σ=0.016kg 2.现从某天生产的钢板中抽取n =25块,得其样本方差2s =0.025kg 2,问该天生产的钢板重量的方差是否满足要求.分析:这是正态总体方差的单侧检验问题.应采用2χ检验,检验统计量为 2χ=202)1(σs n -.因此,不同的参数检验,不同抽样分布的检验统计量也不同.下面以一个具体例子来阐述假设检验问题的具体步骤:例4. 已知炼铁厂铁水含碳量服从正态分布N (4.55,0.1082)现在测定了9炉铁水,其平均含碳量为4.484,如果铁水含碳量的方差没有变化,可认为现在生产的铁水仍为4.55(α=0.05)?分析:这是一个典型的假设检验问题.要检验铁水含碳量是否仍为4.55,根据55.4=μ是历史资料提供的信息,放在原假设即建立假设0H :55.4=μ vs 1H : 55.4≠μ, 这个假设符合上述设立原假设原则,由于方差没有变化,即为已知,统计量n x u /0σμ-=,检验的拒绝域为W={|u|≥u 21α-},因05.0=α,查表得u 21α-=u 975.0=1.96,484.4=x ,μ0=4.55,108.0=σ,n=9,算得u=9/108.055.4484.4-≈-1.83,所以|u|=1.83<1.96,最后作出结论,观测值未落入拒绝域内,故接受原假设,即可以认为现在生产的铁水含碳量仍为4.55.5. 假设检验与置信区间的关系.双侧检验与双侧置信区间的关系.假设检验与区间估计在解决问题的途径上非常相似.θ的置信水平为α-1的置信区间为(θ(n x x x ⋯,,21),θ(n x x x ⋯,,21)),双侧检验 0H :θθ=0,1H :θθ≠0的接受域为 θ(n x x x ⋯,,21)≤θ0≤θ(n x x x ⋯,,21)单侧检验与单侧置信区间的关系. 单侧置信区间与显著性水平为α的左侧检验问题,0H :θθ≥0,1H :θθ<0的关系,单侧置信区间为(-∞,θ),接受域为(-∞,θ).单侧置信区间与显著性水平为α的右侧检验问题,H0:θθ≤0,1H :θθ>0的关系,单侧置信区间为(θ,+∞),接受域为(θ,+∞).]5[求置信区间的枢轴量与假设检验的统计量的形式非常相似,学习置信区间是学习假设检验的一个很好的知识准备.但是,假设检验与置信是从不同角度回答同一个问题,假设检验的接受域就是区间估计的置信区间,前者是回答接受0H 还是拒绝0H 的定性问题,而后者是回答参数的范围问题.本文归纳了假设检验中应注意的四个问题,一是两类错误的概率分析,二是原假设的建立原则,三是假设统计量的选取问题,四是假设检验与置信区间的联系.由于自身知识有限,对问题的分析谈的比较肤浅,没有涉及非参数性检验等深度问题.引用例题不够丰富多样.致谢本篇论文撰写时经一个多月,在这段时间里,徐健老师耐心地给了很多指导和建议。
剖析假设检验的两类错误并举例说明
![剖析假设检验的两类错误并举例说明](https://img.taocdn.com/s3/m/1e27a7dc760bf78a6529647d27284b73f242367a.png)
• 可能产生原因:1:实验设计不灵敏
•
2.样本数据变异性过大
•
3.处理效应本身比较小
两类错误的关系 2.
命题 1:在统计检验中,在样本容量一定的条件下,α 错误和 β 错误不可能同时减小。 例子:一个公司有员工3000 人(研究的总体) ,为了检验公司员工工资统计报表的真实性,研究者作了 50 人的大样本随机抽样调查, 人均收入的调查结果是: X (样本均值)=871 元;
影部分的面积(β错误)也将增大。 1:α与β是在两个前提下的概率,所以α+β不一定等于1 1:α与β是在两个前提下的概率,所以α+β不一定等于1 这个命题可以借助前面的图形1 来理解,一旦正态分布A 的拒绝域减小即 α 错误减小,则( 2 1 Χ − Χ )这个区域将增大,而图 A 上阴 影部分的面积(β错误)也将增大。 结果表明,如果总体的真值为 870 元,而虚无假设为880元的话,那么,平均而言每100 次抽样中,将约有8次把真实情况当作880 元 被接受,即犯β错误的概率大小是0. 命题 3:犯 α 错误的概率和犯 β 错误的概率之和不为 1。 根据现有的资料的性质,设计类型,样本含量大小,正确选用检验方法
元。
1:α与β是在两个前提下的概率,所以α+β不一定等于1
• 2:在其他条件不变的情况下,α与β不 这个命题也可以从图形1 得到说明。
可能产生原因:1:实验设计不灵敏 即H0本不真,却接受了他,犯这类错误的概率记为β,即P{接受H0/H1为真}=β
能同时增加或减少 这个命题可以借助前面的图形1 来理解,一旦正态分布A 的拒绝域减小即 α 错误减小,则( 2 1 Χ − Χ )这个区域将增大,而图 A 上阴
β 错误出现原因
• 第二个问题是,统计检验的逻辑犯了从结论推 断前提的错误。命题 B 是由命题 A 经演绎推 论出来的,或写作符号 A→B,命题 C 是我们 在检验中所依据操作法则。如果A 是真的,且 我们从 A 到 B 的演绎推论如果也是正确的, 那么B 可能是真实的。相反,如果结果 B是真 实的,那么就不能得出A 必定是真实的结论。 这就是 β错误出现的原因。
假设检验两类错误
![假设检验两类错误](https://img.taocdn.com/s3/m/0292d92a24c52cc58bd63186bceb19e8b9f6ec62.png)
假设检验两类错误假设检验是统计学中常用的一种方法,用于确定与一个或多个总体参数有关的假设能否得到支持。
在进行假设检验时,我们通常假设一个原假设(null hypothesis,简称H0)和一个备择假设(alternative hypothesis,简称H1),并使用样本数据对它们进行比较。
在进行假设检验时,我们可能会犯两类错误,分别为类型I错误(Type I error)和类型II错误(Type II error)。
下面将详细介绍这两类错误。
1. 类型I错误类型I错误是指在原假设为真的情况下,我们错误地拒绝原假设的概率。
通常将类型I错误的概率称为显著性水平(significance level),用符号α表示。
显著性水平是在进行假设检验前,由研究者事先设定的,用于控制拒绝原假设的错误率。
假设我们在一个假设检验中将显著性水平设置为0.05,即α=0.05。
如果我们在进行假设检验时得到的p值小于0.05,就会拒绝原假设。
但是当原假设为真时,我们有5%的概率犯下类型I错误,即错误地拒绝了原假设。
类型I错误的概率是由显著性水平决定的,通常会在实验设计和分析过程中充分考虑。
如果我们希望降低类型I错误的概率,可以将显著性水平设置为更小的值。
2. 类型II错误类型II错误是指在备择假设为真的情况下,我们错误地接受原假设的概率。
通常将类型II错误的概率称为β错误概率,用符号β表示。
类型II错误的概率与样本量大小、效应大小和样本方差等因素有关。
当样本量过小或者效应较小时,类型II错误的概率会增加。
在进行假设检验时,我们通常希望将类型II错误控制在一个可接受的水平。
与类型I错误不同,我们无法直接控制类型II错误的概率。
通常,我们通过计算样本量,确保实验具有足够的功效(power)来减少类型II错误的概率。
3. 控制类型I和类型II错误的权衡在进行假设检验时,类型I和类型II错误是我们需要权衡的两个因素。
通常,我们无法同时将两者的错误概率降到最低。
假设检验中的两类错误
![假设检验中的两类错误](https://img.taocdn.com/s3/m/80ab3b044a35eefdc8d376eeaeaad1f3469311cd.png)
= (1 ≤ ሜ ≤ 2 )Fra bibliotek1-6
!
取伪的概率β1
四、α与β的关系
1. 设定α1小于α2,观
察图1中的取伪概
率β1明显大于图2
中的取伪概率β2。
图1 α1=0.05的取伪概率β1
取伪的概率β2
2. 结论:在其它条件完
全相同的条件下,弃真
的错误和取伪的错误是
一对矛盾,一个小,另
③
抽样的样本容量多少
④
显著性水平
!
(一)取伪错误的特点——以总体均值检验为例
1、在总体均值未知的情况下取伪概率是不能计算的。取伪概率的计算要依赖于
真实总体均值。抽样目的就是用样本数据推断假设总体,若真实总体是未知的,
在这种情况下是否取伪实际上也就是未知的。
2、取伪概率大小与原假设和真实总体的接近程度有关。若原假设和真实情况相
一个必然大;一个大,
另一个必然小。
1-7
图2 α2=0.1的取伪概率β2
!
五、应对两类错误的原则
1. 一般来说,哪一类错误所带来的后果严重,危害大,
在假设检验中就应当把哪一类错误作为首要控制目标
。
2. 奈曼(Neyman)和皮尔逊(Pearson)提出了一个原
则,即在控制第I类错误的概率α的条件下,尽可能使
图(A)中[x1,x2] 的范围内,就要
接受原假设μ=μ0
2、如图(B)所示:
真实的总体均值是μ=μ1
取伪的概率
真实总体的样本均值分布
B
如果在图(B)真实μ=μ1的总体中
抽取的样本均值落入了图(A)假设
μ=μ0 的接受域内,这样就把错
假设检验中的两类错误及其控制方法
![假设检验中的两类错误及其控制方法](https://img.taocdn.com/s3/m/a8842d7342323968011ca300a6c30c225901f0e4.png)
假设检验中的两类错误及其控制方法在统计学中,假设检验是一种常用的分析方法,用于判断某个假设是否成立。
然而,进行假设检验时会存在两类错误,即第一类错误和第二类错误。
了解并掌握如何控制这两类错误是进行可靠假设检验的关键。
本文将介绍两类错误的概念以及控制方法。
一、第一类错误第一类错误,也称为α错误,是指当原假设为真时,拒绝原假设的错误。
这种错误将导致我们错误地得出结论,即拒绝了一个事实上是真实的假设。
为了控制第一类错误,我们可以通过设置显著性水平来进行调控。
显著性水平(α)是指在假设检验中所容忍的第一类错误的最大概率。
常见的显著性水平有0.05和0.01,分别表示一类错误的容忍程度为5%和1%。
设定更严格的显著性水平会减少第一类错误的发生概率,但同时也增加了第二类错误的风险。
二、第二类错误第二类错误,也称为β错误,是指当原假设不真实时,不能拒绝原假设的错误。
这种错误将导致我们未能发现一个实际上是错误的假设。
相比于第一类错误,控制第二类错误要更具挑战性。
通常,我们无法直接控制第二类错误的概率,但可以通过增加样本容量或改变检验方法来降低第二类错误的风险。
增加样本容量是一种常见的控制第二类错误的方法。
样本容量的增加意味着我们会有更多的观察值用于分析,从而提高检验的灵敏度。
通过增加样本容量,我们可以更容易地检测到真实效应,减少第二类错误的概率。
另一种控制第二类错误的方法是改变检验方法。
例如,可以选择更合适的统计检验方法,或者调整假设检验的参数,以提高检验的效力和准确性。
然而,改变检验方法需要在实践中进行谨慎考虑,并且需要充分了解不同方法的优缺点。
综上所述,假设检验中存在两类错误,即第一类错误和第二类错误。
为了控制第一类错误,可以通过设置显著性水平来调控。
而控制第二类错误则需要采取增加样本容量和改变检验方法等措施。
在进行假设检验时,我们应该充分考虑两类错误的控制方法,确保得出准确可靠的结论。
(文章长度:520字)。
论假设检验中两类错误的关系
![论假设检验中两类错误的关系](https://img.taocdn.com/s3/m/191ab0711fd9ad51f01dc281e53a580216fc5012.png)
论假设检验中两类错误的关系皿睁煞209晦第1期论假设检验中两类错误的关系王德劲高校论坛摘要本丈以左侧检验为倒,引入"检验上限"这一概念,解决了不同条件下假设捡验的第二类错误的计算问题,验证了大多数教科书上引而不论的关于假设检验两类错误问题有关结论.关键词假设检验两类错误检验上限假设检验是推断统计的基本内容之一,在商品质量检验,科学试验和统计决策中得以广泛的应用,其基本原理是"小概率事件在一次试验中几乎不可能发生".由于小概率事件不可能发生指的是该事件发生的概率很小而不是真的不会发生,当我们依据小概率原理做出判断时难免会犯错误.本文从假设检验的原假设(o)和被择假设(日,)的关系出发.讨论假设检验中可能出现的两类错误.1假设检验的两类错误原假设和被择假设是对总体参数特征的相互对立的假定.即两者必居其一.理想的假设检验是:如果H0为真则接受H0;如果H1为真则拒绝H0.但这种情况不一定出现.见下表:袁1假设捡验的两类错误,\H寿'H冉鼻*\,'击董正一革二羹措谖在摹一奥.|谩l夹毫正璃总体情况是,要么为真,要么Hl为真.如果Hl1为真时.结论是拒绝Hl1.就犯了第一类错误(记为a):如果H.为真.结论是接受.就犯了第二类错误(记为13).假设检验不能消除出错的可能性,但可以考虑错误发生的概率:a=P(拒绝lHl1为真).13=P(接受Hl1lHl1为真)在实践中.检验者往往确定允许犯第一类错误概率的最大值.称为检验的显着性水平(一般选择0.01或0.05).结果是,在拒绝H时,要么结论正确.要么犯第一类错误(小概率事件).因此.当样本数据支持拒绝H肘,犯错误的可能性大小(概率a)是可控的.但是当样本数据不支持拒绝H肘.我们只好接受Hl1.这时就有可能犯第二类错误.而第二类错误并不是总能控制的,也即在决定接受H时.其决策正确的概率是不确定的.因此,在样本数据不支持拒绝Hl1时.应使用"不能拒绝Hl1"而非"接受Hl1"的结论.显然.当样本数据拒绝时.采取任何相应的行动都是恰当的(这就是要选择对被择假}殳进行检验的理由):当样本数据不能拒绝时,在研究性和陈述正确性检验中不必采取行动.但在决策情况下,必须接受H拼采取相应行动.此时就会冒犯第二类错误的风险,而且.此风险是不可控制的.2第二类错误的计算和检验效率第二类错误虽然不能控制,但可以通过一定的方法进行计算,以便对风险的大小进行权衡.例如,某公司质量检验员对供货商的电池进行抽样调查(假定样本容量为36.且总体方差已知).以便对接受进货或是退回货物做出决策.假定规定电池的使用寿命至少达120/|',时.合适的假没形式是:Ho:≥120:Hl:<120如果被拒绝,则认为电池质量不合格而将电池退还给供货商;如果不能拒绝H..则认为电池合格而收下电池.在a:O.05显着水平下(临界值.:1.645).检验统计量为:::三:互口fn口|H…当zz0:一1.645.即z=j_ll645时拒绝l{n.此时.i120-1.645(—1—21:1l67l.否则接受Hl1.也就是说,当样本均值<l16.71拒绝H.当样本均值l16.71时接受Hl1.由于:116.71是拒绝H..的最大值,不妨把:l16.7l的样本均值称作拒绝上限,记作(对于右便4检验和双侧检验分别有下限和上下限).第二类错误指的是当总体均值小于l2(悝我们却接受了H'..为作者单位:华南师范大学旅游管理系了计算第二类错误.必须选择一个小于'120的总体均值.例如.设总体均值ul12120时(图1).则第二类错误为:,=^116.7lI=I12)=l一^<l167lI:l12)n三<!ll_f236):01?~".2/436图1第二类错误的计算一般地,假定总体均值的真值为=,总体均值的检验值为..总体标准羞为.样本均值和样本容量分别为,n.第一类错误为a.则左侧检验的拒绝上限o—z:,第二类错误:-.~1.//="一言"m(.对于不同的总体均值的真值,可以计算对应的p值,P-中(z)-l_称为检验效率.图2和图3为不同总体均值下的P值和p值.可以看出.在其它条件不变的情况下:l,随着总体实际均值,趋近于检验值(120).检验效率的值趋近于检验显着水平或第一类错误的概率a,而犯第二类错误的概率B趋近于置信水平l—a:2,总体实际均值与检验值越接近,犯第二类错误的概率B越大(趋丁l—a. 图3),检验效率相,~J3gd,(趋于a.图2)在其它条件不变时,B值完全取决于总体检验值与实际值之间的羞异.一~二一一=二一二二三一≯3不同情况下第二类错误的计算以上对第二类错误的计算假定总体方羞和样本均值已知.样本容量不变,第二类错误完全由总体检验均值与实际均值之羞所决定.显然,一般情况下.总体实际均值一般是未知的.也就是说第二类错误实际上不能计算.31其它条件相同,第一类错误减少在一般的统计学教科书上都指明了,当第一类错误减少时.第二类错误会随着增大.但并没有具体说明为什么会增大.实际上. 对左侧检验而言.当a减小时.z的值增大.此时拒绝上限i=一zd减小,因而第二类错误13m(三.mf:,)会随着增大.a/√n表3:不同d值和下13值的计算(.=120.o=12.n=36)I1】'¨,,l~"¨7*●●^ll,3,2其它条件不变.样本容量增加控制其它条件不变(0,Ot,不变).样本容量n增加时.第二类错误B会怎么变化呢?还是以左侧检验为例,由第1种情况知.若其它条件不变.当n增加时.拒绝上限一~:—将随着增大.因而第二类错误.()一(z)将随着减小假如其它条件不变,将上述检验的样本容量从36增加到100.则拒绝上限;一z—.120—1.6,45—.:JJB.03.对不同的总体实际均值.可计算相应的13值.(转135页)技术开发由l料技2Q06耷:第1期嘲多砂少的砂泥岩互层段.这两段地层对垛一段下部和戴二段油藏具有控制作用.垛二段顶部有一厚度2o-so~9泥岩和砂质泥岩段,对垛二段油藏起到一定的控制作用.深凹带东部地区三垛组和戴二段油藏只是靠局部并且不稳定的泥岩层作为盖层.另外—个很重要的控制因素就是深凹带三垛,戴南组地层中存在泥岩欠压实现象, 这种欠压实形成的压力封闭具有比泥岩封闭效率更高的封闭能力. 显然它对深凹带三垛,戴南组油藏的保存起着至关重要的作用.4结论4.1高邮凹的油气藏层布规律高邮凹陷的油气藏展布均具有环带状分布,沿近南北向构造高带及沿控凹断层或其它大断裂展布的规律.4.2高邮凹陷油气富集的主要控专6因素①油气资源;②构造背景和沉积背景;③不同性质,形态和级别的断层控制了区带,区块间油气富集程度差异;④泥岩盖层的厚度对油气纵向富集层位具有重要的控制作用.参考文献:[1】张喜林,朱筱敏,钟大康等.苏北盆地高邮凹陷第三系一上白垩统层序地层格架特征沉积,2004,22(3):393-399【2J张渝昌.中国舍油气盆地原型分析[MJ.南京:南京大学出版社.1997[3】徐健,熊学洲.苏北盆地高邮凹陷油气成藏特征研究刚石油勘探与开发,2000,27(4):80-83作者简介田骏(1978一),男,湖北潜江人.2000年毕业于江汉石油学院石油天然气地质勘查专业,从事石油地质开发研究工作.(收稿日期:2005?09?14)(接114页)表4:样本容量n增大时13值的计=120,.:12,{)o)£,'∞0t.)一,注:与表4比较,其它条件不变,当样本容量,9k36增至lOO时,相对相同的总体均值,第二类错误B值明显减少.而检验效率增大,3.3同时减小a,B值的必要条件,f对于左侧检验.拒绝上限/-to一,.第一类错误为n.第二类错误一-?o(二)一o(z,).由于实际检验问题的限制,待检验均值p-O和总体方差都不可能改变.假若保持n不变,a值减小.则za增大.使得拒绝上限减小.此时,州三r一:)必增大.反之.此时若要使p减小.唯一的办法是增加样本容量.显然.当n增大,a值减小时.只要使二-(这一条件显然容易满足).就可使增大.从而B减小.4简要结论本文以左侧检验为例.引入"检验上限"这一概念.解决了不同条件下假设检验的第二类错误的计算问题,验证了大多数教科书上引而不论的关于假设检验两类错误问题有关结论:①随着总体实际均值趋近于检验值.检验效率的值趋近于检验显着水平或第一类错误的概率a.而犯第二类错误的概率B趋近于置信水平1一a;②总体实际均值与检验值越接近.犯第二类错误的概率B越大.检验效率相应越小;③在其它条件不变时.B值完全取决于总体检验值与实际值之间的差异.一般情况下.总体实际均值一般是未知的.也就是说第二类错误实际上不能计算;④控制其它条件不变,当第一类错误减少时.第二类错误会随着增大.当n增加时,第二类错误p将随着减小.因而.增加样本容量是使得a,B值同时减小的必要条件.总之.本文通过实例汁算能使学生更深刻理解假设检验的两类错误及其相互关系,也为管理者在必须考虑第二类错误时提供了有效的决策依据.参考文献[1】徐国祥.统计学.高等教育出版社.上海社会科学出版社,2000年7月[2】黄良文.社会经济统计学原理.中国统计出版社,1996年1月袁卫,庞皓,曾五一主编.统计学.高等教育出版社.2000年7月作者简介王德劲(1970一),男.华南师范大学旅游管理系讲师,西南财经大学统计学院博士生,主要研究方向:宏观经济统计分析.(收稿日期:2005?07?29)(接110页)谋取非法利益或造成重大财产损失的网络犯罪.都应当适用罚金,没收财产等财产刑.财产刑的运用,可以削弱犯罪行为人的经济实力,剥夺其再犯能力.同时,巨额的罚金刑可以沉重打击犯罪者的牟利目的,起到一般预防的作用.要有效预防网络犯罪,资格刑是一种强有力的手段.有人提出.刑法可以考虑设立"禁网刑":对网络犯罪行为人,剥夺其在一定时期内接受网络服务的权利,换言之,犯罪人将在一定的时期内Tq#上网.4.3网络犯罪的社会防范编织社会预防和监督网络,加强对网民特别是对青少年网民的法制宣传教育.网络安全的保护,事关广大网民的切身利益,单靠网络安全技术和法制防范.还不足以形成保护网络安全的社会化有效机制.只有通过教育广大网民.提高守法意识,增强上网切莫触法网的自觉性,并使网民掌握各种防范计算机违法犯罪的技术,提高其自我保护网络安全的能力,才能从根本上解决好计算机犯罪问题.近年来,我国不断增加的上网族中,有的由于未能注意依法进行网上活动,从而有意无意地侵犯了网络安全.为此.对广大网民特别是初上网者进行必要的避免网络利用不当而误闯法网的守法教育.是十分必要的例如"黑客"中有些还是未成年人.他们出于炫耀心理上网作恶.甚至不明白自己这是在干违法的事,因此在调强计算机的普及的同时,要加强对计算机学习,使用的法制教育.对广大网民进行自我防范计算机犯罪的普及宣传和必要的技术培训.培训中,要注意加大防范计算机违法犯罪技术的比重.并不断根据犯罪新趋势,在网民中有重点地推广一系列网络安全技术.建立网络安全的保障机制.技术防范,法制防范和社会防范三管齐下.7I-~I~有效地遏制网络犯罪的蔓延态势.驱走虚拟世界上空的阴霾.还网络空问一份纯净,使之为人们的生活,发展提供更为强大,更为积极的作用.参考文献【1】高铭暄新编中国刑法学.1998【2】安淳.论网络犯罪及其防控安徽大学.2001年第1期[3】于建强.略论计算机网络犯罪.摘自百度搜索引擎其它文献(略)作者简介陈蓓(1979一),女,江苏南通市人民检察院,书记员,双学历双学士.计算机科学与技术和法学(收稿日期:2005?11?:1)(接133页)9.6×10't.油井单井控制可采储量3.1×10It.总体认为.该方案已基本达到小井距试验目的.减小压力损耗.提高了油井供液能力.5结论(1)注采井网对低渗透油藏的开发效果起着决定性作用,井距增大.钻井投入少.但由于低渗透储层导流能力差,很容易造成注不进,采不出.而加密井网.采油速度和采收率可以提高.钻井投入又随之增大.因此对于低渗透油藏的开发应该在对注采井网进行充分科学论证的基础上.采取合理井网密度和注采井距.以取得经济高效.(2)对于异常高压油藏采取压裂改造.必须确定合理的裂缝方向.以最大限度地避免注入水向生产井窜进和暴性水淹现象.提高水驱油效果.参考文献[1】韩大匡.陈钦雷.闰存章油藏数值模拟基础北京:石油工业出版社,1993年:217~272(收稿日期:2005?09?27)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关于假设检验的两类错误问题的分析摘要:本文对假设检验的两类错误问题进行分析,阐述了两类错误问题的基本概念,讨论了两类错误的产生的原因和它们之间的关系,并给出了减少统计假设检验中两类错误发生的方法。
关键词:假设检验,两类错误,关系,控制统计学知识具有理论丰富、应用广泛的特征,在生产实践中具有强烈的应用背景[1],由于受到人力、物力、财力、时间等的限制,以及某些实验与检测的破坏性,人们在实践中对总体的某一数量特征进行评估时,常常采取从总体中抽取若干数量的随机样本,然后,依据“小概率原理”和样本信息,用假设检验方法对总体数量特征做出判断。
例如,商业银行对企业进行信用评估问题[2],产品生产线工作是否异常的判断问题,炮弹质量检测问题等都要用到统计学中假设检验方面的知识。
人们总是希望能够依据样本信息做出关于总体特征的正确判断或决策。
然而,由于样本是从总体中随机抽取的,用少量的随机样本信息来对总体的某些特征进行假设检验难免不犯错误,这些错误我们通常称为假设检验的两类错误问题。
本文对假设检验的两类错误问题进行分析,阐述了两类错误问题的基本概念,讨论了两类错误的产生的原因和它们之间的关系,并给出了减少统计假设检验中两类错误发生的方法。
1问题引入由下例引出的问题[3]:例1:已知罐头番茄汁中维生素C含量服从正态分布,按规定,维生素C的平均含量不得少于21毫克,现在从一批罐头中抽取17罐。
算得维生素C含量的平均值X=23,S2=31982,问该批罐头维生素c含量是否合格? (α=0.05)。
解:维生素c含量X~N(μ,α2),检验假设:H0:μ<21,当H0成立时,则有查表得t0.05=1.746,即P{T>1.746}=0.05,经计算T=2.07>1.746,于是否定H0,认为μ≥21,即该批罐头合格。
在本例中,罐头是否合格,在解答之前并不知道,那么,为什么要设为H0<21而不设为H0>21呢?如果说两种地位均等,取哪一个都行,那么将会得出什么结论。
请看下例:例2:例1中将平均值改为X=22,其它不变。
解:(1)检验假设H0:<21,经计算T=1.036,由于1.036<1.746,所以接受H0,即认为该批罐头不合格。
(2)检验假设H0:μ≥21,计算同上,由于P{T<-1.746}=0.05,而1.036>1.746,所以接受,即认为该批罐头合格。
在同一个检验标准下会有相反的结论,这样的检验是不能付诸现实的。
上面的例子是所谓单边检验,单边检验因为要有说明,所以理解起来似乎更困难一些,但是,在理论上对单边检验的研究却是对双边检验研究的基础,同时单边检验在实际中有许多应用[4]。
事实上,对于形如那样的双边检验也会遇到类似的问题。
例3:某砖厂生产的砖抗断强度服从正态分布,已知α2=1.21,今从一批砖中随便地抽取6块,测得抗断强度平均值=31.88公斤/平方厘米,现在问:这批转的平均抗断强度可否认为是32.50公斤/平方厘米(α=0.05)解:(1)抗断强度X N(32.50,1.12),检验假设H0:μ=32.50,当H0成立时,.查表知P{U>1.96}=0.05,但现在U=1.38<1.96,因此下结论不能否定H0,即认为这批产品的平均抗断强度是32.50公斤/平方厘米。
(2)又根据反证法的思想也可检验<32.50或>32.50,于是有检验假设H1:μ>32.50,当H1成立时,查表得μ0.05=1.65,由于P{<-1.65}0.05,经计算U=-1.38>-1.65,所以不能否定H1,当然H0不能成立[5]。
问题究竟出在哪里呢?2假设检验的两类错误2.1假设检验的基本原理假设检验的最基本原理是显著性原理,是根据样本观测值来判断是否有显著差异,这个差异是由两种可能因素引起的,一是系统性因素,一是偶然性因素。
问题的关键在于:这个差异是否可以仅以偶然性这个因素去解释,也就是说是否有充分的理由来否定这种解释。
如果有,就否定原假设,如果没有,就只能接受它。
假设检验的基本思想是应用小概率原理,所谓小概率原理就是认为小概率事件在一次试验中是几乎不可能发生的,如果发生了,就有充分的理由怀疑原假设为真,也即拒绝原假设[6]。
2.2两类错误如果原假设H0成立,而观察值落入否定域,从而作出拒绝H0的错误结论,称作第一类错误,第一类错误是“以真当假”,犯第一类错误的概率不超过显著性水平α。
如果原假设H0不成立,而观察值未落入否定域,从而作出接受H0的错误结论,称作第二类错误,第二类错误是“以假当真”,犯第二类错误的概率记作β[7]。
两类错误的分类见表1[8]。
表 1 显著性检验判断结果分类犯“弃真”错误的前提条件是H0为真,犯“取伪”错误的前提条件是H0为假,由于犯两类错误的前提条件不同,故犯“弃真”错误与“取伪”错误不是对立事件,因而,在一般情况下α+β≠1。
关于犯“取伪”错误的概率β的计算问题,以及犯两类错误的概率α与β以及样本数量n 之间的数量关系问题,比较复杂,需要知道总体的分布及其相关参数[9]。
然而,由中心极限定理知,无论总体X 服从什么分布,来自总体X 的独立同分布随机样本Xi(i =1,2,…,n)在样本容量n较大时(n≥30),其均值都近似服从正态分布。
因而,以正态总体为例研究犯两类错误的概率与样本容量之间的数量关系具有一般性。
2.3两类错误产生的原因在实践中.检验者往往确定允许犯第一类错误概率的最大值,称为检验的显著性水平(一般选择0.01或0.05)。
结果是,在拒绝H0时,要么结论正确,要么犯第一类错误(小慨率事件)。
因此,当样本数据支持H0时,犯错误的可能性大小(概率α)是可控的。
但是,当样本数据不支持拒绝H0时,我们只好接受H0,这时就有可能犯第二类错误,而第二类错误并不是总能控制的,也即在决定接受H0时,其决策正确的概率是不确定的。
因此,在样本数据不支持拒绝H0时,应使用“不能拒绝H0”而非“接受H0”的结论。
显然,当样本数据拒绝H0时,采取任何相应的行动都是恰当的(这就是要选择对被择假没进行检验的理由);当样本数据不能拒绝H0时,在研究性和陈述正确性检验中不必采取行动,但在决策情况下,必须接受H0并采取相应行动,此时就会冒犯第二类错误的风险[9]。
3假设检验中两种类型错误之间的关系(一)α与β是在两个前提下的概率。
α是拒绝H0时犯错误的概率(这时前提是“H0为真”);β是接受H0时犯错误的概率(这时“H0为假”是前提),所以α+β不一定等于1。
结合图1分析如下:图1 α与β的关系示意图如果H0:μ1=μ0为真,关于与μ0的差异就要在图1中左边的正态分布中讨论。
对于某一显著性水平α其临界点为。
(将两端各α/2放在同一端)。
右边表示H0的拒绝区,面积比率为α;左边表示H0的接受区,面积比率为1-α。
在“H0为真”的前提下随机得到的落到拒绝区时我们拒绝H0是犯了错误的。
由于落到拒绝区的概率为α,因此拒绝“H0为真”时所犯错误(I型)的概率等于α。
而落到H0的接受区时,由于前提仍是“H0为真”,因此接受H0是正确决定,落在接受区的概率为1-α,那么正确接受H0的概率就等于1-α。
如α=0.05则1-α=0.95,这0.05和0.95均为“H0为真”这一前提下的两个概率,一个指犯错误的可能性,一个指正确决定的可能性,这二者之和当然为1[10]。
但讨论β错误时前提就改变了,要在“H0为假”这一前提下讨论。
对于H0是真是假我们事先并不能确定,如果H0为假、等价于H l为真,这时需要在图1中右边的正态分布中讨论(H1:μ1>μ0),它与在“H0为真”的前提下所讨论的相似,落在临界点左边时要拒绝H l(即接受H0),而前提H l为真,因而犯了错误,这就是II型错误,其概率为β。
很显然,当α=0.05时,β不一定等于0.95。
(二)在其他条件不变的情况下,α与β不可能同时减小或增大。
这一点从图1也可以清楚看到。
当临界点向右移时,α减小,但此时β一定增大;反之向左移则α增大β减小。
一般在差异检验中主要关心的是能否有充分理由拒绝H0[11],从而证实H l,所以在统计中规定得较严。
至于β往往就不予重视了,其实许多情况需要在规定的同时尽量减小β。
这种场合最直接的方法是增大样本容量。
因为样本平均数分布的标准差为,当n增大时样本平均数分布将变得陡峭[12],在α和其他条件不变时β会减小(见图2)。
图2 不同标准差影响β大小示意图(三)在图1中Hl为真时的分布下讨论β错误已指出落到临界点左边时拒绝H l所犯错误的概率为β[13]。
那么落在临界点右边时接受H l则为正确决定,其概率等于1—β。
换言之,当Hl为真,即μ1与μ0确实有差异时(图1中,μ1与μ0的距离即表示μ1与μ0的真实差异),能以(1—β)的概率接受之[14]。
如图1所示,当α以及其他条件不变时,减小μ1与μ0的距离势必引起β增大、(1—β)减小,也就是说,其他条件不变,μ1与μ0真实差异很小时,正确接受H l的概率变小了。
或者说正确地检验出真实差异的把握度降低了。
相反,若其他条件不变μ1与μ0的真实差异变大时,(1—β)增大即接受H l的把握度增大。
所以说1—β反映着正确辨认真实差异的能力。
统计学中称(1—β)为统计检验力。
这是个比较重要的统计学概念。
假如真实差异很小时,某个检验仍能以较大的把握接受它,就说这个检验的统计检验力比较大[15]。
4两类错误的控制4.1增加样本容量n我们以正态分布为例,正态分布有两个参数μ和σ,μ是位置参数,μ越小,正态分布曲线的中心越向左移,μ越大,越向右移。
σ是形状参数,σ越大正态分布曲线越平缓低阔,σ越小曲线越陡峭高狭,在总体平均数显著性检验中,检验常常是在平均数为μ0,标准差为σ/n的正态分布中进行的。
n 越大,则σ/n 越小,正态分布形状越陡峭高狭,因而接受域上面积也就越小。
故当样本容量n 较大时,β较小,在检验中要想同时减少犯两类错误的概率α和β,最为有效的方法就是增加样本的容量。
但是,增加样本容量则意味着增加抽检费用和时间,有时并不容易实现,因此在多数场合,α不宜定得太小[16]。
4.2 根据研究的需要选择合适的α水平在样本容量n与μ都不变的条件下,α水平减少则β值就要增大。
因此,我们就要根据研究的需要,选择合适的α水平来降低统计错误的发生。
当一个研究力求证明所比较的两个总体在某个指标上存在差别时,研究者当然希望所推断的方法具有较高的可靠性,此时,在统计假设检验中就得力求有更高的把握拒绝原假设,而要达到这个目的[17],就要使α水平减小,使犯弃真错误的概率降低;当一个研究力求证明所比较的两个总体在某个指标上没有差异时,在统计假设检验中就要力求接受H0,这时只有犯纳违的错误的可能性。