对参数单尾假设检验中存在的问题的探讨_钟路
假设检验的错误分析
假设检验的错误分析苏新富【摘要】假设检验中有两种不同检验方法,即原假设和备择假设,而应用不同的方法经常会得到不同的结论。
较好的结果是在第一类错误相同的条件下,犯第二类错误小的方法得到的结论。
指出在比较第二类错误的大小过程中常见的错误及其产生的原因,并给出在实际应用中选取原假设的原则% Therearetwodifferentinspection methodsinhypothesistest.Theyaretheprimary hypothesisandalternativehypothesis.Weoftengetdifferentconclusionsintheu seofdifferentmethods. Thegoodresultisthatthesecondtypeoferrorissmallerwhenthefirsttypeoferrori sinthesame conditions.Theauthorpointsoutthecommon mistakesandthecauseoftheerrorincomparisonofthe secondtypeoferror.Meanwhiletheauthoralsopointsouttheprincipleofchoosi ngprimaryhypothesisin thepracticalapplication.【期刊名称】《辽宁师专学报(自然科学版)》【年(卷),期】2012(000)002【总页数】2页(P7-8)【关键词】单侧假设检验;原假设;备择假设;第二类错误【作者】苏新富【作者单位】锦州师专,辽宁锦州121000【正文语种】中文【中图分类】O21假设检验是数理统计中的一种重要方法,该方法已经在各领域得到广泛应用.在单侧检验中,对于同一问题有两种不同检验方法,即原假设和备择假设,而应用不同的方法经常会得到不同的结论.人们总是希望在第一类错误相同的条件下,选取犯第二类错误小的方法的结论.此时,我们经常会比较它们第二类错误的大小.在比较过程中有一种常见的错误,现对这一问题作深入探讨.1 同一问题,两种方法例某工厂生产的某种元件,其寿命不小于1 000小时才算合格,现从这批元件中抽取25个,测得其平均寿命为980小时,已知元件寿命X~N(μ,1002),试在α=0.05之下判断这批元件是否合格?分析:本题是假设检验中的单侧检验问题,应用统计量方法一,H0:μ=μ0≥1000,H1:μ=μ1<1000,此时U=-1>-λ1-α=-1.65,因此接受原假设,认为元件合格.方法二,H0:μ=μ0≤1000,H1:μ=μ1>1000,此时U=-1<λ1-α=1.65,因此接受原假设,认为元件不合格.对于同一问题,应用同一统计量,两种方法出现了“相反”的结论,我们应相信哪个结论呢?能不能比较它们第二类错误的大小呢?2 常见的错误及其探讨假设检验的基本思想是根据小概率原理,即小概率事件在一次实验中几乎不可能发生而作出推断的一种“反证法”.由于样本存在随机性,因此有可能会出现误判,导致犯两类错误[1].第一类错误,当原假设H0为真时,却错误拒绝它,于是犯了弃真的错误.犯第一类错误的概率记为:P(拒绝H0|H1为真)=α,也称α为显著性水平.第二类错误,当原假设H0不真(即H1为真)时,却错误地接受了它,于是犯了取伪的错误.犯第二类错误的概率记为:P(接受H0|H1为真)=β.以上两种方法的第一类错误为α=0.05,下面计算犯第二类错误的概率的大小.方法一:方法二:比较(1),(2)两式,由分布函数的单调性,似乎可以立刻得出β2>β1且β2>1-α=0.95的结论,从而认为方法一的结论更可靠.通过以上分析可知,总体参数的真实值越接近假设检验中用到的特定值,犯第二类错误的概率就越大,但不会超过1-α;总体参数的真实值与假设检验中用到的特定值的差距越大,犯第二类错误的概率就越小.由于总体参数的真实值未知,所以无法比较以上两种方法第二类错误的大小.分析(3),(4)式知,由于μ1未知,当固定n时,同时减小两类错误是不可能的,增加样本容量n是同时减小两类错误的必要条件.那么,应如何解决两个结论的“矛盾”呢?其实它们并不矛盾.严格来讲,方法一的结论应该是还没有95%的把握认为该元件不合格,方法二的结论应该是还没有95%的把握认为该元件合格.在实际问题中,在判定这批元件合格与否时就要借鉴过去的经验和已掌握信息,如果该种元件的质量过去一直很好,由方法一,我们没有找到否定它的充分理由(95%的把握),我们就应该判定这批元件合格.相反,如果该种元件的质量过去一直不好,最近也没有采取改进的措施,由方法二,若没有找到肯定它的充分理由(95%的把握),我们就应该判定这批元件不合格.3 选取原假设的原则既然很难通过比较犯第二类错误的概率的大小来确定原假设,那么可具体通过以下原则选取原假设:(1)保护原假设原则.原假设应该是过去经验和已掌握信息的总结,是一个需要保护的假设,没有充分的理由(一般为1-α的把握)就不能轻易否定它.(2)利己原则.假设检验是为我们的实践目的服务的,这就不可避免地带有一种主观色彩.(3)根据样本信息确定原假设.(4)把希望验证得到的结论放在备择假设的位置.如果试验推翻了原假设,我们就有1-α的把握肯定备择假设的正确性.(5)把后果严重的错误设置为第一类错误.以上就是假设检验中选择原假设时行之有效的原则,在实际应用中可以参照使用.【相关文献】[1]叶慈南,曹伟丽.应用概率统计[M].北京:机械工业出版社,2004.102-114.。
关于假设检验的两类错误问题的分析--论文
关于假设检验的两类错误问题的分析摘要:本文对假设检验的两类错误问题进行分析,阐述了两类错误问题的基本概念,讨论了两类错误的产生的原因和它们之间的关系,并给出了减少统计假设检验中两类错误发生的方法。
关键词:假设检验,两类错误,关系,控制统计学知识具有理论丰富、应用广泛的特征,在生产实践中具有强烈的应用背景[1],由于受到人力、物力、财力、时间等的限制,以及某些实验与检测的破坏性,人们在实践中对总体的某一数量特征进行评估时,常常采取从总体中抽取若干数量的随机样本,然后,依据“小概率原理”和样本信息,用假设检验方法对总体数量特征做出判断。
例如,商业银行对企业进行信用评估问题[2],产品生产线工作是否异常的判断问题,炮弹质量检测问题等都要用到统计学中假设检验方面的知识。
人们总是希望能够依据样本信息做出关于总体特征的正确判断或决策。
然而,由于样本是从总体中随机抽取的,用少量的随机样本信息来对总体的某些特征进行假设检验难免不犯错误,这些错误我们通常称为假设检验的两类错误问题。
本文对假设检验的两类错误问题进行分析,阐述了两类错误问题的基本概念,讨论了两类错误的产生的原因和它们之间的关系,并给出了减少统计假设检验中两类错误发生的方法。
1问题引入由下例引出的问题[3]:例1:已知罐头番茄汁中维生素C含量服从正态分布,按规定,维生素C的平均含量不得少于21毫克,现在从一批罐头中抽取17罐。
算得维生素C含量的平均值X=23,S2=31982,问该批罐头维生素c含量是否合格? (α=0.05)。
解:维生素c含量X~N(μ,α2),检验假设:H0:μ<21,当H0成立时,则有查表得t0.05=1.746,即P{T>1.746}=0.05,经计算T=2.07>1.746,于是否定H0,认为μ≥21,即该批罐头合格。
在本例中,罐头是否合格,在解答之前并不知道,那么,为什么要设为H0<21而不设为H0>21呢?如果说两种地位均等,取哪一个都行,那么将会得出什么结论。
对假设检验中若干问题的思考
对假设检验中若干问题的思考作者:杨元启来源:《科技经济市场》2008年第10期摘要:本文对假设检验的几个要点问题进行了深入的阐述,厘清了有关显著性检验的若干概念和内涵.关键词:假设检验;原假设;备择假设;拒绝域中图分类号:O21文献标识码:A根据Neymann-Pearson 在二十世纪二三十年代建立的理论,或者Wald 的统计决策理论,假设检验都可认为是数学上的一个优化问题,这种问题只在一些很有限的场合才可解,更多的情况下,人们只能从直观的想法出发,提出一些看上去合理的检验法,再设法探讨其性质,如似然比检验、拟合优度检验、条件检验、秩检验等均是这样的情况。
在本文中,笔者根据多年学习和教学经验,对假设检验的思想和方法,作一个较详尽的剖析,以厘清有关假设检验的若干概念和内涵。
1假设检验的基本问题和基本原理1.1假设检验的基本问题先对总体(随机变量)的参数或总体分布形式作出一个假设,再利用样本信息来判断这个假设是否合理,即判断总体的真实情况与原假设是否显著地有差异,也就是考虑总体与假设之间的差异是偶然变异,还是确实不一致所引起的,习惯上也称假设检验为显著性检验。
1.2假设检验的基本原理假设检验的基本原理是小概率原理:小概率事件在一次试验中是不大可能发生。
如果这个小概率事件发生了,则认为这个事件未必来自假设中的总体,或者说对总体所做的假设可能不正确。
2假设检验的几个概念2.1假设将现实问题纳入一个适当的统计模型(总体的分布族),一个假设可认为是这个大的模型(分布族)中的子模型(子分布族),以参数分布族(即分布形式已知,具体的分布由其所含的未知参数确定)为例,设总体X ,分布族F(x,θ),θ∈,统计假设是关于参数θ的一个命题,H0:∈ ,其中;这个假设叫做原假设,这同时也给出了一个对立(备择)假设。
如何将两个对立的假设中的一个确定为原假设,另一个为对立假设呢?这个问题非常重要,实践中也常让人困惑。
原假设的选择关系到假设检验的结论,因为即使是同一个样本信息,由于原假设的不同选取,也可能会得到完全不同的检验结论。
假设检验与结果解读科学研究的关键技巧
假设检验与结果解读科学研究的关键技巧科学研究的目标是通过建立假设并进行验证,来获取关于现象和问题的客观真相。
而假设检验是科学研究的关键技巧之一,它帮助研究者判断样本数据是否能够支持或反驳他们的研究假设。
在这篇文章中,我们将介绍假设检验的基本原理以及结果解读的科学方法。
一、假设检验的基本原理假设检验是一种数理统计方法,用于测试研究假设的可行性和有效性。
它基于两个相互竞争的假设:零假设(null hypothesis)和备择假设(alternative hypothesis)。
零假设通常表示没有变化或者没有关联,而备择假设通常表示有某种变化或者关联。
在进行假设检验时,研究者首先根据观察到的数据和已有知识,提出零假设和备择假设。
然后,通过对样本数据进行统计分析,计算某个统计量的观察值,并与理论分布相比较,得出一个概率。
这个概率称为 p 值(p-value),它表示如果零假设为真,获得观察统计量及更极端结果的概率。
二、结果解读的科学方法得出p 值后,研究者需要根据该值来做出关于零假设的决策。
通常,如果 p 值较小(通常设定一个显著性水平,如 0.05),我们会拒绝零假设,认为观察到的差异是显著的。
反之,如果 p 值较大,我们则无法拒绝零假设,认为观察到的差异可能是由随机因素引起的。
然而,仅仅依靠拒绝或接受零假设是不够的,科学研究需要更深入的结果解读。
在结果解读中,我们需要考虑以下几个方面:1. 效应大小(Effect Size):除了 p 值外,研究者还应关注效应大小。
效应大小衡量了观察结果中的差异或关联程度。
通常,较大的效应大小意味着观察到的结果更加显著和可信。
2. 可重复性(Reproducibility): 科学研究要求结果能够被独立的实验或研究再次得到相似的结论。
因此,当解读结果时,我们应该考虑该研究是否具有可重复性。
这可以通过查看其他研究的结果或进行更多实验验证来实现。
3. 数据分布(Data Distribution): 在假设检验中,我们通常假设数据分布服从某个特定的理论分布。
关于参数假设检验中两类错误的思考
商业文化·学术探讨 2008年2月319关于参数假设检验中两类错误的思考谢 铭 翟 彬(西安交通大学经济与金融学院,西安,710061)中图分类号:O212.1 文献标识码:A 文章编号:1006—4117(2008)02—0319—01一、参数假设检验中的两类错误在参数假设检验问题中首先根据实际问题的先验信息,确定参数的可能取值范围,再根据需判断的实际问题,将Θ分成互不相交的两部分0Θ和1Θ。
参数假设检验就是根据样本所携带的信息,推断参数的实际值究竟在哪个集合中。
0Θ称为原假设,用H0表示。
参数集的另一部分1Θ称为备选假设,用H 1表示。
在对总体参数进行假设检验时,我们期望的结果是:当H 0中所作的假设为真时,接受H 0;反之当H 1为真时,接受H 1,拒绝H 0,这时的判断与实际相符,没有错误发生。
但是由于客观上存在抽样的随机性,推断的结果也可能是完全相反的,H 0中所作的假设为真,却拒绝了H 0,或者H 0为假时,接受了H 0,这与实际的结果截然相反,发生了两类错误。
将上述结果列示如下:总体的情况 H0为真 H 0为假 接受H 0 结论正确 第二类错误(取伪错误) 拒绝H 0第一类错误(拒真错误)结论正确二、两类错误的计算方法在一般场合下,拒绝域和接受域要由α决定,α为事件“H 0为真但被拒绝”的概率,这个概率又称为显著性水平。
()1P X c α=>=−Φ(假设是一个右侧检验,c 为临界值)。
α值在一般情况下都是事先给定的。
当我们根据根据抽样的结果拒绝了H 0时,其结果要么正确,要么犯第一类错误,犯第一类错误得概率为α,进一步说,根据这一决定作出得行动有1-α的信心,所以当使用一个更小的α水平时,就可以持有更大的信心,控制α水平的意义即在于此。
在大多数假设检验中,人们一般只慎重考虑α的取值,而较少的关心β值的大小。
并且认为β值是不可计算,不能控制的。
果真如此吗?支持这一结论的观点是:总体的“未知性”。
假设检验中几种常见的误区分析
假设检验中几种常见的误区分析摘要:概率统计是广大理工科院校的必修课程,也是研究生入学考试的全国统考的课程,假设检验是概率统计的一个重要问题,不少学生对其有理解误区。
本文通过例题对困扰广大同学的三个假设检验问题问题进行分析。
关键词:概率统计假设检验错误分析《概率论与数理统计》作为大学数学的一个重要组成部分,是广大理工科院校的必修课程,也是研究生入学考试的全国统考的课程。
与其他学科不同的是,概率论与数理统计是研究自然界,人类社会中大量出现的随机显现规律性的一门数学分支。
它具有独特的理论和思想方法,别开生面的研究课题,并且随着现代科学技术的发展而迅速发展。
随着社会和经济的发展,它在自然科学,金融,经济管理,社会科学等方面的应用也越来越广泛,因此,概率统计的学习受到了同学和老师的高度重视。
统计推断是由样本推断总体,其中一个重要问题是假设检验问题,有关总体分布的未知参数或未知分布形式的种种论断叫统计假设,人们根据样本所提供的信息对所考虑的假设做出接受或拒绝的决策,做出这一决策的过程就是假设检验。
在假设检验这一章节的授课过程中,笔者发现学生对这一部分内容的学习,有点吃力,不少学生反映,不太理解这部分的内容,做题目时只能按照书上的例题照搬照抄,不理解为什么要这样做,特别是双边检验和单边检验的区分,左边检验还是右边检验,显著性水平不同时,结论卫生么有不同等问题很困惑,本文对这样几个误区的进行了探讨。
一、单边检验和双边检验的区分在教学过程中,绝大部分教材都会讲到双边检验和单边检验问题,无论是单正态总体的均值方差检验,还是两个正态总体的均值差方差比的检验,还是非正态总体的检验,双边和单边的区分在于原假设和备则假设H1的形式。
如果原假设H0和备则假设H1是形如“ = ”和“=”的形式,则该假设检验是双边假设检验,反之,该假设检验是单边假设检验。
例 1 某车间用一台包装机包装葡萄糖。
袋装糖的净重是一个随机变量,它服从正态分布。
统计学中的假设检验错误类型分析
统计学中的假设检验错误类型分析假设检验是统计学的重要理论之一,用于判断样本数据对某个总体假设的支持度。
在假设检验过程中,我们会遇到两种类型的错误,即第一类错误和第二类错误。
本文将对这两种错误类型进行分析,并探讨如何降低错误率。
1. 第一类错误第一类错误也被称为显著性水平(Significance Level)或α错误。
它指的是在原假设为真的情况下,拒绝原假设的错误判断。
在假设检验中,我们通常会设定一个显著性水平来进行决策,常见的显著性水平有0.05和0.01。
当结果的p值小于设定的显著性水平时,我们将拒绝原假设。
然而,这种判断并不是绝对准确的,存在一定概率犯下错误。
第一类错误的概率通常用α表示。
当我们将显著性水平设定为0.05时,即α=0.05,意味着有5%的可能犯下第一类错误。
如果显著性水平设定得较低,例如α=0.01,那么犯第一类错误的概率将更小,但同时也会增加犯第二类错误的概率。
2. 第二类错误第二类错误是在原假设为假的情况下,接受原假设的错误判断。
与第一类错误相反,第二类错误常用β表示。
第二类错误的概率与样本大小、效应大小和显著性水平等因素有关。
当样本大小较小时,相同效应大小下犯第二类错误的概率较高;当效应大小较小时,相同样本大小下犯第二类错误的概率也较高;而当显著性水平设定较低时,犯第二类错误的概率也会增加。
3. 降低错误率的方法在实际应用中,我们希望尽可能降低第一类错误和第二类错误的概率,提高假设检验的准确性。
以下是一些常用的方法:3.1 增加样本容量通过增加样本容量,可以降低第一类错误和第二类错误的概率。
较大的样本容量能够提供更充分的信息,减小抽样误差,提高判断结果的准确性。
在样本容量不足时,可能会导致犯下更多的错误。
3.2 提高显著性水平设定较低的显著性水平可以降低第一类错误的概率。
但需要注意的是,过低的显著性水平会增加犯第二类错误的概率,因此需要权衡选择适当的显著性水平。
3.3 增大效应大小提高研究中的效应大小可以降低第二类错误的概率。
假设检验中的两类错误及其控制方法
假设检验中的两类错误及其控制方法假设检验是统计学中常用的一种推断方法,用于判断关于总体参数的假设是否成立。
在进行假设检验时,我们一般会面临两类错误,即第一类错误和第二类错误。
本文将介绍这两类错误的含义、造成原因以及控制方法。
一、第一类错误的含义及控制方法第一类错误,也被称为α错误,指的是当原假设为真时,却错误地拒绝了原假设的情况。
换句话说,第一类错误意味着我们得出了一个错误的结论,即在事实上不存在的关系。
控制第一类错误的方法主要是通过控制显著性水平α来实现。
1. 显著性水平的控制显著性水平α定义了我们在进行假设检验时拒绝原假设的临界值。
通常情况下,α的取值为0.05或0.01,代表了我们容忍犯第一类错误的概率。
较小的α值会降低犯第一类错误的风险,但同时也增加了犯第二类错误的概率。
2. 样本容量的控制样本容量对于控制第一类错误也至关重要。
较大的样本容量可以提供更多的信息,从而降低犯第一类错误的概率。
因此,在进行假设检验时,我们应尽可能选择足够大的样本容量来增加推断的准确性。
二、第二类错误的含义及控制方法第二类错误,也被称为β错误,指的是当原假设为假时,却错误地接受了原假设的情况。
换句话说,第二类错误意味着我们未能发现事实上存在的关系。
控制第二类错误的方法主要是通过改进实验设计或增大样本容量来实现。
1. 实验设计的改进良好的实验设计可以降低发生第二类错误的概率。
例如,在两组样本进行比较时,我们可以增加处理组与对照组的差异,从而提高检测到显著差异的能力。
此外,合理的随机分组和对照设计也能够有效地控制第二类错误。
2. 样本容量的增大与控制第一类错误类似,增大样本容量也是控制第二类错误的一种方法。
较大的样本容量可以提高检测到真实差异的概率,从而减少第二类错误的发生。
在做出假设检验计划时,我们应考虑到研究资金、时间和实验设计等方面的限制,尽可能选择足够大的样本容量。
总结:在假设检验中,我们需要控制两类错误,即第一类错误和第二类错误。
简述假设检验应注意的问题
简述假设检验应注意的问题一、样本选取在假设检验中,样本的选取是非常关键的。
样本应该具有代表性,能够反映总体的情况。
如果样本不具有代表性,那么假设检验的结果可能会产生偏差。
因此,在选取样本时,应该尽可能地保证其多样性,并避免出现选择偏差。
二、假设明确假设检验的前提是提出明确的假设,假设应该清晰明了,没有歧义。
假设不明确会导致检验的结果不准确,甚至可能出现错误。
在提出假设时,应该尽可能地详细描述,明确假设的条件和结果。
三、统计方法在假设检验中,选择合适的统计方法是非常重要的。
不同的统计方法适用于不同的情况,如果选择不当,可能会导致结果不准确。
因此,在选择统计方法时,应该根据具体情况进行选择,并且要确保其适用性。
四、显著性水平显著性水平是假设检验中的重要概念,它代表了检验的可靠性程度。
如果显著性水平设置得过高,可能会导致假阳性结果;如果显著性水平设置得过低,可能会导致假阴性结果。
因此,在设定显著性水平时,应该根据具体情况进行选择,并且要确保其合理性。
五、检验结果解读检验结果的解读是假设检验中的重要环节。
如果解读不准确,可能会导致错误的结论。
因此,在解读检验结果时,应该结合实际情况进行判断,并且要避免过度解读或误读。
六、控制其他因素在假设检验中,控制其他因素是非常重要的。
其他因素可能会对实验结果产生干扰,影响实验的准确性。
因此,在实验中应该尽可能地控制其他因素的影响,确保实验的准确性。
七、重复实验重复实验是验证假设检验结果可靠性的重要手段。
如果实验结果可以被重复,那么结果的可信度会更高。
因此,在假设检验中,应该尽可能地进行重复实验。
对参数单尾假设检验中存在的问题的探讨_钟路
似乎并不存在选择的余地。因为 在数理上, 它们都是根据给定的数据条件, 原假设的问题,
$,* " - !.
$,* "- !.
% &&",!""" %,!’/( #" - !!""
且知该统计量服从标 准 正 态 分 布 。 在 给 定 查正态分布表可得 显著 性 水 平 "’3( 的 情 况 下 ,
% &&",!""" %,!’/( #" - !!""
原因, 我们总是在条件许可的情 况 下 , 尽可能把 原假设设定为可能被拒绝的 , 因 为 当 样 本 数 据 显示, 原假设应该被接受的时候 , 对这样一个结 论的可信程度 !,# 缺乏度量。 在双尾的假设检验中 , 对 于 把 什 么 设 定 为 我们几乎必须把待推断的参 数 设 定 为 等 于 参 照 物, 否则就没有任何可资利用的 信 息 , 支持做进 一步的推断。 但在单尾检验中的情 况 却 非 如 此 , 我 们 似 乎可以任意地把设定待推断 参 数 大 于 等 于 或 小 于等于参照数据作为原假设 。 因 为 无 论 如 何 设 定, 其数理推断逻辑都是一致的。区别仅在于被 拒绝或接受的是谁。按照上 文 中 提 到 的 两 类 错 误的标准,应该是把可以被 样 本 数 据 拒 绝 的 结 果设定为原假设,这样才能 保 证 最 终 结 论 的 科 学性。但照此方法, 有可能会陷入一种悖论。把 上例所问的问题稍做变换, 即 可 发 现 其 中 的 不 合情理之处:即判断新批量 电 池 的 平 均 耐 用 时 间与通常的相比, 是否有显著降低。 设定原假设 )": *"!""" 小时 设定备择假设 )!: *2!""" 小时 根据题意, 构建样本统计量: +%
浅析假设检验中的几个问题
推定” , 为什么后来更改为 “ 无罪推定”; 医 患 纠纷 为 何 由 等等 。这 就是 反 证 法在 假 设检 验 中的 重要 运 用 , 因为反 证 法 患 者 提供 病 历 等 资料 , 改 为 实行 举 证 责任 倒 置 … …类 似 的情 在 证 明 此 类 假 设 时 太 便 利 了 。
途 径 。这恰 是 假设 检 验 可 以解决 的问题 “ 乙没 偷 吃 ”作 为 原假 设 , 而 用 容 易证 明的 “ 乙偷 吃 ”为 备 般说来 , 假 设 检 验 是 小 概 率 事 件 原 理 、 正态 分 布 3 o 择 假设 。
一
原 则 与 反 证 法 的结 合 运 用 , 可 简 单地 分 为 四步 : 设 置 原假 设 以往 我 国法 律 依据 的是 “ 有罪推定”, 其 后更 改为 “ 无 与 备 择假 设 , 确 定显 著 性 水 平 , 计 算 统计 量 , 根据 P 值 得 出结 罪推 定 ” , 为 什 么 会有 这 种 改 变 呢? 试 想 , 若以 “ 有 罪 ” 作 论 。那 么 原 假 设 究 竟 应 当 如何 设 置 ? 它 与其 后 的步 骤 存 在 为审 判 的 起点 , 嫌 疑 人 只要 能证 明 自己 当时 不在 场 或有 证 人 而以 “ 无 罪 ”作 为 原假 设 , 嫌 疑 人如 要证 明清 白 , 何 种 关 系 ? 假设 检 验 的 关 键 点 到底 在 哪 里? 本 文 针 对 实 际 即可 脱 罪 , 运 用 中遇 到的 问题 , 对 此一 一做 出分析 。 则要 提 供 发生 前 后 每 时 每 刻 的 相 应 证 明 , 在现实生活中, 这 在运用 中, 人 们 常 常 对 原 假 设 的 设 置 存 有 疑 问 。 俗 话 是极 为 不易 的 。与 零 食 例 类 似 , 以无 罪 做 原 假 设 , 证 明的 难 因此, 现 在 国 际 通用 做 法 均 采 用 说: 万 事开 头 难 , 如何 选 择原 假 设 的命 题 至 关重 要 , 是 假设 检 度 要 大 于 以有 罪做 原 假 设 ,
6.3 假设检验的两类错误及注意事项
˙注意单侧检验与双侧检验的选择 ˙理解参数估计与假设检验的异同点
值越小,说明越有理由拒绝零假设,而非说明差异越大。 有统计学意义并不等于有实际临床意义,还应结合专业知识来分析,应
考虑差值的平均水平是否达到或超过有临床实际意义的差值。 所有假设检验的结论都是在一定概率下得到的,因此,在作推断结论时
都有可能犯错误(I型错误或者II型错误),假设检验的结论不能绝对化。
如何减小α 及 β ?
二、假设检验需注意的问题
(1)要有严密的研究设计
样本资料应具有代表性,即样本的获取必 须遵循随机化原则;
比较的组间应具有可比性,即各对比组间 除了要比较的主要因素外,其他可能影响结果 的因素应尽可能相同或相近。
二、假设检验需注意的问题
(2)正确理解P值和统计结论的意义
P 值指当零假设成立时,出现当前样本结果以及更极端结果的概率。P
二、假设检验需注意的问题
(3)单侧检验与双侧检验的选择
如果有信息(如专业知识)知某个偏离方向不会发生,那么备选假设就 只有一个偏离方向,就是单侧检验。
双侧检验:
H0 : 0
H1 : 0
单侧检验:
①HH01: :
0 0
或
②
HH01: :
0 0
二、假设检验需注意的问题
(4)参数估计与假设检验的异同点
˙ 两者均可用于统计学推断,两者的统 计结论具有同等的效力。 ˙置信区间能够提供包含参数的范围宽 窄的信息。
˙ 假设检验提供具体的P 值,P 值越小,
代表越有理由去拒绝零假设。
小结
一、假设检验的两类错误 ˙Ⅰ型错误 ˙Ⅱ型错误 ˙检验效能 二、假设检验的注意事项 ˙要有严密的研究设计
对假设检验中若干问题的思考
对假设检验中若干问题的思考摘要:本文对假设检验的几个要点问题进行了深入的阐述,厘清了有关显著性检验的若干概念和内涵.关键词:假设检验;原假设;备择假设;拒绝域根据Neymann-Pearson 在二十世纪二三十年代建立的理论,或者Wald 的统计决策理论,假设检验都可认为是数学上的一个优化问题,这种问题只在一些很有限的场合才可解,更多的情况下,人们只能从直观的想法出发,提出一些看上去合理的检验法,再设法探讨其性质,如似然比检验、拟合优度检验、条件检验、秩检验等均是这样的情况。
在本文中,笔者根据多年学习和教学经验,对假设检验的思想和方法,作一个较详尽的剖析,以厘清有关假设检验的若干概念和内涵。
1假设检验的基本问题和基本原理1.1假设检验的基本问题先对总体(随机变量)的参数或总体分布形式作出一个假设,再利用样本信息来判断这个假设是否合理,即判断总体的真实情况与原假设是否显著地有差异,也就是考虑总体与假设之间的差异是偶然变异,还是确实不一致所引起的,习惯上也称假设检验为显著性检验。
1.2假设检验的基本原理假设检验的基本原理是小概率原理:小概率事件在一次试验中是不大可能发生。
如果这个小概率事件发生了,则认为这个事件未必来自假设中的总体,或者说对总体所做的假设可能不正确。
2假设检验的几个概念2.1假设将现实问题纳入一个适当的统计模型(总体的分布族),一个假设可认为是这个大的模型(分布族)中的子模型(子分布族),以参数分布族(即分布形式已知,具体的分布由其所含的未知参数确定)为例,设总体X ,分布族F(x,θ),θ∈,统计假设是关于参数θ的一个命题,H0:∈,其中;这个假设叫做原假设,这同时也给出了一个对立(备择)假设。
如何将两个对立的假设中的一个确定为原假设,另一个为对立假设呢?这个问题非常重要,实践中也常让人困惑。
原假设的选择关系到假设检验的结论,因为即使是同一个样本信息,由于原假设的不同选取,也可能会得到完全不同的检验结论。
剖析假设检验的两类错误并举例说明资料
案例阐明
• 例子:一个公司有员工3000 人(研究 旳总体) ,为了检验公司员工工资统计 报表旳真实性,研究者作了 50 人旳大 样本随机抽样调查,人均收入旳调查结 果是: X (样本均值)=871 元;S(标 准差)=21 元 问能否定为统计报表中人 均收入μ0=880 元旳数据是真实旳? (显著性水平α=0.05 )
β 错误出现原因
• 第二个问题是,统计检验旳逻辑犯了从结论推 断前提旳错误。命题 B 是由命题 A 经演绎推 论出来旳,或写作符号 A→B,命题 C 是我们 在检验中所根据操作法则。假如A 是真旳,且 我们从 A 到 B 旳演绎推论假如也是正确旳, 那么B 可能是真实旳。相反,假如成果 B是真 实旳,那么就不能得出A 肯定是真实旳结论。 这就是 β错误出现旳原因。
假设检验时应注意旳事项
• 要有严密旳抽样研究设计,样本必须是从同质 总体中随机抽取旳;要确保组间旳均衡性和资 料旳可比性。
• 根据既有旳资料旳性质,设计类型,样本含量 大小,正确选用检验措施
• 对差别有无统计学意义旳判断不能绝对化,因 检验水准只是人为要求旳界线,是相正确。差 别有统计意义时,是指无效假设H0被接受旳可 能性只有5%或不到5%,甚至不到1%,根据小 概率事件一次不可能拒绝H0,但尚不能排除有 5%或1%出现旳可能,所以可能产生第一类错误: 一样,若不拒绝H0,可能产生第二类错误
两类错误旳危害
• 犯第一类错误旳危害较大,因为报告了原来不 存在旳现象,则所以现象而衍生出旳后续研究 、应用旳危害将是不可估计旳。想对而言,第 二类错误旳危害则相对较小,因为研究者假如 对自己旳假设很有信心,可能会重新设计试验 ,再次来过,直到得到自己满意旳成果(但是 假如对本就错误旳观点坚持旳话,可能会演变 成第一类错误)。
对参数假设检验中几个问题的探析
2011.1在数理统计中,假设检验是统计推断的一个重要的内容,包含参数假设检验和非参数假设检验。
参数假设检验是对总体分布中的未知参数先作出某种假设,再利用样本的信息对所提出的假设作检验。
在实际中,参数假设检验在经济管理、质量控制、医药卫生等多方面都具有广泛的应用。
因此,理解好假设检验的基本思想,掌握假设检验的基本方法、步骤,清楚假设检验过程中可能遇到的问题及其解决办法,是将假设检验的统计推断方法有效应用于实际的前提。
本文从假设到检验,就假设检验中的几个主要问题进行探讨和分析。
一、原假设的选择问题假设检验必须先有假设,然后才有对假设的检验,因此,参数假设检验中的第一步也是很重要的一步就是原假设的提出。
在这一环节中,初学者常遇到的困惑是对同一个检验模型,当交换原假设和备择假设分别作检验时,却得出完全不同的结论。
如下例例1、设某电子元件的寿命(小时)X ~N(μ,σ2),参数μ,σ2均为未知,现抽取16件元件的一组样本,测得平均寿命为x 軃=241.5,标准差为s=101.97。
问是否有理由认为元件的平均寿命大于220小时?(α=0.05)检验法一H 0:μ≤μ0=220,H 1:μ≥μ0=220该检验问题的拒绝域为t=x 軃-μ0s/n 姨≥t α(n-1)姨姨,由样本观测值计算得t=0.8434<t 0.05(15)=1.7531。
所以,不能拒绝H o ,认为元件的平均寿命不大于220小时。
检验法二H 0':μ>μ0=220,H 1':μ≤μ0=220该检验问题的拒绝域为t=x 軃-μ0s/n 姨≤-t α(n-1)姨姨,由样本观测值算得t=0.8434>-t 0.05(15)=-1.7531。
故不能拒绝H 0',认为元件的平均寿命大于220小时。
例1的检验结果给我们提出了两个问题:一是两种检验方法孰是孰非?二是原假设的设定有什么原则?对于第一个问题,作者认为若单纯从统计推断的方法来看两种检验方法都是对的,之所以得出截然相反的结论主要是由于样本的随机性所引起的。
医学统计学中假设检验的应用和注意事项
医学统计学中假设检验的应用和注意事项医学统计学中的假设检验是统计分析中常用的工具,它可以帮助临床研究者从组间的数据中提取出更多的有价值的信息,识别出试验和实验结果中的差异。
应用假设检验的最常见的情况是检验某一给定的治疗策略对研究对象的影响。
临床研究者可以通过假设检验来评估研究结果,从而决定治疗策略是否有效。
使用假设检验时,首先要确定假设检验的类型,如检验两个总体的平均值、方差、众数、概率或等概率等特征差异,或者检验某个给定总体是否达到某一水平。
在确定假设检验类型时,应结合研究的目的,考虑实验结果的解释以及结果的有效性。
其次,应该确定假设检验的显著水平和统计方法,一般来说,显著水平用于判断拒绝原假设的强度,一般显著水平取0.05~0.01,根据研究目的和对结果的容忍程度选择。
统计方法通常有t检验、孔氏检验等,其选择取决于两个总体变量的分布情况,例如是否是正态分布或双尾分布,以及两个总体的大小。
最后,在解释结果时应考虑统计学解释,以及研究的实际意义,结果的解释应该免于被实验偏差等所影响,排除在研究中没有考虑的可能因素。
假设检验也有一定的注意事项,首先在研究计划时,应该有明确的中心问题,既研究的目的,以及拟定假设检验的类型、显著水平和统计方法;其次,在收集数据时,应该注意数据的准确性,数据采集人员应按照设计的规范收集数据;第三,在分析结果时,应考虑数据的复杂性,不要仅仅靠统计结论去判定结果的有效性;最后,在结果解释时,应保持谨慎,不要过度解释,结合研究背景和实际情况予以解释。
总之,医学统计学中的假设检验是临床研究中常用的工具,它可以帮助临床研究者识别出实验和研究结果中的差异,更好地判断治疗策略的有效性。
在进行假设检验时,应该按照研究目的,确定假设检验的类型、显著水平和统计方法,并注意统计学解释和研究的实际意义,在结果解释时保持谨慎,不要过度解释结果。
数据分析报告中的假设检验与结果解读方法
数据分析报告中的假设检验与结果解读方法在当今数据驱动的时代,数据分析报告对于企业和组织的决策制定起着至关重要的作用。
而假设检验作为数据分析中的重要方法之一,能够帮助我们判断数据中的关系是否具有统计学意义,从而为决策提供有力的支持。
同时,正确解读假设检验的结果也是至关重要的,否则可能会得出错误的结论,导致决策失误。
接下来,让我们深入探讨一下数据分析报告中的假设检验与结果解读方法。
一、假设检验的基本概念假设检验是一种基于样本数据来推断总体特征的统计方法。
它的基本思想是先对总体的特征提出一个假设,然后通过样本数据来验证这个假设是否成立。
在假设检验中,我们通常会提出两种假设:原假设(H₀)和备择假设(H₁)。
原假设是我们想要推翻的假设,通常表示没有差异或没有关系;备择假设则是我们希望证明的假设,表示存在差异或关系。
例如,我们想要检验一种新的营销策略是否能提高销售额。
原假设可能是“新的营销策略不会提高销售额”,备择假设则是“新的营销策略会提高销售额”。
二、假设检验的步骤1、提出假设明确原假设和备择假设。
这需要根据研究问题和实际情况来确定。
2、选择检验统计量根据数据的类型和分布,选择合适的检验统计量。
常见的检验统计量包括 t 统计量、z 统计量等。
3、确定显著性水平显著性水平(α)是我们预先设定的用来判断拒绝原假设的阈值。
通常,α的值取 005 或 001。
4、计算检验统计量的值根据样本数据计算所选检验统计量的值。
5、得出结论将计算得到的检验统计量的值与临界值进行比较。
如果检验统计量的值落在拒绝域内,我们就拒绝原假设,接受备择假设;否则,我们就不能拒绝原假设。
三、常见的假设检验方法1、单样本 t 检验用于检验一个样本的均值是否与某个已知的总体均值存在显著差异。
2、独立样本 t 检验用于比较两个独立样本的均值是否存在显著差异。
3、配对样本 t 检验用于比较配对样本之间的均值差异。
4、方差分析(ANOVA)用于比较多个总体的均值是否存在显著差异。
参数估计与假设检验:原理、方法与误区
参数估计与假设检验:原理、方法与误区作者:李奇明徐德义来源:《大学教育》 2018年第2期[摘要]作为统计分析的基础,参数估计和假设检验的原理与方法是教学难点所在,常常引起教与学的过程中诸多误解、误用和误读。
在对参数估计和假设检验的原理与方法加以阐释基础上,采用比较研究的方法,可以找出教学中可能存在的误区。
参数估计和假设检验具有许多共同点,二者之间存在紧密联系。
一般情况下,区间估计与假设检验之间具有对应性;可以利用置信区间进行假设检验,也可以利用假设检验进行区间估计;但不能把参数估计与假设检验等同起来。
[关键词]参数估计;置信区间;假设检验;原理;方法;误区[中图分类号]C8 [文献标识码] A [文章编号]2095-3437(2018)02-0040-03参数估计和假设检验是统计学专业的基础知识,是统计学课程教学的重点内容。
然而,由于对基本思想和原理的认识不到位,常常导致对一些知识点存在误解,进而造成错误的应用,甚至得出错误的结论。
本文将从参数估计与假设检验的原理谈起,重点就这两类方法应用中的一些误区展开讨论,为相关课程的教学提供参考。
一、参数估计与假设检验的内涵参数估计与假设检验是推断统计的重要内容。
[1]其中参数估计是利用样本统计量的信息推断未知的总体参数,包括点估计和区间估计。
因点估计不能提供可信程度的信息,我们更多使用的是区间估计。
而假设检验是先对总体的参数做出某种假设,为判断所作的假设是否正确,从总体中抽取样本判断假设是否成立的过程。
[2](一)正确理解置信水平的含义在区间估计时,我们可以根据样本信息求出总体未知参数的置信区间,并保证总体参数的真值将有一定的机会落在所计算的区间内。
比如置信水平为95%,即意味着总体参数的真值将有95%的机会落在该区间内。
当然,对置信水平含义的这一解释常常会被误解为“有95%的把握保证”参数的真值会落在这个区间里。
显然,计算某人对某一件事的把握程度,与计算一个置信区间完全是两回事,不应该“从一个结论的角度看待置信区间”,而应该“将其视为一个过程” 。
假设检验应注意的若干问题1(论文)
上饶师范学院本科毕业论文论文题目:假设检验应注意的若干问题系别:数学与计算机科学学院专业:数学与应用数学班级:09 级(3)班学号:09010302学生姓名:陈福英指导教师姓名:徐健上饶师范学院教务处2013年4 月假设检验应注意的若干问题摘要:了解理清假设检验中注意的问题对解决关于假设检验的数学问题和实际问题很有帮助。
假设检验的基本思想,基本概念以及它的相关步骤都是学习假设检验的重要内容。
两类错误的分析,假设的确立,检验统计量的选择,假设检验与置信区间的联系都是需要注意的问题。
关键词:假设检验;原假设;两类错误Some problems that have to pay attention in hypothesis testing Abstract:Get to know the problem in Hypothesis testing problem is help for solving math problem or reality problem.Its basic thought ,basic conceptions and steps are important contents of learning Hypothesis testing problem.Its tow kinds of errors,how to radicate hypothesis,how to choose the test statistic, the connections between hypothesis testing and confidence interval are all problems that have to be taken care.Key words:hypothesis testing ; null hypothesis; tow kinds of errors;目录1.预备知识 (1)1.1 假设检验问题 (1)1.2 假设检验基本思想 (1)1.3 参数假设检验问题 (1)1.4 两类错误的概念 (1)2.原假设的设立原则 (1)H的基本依据 (2)2.1建立原假设2.2 单边或双边检验的选择 (2)3.两类错误的分析 (3)3.1 犯两类错误概率(α和β)的关系 (3)3.2减少两类错误风险的途径 (4)4.检验统计量的选择 (5)5.假设检验与置信区间的关系 (6)致谢 (7)参考文献 (8)1.预备知识1.1 假设检验问题.假设检验是数理统计的基本知识,与参数估计构成数理统计的基本内容.对总体的分布或分布参数作某种假设,然后根据所得的样本,运用统计分析的方法来检验这一假设是否正确,从而作出接受或拒绝的决定,这就是假设检验问题.]1[学习和应用假设检验时,需要注意假设检验的基本思想,基本概念,基本步骤. 1.2 假设检验基本思想.假设检验依据小概率原理(或实际推断原理),即“概率很小的事件在一次试验中几乎不发生”.如果概率很小的事件在一次试验中发生了,有理由怀疑假设的正确性.]2[原理和数学逻辑证明中的反证法类似,如果命题是错误的,只需要一个反例就可以推翻它.1.3 参数假设检验问题.可以用一个参数(如正态总体的均值,方差)的集合表示的假设,称为参数假设检验问题.否则如对假设“总体为正态分布”作出的检验问题就是一个非参数假设检验,非参数假设检验有分布拟合检验,秩和检验等.1.4 两类错误及概念.在假设检验中,由于样本信息的局限性,势必会产生错误.在统计学中,当原假设0H 为真但由于随机性使样本观测值落在拒绝域中,从而拒绝原假设0H ,这种错误称为第一类错误,也称“拒真错误”,通常称犯这个错误的概率叫拒真概率,记为α,即α=P (拒绝0H |0H 为真)=()W X P ∈θ,∈θ0Θ.第二类错误是指备择假设1H 为真,但随机样本观测值落入接受域中,从而接受原假设0H ,其发生的概率称为受伪概率,记为β,即β=P (接受0H |1H 为真)=()W X P ∈θ,∈θ1Θ.]3[2.原假设的设立原则.假设检验问题,顾名思义,包括两大方面,即“假设”和“检验”,其具体的步骤分为四步:Ⅰ.根据给定问题,提出原假设0H 和备择假设;Ⅱ.由假设构造检验统计量,并在0H 为真的条件下得出统计量的分布;Ⅲ.给定显著性水平α,按P{拒绝0H |0H 为真}=α,求出拒绝域W ;Ⅳ.根据样本观测值作出决策,若(n x x x ⋯,,21)W ∈,拒绝0H ,若(n x x x ⋯,,21)W ∉,接受0H .假设检验首先要考虑的是如何设立假设.2.1建立原假设0H 的基本依据.解决假设检验问题的第一步就是建立假设,正确地确定原假设与备择假设.对检验结果的正确与否起到很大的作用.因此正确建立假设是解决问题的关键.在解决假设检验问题时, 在假设检验中原假设和备则假设地位是不平等的,原假设是受到保护的.明确说就是,如果没有充分的证据来否定原假设,就要接受它.根据实践经验建立原假设0H 的依据有:1、依据经验事实,历史资料,设计需要设立0H .2、专业知识等初步可以认可的结论定为原假设,或者把相等、符合性质的结论作为原假设.3、对有待观察的新事物,一般不宜作为原假设0H .例1.一种零件的生产标准是直径应为10cm ,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求.如果零件的平均直径大于或小于10cm ,则表明生产过程不正常,必须进行调整.试陈述用来检验生产过程是否正常的原假设和被择假设.分析:研究者想收集证据予以证明的假设应该是“生产过程不正常”.建立的原假设和备择假设为H 0 : =μ10cm vs H 1 :=μ10cm例2.某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克.从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实.试陈述用于检验的原假设与备择假设.分析:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述.建立的原假设和备择假设为H 0:≤μ 500 H 1 : >μ 5002.2单边或双边检验的选择.双侧检验问题. 当备择假设1H 分散在原假设0H 两侧时称为双侧检验,如果检验的目的是检验抽样的样本统计量与假设参数的差数是否过大(无论是正方向还是负方向),就把风险平分在右侧和左侧,这就是用双侧检验.如0H :0θθ= vs 1H :0θθ≠单侧检验问题.当备择假设1H 在原假0H 的一侧时称为单侧检验..如0H :0θθ≤ vs 1H :θ>0θ单侧检验方向的选择可以依据信息原则.就是将一个不以本次检验为改变的一个先验的信息作为选择方向的基础.先验信息有两种:一种是自然的先验信息,我们都认为先验信息是正确,普遍成立的,因此将其作为代表的情况放入原假设.另一种是样本的统计量提供的先验信息,它表明了样本支持和反对的结论,若样本反对的结论出现在备择中,则备择假设必然不会成立,检验不必进行.若样本支持的结论出现在备择假设中,则备择假设成立与否依赖于选取的显著性水平.]4[在单侧检验中,一般将研究者想收集证据予以支持的假设作为备择假设1H ,将研究者想收集证据证明其不正确的假设作为原假设0H .例 3.一项研究表明,采用新技术生产后,会使产品的使用寿命明显延长到1500小时以上,检验这种结论成立,按照前面的理论,研究者想要证明结论是正确的(寿命延长),于是备择假设的方向为“>”,即建立假设0H :≤μ vs 1H :1500>μ 在作假设检验时,应事先根据专业知识和问题的要求在设计时确定采用单侧还是双侧检验.不能在计算检验统计量后才主观确定.对同一资料检验时,有可能双侧检验无统计意义,而单侧有统计意义.因此,当我们报告结论时,应列出所采用的是单侧还是双侧检验、检验方法、检验水准和P 值的确切范围,然后结合专业作出专业结论.3.两类错误的分析.3.1 犯两类错误概率(α和β)的关系.犯两类错误概率可以用一个函数表示,即势函数.定义3.1.1 ]3[设检验问题0H :0Θ∈θ vs 11Θ∈H的拒绝域为W ,则观测值X 落在拒绝域W 内的概率称为该检验的势函数.10),()(ΘΘ∈∈= θθθW X P g势函数是)(θg 是定义在参数空间0Θ上的一个函数,由上述α和β的概念知,当0Θ∈θ时,)()(θααθ==g ,当1Θ∈θ时,)(1)(θββθ=-=g .也就是,犯两类错误的概率都是参数θ的函数,并可由势函数得到,即:⎩⎨⎧Θ∈-Θ∈=.),(1),()(1,0θθβθθαθg我们用一个实例,通过势函数)(θg 来考查两类错误概率之间的关系.例1,某厂生产的合金强度服从正态分布N(θ,16),其中θ的设计值为不低于110(Pa ).为保证质量,该厂每天都要对生产情况做例行检查,以判断生产是否正常进行,即该合金的平均强度不低于110(Pa ).某天从生产中随机抽取25块合金,测得强度值为,21,x x …,25x ,其均值为x =108(Pa ),问当日生产是否正常.分析:原假设0H :0Θ∈θ={110:≥θθ} 和备择假设11Θ∈H ={110<θ} ,拒绝域为W={c x ≤},则可算出该检验的势函数)5/4()5/45/4()()(θθθθθθ-Φ=-≤-=≤=c c x P c x P g , 利用这个势函数,可以写出两类错误的概率分别为 0),5/4()(Θ∈-Φ=θθθαc , 1),5/4(1)(Θ∈-Φ-=θθθβc . 从上述例子看出,在样本量给定的条件下,α与β中一个减小会导致另一个增加.也就是,在一定条件下,α与β不能同时增加或减小.3.2 减少两类错误风险的途径.犯拒真错误可能的原因是样本中极端数值或采用决策标准比较宽松.而犯受伪错误的原因是试验设计不灵敏,样本数据变异性过大,或者处理效应本身比较小.犯第一类错误的风险较大,由于报告了本来不存在的现象,则因此现象而衍生出的后续研究、应用是不可估量的.相对而言,第二类错误的风险相对较小,因为研究者如果对自己的假设很有信心,可能会重新设计检验,再次来过,直到得到自己满意的结果.降低风险的方法有:首先控制犯第一类错误的概率,控制犯第一类错误的概率α的条件下,尽量使犯第二类错误的概率β小,因为根据反证法思想,拒绝0H 比错误地接受0H 更重要,这类方法即我们常用的显著性检验.其次增加样本容量n ,来减少犯第二类错误的概率.增加样本容量可以减少数据选取的偶然性,减轻极端数据对结果的影响.但是一味地增加样本容量会使计算更复杂,计算量大,所以这种方法有利也有弊.应该根据以上说犯两类错误产生的原因注意选择恰当的数值,试验设计严密等.在进行假设检验时,我们希望α与β尽量小,通俗地讲希望买卖双方的风险都要小,这是不可能实现的,否则会导致样本容量n 的无限增大,这又是不实际的.因此,英国统计学家Neyman 和Pearson 提出水平为α的显著性检验.即控制犯第一类错误的概率的条件下,尽量使犯第二类错误的概率β小,也就是通常说的只考虑卖方风险,因为很据反证法思想,拒绝原假0H 设比错误地接受0H 更重要,这就是常用的显著性检验.常用α的可以0.05,0.01或0.1.]4[4.检验统计量的选择.影响检验统计量的选择因素有:① 未知参数的特征;② 统计量的抽样分布例如:要求一种元件平均使用寿命不得低于1000小时,生产者从一批这种元件中随机地抽取25件,测得其寿命的平均值为950小时,已知该元件寿命从标准差=σ100小时的正态分布,试在显著性水平=σ0.05下确定这批元件是否合格.分析:这是均值μ的检验,σ已知,采用u 检验,检验统计量为n X u /1001000-=,在0H 成立时,)1,0(~N u .而如果上述问题方差未知时,则采用t 检验.又如:某类钢板每块的重量X 服从正态分布,其一项质量指标是钢板重量的方差不得超过20σ=0.016kg 2.现从某天生产的钢板中抽取n =25块,得其样本方差2s =0.025kg 2,问该天生产的钢板重量的方差是否满足要求.分析:这是正态总体方差的单侧检验问题.应采用2χ检验,检验统计量为 2χ=202)1(σs n -.因此,不同的参数检验,不同抽样分布的检验统计量也不同.下面以一个具体例子来阐述假设检验问题的具体步骤:例4. 已知炼铁厂铁水含碳量服从正态分布N (4.55,0.1082)现在测定了9炉铁水,其平均含碳量为4.484,如果铁水含碳量的方差没有变化,可认为现在生产的铁水仍为4.55(α=0.05)?分析:这是一个典型的假设检验问题.要检验铁水含碳量是否仍为4.55,根据55.4=μ是历史资料提供的信息,放在原假设即建立假设0H :55.4=μ vs 1H : 55.4≠μ, 这个假设符合上述设立原假设原则,由于方差没有变化,即为已知,统计量n x u /0σμ-=,检验的拒绝域为W={|u|≥u 21α-},因05.0=α,查表得u 21α-=u 975.0=1.96,484.4=x ,μ0=4.55,108.0=σ,n=9,算得u=9/108.055.4484.4-≈-1.83,所以|u|=1.83<1.96,最后作出结论,观测值未落入拒绝域内,故接受原假设,即可以认为现在生产的铁水含碳量仍为4.55.5. 假设检验与置信区间的关系.双侧检验与双侧置信区间的关系.假设检验与区间估计在解决问题的途径上非常相似.θ的置信水平为α-1的置信区间为(θ(n x x x ⋯,,21),θ(n x x x ⋯,,21)),双侧检验 0H :θθ=0,1H :θθ≠0的接受域为 θ(n x x x ⋯,,21)≤θ0≤θ(n x x x ⋯,,21)单侧检验与单侧置信区间的关系. 单侧置信区间与显著性水平为α的左侧检验问题,0H :θθ≥0,1H :θθ<0的关系,单侧置信区间为(-∞,θ),接受域为(-∞,θ).单侧置信区间与显著性水平为α的右侧检验问题,H0:θθ≤0,1H :θθ>0的关系,单侧置信区间为(θ,+∞),接受域为(θ,+∞).]5[求置信区间的枢轴量与假设检验的统计量的形式非常相似,学习置信区间是学习假设检验的一个很好的知识准备.但是,假设检验与置信是从不同角度回答同一个问题,假设检验的接受域就是区间估计的置信区间,前者是回答接受0H 还是拒绝0H 的定性问题,而后者是回答参数的范围问题.本文归纳了假设检验中应注意的四个问题,一是两类错误的概率分析,二是原假设的建立原则,三是假设统计量的选取问题,四是假设检验与置信区间的联系.由于自身知识有限,对问题的分析谈的比较肤浅,没有涉及非参数性检验等深度问题.引用例题不够丰富多样.致谢本篇论文撰写时经一个多月,在这段时间里,徐健老师耐心地给了很多指导和建议。
单尾假设检验假设设置的探讨_陈秀虎
统计教育2007年第2期摘要:根据多年的工作经验,本文对在单尾假设检验中,假设设置问题提出了自己的三步解决法:即使用双尾假设的方法进行设置,根据检验问题的重要性选取α值,分步推断统计结果。
在实际操作上具有一定的意义,供同仁们参考。
关键词:假设检验;单尾检验;假设设置假设检验是生物统计学中的核心问题之一,统计假设检验的基本方法和步骤可归纳为如下四步:第一,提出假设;第二,确定显著水平;第三,计算概率值;第四,推断H0的正误。
提出假设是假设检验的第一步,也是最为关键的一步,特别是在单尾检验中,如果这一步发生了偏差,最后的推断就会出现与事实完全相反的错误。
怎样科学设置假设是实际工作中的一个重点和难点问题。
笔者试从双尾检验和检验的基本原理入手来分析这个问题。
一、检验假设的基本原理和二类错误参数检验的基本原理是小概率原理,即:如果一个事件发生的概率很小,那么,它在仅有的一次试验中是不可能发生的,并且这一发生的事件应是我们期望的结果。
根据这一原理,针对总体中抽取样本的信息,在一定的显著水平α的情况下,通过设置适当的假设条件(H0与HA)后,通过计算概率值,我们便可以对总体的参数进行检验。
由于样本的取得是随机的,因此,α不可能为0,这样我们就会存在犯两类错误的可能。
即:第I类错误:原假设H0为真,在检验过程中被拒绝,即弃真错误;第II类错误:备择假设HA正确,在检验过程中却舍弃HA而选择了原假设,即取伪错误。
如果把犯两类错误的概率规定为α和β,根据数理理论,我们可以得到α与β的一般关系:当α增加时,β减小;反之,当α减小时,将导致β的增加。
也就是说,我们在有限的抽样样本中根本无法找到一个能使α与β同时减小的理想方法。
为了摆脱假设检验中这一尴尬的局面,我们在实际工作中只对犯第I类错误的概率α加以限制,而不考虑犯第II类错误的概率。
特别是在单尾假设检验中,我们对两种假设的设置显得尤为重要。
二、单尾检验假设设置存在的问题单尾检验主要存着两个问题,其一是单尾检验的假设设置与双尾检验的假设设置相比显得较复杂;其二是结果推断也比较麻烦。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
有所下降?当然, 在不很严格的要求下, 大于 "#$% ,进入拒绝域,这也是不可信
要 对 此 情 况 做 出 合 乎 逻 辑 的 解 决 , 时的置信水平 "!! 未知。
+4
统计与决策
DOI:10.13546/ki.tjyjc.2004.11.015
!"#"$
理论新探 56578*689:8
( 总 第 $%& 期 ) !""# 年 第 $$ 期
对
参 数 单 尾 假 设 检 验 中 存 在 种常 见方法,也是实际工作中被广泛使用的一种判 断技术。其数理原理与参数的区间估计完全相 同, 只是由于两种方法的推断思路的不同, 造成 了在具体操作上的一些差别。 构造一个包含待推断参数的样本统计量,然后 利用数理统计的已有结论,判定该统计量的数 理分布状态。由此知道该统计量取任意具体数 (区间估计中, 值的概率。更进一步, 在给定的 ! 该值称为显著性水平; 在假设检验中, 该值则表 示犯弃真错误的概率) 值下, 结合该次具体抽样 的样本数据, 推断待判断参数的取值情况。 通过一个简单的例题,说明参数的假设检 验的判断思路: 某电池厂生产电池,根据历史资料统计结 标 果,该厂产品的平均发光时间为 !""" 小时, 准差为 #" 小时。现从新批量的产品中, 随机抽 取 !"" 个电池作实验,得到样本平均发光时间 为 $%&&" 。给定显著性水平为 "’"( , 判断新批量 电池的平均耐用时间与通常的相比,是否有显 著差异。 设定原假设 )": *%!""" 小时 设定备择假设 )!: *!!""" 小时 根据题意, 构建样本统计量: +%
( 总 第 $%& 期 ) !""# 年 第 $$ 期
也就是说, 在上例的第一种假设下, 的取值与临界值的大小关系比较。严格 (!&, 考察上例, 我们会发现假设检验中, 做数 正确的临界值 应 该 是 !"#$% 绝 域 为 , 因此其结论应为接受原假设 (准 !"#$% ) 确的说法是凭此样本不能拒绝原假设) , 即不能认为电池质量没有显著提高。而 拒 在 相 反 的 假 设 下 , 临 界 值 应 为 ’"#$% , , 结论也为接受原假设 绝域为 ("#$% , ’&) (准 确 的 说 法 仍 为 凭 此 样 本 不 能 拒 绝 原 假设) , 即不能认为电池质量没有显著下 降。 因此可见, 在此例中, 即使根据逻辑 关系准确定义拒绝域,由于样本表现的 特殊性, 无论如何设定原假设, 其结论也 都是接受原假设,对于该结论的可信程 都缺乏度量。但即使不考虑结论 度 "!! , 的可信度问题,两种假设实际上也都没 能真正回答提出的问题:电池质量是否 也可以认为两种结论都在一定程度上回 答了提出的问题:不能认为发光时间没 有提高, 也不能认为发光时间没有下降。 要注意的是, 这种回答, 并不是假设 检验方法本身的失效,因为在此特殊例 子, 具体该次样本数据的特殊性, 是造成 这种结果的根本原因。但在参数的单尾 检验中, 真正存在的问题是, 什么才是决 定原假设设定的依据。 在上例中, 哪种假 设在科学上更严谨呢? 笔者认为,与尽可能选择可以被拒 绝的原假设这一原则相比,更重要的是 在检验过程中, 逻辑关系的顺畅问题。 在 据判断时出现的一个误区。 上 例 中 , 当 以 ) !"*** 为 原 假 设 与之 时, 我 们 计 算 得 到 的 ( 值 为 !"#+, , 比 较 的 临 界 值 为 !"#$% , 拒绝域为 (!&, ! , 不考虑第二类错误问题, 能够得 "#$% ) 出得结论是接受原假设。但稍加留意就 会发现, 事实上做出这样一个判断, 在逻
且知该统计量服从标准正态分布。在给定 显 著 性 水 平 "’&( 的 情 况 下 , 查正态分布表可得
+ 值的临界值为 !’14 。 小 于 !’14 , 所以落在拒 由 于 + 值 为 ,!’/( ,
绝域内, 因此拒绝原假设, 这意 味 着 质 量 没 有 显 著提高。该判断结论错误的概率是 "’"( 。 而当我们对此问题做 完 全 相 反 的 原 假 设 的 时候, 由于一切数据和理论推断 都 没 有 变 化 , 所 以得到的结论仍然会是拒绝原假设。而此时, 该 结论意味着以同样的概率保 证 程 度 断 定 质 量 没 有显著降低。 但我们很清楚地意识 到 , 这 种 解 法 是 错 误 的。很明显, 其中涉及到了拒绝 域 位 置 的 问 题 。 这应该是个严谨的逻辑范畴的问题。显然, 按逻 辑关系判断,当考察的是待 推 断 参 数 是 否 高 于 参照数据时, 拒绝域应该放在数轴左侧。大于该 相反 , 如果 负临界值的一切 + 值都是可接受的; 考察的是待推断参数是否低于参照数据的问 题, 则应该把拒绝域放在数轴的 右 侧 , 低于该正 临界值的一切 + 值都是可接受的。其 中 的 原 因 不难理解: 当要求判断是否高于 参 照 数 据 时 , 样 的任意一点时,都说明待推断参数是以 !,! 的 概率高于参照数据的。而相反, 当需要判断的是 是否低于参照数据的时候, 则 样 本 统 计 量 取 值
辑上是行不通的。因为根据 原 假 设 )! 这种结论的科学依据。设想与该例完全 我们并不能得到 ( 值的准确数据, 相同的条件,但把问题改为考察总体参 "*** , 据 计 算 得 到 的 !"#+, , 仅 是 ( 值 的 上 限 , 此 判 断 其 取 值 必 然 大 于 !"#$% , 不能落入 拒绝域内, 这在逻辑上无疑是不可行的。 同 而 考 察 相 反 的 原 假 设 ) ""*** , 样会发现,计算得到的 !"#+, ,仅仅是 ( 值的下限, 同样, 据此认为 ( 值必然不能 的。 对此情况,数据的特殊性是无法解 释的。这是在任何参数的单尾假设检验 中, 都存在的问题。这种情况, 在某些具 体单尾检验中,不会造成逻辑判断上的 — 困难。但在本文所举的类似例子中—— 即样本统计量在该次抽样中的数据, 表 现为落在接受域内的情况时,都会造成 推断的两难局面。 只能是对原假设的含义做出更具体的解 释: 待推断参数等于设定参照数据, 而此 时要得出是否高于或低于的结论,则只 (作者单位 - 首都经贸大学统计系)
(责任编辑 - 李友平)
数是否有显著变化。 此时, 只要把显著性 水平 " 扩大一倍,就可以保证两者的临 界值点保持不变。 可以看到, 这个新问题 在数学计算上是完全等同于原问题的。 但对新问题的检验,是采用双尾方式进 行的。 在双尾检验中, 显然不会出现单尾 检验中的类似问题。而且这样的样本数 据表现, 在双尾检验中, 恰是落在接受域 内,这也意味着凭此样本不足以判断没 有显著差异。 可以看到, 两种检验在结论 上可以认为是一致的。因此,有理由认 为, 两者是等价的。 这样, 在传统单尾检验中, 当出现样 本统计量落在接受域内的情况时,更准 确的结论也许是认为凭此样本不足以进 行推断,但其原因并非在于接受原假设
!"#"$
理论新探 ./.01)/1231
落在该临界值到负无穷大上的任意一点 时, 都意味着待推断参数低于参照数据。 假设检验问题中,最终的判断依据是在 一次具体的样本实现中,样本统计量 ( 能根据具体样本统计量数据与参照数据 之间的位置关系决定, 但这种判断, 显然 已经超出假设检验的范畴,而更明显地 表现为一种感性经验判别了。 —即 样 个人认为,对于此类情 况—— 本统计量数据恰处于两个临界值之间时 的单尾检验,可以认为凭此样本不足以 —即 不 能 判 断 有 所 提 高 或 降 低 。 判 断—— 这种结论在实证分析上,是可以理解和 接受的。 转换一下思路, 对比本文提到的 双尾检验的例子,就可以很容易地发现
似乎并不存在选择的余地。因为 在数理上, 它们都是根据给定的数据条件, 原假设的问题,
$,* " - !.
$,* "- !.
% &&",!""" %,!’/( #" - !!""
且知该统计量服从标 准 正 态 分 布 。 在 给 定 查正态分布表可得 显著 性 水 平 "’3( 的 情 况 下 ,
% &&",!""" %,!’/( #" - !!""
的 探 讨
对 犯 取 伪 错 误 的 概 率 # , 本统计量的取值落在从该临 界 值 到 正 无 穷 大 上 犯 弃 真 错 误 的 概 率 !,
#
钟 路
则多不要求。 但对于统计认知而言, 单纯地给出 一个结论是没有意义的,我们还必须知道这样 一个结论正确或错误的概率是多少。出于这种
/;
统计与决策
原因, 我们总是在条件许可的情 况 下 , 尽可能把 原假设设定为可能被拒绝的 , 因 为 当 样 本 数 据 显示, 原假设应该被接受的时候 , 对这样一个结 论的可信程度 !,# 缺乏度量。 在双尾的假设检验中 , 对 于 把 什 么 设 定 为 我们几乎必须把待推断的参 数 设 定 为 等 于 参 照 物, 否则就没有任何可资利用的 信 息 , 支持做进 一步的推断。 但在单尾检验中的情 况 却 非 如 此 , 我 们 似 乎可以任意地把设定待推断 参 数 大 于 等 于 或 小 于等于参照数据作为原假设 。 因 为 无 论 如 何 设 定, 其数理推断逻辑都是一致的。区别仅在于被 拒绝或接受的是谁。按照上 文 中 提 到 的 两 类 错 误的标准,应该是把可以被 样 本 数 据 拒 绝 的 结 果设定为原假设,这样才能 保 证 最 终 结 论 的 科 学性。但照此方法, 有可能会陷入一种悖论。把 上例所问的问题稍做变换, 即 可 发 现 其 中 的 不 合情理之处:即判断新批量 电 池 的 平 均 耐 用 时 间与通常的相比, 是否有显著降低。 设定原假设 )": *"!""" 小时 设定备择假设 )!: *2!""" 小时 根据题意, 构建样本统计量: +%