单侧检验的原假设问题.
如何正确选用单侧检验与双侧检验
如何正确选用单侧检验与双侧检验单侧检验与双侧检验是统计学中常用的两种假设检验方法。
在进行假设检验时,我们需要选择适当的检验方法以得出准确的结论。
以下是如何正确选用单侧检验与双侧检验的一些步骤和考虑因素。
首先,了解单侧检验和双侧检验的定义和假设。
在单侧检验中,我们只关心样本数据是否支持我们的研究假设中的一种方向。
因此,在进行单侧检验时,我们只检查一种特定的假设。
另一方面,在双侧检验中,我们对样本数据支持研究假设的两种方向感兴趣。
因此,我们会检查两种特定的假设。
其次,确定研究假设。
在进行单侧检验或双侧检验之前,我们需要明确自己的研究假设。
研究假设通常有两种形式:一种是有方向的假设,例如“治疗A的效果优于治疗B”或“产品X的质量超过标准”,这时我们可以选择单侧检验;另一种是无方向的假设,例如“治疗A和治疗B的效果相同”或“产品X的质量符合标准”,这时我们通常会选择双侧检验。
然后,选择合适的检验统计量。
在进行单侧检验或双侧检验时,我们需要选择一个适当的检验统计量来计算样本数据的观察值。
选择合适的检验统计量取决于研究问题和数据类型。
例如,对于比例数据,可以使用z 检验或χ²检验;对于均值数据,可以使用t检验或F检验。
接下来,设置显著性水平α。
显著性水平是进行假设检验时的一个重要参数,它代表了我们错误地拒绝原假设的风险。
常见的α水平为0.05或0.01、选择适当的α水平需要考虑研究领域的特点、样本容量以及研究目的等因素。
较小的显著性水平意味着我们更加保守,拒绝原假设的标准更高。
然后,计算p值。
p值是进行假设检验时的另一个重要指标,它代表了我们观察到的数据结果发生的概率。
在进行假设检验时,我们通常将p 值与显著性水平比较,如果p值小于显著性水平,则我们有足够的证据拒绝原假设。
最后,根据研究目的和数据特征选择单侧检验或双侧检验。
单侧检验适用于我们只关心一些方向的做法,并且对另一种方向的结果不感兴趣的情况。
假设检验例题和习题
超过1cm3。如果达到设计要求 -0.6 0.7 -1.5 -0.2 -1.9
,表明机器的稳定性非常好。 -0.5 1 -0.2 -0.6 1.1
现从该机器装完的产品中随机
抽取25瓶,分别进行测定(用样
本减1000cm3),得到如下结果
。检验该机器的性能是否达到
设计要求 (=0.05)
8 - 30
双侧检验
备择假设的方向为“<”(废品率降低) 建立的原假设与备择假设应为
H0: 2% H1: < 2%
8 -7
统计学
(第二版)
单侧检验
(原假设与备择假设的确定)
某灯泡制造商声称,该企业所生产的灯泡 的平均使用寿命在1000小时以上。如果 你准备进一批货,怎样进行检验
▪ 检验权在销售商一方
▪ 作为销售商,你总是想收集证据证明生产商 的说法(寿命在1000小时以上)是不是正确的
决策:
在 = 0.05的水平上拒绝H0
结论:
有证据表明新机床加工的零件 的椭圆度与以前有显著差异
统计学
(第二版)
2 已知均值的检验
(P 值的计算与应用)
第1步:进入Excel表格界面,选择“插入”下拉菜 单
第2步:选择“函数”点击
第3步:在函数分类中点击“统计”,在函数名的 菜
单下选择字符“NORMSDIST”然后确定
?( = 0.05)
统计学
(第二版)
均值的单尾 t 检验
(计算结果)
H0: 40000 H1: < 40000 = 0.05 df = 20 - 1 = 19 临界值(s):
拒绝域
.05
-1.7291 0
t
8 - 23
r语言中进行方差的单侧假设检验
R语言是一种广泛应用于数据分析和统计学的编程语言,在进行数据分析和统计建模时,常常需要进行假设检验来验证研究假设的有效性。
其中,方差的假设检验是一种常见的检验方法之一。
在R语言中,进行方差的单侧假设检验需要遵循一定的步骤和方法。
本文将通过以下内容来介绍在R语言中进行方差的单侧假设检验的具体步骤和方法:1. 确定研究问题在进行方差的单侧假设检验之前,首先需要确定要研究的问题,明确研究的目的和假设。
我们要检验一个新药物的剂量对患者的治疗效果是否有显著影响,那么我们的研究问题可以是:新药物的高剂量组的治疗效果是否显著高于低剂量组。
2. 收集数据确定了研究问题之后,接下来需要收集相关数据。
在R语言中,可以使用各种方式来导入数据,例如读取Excel文件、CSV文件或直接生成模拟数据。
假设我们已经获取了患者的治疗效果数据,数据包括治疗组别(高剂量组/低剂量组)和治疗效果的观测值。
3. 数据清洗与探索在进行假设检验之前,需要对数据进行清洗和探索性分析。
数据清洗可以包括缺失值处理、异常值处理等。
而探索性分析则可以通过绘制直方图、箱线图、散点图等方式来对数据的分布和特征进行初步了解。
4. 构建假设在进行方差的单侧假设检验时,需要构建原假设和备择假设。
对于我们的研究问题,原假设可以是“新药物的高剂量组的治疗效果不显著高于低剂量组”,备择假设可以是“新药物的高剂量组的治疗效果显著高于低剂量组”。
5. 进行假设检验在R语言中,进行方差的单侧假设检验可以使用t检验或方差分析(ANOVA)等方法。
以方差分析为例,可以使用`aov`函数来构建方差分析模型,然后使用`summary`函数来查看方差分析的结果。
在结果中,关注组别之间的方差比较,判断高剂量组和低剂量组的治疗效果是否存在显著差异。
6. 结果解释根据假设检验的结果,在R语言中可以通过输出结果的p值或显著性水平来判断原假设的成立与否。
如果p值小于显著性水平,就可以拒绝原假设,接受备择假设,认为高剂量组和低剂量组的治疗效果存在显著差异。
单侧假设检验
以能否认为这批导线的标准差显著地偏大?
解:假设: H0 : 0.005 H1 : 0.005
由
2分布表查得临界值
2 0.05
8
15.507
又
2
8 0.007 2 0.005 2
15.68
15.507
拒绝H0,即认为这批导线的标准差显著地偏大。
例7 按规定,每100g的罐头,番茄汁中VC的含量
又 f s12 3.325 1.49 s22 2.225
因为 0.248<1.49<4.03。故应接受H0,即认为两种方 法的方差无显著差异,可以认为相等,亦即σ12=σ22
其次在σ12=σ22 的前提下,检验假设:
H 0
:1≥
,
2
H1:
<
1
。
2
由于两总体方差相等,因此可选择检验统计量
T X Y
因此,在实际应用中,除了上述的双侧假设检 验之外,还有许多其它形式的假设检验问题:
(3)原假设H0:≥0(或≤0), 备择假设H1:<0(或>0)。其中为总体X的
未知参数,0为一常数; (4)原假设H0:1≥2(或1≤2), 备择假设H1:1<2(或1>2)。其中1,2为
相互独立的总体X与Y的未知参数。 (3)(4)两种统计假设,常称之为单侧假设,相应的
由于方差2未知,故采用t—检验法。由样本值得,
x
1
265 C ,
s2
1 3
4 i 1
一、单侧假设检验的概念
以上介绍的假设检验,归纳起来为下面两种形式: (1)原假设H0:=0,备择假设H1:≠0,其中0
为某一常数; (2)原假设H0: 1=2,备择假设H1: 1≠2,其中
1,2分别为两相互独立的总体X与Y的参数。
统计假设检验中原假设H0和备择假设H1的探讨
统计假设检验中原假设H0和备择假设H1的探讨作者:孙艳来源:《教育教学论坛》2013年第52期摘要:本文通过对假设检验的原理的分析,说明了假设检验的方法是在一定情况下,否定原假设,而不能肯定原假设,举例说明了交换原假设与备择假设,产生相反结果的原因,并指出了设定原假设与备择假设的合理方法。
关键词:假设检验;原假设;备择假设;小概率事件中图分类号:G642 文献标志码:A 文章编号:1674-9324(2013)52-0093-02在统计学教学实践中,参数的假设检验占有独特、重要的地位。
在教学中,笔者发现大多数学生及统计工作者甚至个别青年教师假设检验的原理理解不到位,突出表现在对原假设与备择假设的设定上觉得无从下手,掌握不好,有时在判断结论上会出现截然相反的结论,这种情况的发生,使得在教学过程中引起混淆,甚至怀疑假设检验本身的正确性。
基于此,本人谈几点看法。
一、假设检验的基本思想及基本原理假设检验是事先对总体参数或分布形式作出某种假设,随后由所抽取的样本构成检验统计量,根据统计中的小概率原理,即“小概率事件在一次试验中几乎不可能发生的”。
依据样本信息,对于提出的假设作出判断:是接受,还是拒绝,这种基本思想是带有概率性质的“反证法”。
为了判断一个“结论”是否成立,先假设该“结论”成立,称此“结论”成立为原假设,记为H0,与之对立的“结论”,称为备择假设,记为H1,在原假设H0成立的前提下运用统计分析的方法进行推导和计算,如果得到一个不合理(小概率事件在一次试验中发生了)的现象,就有理由怀疑原假设H0的正确性,从而拒绝原假设H0。
反之,若没有出现上述这种不合理现象的发生,就没有理由拒绝原假设H0,即可以接受原假设H0。
由于样本的随机性,无论是拒绝H0,还是接受H0,我们都无法保证假设检验的结果绝对或者是完全的正确,也可能会出现错误判断,从而导致犯两类错误。
第Ⅰ类错误一般叫做“弃真”错误:如果原假设H0为真时,错误地拒绝了H0,那么就犯了弃真错误,记为P{拒绝H0|H0为真}=α,α为显著性水平。
简述单双侧检验及应用场景
简述单双侧检验及应用场景单侧检验和双侧检验是统计学中经常使用的两种假设检验方法。
通过对统计样本进行分析,可以对某种特定的假设进行推断或验证。
1. 单侧检验单侧检验也被称为单边检验或单肢检验,是一种用来检验假设参数是否大于或小于某个特定值的方法。
在单侧检验中,研究者明确指定一个检验方向,只关注假设参数大于或小于某个特定值的情况。
单侧检验通常适用于研究者有明确的预期和研究目的的情况下。
比如,一个医药公司研发了一种新药物,他们希望证明这种药物的效果比目前市面上的药物效果更好。
在这种情况下,研究者会使用单侧检验来检验新药物的效果是否显著优于已有的药物。
单侧检验通常需要指定一个拒绝域(critical region),当样本观察值落在这个拒绝域内时,可以拒绝原假设。
2. 双侧检验双侧检验也被称为双边检验或双肢检验,是一种用来检验假设参数是否不等于某个特定值的方法。
在双侧检验中,研究者关注的是假设参数与特定值之间是否存在显著差异。
与单侧检验相对应,双侧检验不关注具体的方向,只关注差异的存在与否。
比如,一个制造商生产了一种新型的电池,并声称这种电池的寿命与传统的电池相等。
为验证这个假设,研究者可以使用双侧检验来检验这种电池的寿命是否与传统电池存在显著差异。
双侧检验通常需要指定一个拒绝域,并将其分配到两个尾部,当样本观察值分别落在这两个尾部时,可以拒绝原假设。
单侧检验和双侧检验各有其应用场景和优缺点。
选择合适的检验方法取决于研究者的研究目的和假设。
单侧检验的应用场景:1. 针对一种新产品或新技术,研究者希望证明其优于已有产品或技术。
例如,一个手机制造商开发了一种新型摄像头,他们希望证明这种摄像头的像素数目比市场上其他手机的摄像头多。
2. 研究者想要证明某种治疗方法比标准治疗法更有效。
例如,一项药物研发公司开发了一种新药物,他们希望证明这种新药物的疗效比市场上已有的类似药物更好。
双侧检验的应用场景:1. 比较两个群体之间的差异,而不限制在某个特定方向上。
贾俊平统计学第7版第八章例题课后习题
第8章假设检验例题由统计资料得知,1989 年某地新生儿的平均体重为3190克,现从1990年的新生儿中国机抽取100个,测得其平均体重为3210克,问1990年的新生儿与1989年相比,体重有无显着差异★解:从调查结果看,1990 年新生儿的平均体重为3210克,比1989年新生儿的平均体重3190克增加了20克,但这20克的差异可能源于不同的情况。
_种情况是,1990 年新生儿的体重与1989年相比没有什么差别,20克的差异是由于抽样的随机性造成的;另一种情况是,抽样的随机性不可能造成20克这样大的差异,1990年新生儿的体重与1989年新生儿的体重相比确实有所增加。
上述问题的关键点是,20克的差异说明了什么这个差异能不能用抽样的随机性来解释为了回答这个问题,我们可以采取假设的方法。
假设1989年和1990年新生儿的体重没有显着差异,如果用μo表示1989年新生儿的平均体重,μ表示1990年新生儿的平均体重,我们的假设可以表示为μ=μ或μ心=0,现要利用1990年新生儿体重的样本信息检验上述假设是否成立。
如果成立,说明这两年新生儿的体重没有显着差异;如果不成立,说明1990年新生儿的体重有了明显增加。
在这里,问题是以假设的形式提出的,问题的解决方案是检验提出的假设是否成立。
所以假设检验的实质是检验我们关心的参数一1990 年的新生儿总体平均体重是否等于某个我们感兴趣的数值。
例某批发商欲从厂家购进一批灯泡,根据合同规定灯泡的使用寿命平均不能低于1 000小时,已知灯泡燃烧寿命服从正态分布,标准差为200小时。
在总体中随机抽取了100个灯泡,得知样本均值为960小时,批发商是否应该购买这批灯泡★解:这是一个单侧检验问题。
显然,如果灯泡的燃烧寿命超过了1 000小时,批发商是欢迎的,因为他用已定的价格(灯泡寿命为1 000小时的价格)购进了更高质量的产品。
因此,如果样本均值超过1000小时,他会购进这批灯泡。
拒绝域公式深入了解拒绝域的数学公式
拒绝域公式深入了解拒绝域的数学公式拒绝域是统计假设检验中的一个重要概念,它用于决定在给定显著性水平下,是否拒绝原假设。
在进行假设检验时,通过计算统计量的取值是否落在拒绝域内,来确定是否拒绝原假设。
了解和掌握拒绝域的数学公式,对正确进行假设检验至关重要。
1. 单侧假设检验的拒绝域公式在单侧假设检验中,原假设可以是等于某个值,大于某个值或小于某个值。
根据方向性假设的不同,拒绝域的公式也会有所差异。
1.1 原假设为等于某个值时:对于总体均值的假设检验来说,拒绝域公式如下:拒绝域 = {x: |x - μ| ≥ zα/2 * σ/√n}其中,x为样本均值,μ为总体均值,zα/2为显著性水平α/2对应的标准正态分布的分位数,σ为总体标准差,n为样本容量。
1.2 原假设为大于某个值时:对于总体均值的假设检验来说,拒绝域的公式如下:拒绝域= {x: x ≥ μ + zα * σ/√n}1.3 原假设为小于某个值时:对于总体均值的假设检验来说,拒绝域的公式如下:拒绝域= {x: x ≤ μ - zα * σ/√n}2. 双侧假设检验的拒绝域公式在双侧假设检验中,原假设可以是两个值之间的关系,拒绝域的公式也需要根据不同的情况进行调整。
2.1 原假设为不等于某个值时:对于总体均值的假设检验来说,拒绝域的公式如下:拒绝域 = {x: |x - μ| ≥ zα/2 * σ/√n}2.2 原假设为区间时:对于总体均值的假设检验来说,拒绝域的公式如下:拒绝域= {x: x ≤ μ1 - zα/2 * σ/√n 或x ≥ μ2 + zα/2 * σ/√n}其中,μ1和μ2为原假设给定的两个值,zα/2为显著性水平α/2对应的标准正态分布的分位数,σ为总体标准差,n为样本容量。
总结:在进行假设检验时,通过理解和应用拒绝域的数学公式,我们可以更准确地判断是否拒绝原假设。
不同类型的假设对应着不同的拒绝域公式,通过灵活运用这些公式,我们能够更加准确地进行假设检验,得出可靠的统计结论。
贾俊平统计学第7版第八章例题课后习题
贾俊平统计学第7版第⼋章例题课后习题第8章假设检验例题8.1由统计资料得知,1989 年某地新⽣⼉的平均体重为3190克,现从1990年的新⽣⼉中国机抽取100个,测得其平均体重为3210克,问1990年的新⽣⼉与1989年相⽐,体重有⽆显著差异?★解:从调查结果看,1990 年新⽣⼉的平均体重为3210克,⽐1989年新⽣⼉的平均体重3190克增加了20克,但这20克的差异可能源于不同的情况。
_种情况是,1990 年新⽣⼉的体重与1989年相⽐没有什么差别,20克的差异是由于抽样的随机性造成的;另⼀种情况是,抽样的随机性不可能造成20克这样⼤的差异,1990年新⽣⼉的体重与1989年新⽣⼉的体重相⽐确实有所增加。
上述问题的关键点是,20克的差异说明了什么?这个差异能不能⽤抽样的随机性来解释?为了回答这个问题,我们可以采取假设的⽅法。
假设1989年和1990年新⽣⼉的体重没有显著差异,如果⽤µo表⽰1989年新⽣⼉的平均体重,µ表⽰1990年新⽣⼉的平均体重,我们的假设可以表⽰为µ=µ或µ⼼=0,现要利⽤1990年新⽣⼉体重的样本信息检验上述假设是否成⽴。
如果成⽴,说明这两年新⽣⼉的体重没有显著差异;如果不成⽴,说明1990年新⽣⼉的体重有了明显增加。
在这⾥,问题是以假设的形式提出的,问题的解决⽅案是检验提出的假设是否成⽴。
所以假设检验的实质是检验我们关⼼的参数⼀1990 年的新⽣⼉总体平均体重是否等于某个我们感兴趣的数值。
例8.2某批发商欲从⼚家购进⼀批灯泡,根据合同规定灯泡的使⽤寿命平均不能低于1 000⼩时,已知灯泡燃烧寿命服从正态分布,标准差为200⼩时。
在总体中随机抽取了100个灯泡,得知样本均值为960⼩时,批发商是否应该购买这批灯泡?★解:这是⼀个单侧检验问题。
显然,如果灯泡的燃烧寿命超过了1 000⼩时,批发商是欢迎的,因为他⽤已定的价格(灯泡寿命为1 000⼩时的价格)购进了更⾼质量的产品。
单侧检验的原假设问题
~ N(0,1)
结论?
例:某金属矿石中金属含量达到1.1%以上时就具有 开采价值。现从矿石中随机抽取10 块,测得金属含量 为(%):1.15,1.23,1.18,1.31,1.25,1.24,1.21, 1.21,1.26,1.27。
假设一: H0: 1.1 ; H1: 1.1 假设二: H0: 1.1 ; H1: 1.1 统计量: z x n
~ N(0,1)
结论?
例:某金属矿石中金属含量达到1.1%以上时就具有 开采价值。现从矿石中随机抽取10 块,测得金属含量 为(%):0.91,1.05,1.12,0.87,1.26,1.06,1.16, 0.98,1.25,1.37。
若矿石中金属含量服从标准差为0.01的正态分布, 问此矿石是否具有开采价值(α=0.05)?
假设一: H0: 1.1 ; H1: 1.1 假设二: H0: 1.1 ; H1: 1.1 统计量: z x n
~ N(0,1)
结论?
思考: 1、对于假设一,当u>1.1时,z值向哪边移动? 2、对于假设二,当u<1.1时,z值向哪边移动?
若矿石中金属含量服从标准差为0.01的正态分布, 问此矿石是否具有开采价值(α=0.05)?
假设一: H0: 1.1 ; H1: 1.1 假设二: H0: 1.1 ; H1: 1.1 统计量: z x n
~ N(0,1)
结论?
例:某金属矿石中金属含量达到1.1%以上时就具有 开采价值。现从矿石中随机抽取10 块,测得金属含量 为(%):1.15,1.23,1.18,1.31,1.25,1.24,1.21, 1.21,1.26,1.27。
关于假设检验如何选择备择假设和原假设
关于假设检验如何选择备择假设和原假设1. 单侧检验原假设的选择疑问 就以往的概括性理论而言,在单侧检验中一般将研究者想收集证据予以支持的假设作为备择假设H1。
这就是说一个研究者想证明自己的研究结论是正确的,备择假设的方向就要与想要证明其正确性的方向一致;同时将研究者想收集证据证明其不正确的假设作为原假设H0。
例1:一项研究表明,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上。
检验这一结论是否成立。
按照前面的理论,研究者是想证明自己的研究结论(寿命延长)是正确的,于是备择假设的方向为“>”(寿命延长),即建立的原假设与备择假设应为: 例2,一项研究表明,改进生产工艺后,会使产品的废品率降低到2%以下。
检验这一结论是否成立。
根据研究者总是想证明自己的研究结论(废品率降低)是正确的,选择备择假设的方向为“<”(废品率降低)。
建立的原假设与备择假设应为 但在实际的操作中,这种以将自己想要证明的结论放在备择假设中的办法却会带来疑问。
例3:某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上。
如果准备进一批货,怎样进行检验。
根据上面的理论,一种认为是:检验权在销售商一方。
作为销售商,总是想收集证据证明生产商的说法(寿命在1000小时以上)是不是正确的。
于是选取备择假设的方向为“<”(寿命不足1000小时),建立的原假设与备择假设应为 但是这种看法会带来疑问,我为什么一定要证明生产商的说法是错误的呢?如果是一个关系稳定,长期合作的供货商,这种“找茬”的理念肯定会有破坏两家厂商合作的可能。
并且这种方式有一个严重的隐患,即使确实是小于1000的,但如果幅度较小,假设检验会认为这个小于1000是不显著的,接受原假设。
厂商还可能受损失。
但如果将检验方式颠倒: 即使μ确实是大于1000的,但如果幅度较小,假设检验会认为这个大于1000是不显著的,接受原假设。
厂商就可能“冤枉好人”。
关于假设检验如何选择备择假设和原假设
关于假设检验如何选择备择假设和原假设1. 单侧检验原假设的选择疑问就以往的概括性理论而言,在单侧检验中一般将研究者想收集证据予以支持的假设作为备择假设H1。
这就是说一个研究者想证明自己的研究结论是正确的,备择假设的方向就要与想要证明其正确性的方向一致;同时将研究者想收集证据证明其不正确的假设作为原假设H0。
例1:一项研究表明,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上。
检验这一结论是否成立。
按照前面的理论,研究者是想证明自己的研究结论(寿命延长)是正确的,于是备择假设的方向为“>”(寿命延长),即建立的原假设与备择假设应为:例2,一项研究表明,改进生产工艺后,会使产品的废品率降低到2%以下。
检验这一结论是否成立。
根据研究者总是想证明自己的研究结论(废品率降低)是正确的,选择备择假设的方向为“<”(废品率降低)。
建立的原假设与备择假设应为但在实际的操作中,这种以将自己想要证明的结论放在备择假设中的办法却会带来疑问。
例3:某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上。
如果准备进一批货,怎样进行检验。
根据上面的理论,一种认为是:检验权在销售商一方。
作为销售商,总是想收集证据证明生产商的说法(寿命在1000小时以上)是不是正确的。
于是选取备择假设的方向为“<”(寿命不足1000小时),建立的原假设与备择假设应为但是这种看法会带来疑问,我为什么一定要证明生产商的说法是错误的呢?如果是一个关系稳定,长期合作的供货商,这种“找茬”的理念肯定会有破坏两家厂商合作的可能。
并且这种方式有一个严重的隐患,即使确实是小于1000的,但如果幅度较小,假设检验会认为这个小于1000是不显著的,接受原假设。
单侧假设检验中原假设选取的探究
单侧假设检验中原假设选取的探究陈宇【摘要】单侧假设检验中的原假设选取问题一直困扰着多数假设检验的初学者,单侧检验问题中互换原假设和备择假设后很可能使得检验结果完全相反.文章通过实例分析了该问题产生的主要原因,并提出几条原假设选取的原则.【期刊名称】《吉林化工学院学报》【年(卷),期】2017(034)009【总页数】5页(P74-78)【关键词】单侧检验;原假设;备择假设【作者】陈宇【作者单位】吉林化工学院教师发展中心,吉林吉林132022【正文语种】中文【中图分类】O212.1假设检验是数理统计中重要的统计方法,它包含了两个部分:参数假设检验和非参数假设检验[1].参数检验具有广泛应用,在数理统计学习中占据较大的比例.但是,目前多数工科和经济类的统计参考书中对假设检验的介绍主要是侧重于检验的步骤和拒绝域公式的给出,而对假设检验的基本思想一带而过.因此,致使很多初学者在接触假设检验后会产生很多疑难问题,其中比较典型的就是单侧检验中原假设和备择假设的选取问题.国内许多学者对假设检验问题进行了较为深入的研究.崔严民阐述了假设检验的基本概念与步骤,同时推断了假设检验的合理性[2].娄银霞通过讨论两类错误产生与控制,结合概率论中的“小概率原理”和反证法给出一种简便的假设检验推到和推理方法[3].杨桂元等对参数统计检验中的基本原理、单边检验假设与拒绝域等若干问题进行了研究,阐明了区间估计和假设检验的关系[4].杨刚展示了假设检验的基本思想,接着给出了关于单侧检验过程中拒绝域和接受域确定的推理、推导过程[5].已有的文献从不同的角度研究了如何更好的进行假设检验.本文就这一问题进行深度分析,给出如何正确建立原假设和备择假设的方法,以便大家共同研究和探讨.运用假设检验解决问题时,首先需要根据实际问题提出两个互相对立的假设:原假设H0和备择假设H1,然后利用样本观测值对所给出的假设进行检验、判断真伪.在很多情况下,我们给出一个统计假设仅仅是为了拒绝它[6].然而对于同一问题,在相同的显著水平α下进行假设检验,如果互换原假设和备择假设,很有可能使得检验结果完全相反.据此,有人怀疑假设检验的科学性.由此可见,原假设和备择假设不能够随意提出,也不能够随意更换.1.1 实例1某种元件的寿命X(以小时计)服从正态分布N(μ,σ2),μ,σ2均未知.现测得16只元件的寿命如下[7]:159 280 101 212 224 379 179 264222 362 168 250 149 260 485 170问是否有理由认为元件的平均寿命大于225小时?解法1:设H0:μ≤μ0=225, H1:μ>225.取显著性水平α=0.05.此检验问题为右侧检验,拒绝域为t=≥tα(n-1).由题可知 9,n=16,t0.05(15)=1.753 1,即有t==0.668 5<1.753 1.没有落在拒绝域,故接受H0.即认为元件平均寿命不大于225小时.解法2:设H0:μ≥μ0=225, H1:μ<225.取显著性水平α=0.05.此检验问题为左侧检验,拒绝域为t=≤-tα(n-1).由题可知 9,n=16,t0.05(15)=1.753 1,即有t==0.668 5>-1.753 1.没有落在拒绝域,故接受H0.即认为元件平均寿命大于等于225小时.实例1 发现,在同样显著性水平下,用同样的样本进行假设检验时,由于两种解法互换了原假设和备择假设而使得结论完全相反.下面对上述实例1中的样本重新抽样,得到下面的实例2.1.2 实例2对上述实例中的元件重新抽样16只,测得寿命如下:180 280 172 223 224 360 193 285222 335 195 250 173 260 320 200问是否有理由认为元件的平均寿命大于225小时?解法1:设H0:μ≤μ0=225, H1:μ>225.取显著性水平α=0.05.此检验问题为右侧检验,拒绝域为t=≥tα(n-1).由题可知 1,即有t==1.967 1≥1.753 1.落在拒绝域,故拒绝H0,接受H1.即认为元件平均寿命大于225小时.解法2:设H0:μ≥μ0=225, H1:μ<225.取显著性水平α=0.05.此检验问题为左侧检验,拒绝域为t=≤-tα(n-1).由题可知 1,即有t==1.967 1>-1.753 1.没有落在拒绝域,故接受H0.即认为元件平均寿命大于等于225小时.从实例2发现,虽然两种解法也互换了原假设和备择假设,但是检验的结论却是一样的.通过上述两个实例可以肯定一件事情,就是假设检验中原假设和备择假设的选取不是随意的.那么根据什么原则选取原假设和备择假设,或者采取什么样的方法去更好的运用假设检验来解决问题,这是我们要研究的重点.通过对上述两个实例的观察,知道解法1和解法2的实质区别就在于运用的是左侧检验还是右侧检验,这就需要了解两种单侧检验的内在不同.先看右侧检验问题(见图1),右侧检验的拒绝域为t=≥tα(n-1).即样本的观测值t落在(tα(n-1),+∞)时就拒绝原假设H0,接受备择假设H1.反之,若落在(-∞,tα(n-1))时就接受原假设H0.同理,再看左侧检验(见图2),左侧检验的拒绝域为t=≤-tα(n-1).即样本的观测值t落在(-∞,-tα(n-1))时就拒绝原假设H0,接受备择假设H1.反之,若落在(-tα(n-1),+∞)时就接受原假设H0.而我们知道右侧检验和左侧检验有一个共同的接受域(-tα(n-1),tα(n-1))(见图3).那么实例1中的样本观测值t正好落在共同接受域内,由于两种解法的原假设H0正好相反,两种解法都是接受原假设,因此导致检验结果相互矛盾.而实例2中,解法1的样本观测值t落在右侧检验的拒绝域,解法2的样本观测值t落在左侧检验的接受域中,两种解法的原假设相反,所以检验结果一致.3.1 目前解决方法及其不足之处对于两种假设得出矛盾结论的情况,如果需要进一步得出比较确定的结论,比较直接的办法有两种:一是缩小共同接受域,要缩小接受域的同时就要扩大拒绝域,就需要增大显著性水平α.但是提高显著性水平的不足之处就是容易增加弃真错误的概率,降低了检验的可信度.二是改变样本观测值,使其尽可能不落入到共同接受域内,如实例2中可以对产品进行重新抽样;或者在保证均值和方差不变的前提下,提高样本容量n[8],由检验统计量t=可知,增大样本容量会使样本观测值t 增大,进而落入拒绝域内.而这种办法同样也有其不足之处就是,增大了工时,还降低了经济效益.因此上述两种方法均有不足之处.还有些学者为了解决假设检验的结论矛盾问题,提出了一种三联式的检验方法[9],即假设由三部分组成,原假设为H0:μ=μ0, 备择假设为H1:μ<μ0,H2:μ>μ0.同时判定区域也分为三部分(见图4),中央区域为表示样本观测值与μ0没有显著性差异,左侧区域为表示样本观测值显著小于μ0,右侧区域为表示样本观测值显著大于μ0.这种三联式假设提出确实解决了假设检验中由于原假设和备择假设的选取不当而造成的结论模糊,甚至相反的情况.但是仔细观察可以发现,三联式检验方法事实上是对原有的双侧检验H0:μ=μ0,H1:μ≠μ0中的备择假设H1进行的改进,即将备择假设拆分成两个部分.通过对图4的研究发现,单侧检验的共同接受域(-tα(n-1),tα(n-1)),正好是双侧检验接受域的子集,那么问题就出现,如果样本观测值恰好落在或内,如何去解释这个情况?显然这类问题涉及到的是采用双侧检验还是单侧检验的问题:那么研究表明当假设检验的显著性α(弃真错误发生的概率)一定时,双侧检验的β(取伪错误发生的概率)要比单侧检验的β大,因此在实践工作中应尽可能采取单侧检验[10],这样可以在选定检验的显著性α时有效地减少β的值.由此可知,三联式的检验方法在取伪错误的控制上没有单侧检验理想.3.2 假设检验的原理通过上述分析要解决单侧检验中检验结果相互矛盾的问题,还需要从原假设和备择假设的选取上着手.假设检验的基本依据是“小概率事件原理”,所谓小概率原理就是:概率很小的随机事件在一次实验中一般不会发生.根据这一原理,我们从H0出发,在一定的显著水平α下,从总体中抽取一个样本进行检验,在H0成立的条件下,若发生“相应统计量取到样本值代入统计量后的数值”是一个小概率事件,即小概率事件发生,这与“小概率原理”矛盾,所以此时就拒绝H0并接受H1;反之,就只有被迫接受H0[11].例如,某厂家宣称其产品合格率是99%,质检部门对其1000个产品进行抽检,随机抽取1只发现是正品,那么质检人员认为是应该的,但是这并不意味着产品的合格率就是99%,反之如果随机抽取一只发现是次品,那么质检人员有理由认为产品合格率不是99%.道理很简单,按厂家说法1 000个产品中只有10个是次品,那么在一次试验中抽到次品是一个小概率事件,然而这个小概率事件的发生必然引起质检人员的怀疑.根据此例可知样本观测值落入拒绝域,则有充分理由拒绝原假设,选择备择假设.而样本观测值落入接受域内,则不拒绝原假设,但是也不等同于接受原假设,此时接受原假设就会冒取伪的风险,既假设检验不能证明原假设的真,也不能证明备择假设的假,只能理解为目前还没有找到有力的证据拒绝原假设[12].3.3 假设检验中原假设和备择假设选取依据利用假设检验解决问题的关键就在于如何根据实际情况正确的提出原假设和备择假设.具体的原则可以归结为以下几点:如果交换原假设和备择假设后,得到的检验结果不变,那么说明样本观测值在两种情况下一个落在拒绝域,而另一个落在接受域,如实例2.我们考虑样本观测值落在拒绝域代表有充分理由认为原假设的不合理,拒绝原假设,接受备择假设.而样本值落在接受域时,结论是没有充分的理由去拒绝原假设,也就说明不了实质问题.因此原假设和备择假设的选定尽可能使得样本观测值落在原假设拒绝域中,那么对于实例2采取解法1就有充分说服力.如果交换原假设和备择假设后,得到的检验结果相反,那么说明样本观测值在两种情况下都落入接受域内.根据奈曼与皮尔逊提出的原则:在控制弃真错误概率α的条件下,尽量使取伪错误的概率β小,换而言之,在很大程度上考虑弃真概率α的取值[13],因此原假设H0是受保护的.依据的原则就是把不能轻易被否定的命题定为原假设,而把不能轻易被肯定的命题定为备择假设.比如:检验新工艺挺高生产率的问题,更换新工艺就要改变原有的生产模式,势必要投入更多的财力、人力和物力,所以要慎重考虑.因此,可以设定旧工艺效益为μ0,新工艺的效益为μ,把新工艺能带来更大的效益视为小概率事件,提出假设为,H0:μ≤μ0,H1:μ>μ0.那么这样在给定的α下拒绝了原假设H0,就可以接受新工艺.检验问题从考虑到犯错误的后果严重性来看,一般把后果严重的错误定为弃真错误,也就是尽可能的减小这类错误发生概率.比如,考虑某种药品是否为真,这里可能出现两种错误:(1)将假药误作为真药,则会有伤害病人的健康甚至生命的风险.(2)将真药误作为假药,则会有承受经济损失的风险.很显然,犯错误(1)比错误(2)的后果更严重,因此,我们选取H0:药品为假,H1:药品为真.建立假设的侧重点和角度不同而定.比如,质检部门对某厂家生产的元件使用寿命进行检测时,如果该厂家生产的元件质量一直以来都很好,那么质检部门可以认为今年的产品也不会差,则选定原假设H0: 产品合格,反之,若该厂家的元件质量一直都不是很好,这时候质检部门就有必要考虑选原假设H0:产品不合格.那么这种视角度不同建立假设检验主要体现为前者站在厂家的角度,建立假设侧重于保护厂家;而后者站在消费者的角度,建立假设侧重于保护消费者.从文中的实例分析,可以看到假设检验的方法不应该从原假设入手,应该优先考虑备择假设,把希望证明的命题放在备择假设上[14].原假设和备择假设的受保护程度是不一样的,不能够随意更换.研究者需要根据处理问题的实际情况提出假设,具有较强的主观性.假设检验方法本质上是归纳的,但在期推理过程中,最主要的部分是基于小概率原理的反证法的使用,这又是演绎推理过程[15].因此,假设检验中如何选取原假设和备择假设问题只能在实践中积累经验,根据实际情况去判断.【相关文献】[1] 黄敢基.对参数假设检验中几个问题的探析[J].统计与咨询,2011,(1):22-23.[2] 崔严民,陈国良,阿拉腾图雅.假设检验的方法及应用讨论[J].内蒙古石油化工,2011(13):27-28.[3] 娄银霞.关于假设检验的一种合理推导[J].电子设计工程,2012(20):33-35.[4] 杨桂元;刘德志.参数假设检验中的若干基本问题研究[J].统计与决策,2012,(24):13-15.[5] 杨刚.统计学中参数假设检验拒绝域的确定[J].长春工程学院学报:自然科学版,2012,13(2):162-128.[6] 邓华玲.概率论统计方法与应用[M].北京:中国农业出版社,2003.[7] 盛骤,谢式千,潘承毅.概率论与数理统计[M].北京:高等教育出版社,2001(12)..[8] 李晓红.假设检验中原假设的选取问题[J].平原大学学报,2006,23(6):122-124.[9] 罗晓娟.对假设检验方法的改进[J].统计与决策,2011(15):157-158.[10] 胡菊华.假设检验中的原假设选取问题[J].大学数学,2013,29(5):140-143.[11] 任永泰.关于假设检验中原假设的提出[J].大学数学,2005,21(5):121-123.[12] 韩兆洲;魏章进.假设检验的一个常见误区[J].统计与信息论坛,2005,20(1):9-11.[13] 杨少华,杨林涛.参数假设检验中原假设和备择假设的交换问题[J].统计与决策,2009(5):148-149.[14] 黄发贵.单侧假设检验中备择假设的设定依据[J].统计教育,2006(6):62-64.[15] 欧新元,李海英.假设检验的推理过程分析[J].沈阳师范大学学报:自然科学版,2008,26(2):157-159.。
《应用统计学》教学中原假设和备择假设建立探讨
《应用统计学》教学中原假设和备择假设建立探讨摘要:学习假设检验的第一步是建立原假设和备择假设,初学者对原假设和备择假设如何建立理解不透。
首先通过单侧检验的一个实例,采用建立不同的原假设和备择假设会导致矛盾的结论;其次,分析了产生矛盾的原因;最后,给出了建立原假设和备择假设的几个原则。
关键词:假设检验原假设备择假设第一类错误假设检验包括参数检验和非参数检验两种情形,是统计学中的核心内容之一。
在学习假设检验的这部分内容时,第一步根据资料对总体的参数或分布建立假设,然后我们假定在原假设是正确的条件下,利用抽样数据计算统计量对应的数值以及计算更不利于原假设的概率,由此判断是否拒绝原假设[1]。
但对于假设如何建立的问题,特别是对单侧检验的假设如何建立,目前仍然没有统一的标准,但不同的建立方式有时会得到相互矛盾的结论[2]。
这导致不少学习这门课程的大学生对此十分困惑,不知道究竟怎么建立假设检验的假设,影响了学生对这部分内容的掌握。
为此,结合教学中出现的问题,探讨如何建立假设的问题非常有必要。
一、原假设建立不同导致的问题学习假设检验这部分内容时,首先就是要依据问题建立需要检验的假设,其次就是根据抽样调查获得的数据来检验上述假设是否成立。
实际教学中,我们发现对于同一组抽样数据,如果原假设和备择假设设定不同,往往会得到不同的结果,甚至得到的结论相互矛盾,初学这部分内容的经管专业学生往往感觉到无所适从,不知道其中的原因是什么。
具体我们以下面的例子进行说明。
例某经销商准备从厂家采购一批蓄电池,合同规定该蓄电池的充电次数不能低于1000次。
已知蓄电池的充电次数服从。
从这批产品中随机抽取64个蓄电池进行检测,测得平均充电次数=990次,请问,经销商是否购进这批蓄电池()?分析:这是一个单侧假设检验的问题,我们可以采用不同的方法建立原假设,检验的统计量为。
方法一:设,取显著性水平,则临界值。
检验的统计量:。
因为,所以在显著性水平为5%下,不拒绝原假设,即样本提供的证据还不能推翻原假设,即该厂生产的蓄电池达到了规定的充电次数。
假设检验
H 0 : X = X 0; H1 : X ≠ X
0
或 H 0 : P = P0 ; H 1 : P ≠ P0
2.单侧检验:如果不仅仅检验样本平均数( 2.单侧检验:如果不仅仅检验样本平均数(或成 单侧检验 和总体平均数(或成数)有没有显著的差异, 数)和总体平均数(或成数)有没有显著的差异, 而且追究是否发生预先指定方向的差异( 而且追究是否发生预先指定方向的差异(正差 异或负差异),则原假设取不等式形式, ),则原假设取不等式形式 异或负差异),则原假设取不等式形式,如:
其次,确定显著性水平。 其次,确定显著性水平。 我们所以拒绝原假设, 我们所以拒绝原假设,并不是因为它存在逻辑的 绝对矛盾,或实际上不可能存在这种假设, 绝对矛盾,或实际上不可能存在这种假设,而仅 仅因为它存在的可能性很小。 仅因为它存在的可能性很小。根据小概率事件原 理,概率很小的事件在一次试验中几乎是不会发 生的。 生的。如果根据原假设的条件正确计算出某一结 果发生的概率很小, 果发生的概率很小,理应在一次试验中不至于发 然而在一次试验中事实上又发生了, 生,然而在一次试验中事实上又发生了,则我们 认为原假设不正确,而拒绝接受。 认为原假设不正确,而拒绝接受。 进行假设检验时应该事先规定一个小概率的标 作为判断的界限, 准,作为判断的界限,这个小概率标准称为显 著性水平。 著性水平。
(一)设立假设 首先提出原假设,记为H 首先提出原假设,记为H0,原假设总是假定 总体没有显著性差异, 总体没有显著性差异,所有差异都是由随机 原因引起的。所以这种假设又称无效假设。 原因引起的。所以这种假设又称无效假设。 其次提出备择假设,记为H 其次提出备择假设,记为H1,如果原假设被 拒绝等于接受了备择假设, 拒绝等于接受了备择假设,所以备择假设也 就是原假设的对立事件。 就是原假设的对立事件。
概率论中单侧检验的原理
概率论中单侧检验的原理
单侧检验是一种概率论中的假设检验方法,旨在检验一个假设是否在一定程度上成立。
它的原理基于以下几个步骤:
1. 确定原假设和备择假设:原假设(H0)是要被检验的假设,而备择假设(H1)是对原假设的替代假设。
2. 选择显著性水平:显著性水平(α)是一个事先确定的阈值,表示接受原假设的最高错误率。
3. 计算检验统计量:根据所选的检验方法,计算出相应的检验统计量。
检验统计量是由样本数据计算出来的一个数值,用于衡量样本观测值与原假设的差异程度。
4. 确定拒绝域:拒绝域是一组满足某个条件的观测值的集合。
它是基于显著性水平和检验统计量来确定的,如果观测值落在拒绝域内,则拒绝原假设。
5. 比较检验统计量和拒绝域:将计算得到的检验统计量与拒绝域进行比较。
如果检验统计量落在拒绝域内,则可以拒绝原假设,否则接受原假设。
6. 得出结论:根据比较的结果,根据样本数据和检验结果,得出对原假设的结论。
如果拒绝原假设,则支持备择假设;如果接受原假设,则暂时保留原假设。
总之,单侧检验的原理是通过计算检验统计量,并根据显著性水平与拒绝域的比较,来判断对原假设的接受与否。
单侧检验主要用于确定一个方向的差异,即是一种较为具体的假设检验方法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
~ N (0,1)
结论?
例:某金属矿石中金属含量达到1.1%以上时就具有 开采价值。现从矿石中随机抽取10 块,测得金属含量 为(%):0.91,1.05,1.12,0.87,1.26,1.06,1.16, 0.98,1.25,1.37。
若矿石中金属含量服从标准差为0.01的正态分布, 问此矿石是否具有开采价值(α=0.05)?
假设一:H 0: 1.1;H1: 1.1 假设二:H 0: 1.1;H1: 1.1 统计量:z x n
~ N (0,1)
结论?
例:某金属矿石中金属含量达到1.1%以上时就具有 开采价值。现从矿石中随机抽取10 块,测得金属含量 为(%):1.15,1.23,1.18,1.31,1.25,1.24,1.21, 1.21,1.26,1.27。
接受原假设?
—— 一个单侧检验的例子
例:某金属矿石中金属含量达到1.1%以上时就具有 开采价值。现从矿石中随机抽取10 块,测得金属含量 为(%):0.91,1.05,1.12,0.87,1.26,1.06,1.16, 0.98,1.25,1.37。
若矿石中金属含量服从标准差为0.01的正态分布, 问此矿石是否具有开采价值(α=0.05)?
若矿石中金属含量服从标准差为0.01的正态分布, 问此矿石是否具有开采价值(α=0.05)?
假设一:H 0: 1.1;H1: 1.1 假设二:H 0: 1.1;H1: 1.1 统计量:z x n
~ N (0,1)
结论?
思考: 1、对于假设一,当u>1.1时,z值向哪边移动? 2、对于假设二,当u<1.1时,z值向哪边移动?
假设一:H 0: 1.1;H1: 1.1 假设二:H 0: 1.1;H1: 1.1 统计量:z x n
~ N (0,1)
结论?
例:某金属矿石中金属含量达到1.1%以上时就具有 开采价值。现从矿石中随机抽取10 块,测得金属含量 为(%):1.15,1.23,1.18,1.31,1.25,1.24,1.21, 1.21,1.26,1.27。
若矿石中金属含量服从标准差为0.01的正态分布, 问此矿石是否具有开采价值(α=0.05)?
假设一:H 0: 1.1;H1: 1.1 假设二:H 0: 1.1;H1: 1.1 统计量:z x n
~ N (0,1)
结论?
思考: 1、对于假设一,当u>1.1时,z值向哪边移动? 2、对于假设二,当u<1.1时,z值向哪边移动?
假设一:H 0: 1.1;H1: 1.1 假设二:H 0: 1.1;H1: 1.1 统计量:z x n
~ N (0,1)
结论?