第四章假设检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第四章假设检验

参数估计与假设检验的关系:参数估计和假设检验是推断统计方法的两个重要组成部分。共同点:都是利用样本信息对总体数量特征进行推断。不同点:推断的角度不同

4.1 假设检验的基本问题

1、假设检验——是指先对总体的参数或分布形式提出某种假设,然后利用样本信息判断假设是否成立的过程;

包括参数检验和非参数检验;逻辑上运用的是概率反证法;统计依据为小概率原理。

2、小概率事件——若事件A发生的概率P(A)很小很小或接近于0。一般在假设检验中,通常要求P(A)≤0.05。

3、原假设——又称零假设,是指研究者想收集证据予以反对的假设,表示为H0。总是有

符号=、≤或 ≥

备择假设——也称研究假设,是指研究者想收集证据予以支持的假设,表示为H1。总是有符号≠、<或>

4、原假设和备择假设是一个完备事件组,而且相互对立。在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立;

先确定备择假设,再确定原假设。因为备择假设大多是人们关心并想予以支持和证实的,一般比较清楚和容易确定;

等号“=”总是放在原假设上;

因研究目的不同,对同一问题可能提出不同的假设,也可能得出不同的结论。

假设检验主要是搜集证据来推翻和拒绝原假设。

5、双侧检验——是指备择假设没有特定的方向性,并含有符号≠的假设检验,又称为双尾检

验。

单侧检验——是指备择假设具有特定的方向性,并含有符号>或<的假设检验,又称为单尾检验。

6、第Ⅰ类错误(弃真错误)

原假设为真时拒绝原假设。第Ⅰ类错误的概率记为α,又被称为显著性水平。

又称为显著性水平,常被用于检验结论的可靠性度量;

既是一个概率值;又是抽样分布拒绝域面积的大小(表示犯第Ⅰ类错误概率的最大允许值);常用的α 值有0.01,0.05,0.10;由研究者事先确定。

第Ⅱ类错误(取伪错误)

原假设为假时未拒绝原假设。第Ⅱ类错误的概率记为β。

确定了显著性水平α 就等于控制了第Ⅰ类错误的概率,但犯第Ⅱ类错误概率β的具体数值却很难确定,其受影响因素包括: 随假设总体参数的减少而增大;

当 α 减少时增大;当 σ 增大时增大;当 n 减少时增大。

7、检验统计量——是指根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量。

标准化的检验统计量可表示为:点估计量的抽样标准差

假设值

点估计量标准化检验统计量-=

8、拒绝域——是指能够拒绝原假设的统计量的所有可能取值构成的集合。 大小等于显著性水平α 。

位置取决于检验是单侧还是双侧。双侧拒绝域在分布两侧;单侧拒绝域在左侧或右侧。 临界值——根据给定的显著性水平确定的拒绝域的边界值。 9、决策步骤

①给定显著性水平α,查表得出相应的临界值z α或z α/2, t α或t α/2 ②将计算出的检验统计量的值与临界值比较 ③作出决策

双侧检验:|统计量| > 临界值,拒绝H 0 左侧检验:统计量 < -临界值,拒绝H 0 右侧检验:统计量 > 临界值,拒绝H 0 10、利用p 值进行决策

p 值——又称为观察到的显著性水平,在原假设为真的条件下,所得到的样本结果会像实际观测结果那么极端或更极端的概率。

α是指原假设正确时被拒绝的概率,或拒绝原假设犯错误的最大允许值;

p 值与原假设的对或错的概率无关,它是关于数据的概率。如果原假设正确,p 值表示这样的观测数据会有多么的不可能得到。或是犯错误的实际概率。 不论是单侧检验还是双侧检验,用p 值进行决策的规则: 若p 值<α,拒绝 H 0 若p 值>α,不拒绝 H 0

p 值反映实际观测到的数据与原假设H 0之间不一致的程度的一个概率值。

p 值越小,说明实际观测到的数据与原假设H 0之间不一致的程度就越大,检验的结果也就越显著。

11、假设检验步骤

(1)、提出原假设和备择假设;

(2)、确定一个适当的检验统计量,并利用样本数据算出其具体数值; (3)、根据显著性水平,计算出其临界值,指定拒绝域; (4)、将统计量的值与临界值进行比较,作出决策。

统计量的值落在拒绝域,拒绝H 0,否则不拒绝H 0 也可以直接利用p 值作出决策 4.2 一个正态总体的检验 一、总体均值的检验 1、总体方差已知的检验

当总体方差已知的情况,无论样本是大样本,还是小样本时,都使用z 检验统计量。

)1,0(~0

N n

x z σμ-=

【例1】某厂生产铜丝,其主要质量指标为折断力X ,根据历史资料统计,可假定X ∼N (570,82)。今新换材料生产,抽取30个样本值为:

577、578、579、569、565、577、568、587、 578、572、570、568、572、581、582、569、 570、570、572、596、584,598、588、563、 577、587、567、587

欲检验新材料生产的铜丝的折断力X 有无明显变化。假定方差σ2 = 8 2保持不变,α=0.05

【解】此题为正态总体均值的假设检验 H0: µ= 570 H1:µ≠570

由于铜丝折断力X 为大样本且总体方差已知,故可以采用Z 检验法。依题意,样本均值

为:4.53830

587567...578577=++++==

∑n

x x 检验统计量64.2146.16

.3130

85704.5380

-≈-=-=

-=

n

x Z σμ

α=0.05,查表得Z α/2=1.96

检验统计量|Z|=21.64>Z α/2=1.96

所以应拒绝H0,表明新材料生产的铜丝的折断力X 有明显的变化。

【练习1】完成生产线上某件工作所需的平均时间不少于15.5分钟,标准差为3分钟,对随机抽选的36名职工讲授一种新方法,训练期结束后这36名职工完成此项工作所需的平均时间为13.5分钟,这个结果是否提供了充分证据,说明用新方法所需的时间短?设α=0.05,并假定完成这件工作的时间服从正态分布。 解:H0:µ≥15.5 H1:µ<15.5

由于大样本且总体方差已知,故采用Z 检验法。依题意已知:3=σ 36=n 5.13=x 检验统计量 436

35

.155.130

-=-=

-=

n

x Z σμ

α=0.05,临界值Z α=1.645

Z =-4<-Z α=-1.645,所以拒绝原假设H0,表明有充分的证据说明用新方法所需的时间更短。 总体方差已知,检验方法的总结

相关文档
最新文档