假设检验基本原理
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
u x x
x
x
x
x 0 n
本例,
9.5 g 得
n 9, x 308 g 0 300 g
x 0 308 300 u 2.526 n 9.5 9
18
下面估计|u|≥2.526的两尾概率,即估计P (|u |≥2.526)是多少? 我们知道,两尾概率为0.05的临界值为
于两个临界 值之间,即:
u0.05
<2.526<
u0.01
所以,| |≥2.526的概率P介于0.01和
u
0.05之间,即
0.01 < p < 0.05 说明假定表面差异( x 范围内)。 )是由抽样误 0
差造成的概率在0.01—0.05之间(小概率取值
(四)统计推断
根据小概率事件实际不可能性原理作 出否定或接受无效假设的推断。
称地分配在 分布曲线的两侧尾部,每侧尾部 在【例3· 1】中,对应于无效假设 H0:
/ 2 ,如图3-1所示。这种利用两尾 概率进行的检验叫两尾检验. u 为 水平两
的概率为 尾检验的临界 值。
u
u
抽样分布
拒绝域 /2 1-
置信水平 拒绝域 /2 接受域 H0值 样本统计量
临界值
临界值
根据这一原理 ,当表面差异是抽样误差 的概率在小于0.05( α )时 ,可以认为在一 次抽样中表面差异是抽样误差实际上是不可能 0 , 的,因而否定原先所作的无效假设H0: 接受备择假设HA: 0 , 即认为存在真实 差异。 当表面差异是抽样误差的概率大于0.05 ( α )时,说明无效假设H0: 0 成立的 可能性大,不能被否定,因而也就不能接受备 择假设HA: 0 。
(二)两类错误
因为在显著性检验中,否定或接受无 效假设的依据是“小概率事件实际不可能 性原理”,所以我们下的结论不可能有百 分之百的把握。
例如,经 检验获得“差异显著”的结论,
我们有95%的把握否定无效假设H0,同时要冒 5%下错结论的风险;(拒真错误)
u
而经检验获得“差异不显著”的结论,在统计
26
三、显著水平与两种类型的错误
(一)显著水平
用来否定或接受无效假设的概率标准叫
显著水平,记作
=0.05,称 为 =0.01,称 为
水平。
。 在生物学研究中常取
5% 显 著 水 平; 或
1% 显 著 水 平 或 极显著
可以看到,是否否定无效假设H 0 : 0 ,
是用实际计算出的检验统计数 的绝对值与显著 水平 对应的临界 值 u 比较:
u 分布来估计出 ∣u∣≥2.526的两尾概率,所以称为 u 检验.
上述显著性检验利用了
25
假设检验的步骤可概括为:
(1)对样本所属总体提出无效假设H0和备 择假设HA; (2)确定检验的显著水平α; (3)在H0正确的前提下,根据抽样分布的 统计数,进行假设检验的概率计算; (4)根据显著水平α 的统计数(如u值)临 界值,进行差异是否显著的推断。
谎。
反过来,如果要证明这个人说过 谎很容易,只要有一次被抓住就 足够了。 企图肯定什么事物很难,而否定 却要相对容易得多。 这就是假设检验背后的哲学。
区间估计与假设检验的基本区别
上一章中讨论了置信区间的估计方法。它是利用
样本数据,以抽样总体的分布为理论基础,用一 定的概率保证来计算出原总体中未知参数的区间 范围。特别值得注意的是:在作区间估计之前, 我们对所要估计的参数是一无所知的。 而在这一章中,我们所要做的工作是,先对要 研究的参数作一个假设,然后去检验这个假设 是否正确。因此假设检验对于所研究的参数总 是先有一个假设的值。
在进行无效假设和备择假设后,要确定一 个否定H0的概率标准,这个概率标准叫显 著水平(significance level)或概率水平 (probability level),记作α。 α是人为规 定的小概率界限,生物统计学中常取α= 0.05和α=0.01两个显著水平。
(三)计算概率
在假定无效假设成立的前提下,根据所检验
减少(增加)I型错误,将会 增加(减少)II型错误
增大n 同时降低 与
37
减少I型错误的主要方法:假设检验时设定 值。
减少II型错误的主要方法:提高检验效能。
提高检验效能的最有效方法:增加样本量。
如何选择合适的样本量:实验设计。
38
四、两尾检验与一尾检验
的备择假设为HA: 0 0。 HA实际 0 上包含了 0 或 这两种情况。此时, 0 在 水平上否定域为 , u 和 u , ,对
的统计数的抽样分布,计算表面差异( x 0 )
是由抽样误差造成的概率。 本例是在假定无效假设 H 0 : 0 成立的前 提下,研究在 ~N(300,9.52)这一已知 正态总体中抽样所获得的样本平均数 的分布。
x
x
若 x N ( , 2 ) ,则样本平均 数x 得
2 x
N ( x , ), x , x ,将其标准化, n
误率” 这是统计推断的基本特点。
35
为了降低犯两类错误的概率,一般从选取适 当的显著水平 和增加试验重复次数 n 来考虑。 因为选取数值小的显著水平 值可以降低犯Ⅰ 错误的概率,所以显著水平 值的选用要同时 考虑到犯两类错误的概率的大小。 类型错误的概率,但与此同时也增大了犯Ⅱ型
与 间的关系
6
问题计
量的差别,来推断总体参数是否不同。
这种识别的过程,就是本章介绍的假 设检验(hypothesis test)。
7
假设检验在统计方法中的地位
统计方法
描述统计
推断统计
参数估计
假设检验
8
9
第一节 统计假设检验的 基本原理
一、显著性检验的意义
Ⅱ类错误又称为 错误 ,就是把非真实 的差异错判为是真实的差异 ,即实际上HA 正确,检验结果却未能否定H0 。 犯Ⅱ类型 错误的可能性记为 ,一般是随着 0 的 减小或试验误差的增大而增大,所以 0
越小或试验误差越大,就越容易将试验的真
实差异错判为试验误差。
显著性检验的两类错误归纳如下:
成:
一部分是试验的真实差异( 1 2 );
另一部分是试验误差( 1 2 )。
虽然真实差异 ( 1 2 ) 未知,但试验的表面差异( x1 x2 ) 是可以计算的,借助数理统计方法可以对试验误差作出 估计。所以,可将试验的表面差异 显著性检验。
相比较间接推断真实差异 ( 1 2 ) 是否存在,即进行差异
表3-1 显著性检验的两类错误
假设检验的结果 客观实际 拒绝 H0 H0 成立 H0 不成立 即 H1 成立 I 型错误 ( ) 推断正确 (1 ) “接受” H0 推断正确 (1 ) II 型错误 ( )
因而,不能仅凭统计推断就简单 地作出绝对肯定或绝对否定的结论。
“有很大的可靠性,但有一定的错
u 学上是指“没有理由”否定无效假设H0,同样
也要冒下错结论的风险。(存假错误)
显著性检验可能出现两种类型的错误: Ⅰ类错误(拒真) 与Ⅱ类错误(存假)。
Ⅰ类错误又称为 错误,就是把真实的 差异错判为是非真实的差异,即实际上H0正 确,检验结果为否定H0。犯Ⅰ类型错误的可
能性一般不会超过所选用的显著水平 ;
0 ,但备择假
=0.05时,否定域为[1.64,
这种利用一尾概率进行的检验叫一尾检验 。
此时u 为一尾检验的临界 值。 一尾检验的 u=两尾检验的 u2 例如, 一尾检验的 一尾检验的
u
图3-1 双侧检验
40
抽样分布
拒绝域
置信水平
1- 接受域 H0值
单侧检验-1
41
临界值
图3-2
样本统计量
抽样分布
置信水平
拒绝域 1-
接受域 H0值 样本统计量 临界值
图3-2
单侧检验-2
42
两尾检验的目的在于判断 与0有无差异,
而不考虑
与 0谁大谁小。
在有些情况下两尾检验不一定符合实际 情况。
生物统计学
如果一个人说他从来没有说过谎。他能够 证明吗?要证明他没有说过谎,他必须出 示他从小到大每一时刻的录音录像,所有 书写的东西等等,还要证明这些物证是完 全的、真实的、没有间断的。这简直是不 可能的。即使他找到一些证人,比如他的
同学、家人和同事,那也只能够证明在那
些证人在场的某些片刻,他没有被听到说
相应地还要有一个对应假设, 称为备择假设。 备择假设是在无效假设被否定时 ,准备接受的 假设,记为H A : 0或 0 0 。
通过检验,若否定无效假设,我们就接受备 择假设。此外,样本频率、变异数以及多个平 均数的假设检验,也应根据试验目的提出无效 假设和备则假设。
(二)确定显著水平
显著性检验的结果表明: 本例的样本平均数与原总体平均数之间
x 0 ) 除包含抽样误差外, 还包含真实差异( 0) , 即喷洒了药剂 的玉米单穗重总体平均数 与原来的玉米 单穗重总体平均数 0 不同。
的表面差异(
综上所述,显著性检验,从提出无效假 设与备择假设,到根据小概率事件实际不可 能性原理来否定或接受无效假设,这一过程 实际上是应用所谓“概率性质的反证法”对 样本所属总体所作的无效假设的统计推断。
如,某地进行了两个水稻品种对比试验,在相
同条件下,两个水稻品种分别种植10个小区,
获得两个水稻品种的平均产量为:
x1 510
x2 500
x1 x2 10
我们能否根据 x1 x2 10就判定这两个水稻 品种平均产量不同?结论是,不一定。
这里,试验的表面差异 ( x1 x2 )是由两部分组
( x1 x2 )
与试验误差
二、显著性检验的步骤
【例3· 1】 已知某品种玉米单穗重 ~N
0 300g, (300,9.52),即单穗重总体平均数
标准差 穗重
x
9.5g。在种植过程中喷洒了某种 308g,试问这种药剂对该品种玉
药剂的植株中随机抽取9个果穗 ,测得平均单
x
米的平均单穗重有无真实影响?
(一)提出假设
首先对样本所在的总体作一个假设。假设喷 洒了药剂的玉米单穗重总体平均数
与原
来的玉米单穗重总体平均数 0 之间没有真 实差异,即 0 0 或 0。也就是假设 表面差异
( x 0 )是由抽样误差造成的。
这种假设通常称为无效假设或零假设,记 为 H 0 : 0 。无效假设是待检验的假设,它有 可能被接受,也有可能被否定。
这也是这两种方法最基本的区别。
假设检验又叫显著性检验是统计学中的一
个重要内容 。 显著性检验的方法很多 ,常用的有u检 验、t检验、F检验和2检验等。尽管这些 检验方法的使用条件及用途不同,但检验
的基本原理是相同的。
假设检验基本思想
它是利用小概率反证法思想,从问题的
对立面(H0)出发间接判断要解决的问题 (H1)是否成立。然后在H0成立的条件下 计算检验统计量,最后获得P值来判断。
例如,目前我国大豆育种工作者认为,大 豆籽粒蛋白质含量超过45%(0)的品种为高
蛋白品种。如果进行样品含量检测 ,我们关心
的是 x 所在的总体平均数 设则为HA: 例如当
此时的无效假设仍为H0:
大于 0 。
。
线的右尾,即 [u , )
0。这时否定域位于u 分布曲
。 )
u0.05=1.96,两尾概率为0.01的临界 u 值为 =2.58,即: u0.01
P(| |>1.96)
u
= P( u >1.96)+ P( <-1.96)
=0.05
u
P(| |>2.58) = P( >2.58)+ P( <-2.58) =0.01
u
u u
u
根据样本数据计算所得的 u值为2.526,介
u
u
u|≥ u,则在 水平上否定 H : 若| u | < u ,则 不 能 在 水 平 上 否
若|
0
0
定H 0 : 0 。
, u 和 u , 称为水平 上的否定域,而区间 ( u , u ) 则称为 水平
区间
上的接受域。
x
x
x
x 0 n
本例,
9.5 g 得
n 9, x 308 g 0 300 g
x 0 308 300 u 2.526 n 9.5 9
18
下面估计|u|≥2.526的两尾概率,即估计P (|u |≥2.526)是多少? 我们知道,两尾概率为0.05的临界值为
于两个临界 值之间,即:
u0.05
<2.526<
u0.01
所以,| |≥2.526的概率P介于0.01和
u
0.05之间,即
0.01 < p < 0.05 说明假定表面差异( x 范围内)。 )是由抽样误 0
差造成的概率在0.01—0.05之间(小概率取值
(四)统计推断
根据小概率事件实际不可能性原理作 出否定或接受无效假设的推断。
称地分配在 分布曲线的两侧尾部,每侧尾部 在【例3· 1】中,对应于无效假设 H0:
/ 2 ,如图3-1所示。这种利用两尾 概率进行的检验叫两尾检验. u 为 水平两
的概率为 尾检验的临界 值。
u
u
抽样分布
拒绝域 /2 1-
置信水平 拒绝域 /2 接受域 H0值 样本统计量
临界值
临界值
根据这一原理 ,当表面差异是抽样误差 的概率在小于0.05( α )时 ,可以认为在一 次抽样中表面差异是抽样误差实际上是不可能 0 , 的,因而否定原先所作的无效假设H0: 接受备择假设HA: 0 , 即认为存在真实 差异。 当表面差异是抽样误差的概率大于0.05 ( α )时,说明无效假设H0: 0 成立的 可能性大,不能被否定,因而也就不能接受备 择假设HA: 0 。
(二)两类错误
因为在显著性检验中,否定或接受无 效假设的依据是“小概率事件实际不可能 性原理”,所以我们下的结论不可能有百 分之百的把握。
例如,经 检验获得“差异显著”的结论,
我们有95%的把握否定无效假设H0,同时要冒 5%下错结论的风险;(拒真错误)
u
而经检验获得“差异不显著”的结论,在统计
26
三、显著水平与两种类型的错误
(一)显著水平
用来否定或接受无效假设的概率标准叫
显著水平,记作
=0.05,称 为 =0.01,称 为
水平。
。 在生物学研究中常取
5% 显 著 水 平; 或
1% 显 著 水 平 或 极显著
可以看到,是否否定无效假设H 0 : 0 ,
是用实际计算出的检验统计数 的绝对值与显著 水平 对应的临界 值 u 比较:
u 分布来估计出 ∣u∣≥2.526的两尾概率,所以称为 u 检验.
上述显著性检验利用了
25
假设检验的步骤可概括为:
(1)对样本所属总体提出无效假设H0和备 择假设HA; (2)确定检验的显著水平α; (3)在H0正确的前提下,根据抽样分布的 统计数,进行假设检验的概率计算; (4)根据显著水平α 的统计数(如u值)临 界值,进行差异是否显著的推断。
谎。
反过来,如果要证明这个人说过 谎很容易,只要有一次被抓住就 足够了。 企图肯定什么事物很难,而否定 却要相对容易得多。 这就是假设检验背后的哲学。
区间估计与假设检验的基本区别
上一章中讨论了置信区间的估计方法。它是利用
样本数据,以抽样总体的分布为理论基础,用一 定的概率保证来计算出原总体中未知参数的区间 范围。特别值得注意的是:在作区间估计之前, 我们对所要估计的参数是一无所知的。 而在这一章中,我们所要做的工作是,先对要 研究的参数作一个假设,然后去检验这个假设 是否正确。因此假设检验对于所研究的参数总 是先有一个假设的值。
在进行无效假设和备择假设后,要确定一 个否定H0的概率标准,这个概率标准叫显 著水平(significance level)或概率水平 (probability level),记作α。 α是人为规 定的小概率界限,生物统计学中常取α= 0.05和α=0.01两个显著水平。
(三)计算概率
在假定无效假设成立的前提下,根据所检验
减少(增加)I型错误,将会 增加(减少)II型错误
增大n 同时降低 与
37
减少I型错误的主要方法:假设检验时设定 值。
减少II型错误的主要方法:提高检验效能。
提高检验效能的最有效方法:增加样本量。
如何选择合适的样本量:实验设计。
38
四、两尾检验与一尾检验
的备择假设为HA: 0 0。 HA实际 0 上包含了 0 或 这两种情况。此时, 0 在 水平上否定域为 , u 和 u , ,对
的统计数的抽样分布,计算表面差异( x 0 )
是由抽样误差造成的概率。 本例是在假定无效假设 H 0 : 0 成立的前 提下,研究在 ~N(300,9.52)这一已知 正态总体中抽样所获得的样本平均数 的分布。
x
x
若 x N ( , 2 ) ,则样本平均 数x 得
2 x
N ( x , ), x , x ,将其标准化, n
误率” 这是统计推断的基本特点。
35
为了降低犯两类错误的概率,一般从选取适 当的显著水平 和增加试验重复次数 n 来考虑。 因为选取数值小的显著水平 值可以降低犯Ⅰ 错误的概率,所以显著水平 值的选用要同时 考虑到犯两类错误的概率的大小。 类型错误的概率,但与此同时也增大了犯Ⅱ型
与 间的关系
6
问题计
量的差别,来推断总体参数是否不同。
这种识别的过程,就是本章介绍的假 设检验(hypothesis test)。
7
假设检验在统计方法中的地位
统计方法
描述统计
推断统计
参数估计
假设检验
8
9
第一节 统计假设检验的 基本原理
一、显著性检验的意义
Ⅱ类错误又称为 错误 ,就是把非真实 的差异错判为是真实的差异 ,即实际上HA 正确,检验结果却未能否定H0 。 犯Ⅱ类型 错误的可能性记为 ,一般是随着 0 的 减小或试验误差的增大而增大,所以 0
越小或试验误差越大,就越容易将试验的真
实差异错判为试验误差。
显著性检验的两类错误归纳如下:
成:
一部分是试验的真实差异( 1 2 );
另一部分是试验误差( 1 2 )。
虽然真实差异 ( 1 2 ) 未知,但试验的表面差异( x1 x2 ) 是可以计算的,借助数理统计方法可以对试验误差作出 估计。所以,可将试验的表面差异 显著性检验。
相比较间接推断真实差异 ( 1 2 ) 是否存在,即进行差异
表3-1 显著性检验的两类错误
假设检验的结果 客观实际 拒绝 H0 H0 成立 H0 不成立 即 H1 成立 I 型错误 ( ) 推断正确 (1 ) “接受” H0 推断正确 (1 ) II 型错误 ( )
因而,不能仅凭统计推断就简单 地作出绝对肯定或绝对否定的结论。
“有很大的可靠性,但有一定的错
u 学上是指“没有理由”否定无效假设H0,同样
也要冒下错结论的风险。(存假错误)
显著性检验可能出现两种类型的错误: Ⅰ类错误(拒真) 与Ⅱ类错误(存假)。
Ⅰ类错误又称为 错误,就是把真实的 差异错判为是非真实的差异,即实际上H0正 确,检验结果为否定H0。犯Ⅰ类型错误的可
能性一般不会超过所选用的显著水平 ;
0 ,但备择假
=0.05时,否定域为[1.64,
这种利用一尾概率进行的检验叫一尾检验 。
此时u 为一尾检验的临界 值。 一尾检验的 u=两尾检验的 u2 例如, 一尾检验的 一尾检验的
u
图3-1 双侧检验
40
抽样分布
拒绝域
置信水平
1- 接受域 H0值
单侧检验-1
41
临界值
图3-2
样本统计量
抽样分布
置信水平
拒绝域 1-
接受域 H0值 样本统计量 临界值
图3-2
单侧检验-2
42
两尾检验的目的在于判断 与0有无差异,
而不考虑
与 0谁大谁小。
在有些情况下两尾检验不一定符合实际 情况。
生物统计学
如果一个人说他从来没有说过谎。他能够 证明吗?要证明他没有说过谎,他必须出 示他从小到大每一时刻的录音录像,所有 书写的东西等等,还要证明这些物证是完 全的、真实的、没有间断的。这简直是不 可能的。即使他找到一些证人,比如他的
同学、家人和同事,那也只能够证明在那
些证人在场的某些片刻,他没有被听到说
相应地还要有一个对应假设, 称为备择假设。 备择假设是在无效假设被否定时 ,准备接受的 假设,记为H A : 0或 0 0 。
通过检验,若否定无效假设,我们就接受备 择假设。此外,样本频率、变异数以及多个平 均数的假设检验,也应根据试验目的提出无效 假设和备则假设。
(二)确定显著水平
显著性检验的结果表明: 本例的样本平均数与原总体平均数之间
x 0 ) 除包含抽样误差外, 还包含真实差异( 0) , 即喷洒了药剂 的玉米单穗重总体平均数 与原来的玉米 单穗重总体平均数 0 不同。
的表面差异(
综上所述,显著性检验,从提出无效假 设与备择假设,到根据小概率事件实际不可 能性原理来否定或接受无效假设,这一过程 实际上是应用所谓“概率性质的反证法”对 样本所属总体所作的无效假设的统计推断。
如,某地进行了两个水稻品种对比试验,在相
同条件下,两个水稻品种分别种植10个小区,
获得两个水稻品种的平均产量为:
x1 510
x2 500
x1 x2 10
我们能否根据 x1 x2 10就判定这两个水稻 品种平均产量不同?结论是,不一定。
这里,试验的表面差异 ( x1 x2 )是由两部分组
( x1 x2 )
与试验误差
二、显著性检验的步骤
【例3· 1】 已知某品种玉米单穗重 ~N
0 300g, (300,9.52),即单穗重总体平均数
标准差 穗重
x
9.5g。在种植过程中喷洒了某种 308g,试问这种药剂对该品种玉
药剂的植株中随机抽取9个果穗 ,测得平均单
x
米的平均单穗重有无真实影响?
(一)提出假设
首先对样本所在的总体作一个假设。假设喷 洒了药剂的玉米单穗重总体平均数
与原
来的玉米单穗重总体平均数 0 之间没有真 实差异,即 0 0 或 0。也就是假设 表面差异
( x 0 )是由抽样误差造成的。
这种假设通常称为无效假设或零假设,记 为 H 0 : 0 。无效假设是待检验的假设,它有 可能被接受,也有可能被否定。
这也是这两种方法最基本的区别。
假设检验又叫显著性检验是统计学中的一
个重要内容 。 显著性检验的方法很多 ,常用的有u检 验、t检验、F检验和2检验等。尽管这些 检验方法的使用条件及用途不同,但检验
的基本原理是相同的。
假设检验基本思想
它是利用小概率反证法思想,从问题的
对立面(H0)出发间接判断要解决的问题 (H1)是否成立。然后在H0成立的条件下 计算检验统计量,最后获得P值来判断。
例如,目前我国大豆育种工作者认为,大 豆籽粒蛋白质含量超过45%(0)的品种为高
蛋白品种。如果进行样品含量检测 ,我们关心
的是 x 所在的总体平均数 设则为HA: 例如当
此时的无效假设仍为H0:
大于 0 。
。
线的右尾,即 [u , )
0。这时否定域位于u 分布曲
。 )
u0.05=1.96,两尾概率为0.01的临界 u 值为 =2.58,即: u0.01
P(| |>1.96)
u
= P( u >1.96)+ P( <-1.96)
=0.05
u
P(| |>2.58) = P( >2.58)+ P( <-2.58) =0.01
u
u u
u
根据样本数据计算所得的 u值为2.526,介
u
u
u|≥ u,则在 水平上否定 H : 若| u | < u ,则 不 能 在 水 平 上 否
若|
0
0
定H 0 : 0 。
, u 和 u , 称为水平 上的否定域,而区间 ( u , u ) 则称为 水平
区间
上的接受域。