数理统计 第三章 假设检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
其中μ0和检验水平α给定。
1、正态总体的方差σ2已知 对于检验(1),称为双边检验 H 0 : 0 H1 : 0 在估计理论中用样本均值作为总 体均值的估计。在直观上,若原
假设H0成立,样本均值与μ0的差 别不应太大,若差别过大,就有 理由拒绝原假设。但是在考虑两 者的差时,还应该考虑总体均方 差的取值。
第三章 假设检验
假设检验问题,就是通过从有关 总体抽取一定容量的样本,利用 样本去检验总体分布是否具有某 种特征。假设检验问题大致分为 两类:
(1)参数检验问题:即总体的分布 形式已知(如正态,指数,二项 分布等),总体分布依赖于未知 参数(或参数向量)θ,要检验的是 有关未知参数的假设。例如总体
2 1 2 2
当μ0和检验水平α给定时,讨论 下列检验问题:
H 0 : 2 1 0 H1 : 2 1 0 H 0 : 2 1 0 H1 : 2 1 0 H 0 : 2 1 0 H1 : 2 1 0
1, | T | t 2 ( n 1) (X ) 0, | T | t 2 (n 1)
同理可得检验(2),(3)的拒绝域与检 验函数。 检验统计量仍然取
X T S n
对于检验(2),当原假设成立时,有 X 0 P{ t (n 1)}
缩小拒绝域,使接受域增大,这 必然导致犯第二类错误的概率增 大,反之亦然。因此Neyman— Paerson提出了一条原则,就是 限制犯第一类错误概率的原则,
即在保证犯第一类错误的概率不 超过指定数值α(0<α<1,通常取 较小的数)的检验中,寻找犯第二 类错误概率尽可能小的检验。
若记: S : ( ) , 0 S 表示由所有犯第一类错误的概 率不超过α的检验函数构成的类. 只考虑 S 中的检验,在 S 中挑 选“犯第二类错误的概率尽可能小
显然,检验函数为拒绝域的示性 函数。当φ(X)=1时,拒绝原假设, 当φ(X)=0时,接受原假设。检验 函数完全的表示了检验规则。 在通常的情况下,检验的拒绝域
可以通过一个统计量来表示,这 个统计量称为检验统计量。此时, 拒绝域和接受域之间常用一个或 几个数值分开,称这些值为检验 的临界值。
4、两类错误 第一类错误:原假设为真,而错 误的拒绝了原假设,称为弃真。 拒绝正确的原假设H0等价于 X S
为对立假设。因此原假设H0和对 立假设H1的地位是不平等的,不 能相互调换。 与犯第一类错误概率相联系的另 一个概念是检验水平。
定义2:设φ是 H 0 : 0 H1 : 1 的一个检验,而0≤α≤1。如果 φ犯第一类错误的概率总不超过 α,则称α是检验φ的一个水平, 而φ称为显著性水平α的检验。
S n
于是检验的拒绝域为:
S {( X 1 , X 2 ,, X n ) : T t (n 1)}
T
对于检验(3),当原假设成立时,有 X 0 P{ t (n 1)} S n 于是检验的拒绝域为:
S {( X 1 , X 2 ,, X n ) : T t (n 1)}
( ) P (第二类错误) P X S ) (
* c
1 E ( ( X)) 1 ( ), 1
一个好的检验函数,犯两类错误的 概率都应较小,也就是功效函数 在0中应尽可能的小,在1中尽 可能的大。
6、检验水平 希望一个检验犯两类错误的概 率都小,一般在固定样本大小时, 对任何检验都办不到。例如:要 犯第一类错误的概率减小,就要
对于检验(1),当原假设成立,及给 定的显著性水平α,有: | X 0 | P{| T | t 2 (n 1)} S n 则认为,检验(1)的水平为α的拒绝
域为:
S {( X 1 , X 2 ,, X n ) :| T | t 2 (n 1)}
T
该检验称为t检验,其检验函数为:
T
二、单个正态总体方差的检验
设X=(X1,X2,…,Xn)为从正态 总体N(μ,σ2)中抽取的简单随机 样本,给定检验水平α,求下列 三类检验:
(1) H 0 : H1 :
2 2 0 2 2 2 0 2
2 0 2 0
(2) H 0 : H1 :
P (第二类错误 ) P (X S )
C
1 E ( (X )), 1
5、功效函数 定义1:设 (X)是H 0 : 0 H1 : 1 的一个检验函数,则:
( ) P (用检验 ( X )拒绝了 H 0 )
E ( ( X)),
2 1 2 2
当检验水平α给定时,讨论下列检 验问题:
2 2 2 2 (1) H 0 : 2 1 H1 : 2 1 1 1 2 2 2 2 ( 2) H 0 : 2 1 H1 : 2 1 1 1 2 2 2 2 (3) H 0 : 2 1 H1 : 2 1 1 1
间,它们是有关系的,不会相互 独立。另一方面X1,X 2,…. Xn是n 个不同失眠病人的睡眠时间,由 于个 人体质诸方面的条件不同, 这n个观察值不能认为是来自同一
检验函数犯第一类错误的概率为:
P (第一类错误) P X S) ( E((X)), 0
这个概率一般随在0中取值的变 化而变化。
第二类错误:原假设不真,而错 误的接受了原假设,又称为取伪, c 接受错误的原假设H0等价于 X S 一般地,检验函数犯第二类错误 的概率为:
第一节 假设检验的基本概念 一、假设检验问题的提出 实际推断原理:小概率事件 在一次试验中几乎不会发生;或 者说在一次试验中观察到的事件 不会是小概率事件。
实际推断原理是假设检验的 基本原则,类似于数学推断中的 反证法,但是又与反证法有本质 的不同。
二、基本概念 1、总体分布族 假设 X 1 , X 2 ,, X n 是来自于分 布族 { f ( x, ) : } 中某一分布的 简单随机样本。目前我们只考
因此检验统计量取值为:
X U 0 / n
当原假设为真,即 0 时,检 验统计量 U ~ N (0,1)
对于给定的检验水平α,有
P(| U | u 2 ) 1
于是,当总体的方差已知时,双 边检验(1)的检验水平为α的拒 T S 绝域为: {( X 1 ,..., X n ) :| U | u }
赖于未知参数;当样本落入S时就 拒绝原假设H0而接受对立假设H1, c 否则就接受原假设H0。划分 (S , S ) 称为假设检验问题 " H 0 H1" 的一 个检验。称S为该检验的拒绝域,
而 S 为该检验的接受域。 为了研究的方便,常用检验函 数φ(X)来描述检验规则:
c
1 , XS (X ) C 0 , X S
2 2 : 2 0 H1: 2 0 (3) H 0
其中 及检验水平α给定。
2 0
三、两个正态总体均值差的检验 设 X ( X 1 , X 2 , L , X m ), Y (Y1 , Y2 , L , Yn ) 分别来自两个相互独立的正态总体
X ~ N ( 1 , ), Y ~ N ( 2 , )
的检验”,这种法则称为控制犯第 一类错误概率的法则。 根据Neyman—Paerson原则, 在原假设H0为真时,作出错误决 定(即否定H0)的概率受到了控制.
这表明,原假设H0受到保护,不至 于轻易被否定。所以在具体问题 中,往往将有把握、不轻易否定 的命题作为原假设H0,而把没有 把握的、不能轻易肯定的命题作
1、当 , 已知时均值差的检验
2 1 2 2
2、当
2 1 2 2
2
未知时均值差
的检验
四、两个正态总体方差比的检验
设 X ( X 1 , X 2 ,, X m ), Y (Y1 , Y2 ,, Yn ) 分别来自两个相互独立的正态总体
X ~ N ( 1 , ), Y ~ N ( 2 , )
X ~ N ( , )
2
μ未知,检验:
H 0 : 0 H1 : 0 H 0 : 0 H1 : 0
(2)非参数型假设检验:如果总体 分布形式未知,此时就需要有一 种与总体分布族的具体数学形式 无关的统计方法,称为非参数方 法。例如检验一批数据是否来自 某个已知的正态总体的问题。
虑参数分布族,即概率密度或概 率函数的形式已知,参数的真值 属于已知的参数空间但是未知。 与参数估计的问题一样,总体分 布族的确定建立了统计模型。
2、原假设与对立假设 在实际问题中,研究人员往往 提出某个假设,并希望通过样本 来检验该假设是否成立。在上例 中,检验人员关心的问题是:
这批产品的不合格率是否大于0.04, 这个假设可以称为研究假设,在假 设检验问题中,称为对立假设或备 择假设。“不合格率小于等于0.04” 就是研究假设的反面,称为原假设
一般的参数的假设检验问题可 以表示为: H 0 : 0 H 1 : 1
其中 0,1均为 的真子集 且 0 1
wenku.baidu.com
3、检验规则 即根据样本判断能否接受原假 设的规则一般的,最简单的检验 规则是:把样本可能的取值范围 即样本空间划分为两个不相交的 部分 S和S c ,并且这种划分不依
或零假设。原假设常用H0来表示, 对立假设常用H1来表示。在参数 族分布模型中,原假设和对立假 设表现为参数的不同范围。
为了清楚的表达所考虑的原假设 和对立假设,一般的将它们成对 的写出来:
H 0 : p 0.04 H1 : p 0.04 H 0 : p 0.04 ; H1 : p 0.04
第二节 正态总体参数的假设检验 一、单个正态总体均值的检验 设X=(X1,X2,…,Xn)为从正态 总体N(μ,σ2)中抽取的简单随机 样本,给定检验水平α,求下列 三类检验:
(1) H 0 : 0 H 1 : 0 ( 2) H 0 : 0 H 1 : 0 (3) H 0 : 0 H 1 : 0
称为检验的功效函数(power function),也称为势函数。
检验函数犯第一类错误的概率为
* ( ) P (第一类错误) P ( X S )
( ) E ( ( X)), 0
这个概率一般随θ在Θ 0中的取值 变化而变化。
第二类错误:一般的检验函数犯第 二类错误的概率为:
五、成对数据的t检验
前面讨论的用于两个正态总体 均值差、方差比的检验中,假定 了来自两个正态总体的样本是相 互独立的,但在实际问题中,
有时候情况不是这样,可能这两 个正态 总体的样本是来自同一个 总体上的重复观察,它们是成对 出现的,而且是相关的,例如, 为了观察一种安眠药的效果,记
录了n个失眠病人服药前的每晚睡 眠时间 X1,X2 ,… ,Xn和服用此安 眠药后每晚睡眠时间Y1,Y2, …,Yn, 其中(xi : yi)是 第i个病人不服用安 眠药和服用安眠药每晚的睡眠时
2
其检验函数为:
1, (X ) 0, | U | u 2 | U | u 2
2、正态总体的方差σ2未知 当正态总体的方差未知时,检 验统计量就需要改变,在原来的 检验统计量中, σ未知,自然想 到用样本方差去替代总体方差。
于是,取检验统计量为: X T S n 且由T分布的定义知: T ~ t (n 1)
1、正态总体的方差σ2已知 对于检验(1),称为双边检验 H 0 : 0 H1 : 0 在估计理论中用样本均值作为总 体均值的估计。在直观上,若原
假设H0成立,样本均值与μ0的差 别不应太大,若差别过大,就有 理由拒绝原假设。但是在考虑两 者的差时,还应该考虑总体均方 差的取值。
第三章 假设检验
假设检验问题,就是通过从有关 总体抽取一定容量的样本,利用 样本去检验总体分布是否具有某 种特征。假设检验问题大致分为 两类:
(1)参数检验问题:即总体的分布 形式已知(如正态,指数,二项 分布等),总体分布依赖于未知 参数(或参数向量)θ,要检验的是 有关未知参数的假设。例如总体
2 1 2 2
当μ0和检验水平α给定时,讨论 下列检验问题:
H 0 : 2 1 0 H1 : 2 1 0 H 0 : 2 1 0 H1 : 2 1 0 H 0 : 2 1 0 H1 : 2 1 0
1, | T | t 2 ( n 1) (X ) 0, | T | t 2 (n 1)
同理可得检验(2),(3)的拒绝域与检 验函数。 检验统计量仍然取
X T S n
对于检验(2),当原假设成立时,有 X 0 P{ t (n 1)}
缩小拒绝域,使接受域增大,这 必然导致犯第二类错误的概率增 大,反之亦然。因此Neyman— Paerson提出了一条原则,就是 限制犯第一类错误概率的原则,
即在保证犯第一类错误的概率不 超过指定数值α(0<α<1,通常取 较小的数)的检验中,寻找犯第二 类错误概率尽可能小的检验。
若记: S : ( ) , 0 S 表示由所有犯第一类错误的概 率不超过α的检验函数构成的类. 只考虑 S 中的检验,在 S 中挑 选“犯第二类错误的概率尽可能小
显然,检验函数为拒绝域的示性 函数。当φ(X)=1时,拒绝原假设, 当φ(X)=0时,接受原假设。检验 函数完全的表示了检验规则。 在通常的情况下,检验的拒绝域
可以通过一个统计量来表示,这 个统计量称为检验统计量。此时, 拒绝域和接受域之间常用一个或 几个数值分开,称这些值为检验 的临界值。
4、两类错误 第一类错误:原假设为真,而错 误的拒绝了原假设,称为弃真。 拒绝正确的原假设H0等价于 X S
为对立假设。因此原假设H0和对 立假设H1的地位是不平等的,不 能相互调换。 与犯第一类错误概率相联系的另 一个概念是检验水平。
定义2:设φ是 H 0 : 0 H1 : 1 的一个检验,而0≤α≤1。如果 φ犯第一类错误的概率总不超过 α,则称α是检验φ的一个水平, 而φ称为显著性水平α的检验。
S n
于是检验的拒绝域为:
S {( X 1 , X 2 ,, X n ) : T t (n 1)}
T
对于检验(3),当原假设成立时,有 X 0 P{ t (n 1)} S n 于是检验的拒绝域为:
S {( X 1 , X 2 ,, X n ) : T t (n 1)}
( ) P (第二类错误) P X S ) (
* c
1 E ( ( X)) 1 ( ), 1
一个好的检验函数,犯两类错误的 概率都应较小,也就是功效函数 在0中应尽可能的小,在1中尽 可能的大。
6、检验水平 希望一个检验犯两类错误的概 率都小,一般在固定样本大小时, 对任何检验都办不到。例如:要 犯第一类错误的概率减小,就要
对于检验(1),当原假设成立,及给 定的显著性水平α,有: | X 0 | P{| T | t 2 (n 1)} S n 则认为,检验(1)的水平为α的拒绝
域为:
S {( X 1 , X 2 ,, X n ) :| T | t 2 (n 1)}
T
该检验称为t检验,其检验函数为:
T
二、单个正态总体方差的检验
设X=(X1,X2,…,Xn)为从正态 总体N(μ,σ2)中抽取的简单随机 样本,给定检验水平α,求下列 三类检验:
(1) H 0 : H1 :
2 2 0 2 2 2 0 2
2 0 2 0
(2) H 0 : H1 :
P (第二类错误 ) P (X S )
C
1 E ( (X )), 1
5、功效函数 定义1:设 (X)是H 0 : 0 H1 : 1 的一个检验函数,则:
( ) P (用检验 ( X )拒绝了 H 0 )
E ( ( X)),
2 1 2 2
当检验水平α给定时,讨论下列检 验问题:
2 2 2 2 (1) H 0 : 2 1 H1 : 2 1 1 1 2 2 2 2 ( 2) H 0 : 2 1 H1 : 2 1 1 1 2 2 2 2 (3) H 0 : 2 1 H1 : 2 1 1 1
间,它们是有关系的,不会相互 独立。另一方面X1,X 2,…. Xn是n 个不同失眠病人的睡眠时间,由 于个 人体质诸方面的条件不同, 这n个观察值不能认为是来自同一
检验函数犯第一类错误的概率为:
P (第一类错误) P X S) ( E((X)), 0
这个概率一般随在0中取值的变 化而变化。
第二类错误:原假设不真,而错 误的接受了原假设,又称为取伪, c 接受错误的原假设H0等价于 X S 一般地,检验函数犯第二类错误 的概率为:
第一节 假设检验的基本概念 一、假设检验问题的提出 实际推断原理:小概率事件 在一次试验中几乎不会发生;或 者说在一次试验中观察到的事件 不会是小概率事件。
实际推断原理是假设检验的 基本原则,类似于数学推断中的 反证法,但是又与反证法有本质 的不同。
二、基本概念 1、总体分布族 假设 X 1 , X 2 ,, X n 是来自于分 布族 { f ( x, ) : } 中某一分布的 简单随机样本。目前我们只考
因此检验统计量取值为:
X U 0 / n
当原假设为真,即 0 时,检 验统计量 U ~ N (0,1)
对于给定的检验水平α,有
P(| U | u 2 ) 1
于是,当总体的方差已知时,双 边检验(1)的检验水平为α的拒 T S 绝域为: {( X 1 ,..., X n ) :| U | u }
赖于未知参数;当样本落入S时就 拒绝原假设H0而接受对立假设H1, c 否则就接受原假设H0。划分 (S , S ) 称为假设检验问题 " H 0 H1" 的一 个检验。称S为该检验的拒绝域,
而 S 为该检验的接受域。 为了研究的方便,常用检验函 数φ(X)来描述检验规则:
c
1 , XS (X ) C 0 , X S
2 2 : 2 0 H1: 2 0 (3) H 0
其中 及检验水平α给定。
2 0
三、两个正态总体均值差的检验 设 X ( X 1 , X 2 , L , X m ), Y (Y1 , Y2 , L , Yn ) 分别来自两个相互独立的正态总体
X ~ N ( 1 , ), Y ~ N ( 2 , )
的检验”,这种法则称为控制犯第 一类错误概率的法则。 根据Neyman—Paerson原则, 在原假设H0为真时,作出错误决 定(即否定H0)的概率受到了控制.
这表明,原假设H0受到保护,不至 于轻易被否定。所以在具体问题 中,往往将有把握、不轻易否定 的命题作为原假设H0,而把没有 把握的、不能轻易肯定的命题作
1、当 , 已知时均值差的检验
2 1 2 2
2、当
2 1 2 2
2
未知时均值差
的检验
四、两个正态总体方差比的检验
设 X ( X 1 , X 2 ,, X m ), Y (Y1 , Y2 ,, Yn ) 分别来自两个相互独立的正态总体
X ~ N ( 1 , ), Y ~ N ( 2 , )
X ~ N ( , )
2
μ未知,检验:
H 0 : 0 H1 : 0 H 0 : 0 H1 : 0
(2)非参数型假设检验:如果总体 分布形式未知,此时就需要有一 种与总体分布族的具体数学形式 无关的统计方法,称为非参数方 法。例如检验一批数据是否来自 某个已知的正态总体的问题。
虑参数分布族,即概率密度或概 率函数的形式已知,参数的真值 属于已知的参数空间但是未知。 与参数估计的问题一样,总体分 布族的确定建立了统计模型。
2、原假设与对立假设 在实际问题中,研究人员往往 提出某个假设,并希望通过样本 来检验该假设是否成立。在上例 中,检验人员关心的问题是:
这批产品的不合格率是否大于0.04, 这个假设可以称为研究假设,在假 设检验问题中,称为对立假设或备 择假设。“不合格率小于等于0.04” 就是研究假设的反面,称为原假设
一般的参数的假设检验问题可 以表示为: H 0 : 0 H 1 : 1
其中 0,1均为 的真子集 且 0 1
wenku.baidu.com
3、检验规则 即根据样本判断能否接受原假 设的规则一般的,最简单的检验 规则是:把样本可能的取值范围 即样本空间划分为两个不相交的 部分 S和S c ,并且这种划分不依
或零假设。原假设常用H0来表示, 对立假设常用H1来表示。在参数 族分布模型中,原假设和对立假 设表现为参数的不同范围。
为了清楚的表达所考虑的原假设 和对立假设,一般的将它们成对 的写出来:
H 0 : p 0.04 H1 : p 0.04 H 0 : p 0.04 ; H1 : p 0.04
第二节 正态总体参数的假设检验 一、单个正态总体均值的检验 设X=(X1,X2,…,Xn)为从正态 总体N(μ,σ2)中抽取的简单随机 样本,给定检验水平α,求下列 三类检验:
(1) H 0 : 0 H 1 : 0 ( 2) H 0 : 0 H 1 : 0 (3) H 0 : 0 H 1 : 0
称为检验的功效函数(power function),也称为势函数。
检验函数犯第一类错误的概率为
* ( ) P (第一类错误) P ( X S )
( ) E ( ( X)), 0
这个概率一般随θ在Θ 0中的取值 变化而变化。
第二类错误:一般的检验函数犯第 二类错误的概率为:
五、成对数据的t检验
前面讨论的用于两个正态总体 均值差、方差比的检验中,假定 了来自两个正态总体的样本是相 互独立的,但在实际问题中,
有时候情况不是这样,可能这两 个正态 总体的样本是来自同一个 总体上的重复观察,它们是成对 出现的,而且是相关的,例如, 为了观察一种安眠药的效果,记
录了n个失眠病人服药前的每晚睡 眠时间 X1,X2 ,… ,Xn和服用此安 眠药后每晚睡眠时间Y1,Y2, …,Yn, 其中(xi : yi)是 第i个病人不服用安 眠药和服用安眠药每晚的睡眠时
2
其检验函数为:
1, (X ) 0, | U | u 2 | U | u 2
2、正态总体的方差σ2未知 当正态总体的方差未知时,检 验统计量就需要改变,在原来的 检验统计量中, σ未知,自然想 到用样本方差去替代总体方差。
于是,取检验统计量为: X T S n 且由T分布的定义知: T ~ t (n 1)