多元正态总体均值向量和协差阵的假设检验.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章 多元正态总体均值向量和协差阵的假设检验
什么是假设检验及基本思想、计算步骤,在初等数理统计中都已做过介绍。多元分析也涉及这方面内容,在后面介绍的常用各种统计方法,有时要对总体的均值向量和协差阵做检验,比如,对两个总体做判别分析时,事先就需要对两个总体的均值向量做检验,看看是否在统计上有显著差异,否则做判别分析就毫无意义。
本章类似一元统计分析中的各种均值和方差的检验相应给出多元统计分析中的各种均值向量和协差阵的检验。不论做上述任何检验,其基本步骤均可归纳为四步:第一步,提出待检验的假设0H 和1H 。第二步,给出检验的统计量及它服从的分布。第三步,给定检验水平a ,查统计量的分布表,确定临界值a λ,从而得到否定域。第四步根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设检验做出决策(拒绝或接受)。由于各种检验的计算步骤类似,关键在于对不同的检验给出不同的统计量,而有关统计量的给出大多用似然比方法得到。本章只侧重于解释选取统计量的合理性,而不给出推导过程,最后给出几个实例。同时为了说明统计量的分布,自然地给出HotellingT 2分布和Wilks 分布的定义,它们分别是一元统计中t 分布和F 分布的推广。
§3.1 均值向量的检验
为了对多元正态总体均值向量作检验,首先需要给出HotellingT 2分布的定义。 1 HotellingT 2分布
定义 设),(~),,(~∑∑n W S N X p p μ且X 与S 相互独立,p n ≥,则称统计量X S X n T 12-'
=的分布为非中心HotellingT 2分布,记为),,(~22μn p T T 。当0=μ时,称2T 服从(中心)HotellingT 2分布,记为),(2n p T ,由于这一统计量的分布首先由Harold Hotelling 提出来的,故称为HotellingT 2分布,值
得指出的是,我国著名统计学家许宝马录先生在1938年用不同方法也导出T 2分布的密度函数,因表达式很复杂,故略去。
在一元统计中,若n X X ,,1 来自总体),(2σμN 的样本,则统计量:
)1(~ˆ)
(--=
n t X n t σ
μ分布 其中
2
1
2
)(11ˆ∑
=--=n
i i X X n σ
显然,
)()ˆ()(ˆ)(122
2
2
μσμσ
μ-'-=-=-X X n X n t 与上边给出的T 2
统计量形式类似,且⎪⎪⎭
⎫ ⎝⎛-n N X 2,0~σμ。 可见,T 2
分布是一元统计中t 分布的推广。 基本性质:
在一元统计中,若统计量)1(~-n t t 分布,则)1,1(~2-n F t 分布,即把t 分布的统计量转化为F 统计量来处理,在多元统计分析中T 2统计量也具有类似的性质。
定理 若),(~),,0(~∑∑n W S N X p p 且X 与S 相互独立,令X S X n T 12-'
=,则
)1,(~12
+-+-p n p F T np
p n 这个性质在后面经常用到。 2 均值向量的检验
设p 元正态总体),(∑μp N ,从总体中抽取容量为
n 的样本
∑∑=='--==n
i n
i i i i n X X X X S X n X X X X 11
)()()()()2()1())((,1,,,, 。
(1)∑已知时均值向量的检验
01000:H )(:μμμμμ≠=为已知向量H
检验统计量:
)(~)()(201020p X X n T χμμ-∑'-=-(在H 0成立时)
给出检验水平a ,查2
χ分布表使{}
a T P a =>λ20,可确定出临界值a λ,再用样本值计算出20T ,若
a T λ>20,则否定H 0,否则H 0相容。
这里要对统计量的选取作两点解释,一是说明它为什么取为这种形式。二是说明它为什么服从)(2p χ分布。
一元统计中,当2σ已知时,作均值检验所取的统计量为:
)1,0(~0
N n
X U σ
μ-=
显然,
)())(()(01202
2
02
μσμσ
μ--=-=
-X X n X n U
与上边给出的检验统计量20T 形式相同。另外根据二次型分布定理:若),0(~∑p N X ,则
)(~21p X X E X -'。显然,1001020)()()(--∑'-=-∑'-=μμμX n X X n T )(0μ-X n
Y Y 1-∑'∆。其中,),0(~)(0∑-=p N X n Y μ,因此,)(~)()(201020p X X n T χμμ-∑'-=-。
(2)∑未知时均值向量的检验 00:μμ=H 01:μμ≠H 检验统计量: ),(~)1(1)1(2
p n p F T p n p n --+--(在H 0成立时)
其中[
]
)()()1(01
'02
μμ---=-X n S
X n n T
给定检验水平a ,查F 分布表,使a F T p n p n p a =⎭
⎬⎫
⎩⎨
⎧>--2)1(,可确定出临界值a F ,再用样本值计算出2T ,若
a F T p
n p n >--2
)1(,则否定0H ,否则0H 相容。 这里需要解释的是,当∑未知时,自然想到要用样本协差阵S n 1
1
-去代替∑,因(n-1)S -1是1-∑的无偏估计量,而样本离差阵
),1(~)()()(1
)
(∑-'--=
∑=n W X X X X
S p a n
x a