多元正态总体均值向量与协差阵的假设检验模版(PPT33张)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
接受原假设。
统计量的选取:当
未知时,用
的无偏估计
1 n 1
S
来
代替,而样本离差阵
n
S (X() X )(X() X ) Wp(n 1,) 1
n(X-0) Np(0,)
T 2 (n 1) n(X 0)S1 n(X 0)
T(2 p,n p)
且 两 组 样 本 相 互 独 立 , 1 0, 2 0
H 0 : 1 =2 H 1 :12
分两种情况:
⑴ n=m
令 Z (i) X (i) Y(i) i 1, , n
1 n
Z n i1 Z (i) X Y
n
S (Z( j) Z )(Z( j) Z ) j 1 n
m
S2 (Y() Y )(Y() Y ), Y (Y1, ,Yp ) 1
给定检验水平,做出判断
下述假设检验统计量的选取和前面的思路是一样的,只给出统计量 和分布。
4 协差阵不等时,两个正态总体均值向量的检验
设 X ()(X 1, ,X p) N p(1, ) = 1 , , n Y ()(Y 1, ,Y p) N p(1, ) = 1 , , m
F( p, n p 1)
n p 1 ( p, n, 2) F (2 p, 2(n p))
p
( p,n,2)
当 p 1时 有 :
n1 1 (1, n1 , n 2 ) n 2 (1, n1 , n 2 )
当 p 2时 有 :
F (n2 , n1 )
n1 -1 1 ( 2 , n1 , n 2 )
其 中 : ( 在 H 0 成 立 时 )
T
2
(n
m
2)
nm nm
(X
Y
)
S 1
nm (X nm
Y
)
S S1 S2
n
S1 (X() X )(X() X ), X (X1, 1
, X p )
= ( X ( j) Y(i) X Y )( X ( j) Y(i) X Y )
检验统计量: j1
T n ( n 1 ) Z S 1 Z T 2 ( p , n 1 ) ( 在 H 0 成 立 时 )
⑵ nm,不妨假设 n m
令 Z(i) X(i)
n mY(i)
1 nm
n
Y(i)-
j1
1 m
m
Y(i) i
j1
1,
,n
Z
1 n
n i1
Z(i)
XY
n
S (Z(j) Z)(Z(j) Z) j1
检验统计量:
Fn(np)ZS1Z F(p,np) p
5 多个正态总体均值向量的检验
复习一元方差分析 Wilks 分布 多个正态总体均值向量的检验
5 多个正态总体均值向量的检验
2
界 值 困 难 , 可 用 此 极 限 分 布 。
2. 多个协差阵相等检验
设 k 个 正 态 总 体 分 别 为 N p (1 , 1 ) , ,N p (k , k ) , i 0 ,
➢ 单个正态总体均值向量的检验 协差阵已知时的检验 协差阵未知时的检验
➢ 两个正态总体均值向量的检验 协差阵相等时 协差阵不等时
➢ 多个正态总体均值向量的检验
3.1 均值向量的检验
1 Hotelling T 2 分布
⑴ 定义:设 XN p(, ),SW p(n , ) 且 X与 S相 互 独 立
n p ,则统计量T2=nXS1X的分布为非中心Hotelling T 2 分布,记为 T2 T2(p,n,)。 当 0 ,称 T 2 服从 (中心)Hotelling T 2 分布,记为 T 2 ( p , n )。
(且 1两 )组 有样 共本 同相 协互 差独 阵立 时, X1 ni n1X(i) ,Ym 1im 1Y(i)
H 0 : 1 =2 H 1 :12
检验统计量:
T 0 2 n n m m ( X Y ) 1 ( X Y ) 2 ( p ) ( 在 H 0 成 立 时 )
X1(k X2(k
) )
X (k nk
)
此 全 处 部 X样 i(k品 ) 的 (X总 i(1k)均 , 值 , X向 i(pk)量 ), : i 1, , nk
X1 k
n 1p
1
n i1
Xi()
各总体样品的均值向量:
(X1,
,Xp)
X()=1n
⑵ 未知时均值向量的检验
H 0 : = 0 H 1 :0
检验统计量:
(n ( - n 1 ) - 1 ) p p 1 T 2 F (p ,n p ) ( 在 H 0 成 立 时 )
其中 T 2 (n 1 ) n (X 0 ) S 1n (X 0 )
给定检验水平 ,查 F 分布表,确定出临界值 ,判断是否
显然,
t2n(X ˆ 2)2n(X)( ˆ2) 1(X)
t 与上面给出T 2 的统计量形式类似。T 2分布是一元统计中 分布的推广。
⑵基本性质: 定理 若 XN p(0 , ),SW p(n, )且 X与 S相 互 独 立 令 T2=nXS1X,则
n-p1T2 F(p,np1) np
2 均值向量的检验
令Y() DX() =1,,n
则 Y() Np(D,DD) Np(,)
检验0 p 检验统计量:
np
exp
1 2
trS
S
1 2
e n
2
其中
n
S = (Y( ) Y )(Y( ) Y ) 1
2 ln的 极 限 分 布 是 2 p (p 1 )分 布 , 因 为 分 布 计 算 临
检验统计量:
T 0 2 n ( X 0 ) 1 ( X 0 )2 ( p ) ( 在 H 0 成 立 时 )
给定检验水平 ,查 2 分布表,可确定出临界值 ,再
用样本值计算出T
2 0
,判断是否接受H
0。
思考: 统计量的选取 ,联系一元统计为什么取这样的统
计量;二这个统计量为什么服从这样的分布 。
在实际应用中,经常把 统计量化为 T 2
统计量进而化为F 统计量,利用 F 统计量来解决多
元统计分析中有关检验问题。
① n2 =1时,用n代替n1 得到下面的关系式:
(
p,
n,1)
1
1 n
1 T2(
p,
n)
n
p
所以
n p 1 1 ( p, n,1) p ( p, n,1)
② n2 = 2 时
(这个统计量的分布首先由 Harold Hotelling 提 出来的,我国著名统计学家许宝騄先生在1938年用 不同的方法也导出了此分布的密度函数)
在一元统计中,若 则统计量:
X1,
, Xn来自总体N ( , 2 )的样本,
t
n(X) ˆ
t(n1)分 布
其中
ˆ2= 1 n n1i1
(Xi
X)2
n2
(2, n1, n2 )
F (2 n2 , 2(n1 1))
对一些特殊的 统计量可以化为 F 统计量,
而当
n2 2,,p 可2用 统计 2量或 统计F 量来近
似表示。
⑶ 多个正态总体均值向量检验
设 有 k个 p元 正 态 总 体 N p(1, ), ,? N p(k, ? ),从 每 个 总 体
抽 取 独 立 样 品 个 数 分 别 为 n 1, ,nk,n 1 ? nk n,?每 个 样 品 观 测 p个 指 标 得 观 测 数 据 :
第一个总体: XX12((1111))
X (1) n11
X (1) 12
X (1) 22
X (1) n1 2
X (1) 1p
X (1) 2p
X (1) n1p
第三章 多元正态总体均值向量 和协差阵的假设检验
3.1 均值向量的检验 3.2 协差阵的检验 3.3 附注
本章学习目标
熟练掌握多元正态总体均值向量和协差阵的假设 检验的基本思想、基本步骤以及统计量的选取。
掌握 Hotelling T 2 分布和 Wilks 分布的定义。 会运用假设检验的方法解决实际的问题。
⑴ 复习一元方差分析(单因素方差分析) 多元方差分析是一元方差分析的推广 , 先复习一元方差分析。
⑵ Wilks分布
在一元总体中,方差是刻划随机变量分散 程度的一个重要特征,而方差概念在多变 量情况下变为协差阵。使用一个数量指标 来反映协差阵所体现的分散程度的方法很 多,我们用行列式这种方法。
定义 1 若X Np(,),则称协差阵的行列式
为X
的广义方差。称
1 n
S
为样本广义方差。其
中 。 n S (X() X)(X() X)
1
定义 2 若 A 1W p ( n 1 , ) ,n 1 p ,A 2W p ( n 2 , ) 0 且A 1 和
A 2 相互独立,则称 A1 A1A2 为Wilks 统计量, 的分布称为Wilks 分布,其中 n 1 , n 2 为自由度
组内离差阵
k n
T
( Xi( )
X
)(
X
( i
)
X
)
1 i1
总离差阵
T AE 检 验 假 设
H 0 : 1=2==k H 1 :至 少 存 在 ij,使 ij
用似然比原则构成的检验统计量为:
= E E (p,nk,k1) T AE
给定检验水平,查 Wilks 分布表,确定临界值, 作出判断。
1p
n i1
Xi()
此处
(X1(),
,Xp()) =1, ,k
X(j)
1n
n i1
Xi(j) j
1,
,p
类似一元方差分析方法,将平方和变成离差阵:
k
A n (X () X )(X () X ) 1
组间离差阵
k n
E
(
X
( i
)
X
(
)
)(
X
( i
)
X
( )
)
1 i1
假设检验的步骤
第一步:提出待检验的假设 H
0 和H
;
1
第二步:给出检验的统计量及它服从的分布;
第三步:给定检验水平 ,查统计量的分布 表,确定临界值 ,从而得到否定域;
第四步:根据样本观测值计算出统计量的值,看
是否落入否定域中,以便对待判假设检验做出决 策。
3.1 均值向量的检验
Hotelling T 2 分布 均值向量的检验
⑴ H 0: p H 1: p
检验统计量:
np
exp
1 2
trS
S
1 2
e n
2
其中
n
S= ( X ( ) X )( X ( ) X ) 1
( 2 ) H 0 : 0 p H 1 : 0 p 0 0
存 在 D (D 0 )使 D 0 D p
当查 Wilks 分布表不方便时,可用的 2或 F 来
近似。
想一想:Wilks分布与 2 ,F 的关系。
3.2 协差阵的检验
一个正态总体协差阵检验 多个协差阵相等检验
1 一个正态总体协差阵检验
设 X () (X 1 , ,X p ) (= 1 ,, n )来 自 p 元 正 态 总 体 N p (, ) 的 样 本 , 0 未 知 。
给出检验水平 ,查表,确定出临界值。
思考:这个统计量当 p 1 时是我们学习过的三大统计量
中的哪一个?
( 2 ) 有 共 同 的 未 知 协 差 阵 0 时
检H 验0 : 统计1 = 量2 : H 1 :12
F ( n m 2 ) p 1 T 2F ( p ,n m p 1 ) ( n m 2 ) p
X (1) 1
X (1) 2
X (1) n1
此处Xi(1)
(
X (1) i1
,
,
X (1) ip
),
i
1,
, n1
第k个总体: XX12((11kk
)k) 12
X (k) 22
X (k) nk 2
X (k) 1p
X (k) 2p
X (k) nk p
再根据 Hotelling T2的 性 质 , 所 以
(n-1)-p1T2 F(p,np) (n1)p
3 协差阵相等时,两个正态总体均值向量的检验
设 X() (X1, ,Xp) Np(1,) = 1 ,, n Y() (Y1, ,Yp) Np(1,) = 1 ,, m
设 p 元正态总体 NP (,) ,从总体中抽取容量为n 的
样本 X ( 1 ) , ,X ( n ) ,X 1 n i n 1 X ( i) ,S i n 1 ( X ( i) X ) ( X ( i) X ) 。
⑴ 已知时均值向量的检验
H 0 : = ( 00 为 已 知 向 量 ) H 1 : 0