多元正态均值向量和协方差矩阵的检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
76
58.1
12.5
3
92
63.2
14.5
4
81
59.0
14.0
5
81
60.8
15.5
6
84
59.5
14.0
检验三个指标的均值是否有关系
1 6
1
1 4
2
3
2020/5/23
30
H0
:
1 6
1
1 4
2
3
H1
:
1 6
1,
1 4
2
,
3至少有两个不相等
T 2 n(Cx)CSC1 (Cx) ~ T (k,n 1)
Var
(x)
cov(
x2 ,
x1
)
var( x2 )
cov(xp , x1) cov(xp , x2 )
cov(x1, xp ) cov( x2 , xp )
var( xp )
2020/5/23
5
由于样本均值
x
~
Np
(
,
1 n
)
,所以有
T02
(x
0
)
1 n
1
(x
0 )
n(x 0 )1(x 0 )
2020/5/23
15
由极大似然比原理,如果取值太小,说 明H0为真的时观测到此样本的概率要小得多 ,故有理由认为假设H0不成立。
可以证明当样本容量很大时
-2 ln
-2 ln
max
θ0
max θ
( L x(1) , x(2) ,..., x(n);θ) ( L x(1) , x(2) ,..., x(n);θ)
霍特林(Hotelling)T 2 统计量
T 2 n(x 0)S1 (x 0)
2020/5/23
8
在原假设为真时
n p T 2 ~ F( p,n p) p(n 1)
对显著性水平 ,检验的规则为:
当
n p T p(n 1)
2
F
( p,n
p)
,拒绝原假设;
当
n p T p(n 1)
2
F
(
p,
2020/5/23
3
1、总体协方差矩阵已知时 由于 x1,x2, ,xn是来自多元正态总体的简单随机样本
x1 (x11, x21, , xp1)
x2 (x12, x22, , xp2 ) xn (x1n , x2n , , xpn )
(1, 2 , , p )
2020/5/23
4
var( x1) cov(x1, x2 )
2020/5/23
22
1 1 0 0
令
C 1
0
1
0
1 0 0 1
则与上面的原假设等价的假设为
H0 : C 0
H1 : C 0
例 假定人类的体形有这样的一般规律:身高、胸围和
上臂围平均尺寸比例为6:4:1。检验身高、胸围和上臂 围平均尺寸比例是否符合这一规律。
2020/5/23
23
H0
:
1 6
1
1 4
2
3
H1
:
1 6
1,
1 4
2
,
3至少有两个不相等。
C
2 1
3 0
0 6
则上面的假设可以表达为 H0 : C 0; H1 : C 0
2020/5/23
24
设 x1, x2, , xn 取自多元正态总体N p (,)的一个样本。 前面,我们已经利用样本,检验均值向量是否等于一个指 定的向量。在实际问题中,我们也需要检验均值向量的分 量之间是否存在某一指定的结构关系,即检验
近似服从自由度为f的卡方分布,其中自由 度为 的维数减 0的维数。
2020/5/23
16
下面我们讨论
H0 : μ=μ0;H1 : μ μ0
的似然比检验。
np
max L(μ, Σ) (2 ) 2
A n/2 np e2
μ,Σ0
n
其中
n
A (Xi - X)(Xi - X) i1
2020/5/23
x (x1, x2, , xn1 )和 y ( y1, y2 , , yn2 ) 且 0,n1, n2 p。
考虑假设 H0 : 1 2; H1 : 1 2
2020/5/23
32
根据两个样本可得1和2的无偏估计量为
x
1 n1
x n1
i1
i
y
1 n2
y n2
i 1
i
2020/5/23
33
X
服从自由度为p的卡方分布。
当原假设为真时,T02 n(x 0 )1(x 0 ) 服从自由度
为p的中心卡方分布。所以,我们用
T02 n(x 0 )1(x 0 )
作为检验的统计量,对显著性水平,检验的规则为:
2020/5/23
6
当T02 2 ( p)时,接受原假设; 当T02 2 ( p)时,拒绝原假设。
17
原假设成立时,有
np
max Σ0
L(μ
0
,
Σ)
Fra Baidu bibliotek
(2
)
2
A0 n
n/2 np
e2
n
其中 A0 (X - μ0 )(X - μ0 ) i1
A n 2 0
A
n 2
A0 A
n
2
2020/5/23
18
我们来讨论一下,似然比检验的 统计 量和霍特林的T平方统计量的关系。
n
A0 (Xi X X μ0 )(Xi X X μ0 ) i1
p 1T n2 2)
2
F
(
p, n1
n2
p
1)
时,拒绝原假设;
当
n1 n2 p(n1
p 1T n2 2)
2
F
(
p,
n1
n2
p
1)
时,接受原假设。
2020/5/23
35
二、成对试验的T 2 统计量
前面我们讨论的是两个独立样本的检验问题,但是不 少的实际问题中,两个样本的数据是成对出现的。例如检 验男女职工的工资收入是否存在差异;一种新药的疗效等。
n
(Xi X)(Xi X) n(X μ0 )(X μ0) i1
A n(X μ0)(X μ0)
2020/5/23
19
有
A0 A n(X μ0)(X μ0)
A
n(X μ0 )
n(X μ0) I
A 1 n(X μ0)A1(X μ0)
A0 A
1
n(X
μ0
CSC ~ Wk (n,CΣC)
nCx ~ Nk ( nC,CΣC),
T 2 nCx C CSC1 Cx C
2020/5/23
26
为了检验H0:C= ,可以用统计量
T 2 n(Cx )CSC1 (Cx )
当为真时 H0:C= 时
n k T 2 ~ F(k,n k) k(n 1)
对给定的显著性水平,检验的规则
12
注:似然比统计量
在数理统计中关于总体参数的假设检验, 通常还可以利用最大似然原理导出似然比统 计量进行检验。
设p维总体的密度函数为
f (x,θ)
其中 θ 是未知参数,θΘ参数空间。
2020/5/23
13
有如下假设:
H0 : θΘ0
H1 : θ Θ0
现在从总体中抽出容量为n的样本
x(1),x(2),...,x(n)
F n k T 2 6 2 47.143=18.8572 k(n 1) 2(6 1)
2020/5/23
31
第三节 两个总体均值的检验 一、两个独立样本的情形
与一元随机变量的情形相同,常常我们需要检验两个 总体的均值是否相等。
设从总体 N p (1,) 和 N p (2,)中各自独立地抽取样本
H0 : C H1 : C
其中C为一已知的kp阶矩阵,k<p, rank(C)=k , 为已知的k维向量。根据多元正态分布的性质可知
Cx ~ Nk (C,CC), rank(CC) k, CSC 0
2020/5/23
25
Cx
~
Nk
(C,C
Σ n
C),
(n 1)S ~ Wp (n, Σ)
37
中小企业的破产模型 为了研究中小企业的破产模型,首先选定了X1总负债 率(现金收益/总负债),X2收益性指标(纯收入/总财 产),X3短期支付能力(流动资产/流动负债)和X4生产 效率性指标(流动资产/纯销售额)4个经济指标,对17个 破产企业为“1”和正常运行企业“2”进行了调查,得资 料如下。如果这些指标是用来做判别分析和聚类分析的变 量,他们之间没有显著性差异是不恰当的,所以检验所选 择的指标在不同类型企业之间是否有显著的差异。
样本的联合密度函数为
n
( L x(1), x(2),..., x(n);θ) f (x(i);θ) i1
2020/5/23
14
引入似然比统计量
max
θ0
max θ
(L x(1) , x(2) ,..., x(n);θ) (L x(1) , x(2) ,..., x(n);θ)
由于0 ,所以统计量取值在0到1之间。
1 )A1
(X
μ0
)
1
1 1
T2
n 1
2020/5/23
20
三个统计量是等价的,有
T 2 T2 F F
2020/5/23
21
第二节 单个总体均值分量间结构关系的检验
例 设x1,x2, …,xn取自该总体Np(,)的样本, =(1, 2 , … p),检验
H0: 1= 2 = …= p= H1: 至少存在一对i和j,使i j
当
nk T k(n 1)
2
F
(k , n
k)
时,拒绝原假设;
当
nk T k(n 1)
2
F
(k , n
k)
时,接受原假设。
2020/5/23
27
特别当=0 ,即检验H0:C=0 , H1:C0,则
T 2 n(Cx)CSC1 (Cx)
S
1 (n 1)
n i1
(xi
x)(xi
x)
2020/5/23
28
36
检验的统计量T 2 ndSd1d
其中 d x y
Sd
n
1
1
n
i1(di
d)(di
d)
当原假设 0为真时,统计量
n p T2 p(n 1)
服从自由度为n p和 p 的 F 分布。
检验规则为:
当时
n p T2 p(n 1)
F ( p, n
p)
,拒绝原假设,否则接受原
假设。
2020/5/23
Y
~
N
p
(1
2,
(1 n2
1 n2
))
n2n1
n1 n2
XY
~ N p (1 2,)
因为两个总体的协方差矩阵相等,所以我们可以用
样本的联合协方差矩阵来估计
E (n1 1)S1 (n2 1)S2 ~ Wp (n1 n2 2,)
S1
1 n1 1
n1 i1
(xi
x)(xi
x)
2020/5/23
设(xi,yi),i=1,2,3,…,n(n>p),是成对的试验数据,总体 X和y均服从p维正态分布,且协方差相等。令di=xi-yi,则 di=xi-yi服从正态分布 di ~ N p ( , d ) , 1 2 。
检验假设 H0 : 1 2
H1 : 1 2
H0 : 0
H1 : 0
2020/5/23
p P{ 2 ( p) 所计算出的样本统计量 值 ,则拒绝原假设; p P{ 2 ( p) 所计算出的样本统计量 值 ,则接受原假设。
2020/5/23
7
2、总体协方差矩阵未知时 总体的协方差矩阵未知,用样本的协方差矩阵
S
1 (n 1)
n i1
(xi
x)(xi
x)
替代 T02 n(x 0 )1(x 0 ) 中的总体协方差,得
在例中,假定人类的体形有这样一个一般规 律的身高、胸围和上臂围平均尺寸比例为6:4:1。 检验比例是否符合这一规律。检验:
H0
:
1 6
1
1 4
2
3
H1
:
1 6
1,
1 4
2
,
3至少有两个不等
2020/5/23
29
某地区农村男婴的体格测量数据如下
编号 1
身高(cm) 78
胸围(cm) 60.6
上半臂长(cm) 16.5
2020/5/23
2
第一节 单个总体均值向量的推断 一、均值向量的检验
设 x1,x2, ,xn 是取自多元正态总体 N p (,) 的一个样 本, 0 ,现欲检验
H0 : μ μ0 H1 : μ μ0 由于总体的协方差矩阵可能未知或已知,所以在检验时 必须采用有不同的的统计量,所以我们分成两种情况来讨 论。
2020/5/23
11
x (20.92 8.06 11.78 1.090)
0.26
Σ
0.08
1.639
0.156
0.08 1.513 0.222 0.019
1.639 0.222 26.626 2.233
0.156
0.019
2.233
1.346
试问企业的市场结构是否发生了变化?
2020/5/23
n
p)
,接受原假设。
2020/5/23
9
【例】人的出汗多少与人体内的钠和钾的含量 有一定的关系,今测量了20位成年女性的出汗 量、钠含量和钾含量。试检验:
H 0 :μ μ0 4 50 10
2020/5/23
10
例 在企业市场结构研究中,起决定作用
的指标有市场份额X1,企业规模(资产净值 总额的自然对数)X2,资本收益率X3和总收 益增长率X4。为了研究美国市场的变动,夏 菲尔德抽取了美国231个大型企业,调查这些 企业某十年的资料。假设以前企业市场结构 的均值向量为(20,7.5,10,2)’,该调查所得的 样本均值向量和样本协方差矩阵如下。
第三章 多元正态均值向量和协方差
矩阵的检验
2020/5/23
1
内容
第一节 单个总体均值向量的推断 第二节 单个总体均值分量间结构关系的检验 第三节 两个总体均值的检验 第四节 两个总体均值分量间结构关系的检验 第五节 多个总体均值的比较检验(多元方差分析) 第六节 正态总体协方差矩阵的检验 第七节 在SAS多元假设检验过程
S2
1 n2 1
n2 i1
(yi
y)(yi
y)
34
霍特林(Hotelling)统计量T 2为:
1
T
2
n1n2 n1 n2
(x
y)
(n1
E n2
2)
(x y)
当原假设为真的条件下,统计量
n1 n2 p(n1
n2
p 1T 2)
2
~
F(
p,
n1
n2
p
1)
检验的规则为:
当
n1 n2 p(n1