多元正态分布均值向量和协差阵的检验(ppt 45页)
第三章多元正态均值向量和协方差矩阵的检验
2022/2/18
3
第3页,此课件共92页哦
1、总体协方差矩阵已知时
由于 x1, x2,是, xn来自多元正态总体的简单随机样本 x1 (x11, x21,, xp1)
x2 (x12 , x22 ,, xp2 ) xn (x1n , x2n ,, xpn )
(1, 2 ,, p )
2022/2/18
T 2 n(Cx)CSC1 (Cx)
S
1 (n 1)
n i1
(xi
x)(xi
x)
2022/2/18
28
第28页,此课件共92页哦
在例中,假定人类的体形有这样一个一般规 律的身高、胸围和上臂围平均尺寸比例为6:4:1。 检验比例是否符合这一规律。检验:
H0
:
1 6
1
1 4
2
3
H1
:
1 6
1,
1 4
2022/2/18
6
第6页,此课件共92页哦
当T02 2 ( p)时,接受原假设; 当T02 2 ( p)时,拒绝原假设。
p P{ 2 ( p) 所计算出的样本统计量值 ,则拒绝原假设; p P{ 2 ( p) 所计算出的样本统计量值 ,则接受原假设。
2022/2/18
7
第7页,此课件共92页哦
由于 0 ,所以统计量取值在0到1之间。
2022/2/18
15
第15页,此课件共92页哦
由极大似然比原理,如果取值太小,说 明H0为真的时观测到此样本的概率要小得多 ,故有理由认为假设H0不成立。
可以证明当样本容量很大时
-2 ln
-2 ln
max
θ0
max θ
(L x(1) , x(2) ,..., x(n);θ) (L x(1) , x(2) ,..., x(n);θ)
第三章 多元正态分布均值向量和协方差的检验
第三章多元正态分布均值向量和协方差的检验
1.基本思想和步骤
2.均值向量的检验
(1)分布:设且X与S相互独立,,则称统计量的分布为非中心分布
当时,称服从(中心)分布,记为
(2)转换为F分布:若且X与S相互独立,令,则
3.一个正态总体均值向量的检验
(1)协差阵已知,检验统计量为
(2)协差阵未知,检验统计量为
4.两个正态总体均值向量的检验
设为来自p维正态总体的容量为n的样本,
为来自p维正态总体的容量为m的样本,且两组样本相互独立
①针对共同已知协差阵,检验统计量为
②针对共同未知协差阵,检验统计量为
(2)协差阵不等
①针对n=m的情形,检验统计量为
②针对n≠m的情形,检验统计量为
5.多个正态总体均值向量的检验
(1)单因素方差分析:设k个正态总体分别为,从k个总体中取个独立样本,,假设H0成立,检验统计量为
其中,组间平方和为,组内平方和为,总平方和为,其中,
(2)若,则为X的广义方差,为样本广义方差
(3)Wilks分布:若且二者相互独立,
为Wilks统计量,分布为Wilks分布,简记为
(4)多元方差分析:检验统计量为
其中,,A为组间离差阵,E为组内离差阵,T为总离差阵,且T=A+E
6.协差阵的检验
(1)一个正态总体协差阵的检验:构造检验统计量
(2)多个协差阵相等的检验:构造检验统计量。
第四讲均值向量和协方差阵的检验
2
若两总体协差阵相等且未知时,
n1n2 ˆ 1 ( X Y ) ~ T 2 ( p, n n 2) T ( X Y )' 1 2 n1 n2
2
根据两个样本可得μ1和μ2的无偏估计量为
1 n1 x xi n1 i 1 1 n2 y yi n2 i 1 1 1 X Y ~ N p 0,( ) n21 n2 n1n2 X Y ~ N p 0, n1 n2
L1 L2 ˆ 又 ~ Wp (n1 n2 2, ) n1 n2 2
检验原k个观测指标向量之间的互协方差阵是否为零,就是要 检验如下的假设:
H0 : ij 0, i j, i, j 1, 2,, k
若对此p维观测指标向量进行了n次观测,得到了一个容量 为n的样本 x(1) , x(2) , x(n )
并已计算出了样本叉积矩阵向量,则可将此样本叉积 矩阵按原k个观测指标向量进行分块,得到如下的分块 叉积矩阵为:
方差分析表
协方差阵的检验
单个总体协方差阵相等的检验
总体协方差阵是否等于已知常数矩阵的检验
H0 : 0 , H1 : 0
总体协方差阵是否等于已知常数矩阵倍数的 检验
H0 : 0 , H1 : 0
2 2
多总体协方差阵相等的检验
假设有k个多元正态总体,它们的分布分别 为 N p (1, 1 ),, N p (k , k ) 。现从每个总体中分别 随机抽取了一个样本,要根据这些样本,对于 这些总体的协方差阵是否相同进行检验。 首先,列出原假设和备择假设。它们分别为:
多元正态分布均值向量和协差阵的检验
而
Y n(X 0) ~ Np (0,)
故 T02 n(X 0)T 1(X 0) ~ 2( p)
(2)协差阵未知时,均值向量的检验
H0:=(0 0为已知向量),H1: 1
假设H
成立,检验统计量为
0
F (n 1) p 1T 2 ~ F ( p, n p) (n 1) p
第三章 多元正态分布均值向量和
协差阵的检验
一、均值向量的检验
二、协差阵的检验
一、均值向量 •的假设检验
1、霍特林(Hotelling)T 2分布
定义1:设X ~ N p (, ),S ~ Wp (n, ),且X与S相互独立,n p,
则称统计量 T 2 nX T S 1X的分布为非中心霍特林T 2分布,
X (i) ~ N4 (1, ), i 1,2,,10; Y(i) ~ N4 (2 , ), i 1,2,,10
且两组样本相互独立,有共同未知协方差阵 0
假设检验 H0 : 1 2 , H1 : 1 2
构造统计量
F
(n+m 2) (n+m
p 2) p
X
~N
p
(0,
2
n
)
,
在一元统计中,若 t ~ t(n 1) 分布, 则 t2 ~ F (1, n 1) 分布,即把t分布转化为F分 布来处理,在多元统计分析中统计量也有类 似的性质。
定理1:设X ~ N p (0, ), S ~ Wp (n, ),且X与S相互独立, 令 T 2 nX T S 1 X 则 n p 1T 2 ~ F ( p, n p 1)
再由样本值计算出统计量T02,比较
若T02
多元统计分析——均值向量和协方差阵检验
多元统计分析——均值向量和协方差阵检验均值向量检验是评估两个或多个总体均值是否相等的方法。
在多元统计分析中,均值向量检验常用于比较不同组别或条件下的均值是否有差异。
假设有k个样本组别,每个组别有n个观测值,那么总共有nk个观测值。
假设每个观测值有p个测量变量,那么每个样本组别的均值向量可以表示为一个p维的向量。
我们的目标是比较这k个均值向量是否相等。
常用的均值向量检验方法有Hotelling's T-squared统计量和Wilks' Lambda统计量。
Hotelling's T-squared统计量是基于方差-协方差阵的一个推广,它考虑了样本组别的大小和协方差结构。
它的计算公式为:T^2=n(p-k)/(k(n-1))*(x1-x)^TS^(-1)(x1-x)其中,n是每个组别的观测数,p是变量的个数,k是组别的个数,x1是第一个组别的均值向量,x是总体均值向量,S是协方差阵。
T^2的分布是一个自由度为k,维度为p的非中心F分布。
Wilks' Lambda统计量是基于协方差阵的特征值的一个变换,它的计算公式为:Lambda = ,W,/,B其中,W是所有组别的散布矩阵(Within-groups scatter matrix),B是总体的散布矩阵(Between-groups scatter matrix)。
Wilks' Lambda的分布是一个自由度为k和n-k-1的F分布。
协方差阵检验是评估两个或多个总体协方差阵是否相等的方法。
在多元统计分析中,协方差阵检验常用于比较不同组别或条件下的变量之间的协方差结构是否有差异。
假设有k个样本组别,每个组别有n个观测值,那么总共有nk个观测值。
假设每个观测值有p个测量变量,那么每个样本组别的协方差阵可以表示为一个p维的矩阵。
我们的目标是比较这k个协方差阵是否相等。
常用的协方差阵检验方法有Hotelling-Lawley's Trace统计量和Pillai-Bartlett's Trace统计量。
第三章 多元正态均值向量和协方差矩阵的检验
【例】人的出汗多少与人体内的钠和钾的含量 有一定的关系,今测量了20位成年女性的出汗 量、钠含量和钾含量。试检验:
H 0 : μ μ 0 4 50 10
2016/11/13
10
例 在企业市场结构研究中,起决定作用 的指标有市场份额X1,企业规模(资产净值 总额的自然对数)X2,资本收益率X3和总收 益增长率X4。为了研究美国市场的变动,夏 菲尔德抽取了美国231个大型企业,调查这些 企业某十年的资料。假设以前企业市场结构 的均值向量为(20,7.5,10,2)’,该调查所得的 样本均值向量和样本协方差矩阵如下。
2016/11/13 2
第一节 单个总体均值向量的推断
一、均值向量的检验
设 x1 , x2 ,, xn 是取自多元正态总体 N p ( , ) 的一个样
0 ,现欲检验 本, H 0 : μ μ0
H1 : μ μ0
由于总体的协方差矩阵可能未知或已知,所以在检验时 必须采用有不同的的统计量,所以我们分成两种情来讨2016/11/13
22
令
1 1 0 1 0 1 C 1 0 0
0 0 1
则与上面的原假设等价的假设为
H 0 : C 0
H1 : C 0
例
假定人类的体形有这样的一般规律:身高、胸围和
上臂围平均尺寸比例为 6: 4: 1。检验身高、胸围和上臂 围平均尺寸比例是否符合这一规律。
设 x1 , x 2 ,, xn 取自多元正态总体N p ( , )的一个样本。
前面,我们已经利用样本,检验均值向量是否等于一个指
定的向量。在实际问题中,我们也需要检验均值向量的分
第四章 多元正态总体均值向量和协差阵的假设检验
1.当
已知时,检验用的统计量为
2、当
未知时,检验用的统计量为
(二)两个正态总体均值的比较检验 设从总体 中抽出一个样本 中抽出一个样本 ,从总体
,要进行的假设检验为
1.两个正态分布总体方差
和
已知时,检验用的统计量
2.两个正态分布总体方差
和
未知,但
(三)多个正态总体均值的比较检验 设有k个正态总体分别为 本:各总体的样本如下: 从k个总体中各自独立的抽取一个样
经计算得
拒绝原假设
甲和丁存在显著差别
第二节 协方差阵的检验 一、检验
设
要检验
是来自
的样本
是已知的正定矩阵,
检验用的统计量是
对于方阵A =
,将它对角线的所有元素相加所得的和,称为矩阵A的迹,记为trA=
当
及
时
的
分位点表
二、检验
检验用的统计量是
当
不大且
时,
的上
分位点
330
203 150 205 190 200 250 240 270 200 200 270 190
82
65 40 67 38 42 113 80 76 94 60 55 65
45
65 51 54 50 45 40 55 60 33 51 40 48
403
312 477 481 468 351 390 520 507 260 429 390 481
210
280 280 293 210 190 310 200 189 280 190 295 177
100
65 117 114 55 64 110 60 110 88 73 114 103
34
多元正态总体均值向量与协差阵的假设检验模版(PPT33张)
接受原假设。
统计量的选取:当
未知时,用
的无偏估计
1 n 1
S
来
代替,而样本离差阵
n
S (X() X )(X() X ) Wp(n 1,) 1
n(X-0) Np(0,)
T 2 (n 1) n(X 0)S1 n(X 0)
T(2 p,n p)
且 两 组 样 本 相 互 独 立 , 1 0, 2 0
H 0 : 1 =2 H 1 :12
分两种情况:
⑴ n=m
令 Z (i) X (i) Y(i) i 1, , n
1 n
Z n i1 Z (i) X Y
n
S (Z( j) Z )(Z( j) Z ) j 1 n
m
S2 (Y() Y )(Y() Y ), Y (Y1, ,Yp ) 1
给定检验水平,做出判断
下述假设检验统计量的选取和前面的思路是一样的,只给出统计量 和分布。
4 协差阵不等时,两个正态总体均值向量的检验
设 X ()(X 1, ,X p) N p(1, ) = 1 , , n Y ()(Y 1, ,Y p) N p(1, ) = 1 , , m
F( p, n p 1)
n p 1 ( p, n, 2) F (2 p, 2(n p))
p
( p,n,2)
当 p 1时 有 :
n1 1 (1, n1 , n 2 ) n 2 (1, n1 , n 2 )
当 p 2时 有 :
F (n2 , n1 )
n1 -1 1 ( 2 , n1 , n 2 )
其 中 : ( 在 H 0 成 立 时 )
T
2
(n
m
2)
nm nm
多元统计分析——均值向量和协方差阵检验
某地区农村男婴的体格测量数据
编号 1
身高(cm) 78
胸围(cm) 60.6
上半壁围(cm) 16.5
2
76
58.1
12.5
3
92
63.2
14.5
4
81
59.0
14.0
5
81
60.8
15.5
6
84
59.5
14.0
这是假设检验问题: H0 :μ = 0 , H1 :μ≠ 0
第7页/共31页
3.独立样本检验 • 即对相互独立的两个样本的均值进行比较,看二者是否有显著的差异。与
1 1 n1 n2
当 H0 成立时,t 服从自由度为 n1 n2 2 的 t 分布,即 t t(n1 n2 2) 。
检验规则为:
当| t | t /2 (n1 n2 2) 时,拒绝 H0 ;
当| t | t /2 (n1 n2 2) 时,接受 H0 。
第10页/共31页
3、两个p维正态总体均值的检验
——这就需要用到均值比较的方法
第1页/共31页
2.单一样本检验
• 已知某校大三学生的平均身高是163cm。现从某院大三学生中随机抽取20个测量出其身高。检验该院大三 学生的身高与该校大三学生的身高平均值是否相等。
• 建立一个原假设:H0:假设该院大三学生的身高与该校大三学生的平均身高相等。 • 这属于单个变量的均值与已知常数的比较
多元统计分析——均值向量和协方差阵检验
第13页/共31页
为什么多样本均值检验不采用两两 样本的t检验,而一定要采用方差分 • 统计结论都是概率性的。假设实际情况是H0成立,那么根据设置的显著性水平如0.05, 平均每100次检验
中有5次会得出拒绝H0的错误结论。
在多元统计中T2也具有类似的性质。
第4页/共31页
2、P 维单个正态总体均值向量的检验 考虑假设检验问题
H0 : 0 , H1 : 0
设 x1, x2 , , xn 是取自总体 N p (, ) 的一个样本,给定显著性水平 。
(1) 已知。 当假设成立时,
T02 n(X 0)'
1( X
——这就需要用到均值比较的方法
第1页/共31页
2.单一样本检验
• 已知某校大三学生的平均身高是163cm。现从某院大三学生中随机抽取20个测量出其身高。检验该院大三 学生的身高与该校大三学生的身高平均值是否相等。
• 建立一个原假设:H0:假设该院大三学生的身高与该校大三学生的平均身高相等。 • 这属于单个变量的均值与已知常数的比较
(1)协方差相等的情况 考虑假设检验问题
H0 : 1 2 , H1 : 1 2
设 x1, x2 , , xn 是 取 自 总 体 N p (1, ) 的 容 量 为 n 的 样 本 , y1, y2 , , ym 是 取 自 总 体
N p (2 , ) 的容量为 m 的样本, n p.m p ,给定显著性水平 。
检验用到的统计量是
M
(n r) ln
|
S (n r)
|
r i1
(ni
1) ln
多元正态分布的检验精品PPT课件
139..2376
199.26 88.38
S d
88.38
418.61
T 2 11 9.36
13.27
0.0055 0.0012
00.0.0002162 139..2376 13.6
取 0.05,求得
n2 i 1
yi
s12
1 n1 1
n1 i 1
( xi
x)2,
s22
1 n2 1
n2 i 1
( yi
y)2
sw2
1 n1 n2 2
(n1 1)s12 (n2 1)s22
或检验统计量:
F
t2
1 n1
1 n2
1
xy sw
2
x
y
1 n1
1 n2
s2w
1
x
y
当F Fα(1,n1 n2 2)时,拒绝H 0
i
2
n
i
i
2
n
i 的T 2 联合置信区间为:
1
1
Xi
T
S2 ii n
i
Xi
T
S2 ii n
i 的Bonferroni 联合置信区间为:
1
1
Xi
t (n 1)
2p
S2 ii n
i
Xi
t (n 1)
2p
S2 ii n
§2.2 两个正态总体均值 的成组比较
一元情形的回顾
设 x1, x2 ,, xn1和 y1, y2 ,, yn2 分别取自于
F
(
p,
n1
n2
p
1).
均值差的T2置信区间
两个p维总体均值差 11 12,21 22,, p1 p2 的10(0 1)% T 2 联合置信区间为:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(3.3)
③判断,根据显著水平 ,确定临界值 t /2(n 1,) 当 |t|t/2(n1),落入拒绝域,接受备择假设;否则 接受原假设。
2020/6/26
20
(3.3)式可以表示为
威沙特分布 (Wishart)
t2n(X S 2)2n(X)(S2) 1(X)
(3.4)
定义3.1 设 X~Np(μ,Σ),S ~Wp(n, Σ)且X 与S 相
接受域
z 2
z 2
拒绝域
2020/6/26
16
其基本思想和步骤均可归纳为: ①第一,提出待检验的假设H0和H1; ②第二,给出检验的统计量及其服从的分布; ③第三,给定检验水平,查统计量的分布表,确定
相应的临界值,从而得到否定域; ④第四,根据样本观测值计算出统计量的值,看是
否落入否定域中,以便对待判假设做出决策(拒 绝或接受)。
2020/6/26
12
假设检验的理论依据:
假设检验所以可行,其理论背景即为 “小概率原理”。
➢在假设检验中,称这个小概率为显著性水 平,用α 表示。α 的选择要根据实际情况而 定。常取
0 .1 , 0 .0 1 , 0 .0 5
2020/6/26
13
可乐的假设检验
➢现在回到我们前面罐装可乐的例中:在提
故入红我色们区可域以(取拒绝拒域绝)域是为个 :
小| z概|率z事 2件。 ➢如 计 域 否概认否(也率为则只就果 量 则| zH事,好是由的,|0件 我 接说不样实不z发 们 受,可本测能2生 就 它信,H值值拒了不)0而则成算 落 绝,能。否拒立H得 入那否定下绝0么定该 区它的。H就H。统小00 ;
把每一罐都打开倒入量杯,
看看容量是否合于标准?
2020/6/26
5
通常的办法是进行抽样检查
➢每隔一定时间,抽查若干罐 。如每隔1小 时,抽查35罐,得35个容量的值X1,…, X35,根据这些值来判断生产是否正常。
➢这就产生两种可能(假设):
生产正常?生产不正常?
2020/6/26
6
这就需要根据X1,…, X35的样本信息,检验 上述的两个假设哪个正确:
②构造检验统计量
(总体方差已知时)
z
(X
0)
n
③判断:根据显著水平 确定临界值 z / ,2 当 | z | z/2
落在拒绝域,接受备择假设,否则接受原假设。
2020/6/26
19
当
2
未知时,用
S2
1 n n1i1
(Xi
X)2
②作为 的2 估计量,构造检验统计量:
(3.2)
t (X 0) n
➢H0:0(0355)
称H0为原假设(或零假设) ➢它的对立假设是:
生产正常
H1: 0
生产不正常
称H1为备选假设(或对立假设)。
2020/6/26
7
那么,如何判断原假设H0 是否成立呢?
➢由于是正态分布的期望值,它的估计量是样
本均值 X ,因此可以根据 X 与 0 的差距 X 0
来判断H0 是否成立。
99 1
红一 球盒 和中 个有 白 球个
…99个 …1个
另一盒中装有99个白球和1个红球。
2020/6/26
10
?
?
➢现从两盒中随机取出一个盒子,问这个盒 子里是白球99个还是红球99个?
➢我们不妨先假设:这个盒子里有99个白球。 ➢现在我们从中随机摸出一个球,发现是 ➢此时应该如何判断这个假设是否成立呢?
➢当 X 0 时,可以认为H0是成立的;
➢当 X 0 时,应认为H0不成立,即生产已 不正常。
2020/6/26
8
小➢∆概怎率么原来则确:定?小合概理率的事界 件限在在一何次处试?验应中由基什么本原上则 不来会确发定生?。
2020/6/26
9
小概率事件在一次试验中基本上不会发生。
下面我们用一例说明这个原则。 这里有两个盒子,各装有100个球。
互独立,n p,则称统计量 T2nXS-1X的分布
为非中心HotellingT2分布,记为 T2 ~T2(p,n,μ)。
当 μ 0 时,称 T 2 服从(中心)HotellingT2 分布。
记为 T 2 ( p , n ) 。
2020/6/26
21
注意:F分布和t 分布有如下关系:
设X和Y是相互独立的服从卡方分布的随机变量, 自由度分别为f 1,f 2,则称随机变量
2020/6/26
11
假设其中真有99个白球,摸 出红球的概率只有 1/100, 这是小概率事件。
➢小概率事件在一次试验中竟然发生了,不能 不使人怀疑所作假设的正确性,因此可以认为 这个盒子应该不是装有99个白球的那个盒子。
这个例子中所使用的推理方法,称为“带概率 性质的反证法”,或“概率反证法”。
出原假设H0后,如何作出接受和拒绝H0 的结论呢?
罐装可乐的容量按标准应在350毫升和
360毫升之间。 一批可乐出厂前进行抽样
检查,现抽查了n罐,测得容量为X1 ,
X2 ,…,Xn,问这一批可乐的容量是否合格?
2020/6/26
14
提出假设: H 0:3 5 5 ,H 1:3 5 5
假定σ 已知,构造检验统计量z:
2020/6/26
17
第一节 均值向量的检验
单一变量检验的回顾及HotellingT2分布 一个正态总体均值向量的检验 两个正态总体均值向量的检验 多个正态总体均值向量的检验
2020/6/26
18
一、单变量假设检验及Hotelling T2分布
单一变量假设检验的内容:
①提出假设 H 0: 0; H 1:0
第三章 多元正态分布均值向 量和协差阵的检验
2020/6/26
2
第三章 多元正态分布均值向量和 协差阵的检验
第一节 均值向量的检验 第二节 协差阵的检验
2020/6/26
3
补充:
让我们先看一个例子
到底什么是假设检验?
2020/6/26
4
罐装可乐的容量按标准应在 350毫升和360毫升之间。
生产流水线上罐装可乐不 断地封装,然后装箱外运。 怎么知道这批罐装可乐的 容量是否合格呢?
z
X 0
~
N(0,1)
n
由原来观察||XX0 |与
大小,转变为观察
Z 与 Z 22 的大小。
对给定的显著性水平α ,可以在N(0,1)表
中查到分位点的值Z 22 ,使
2020/6/26
P{|z|z2}
15
从小概率的角度看:
➢也 是差如异果就 一大H是个0小小说是的对概,某的率“个,|事统z那|件计么量z。衡落2”量
F X/ f1 : Y/ f2
F(f1, f2)