多元统计分析:第三章 多元正态总体参数的假设检验(补充)
应用多元统计分析课后习题答案高惠璇(第三章部分习题解答)
![应用多元统计分析课后习题答案高惠璇(第三章部分习题解答)](https://img.taocdn.com/s3/m/f9533b1159eef8c75fbfb338.png)
因 X ~ N ( , 1 ), p 0 0 n
H 0下
n ( X 0 ) ~ N p (0, 0 )
H 0下
所以由§3“一﹑2.的结论1”可知
2 ln ~ ( p).
2
20
第三章 多元正态总体参数的检验
3-6 (均值向量各分量间结构关系的检验) 设总体
X~Np(μ ,Σ )(Σ >0),X(α) (α =1,…,n)(n>p)为 来自p维正态总体X的样本,记μ =(μ 1,…,μ p)′.C 为k×p常数(k<p),rank(C)=k,r为已知k维向量.试给出 检验H0:Cμ =r的检验统计量及分布.
(n 1)n(CX r )CAC (CX r ).
1
A ( X (i ) X )( X (i ) X ).
i 1
n
22
第三章 多元正态总体参数的检验
维正态总体X的样本,样本均值为X,样本离差阵为A.记μ= (μ1,…,μp)′.为检验H0:μ1=μ2=…=μp ,H1:μ1,μ2,…,μp至少有一对不 相等.令
X (1) X (1) W X X X (2) X (1) X (1) X (2) W11 W12 , X (2) X (2) W21 W22
即
W11 X (1) X (1), W22 X (2) X (2)
13
第三章 多元正态总体参数的检验
1 T n(n 1)( X ) Ax ( X ) 2 ~ T ( p, n 1). 2 x
令
其中C是pp非退化常数矩阵,d是p1常向量。 则 Y ~ N (C d , CC) (i 1,2,...,n)
第三章 多元正态总体参数的假设检验(第3节、第4节 多总体均值向量(协差阵)的假设检验)
![第三章 多元正态总体参数的假设检验(第3节、第4节 多总体均值向量(协差阵)的假设检验)](https://img.taocdn.com/s3/m/48df040476c66137ee06193d.png)
第三节
多总体均值向量的检验
解决多个正态总体均值向量的检验问题,实际上应用到多元方差分 析的知识。多元方差分析是单因素方差分析直接的推广。为了容易 理解多元方差分析方法,我们有必要先回顾单因素方差分析方法。 (一)单因素方差分析的基本思想及 Wilks 分布 设 k 个正态总体分别为 N (1 , 2 ) , , N (k , 2 ) , k 个总体取 从
任意
任意
2 任意
1
任意
n1 1 (1, n1 , n2 ) ~ F (n2 , n1 ) n2 (1, n1 , n2 )
n1 1 1 (2, n1 , n2 ) ~ F (2n2 , 2( n1 1)) n2 (2, n1 , n2 )
2
任意
任意
以上几个关系式说明对一些特殊的 统计量可以化为 F 统计量,而当
A1 和 A 2 相互独立,则称
A1 A1 A 2
为 Wilks 统 计 量 , 的 分 布 称 为 Wilks 分 布 , 简 记 为 ~ ( p, n1 , n2 ) ,其中 n1,n2 为自由度。 这里我们需要说明的是,在实际应用中经常把 统计量化为 T 2 统 计量进而化为 F 统计量,利用 F 统计量来解决多元统计分析中有 关检验问题。表 3.1 列举常见的一些情形。
2
nm ( X Y )2 (n m) 2
□ 第三章 多元正态总体参数的假设检验
第二节
单总体均值向量的检验
情形 2 两总体的协方差阵相等,但未知 假设
H 0:μ1 μ2 H1:μ 1 μ 2 对此问题,假设 H 0 成立时,所构造的检验统计量为 (n m 2) p 1 2 F T ~ F ( p, n m p 1) (n m 2) p
多元课件第三章
![多元课件第三章](https://img.taocdn.com/s3/m/2e07cfa0680203d8cf2f240c.png)
H H D D ' ' ' 11 1 2 rO rO AB B O H H O O O O 21 2 2
22
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--一般p维正态变量的二次型
结论2 当μi≠0(i=1,„,n),σ2 =1时,X′X的 分布常称为非中心χ2分布. 定义3.1.1 设n维随机向量X~Nn(μ,In)
(μ≠0),则称随机变量ξ=X'X为服从 n n个自由度,非中心参数 i2 i 1` 2 的χ 分布,记为
2 2 n
X X ~ ( n , ), X X ~ ( )
第三章 多元正态总体参数的假设检验
一元统计中,参数μ ,σ 2的检验 涉及到一个总体、二个总体,乃至 多个总体的检验问题; 推广到p元统计分析中,类似地 对参数向量μ 和参数矩阵Σ 涉及 到的检验也有一个总体、二个总体 ,乃至多个总体的检验问题。
3
第三章 多元正态总体参数的假设检验
在一元统计中,用于检验μ, σ2的抽 样分布有χ2分布,t 分布,F分布等,它们都 是由来自总体N(μ, σ2)的样本导出的检验 统计量. 推广到多元统计分析后,也有相应于 以上三个常用分布的统计量: Wishart, Hotelling T 2,Wilks Λ统计 量,讨论这些统计量的分布是多元统计分 析所涉及的假设检验问题的基础.
6
第三章 多元正态总体参数的假设检验
§3.1 几个重要统计量的分布--分量独立的正态变量二次型
1 1 2 则Y Y X X ~ ( n , ), 其中 2 2
结论3 设X~Nn(0 ,σ2In), A为n阶对称方阵, rk(A)= r,则 二次型 X'AX/σ2~χ2(r) A2=A(A为对称幂等阵). 2 2 2 特例:当A=In时, X I X / X X / ~ ( n ) n
第3章 多元假设检验
![第3章 多元假设检验](https://img.taocdn.com/s3/m/76dfddcbda38376baf1faec3.png)
第三章 多元假设检验3.1 实例从本节开始,我们转入多元统计的实际应用。
在实际问题中,有时要同时考虑多个随机性的指标,而且这些指标之间还存在着一定的联系。
例如,检查某人的健康情况,就得检查这个人的体重、体温、血压、心脏等多项指标。
一般仅是单项指标异常还不能立即诊断是什么原因,而必须对各项指标综合分析,才能作出结论。
多元统计分析的精髓之一就是必须对p 个相关变量同时进行分析。
首先让我们看2个例子:例3.1测量20名健康女性排汗量1x 、钠含量2x 、钾含量3x 得表3.1。
问健康女性1x 、2x 、3x 的均值是不是4、50、10?表3.1 20名健康女性排汗量1x 、钠含量2x 、钾含量3x 数据例 3.2 为了研究日美两国在华企业对中国经营环境的评价是否存在差异,从两国在华企业对中国的政治、经济、法律、文化等环境打分,得表3.2。
试分析日美两国在华企业对中国经营环境的评价是否存在差异?表3.2这些问题涉及多个项目同时比较,例如例3.1要检验3个指标(1x )=4,E(2x )=50,E(3x )=10是否同时成立?例3.2要检验美日两国企业四个评价指标是否相同?Ey1=Ex1,Ey2=Ex2,Ey3=Ex3,Ey4=Ex4是否同时成立?本章总作多元正态假设:设)',...,(21p x x x x =服从),(∑μN 。
例3.1和例3.2即是要做复合检验⎥⎥⎦⎤⎢⎢⎣⎡=⎥⎥⎦⎤⎢⎢⎣⎡10504321μμμ和⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡43214321y y y y x x x x μμμμμμμμ 按照概率论基础知识的方法,我们可以对每个指标进行t 检验或F 检验。
例如对例1先检验E(1x )=4, 再检验E(2x )=50,然后再检验E(3x )=10。
但是可能会遇到这样的情况:单独检验E(1x )=4不否定原命题(例如接受概率P(A)=0.4),再单独检验E(2x )=50也不否定原命题(例如接受概率P(B)=0.5);而单独检验E(3x )=10也不否定原命题(例如接受概率P(C)=0.6);但是联合起来检验E(1x )=4,E(2x )=50,E(3x )=10,接受域概率P(ABC)是0与0.4间的不定数,依A 、B 、C 的关系而定:若A 、B 、C 重合,则P(ABC)=0.4;若A 和B 互斥,则P(ABC)=0。
(整理)多元统计分析第三章 假设检验与方差分析.
![(整理)多元统计分析第三章 假设检验与方差分析.](https://img.taocdn.com/s3/m/efb2e779c850ad02de804142.png)
第3章 多元正态总体的假设检验与方差分析从本章开始,我们开始转入多元统计方法和统计模型的学习。
统计学分析处理的对象是带有随机性的数据。
按照随机排列、重复、局部控制、正交等原则设计一个试验,通过试验结果形成样本信息(通常以数据的形式),再根据样本进行统计推断,是自然科学和工程技术领域常用的一种研究方法。
由于试验指标常为多个数量指标,故常设试验结果所形成的总体为多元正态总体,这是本章理论方法研究的出发点。
所谓统计推断就是根据从总体中观测到的部分数据对总体中我们感兴趣的未知部分作出推测,这种推测必然伴有某种程度的不确定性,需要用概率来表明其可靠程度。
统计推断的任务是“观察现象,提取信息,建立模型,作出推断”。
统计推断有参数估计和假设检验两大类问题,其统计推断目的不同。
参数估计问题回答诸如“未知参数θ的值有多大?”之类的问题,而假设检验回答诸如“未知参数θ的值是0θ吗?”之类的问题。
本章主要讨论多元正态总体的假设检验方法及其实际应用,我们将对一元正态总体情形作一简单回顾,然后将介绍单个总体均值的推断, 两个总体均值的比较推断,多个总体均值的比较检验和协方差阵的推断等。
3.1一元正态总体情形的回顾一、 假设检验在假设检验问题中通常有两个统计假设(简称假设),一个作为原假设(或称零假设),另一个作为备择假设(或称对立假设),分别记为0H 和1H 。
1、显著性检验为便于表述,假定考虑假设检验问题:设1X ,2X ,…,n X 来自总体),(2σμN 的样本,我们要检验假设100:,:μμμμ≠=H H (3.1)原假设0H 与备择假设1H 应相互排斥,两者有且只有一个正确。
备择假设的意思是,一旦否定原假设0H ,我们就选择已准备的假设1H 。
当2σ已知时,用统计量nX z σμ-=在原假设0H 成立下,统计量z 服从正态分布z )1,0(~N ,通过查表,查得)1,0(N 的上分位点2αz 。
对于检验问题(3.1.1),我们制定这样一个检验规则(简称检验): 当2αz z >时,拒绝0H ;当2αz z ≤时,接受0H 。
R语言版应用多元统计分析多元正态总体的假设检验
![R语言版应用多元统计分析多元正态总体的假设检验](https://img.taocdn.com/s3/m/a539008aa1116c175f0e7cd184254b35eefd1abb.png)
应用多元统计分析第3章 多元正态总体的假设检验- 1-•在一元正态总体 中,关于参数 的假设检验涉及到一个总体和多个总体情况,推广到多元正态总体 ,关于参数 的假设检验问题也涉及一个总体和多个总体情况。
本章我们只讨论关于均值向量 的假设检验问题。
•在多元统计中,用于检验 的抽样分布有维希特(Wishart)分布、霍特林(Hotelling)分布和威尔克斯(Wilks)分布,它们都是由来自多元正态总体 的样本构成的统计量。
在第2章中,我们已经讨论了维希特分布的定义和性质,本章我们讨论后两个统计量的分布。
霍特林 分布在一元统计中,若 ,且 相互独立,则或等价地下面把 的分布推广到多元正态总体。
定义3.1 设 , ,其中 ,且 与 相互独立。
则称统计量 为 统计量,其分布称为自由度为n的霍特林 分布,记为分布的性质性质1 设 是来自正态总体 的随机样本, 和A 分别是样本均值向量和样本离差阵,则性质2 分布与F分布的关系为:若 则分布的性质性质3 设 是来自正态总体 的随机样本, 和A 分别是样本均值向量和样本离差阵,记则性质4 分布只与n,p有关,而与 无关。
威尔克斯 分布定义3.2 设 ,称协方差阵 的行列式 为的广义方差。
若 是来自总体 的随机样本,A为样本离差阵,则称或 为样本广义方差。
定义3.3设 ,这里 ,且 与 独立,则称广义方差比为 统计量,其分布称为威尔克斯 分布,记为 。
当p=1时, 分布正是一元统计中参数为 的贝塔分布,即。
分布的性质性质1当 时,若 ,则当 时,若 ,则当p=1时,当p=2时,若 ,则当 时有下列极限分布其中 。
下面是 分布的两个有用性质。
性质6 若 ,则存在 , 且 之间相互独立,使得性质7 若 则单总体均值向量的假设检验设总体为 , 为来自该总体的随机样本。
欲检验下列假设:其中 为已知常数向量。
1. 当 已知时均值向量的假设检验此时于是有若检验统计量取为则当原假设 成立时, 。
多元统计分析-第三章 多元正态分布
![多元统计分析-第三章 多元正态分布](https://img.taocdn.com/s3/m/73cd1b424a7302768e99398c.png)
第三章 多元正态分布多元正态分布是一元正态分布在多元情形下的直接推广,一元正态分布在统计学理论和应用方面有着十分重要的地位,同样,多元正态分布在多元统计学中也占有相当重要的地位。
多元分析中的许多理论都是建立在多元正态分布基础上的,要学好多元统计分析,首先要熟悉多元正态分布及其性质。
第一节 一元统计分析中的有关概念多元统计分析涉及到的都是随机向量或多个随机向量放在一起组成的随机矩阵,学习多元统计分析,首先要对随机向量和随机矩阵有所把握,为了学习的方便,先对一元统计分析中的有关概念和性质加以复习,并在此基础上推广给出多元统计分析中相应的概念和性质。
一、随机变量及概率分布函数 (一)随机变量随机变量是随机事件的数量表现,可用X 、Y 等表示。
随机变量X 有两个特点:一是取值的随机性,即事先不能够确定X 取哪个数值;二是取值的统计规律性,即完全可以确定X 取某个值或X 在某个区间取值的概率。
(二)随机变量的概率分布函数随机变量X 的概率分布函数,简称为分布函数,其定义为:)()(x X P x F ≤=随机变量有离散型随机变量和连续型随机变量,相对应的概率分布就有离散型概率分布和连续型概率分布。
1、离散型随机变量的概率分布若随机变量X 在有限个或可列个值上取值,则称X 为离散型随机变量。
设X 为离散型随机变量,可能取值为1x ,2x ,…,取这些值的概率分别为1p ,2p ,…,记为k k p x X P ==)((Λ,2,1=k )称k k p x XP ==)((Λ,2,1=k )为离散型随机变量X 的概率分布。
离散型随机变量的概率分布具有两个性质: (1)0≥k p ,Λ,2,1=k(2)11=∑∞=k k p2、连续型随机变量的概率分布若随机变量X 的分布函数可以表示为dt t f x F x⎰∞-=)()(对一切R x ∈都成立,则称X 为连续型随机变量,称)(x f 为X 的概率分布密度函数,简称为概率密度或密度函数。
第3章 多元正态总体参数的假设检验3.2-3.3
![第3章 多元正态总体参数的假设检验3.2-3.3](https://img.taocdn.com/s3/m/4d24781e6c175f0e7cd137bc.png)
例1 人出汗量多少与体内钠和钾的含量有一定关系,今测量了20 名健康成年女性的出汗量(X1),钠(X2)的含量和钾(X3)的含量 试检验: H0 : 0 (4, 50,10) ; H1 : 0 ( 0.05) Σ 未知 解: 随机向量X ( X1 , X 2 , X 3 ), 假定 X ~ N3 ( , ) 检验假设: H0 : 0 ; H1 : 0 p 3, n 20
给定显著性水平
,拒绝域: W {F F1 ( p, n p)}
由样本计算: T 2 , F 的值 判断: 若 F F1 , 则拒绝 H 0 , 否则接受 H0
例1 人出汗量多少与体内钠和钾的含量有一定关系,
今测量了20名健康成年女性的出汗量(X1), 钠(X2)的含量和钾(X3)的含量(数据见下表) ( 0.05) 试检验: H0 : 0 (4, 50,10) ;
二、置信域 (Σ 未知) 总体: X ~ N p ( ,) 样本: X( i ) ( xi1 ,L , xip )(i 1,L , n)
2 2 2 11 TT nn (X ) ((X S (X )S X ) ) ~ T ( p, n 1) ( n 1) p 1 2 n p 或者 F T T 2 ~ F ( p, n p) ( n 1) p ( n 1) p
n p ( n 1) p 1 2 2 ~ F ( p, n p) 2 = T F T 检验统计量: ( n 1) p ( n 1) p F (3,17) 拒绝域:W {F F1 ( p, n p)} {F F0.95 (3,17)}
1 由样本计算:T n( X 0 ) A ( X 0 ) 9.7388 n 1 X (4.64, 45.4, 9.965)
第3章多元正态总体参数的假设检验32-33
![第3章多元正态总体参数的假设检验32-33](https://img.taocdn.com/s3/m/29775712cf84b9d528ea7acc.png)
n i 1
( X(i)
X
)2
1 (X
0 )
一、均值向量的检验
总体: X ~ N p (,) 样本: X(i) ( xi1, , xip )(i 1, , n)
检验假设: H0 : 0 ; H1 : 0
1. Σ = Σ0 ( Σ0 已知) 检验统计量: T02 n( X 0 )01( X 0 )
名健康成年女性的出汗量(X1),钠(X2)的含量和钾(X3)的含量
试检验:H0 : 0 (4, 50,10) ; H1 : 0 ( 0.05)
解:随机向量X ( X1, X2 , X3 ), 假定 X ~ N3(, )
Σ 未知
检验假设: H0 : 0 ; H1 : 0
p 3, n 20
8.4 7.1
10.9 9.4
例1 人出汗量多少与体内钠和钾的含量有一定关系,今测量了
20名健康成年女性的出汗量(X1),钠(X2)的含量和钾(X3)的
含量,试检验:
( 0.05)
H0 : 0 (4, 50,10) ; H1 : 0
p 3, n 20
解:随机向量X ( X1, X2 , X3 ), 假定 X ~ N3(, )
试检验: H0 : 0 (4,50,10) ; ( 0.05)
H1 : 0
p 3, n 20
序号 X1
1
3.7
3
3.8
5
3.1
7
2.4
9
6.7
11
3.9
13
3.5
15
1.5
17
4.5
19
4.1
X2
48.5 47.2 55.5 24.8 47.4 36.9 27.8
第三章多元正态总体参数的假设检验
![第三章多元正态总体参数的假设检验](https://img.taocdn.com/s3/m/dbe621413d1ec5da50e2524de518964bce84d252.png)
第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布一、正态变量二次型的分布1、分量独立的n 维随机向量X 的二次型设),,1)(,(~21n i N X i i =σμ,且相互独立,记⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=n X X X 1,则),(~2n n I N X σμ,其中)',,(1n μμμ =。
X 的二次型具有以下一些结论:结论1 当),,1(0n i i ==μ,12=σ时,则)(~'212n XX X ni iχξ∑===;当),,1(0n i i ==μ,12≠σ时,则)(~'122n X X χσ(或记为)(~'22n X X χσ)。
结论2 当),,1(0n i i =≠μ,X X '的分布常称为非中心2χ分布。
Def3.1.1 设n 维随机向量)0)(,(~≠μμn n I N X ,则称随机向量X X '=ξ为服从n 个自由度、非中心参数∑===ni i 12'μμμδ的2χ分布,记为)(~'),(~'22δχδχn X X n X X 或。
若时且1),0)(,(~22≠≠σμσμn n I N X ,有)(~'122δχσn X X 。
结论3 设),0(~2n n I N X σ,A 为对称矩阵,且r A rank =)(,则二次型 A A r AX X =⇔222)(~/'χσ(A 为对称幂等矩阵)。
结论4 设),(~2n n I N X σμ,'A A =,则),(~'122δχσr AX X ,其中A A A =⇔=22'1μμσδ,且)()(n r r A rank ≤=。
结论5 二次型与线性函数的独立性:设),(~2n n I N X σμ,A 为n 阶对称矩阵,B 为n m ⨯矩阵,令)(,'维随机向量为m Z BX Z AX X ==ξ,若O BA =,则AX X BX '和相互独立。
多元正态分布参数的假设检验
![多元正态分布参数的假设检验](https://img.taocdn.com/s3/m/90d8a280d4d8d15abe234edf.png)
2 22.74 32.56 51.49 61.39 9 22.62 32.57 51.23 61.39 16 23.02 33.05 51.48 61.44
3 22.60 32.76 51.50 61.22 10 22.67 32.67 51.64 61.50 17 23.02 32.95 51.55 61.62
5
武汉理工大学统计学系唐湘晋
一、Σ已知时单个总体均值向量的检验
设 X1, X2,…, Xn 是来自正态总体 N p ( μ , Σ ) 的样本, 考虑假设: H 0 :μ = μ 0 ,
H 1 :μ ≠ μ 0
a) p = 1 b) p > 1
U 1 )
T02 = n ( X − μ 0 )′ Σ − 1 ( X − μ 0 ) .
4
武汉理工大学统计学系唐湘晋
§3.2 多元正态分布的均值向量的检验
p维正态总体 N p (μ, Σ) 的统计推断问题,包括均 值向量的检验和均值的置信域问题。 p维正态随 机向量的每一个分量都是一元正态变量,若将p 维均值向量的检验问题化为p个一元正态的均值 检验问题,虽然可以使问题简化,但忽略了p个 分量间的互相依赖关系,常常得不出正确的结 论。
13
武汉理工大学统计学系唐湘晋
解:
⎡ X 1 ⎤ ⎡ 22.82 ⎤ ⎢ ⎥ ⎢ X 2 ⎥ ⎢ 32.79 ⎥ ⎥ = X=⎢ ⎢ X 3 ⎥ ⎢ 51.45 ⎥ ⎢ ⎥ ⎢ ⎥ X 4 ⎥ ⎣ 61.38 ⎦ ⎢ ⎦ ⎣
1 21 V= ∑ (Xi − X)(Xi − X)′ 21 − 1 i=1 ⎡ 70.3076 ⎤ ⎢ −52.1469 ⎥ 73.5511 ⎥ =⎢ ⎢ 3.4462 −19.3637 ⎥ 90.4098 ⎢ ⎥ 1.2022 −33.6989 40.0895⎦ −6.9624 ⎣
第三章 多元正态总体参数的假设检验
![第三章 多元正态总体参数的假设检验](https://img.taocdn.com/s3/m/33c6b5f3770bf78a652954ee.png)
§3.2例3.2.1x=[3.7 48.5 9.3;5.7 65.1 8;3.8 47.2 10.9;3.2 53.2 12;3.1 55.5 9.7; 4.6 36.1 7.9;2.4 24.8 14;7.2 33.1 7.6;6.7 47.4 8.5;5.4 54.1 11.3;3.9 36.9 12.7;4.5 58.8 12.3;3.5 27.8 9.8;4.5 40.2 8.4;1.5 13.5 10.1;8.5 56.4 7.1;4.5 71.6 8.2;6.5 52.8 10.9;4.1 44.1 11.2;5.5 40.9 9.4]u0=[4 50 10]';n=20;T2=n*(n-1)*(mean(x)'-u0)'*inv(19*cov (x))*(mean(x)'-u0),p=3;F=(n-p)*T2/((n-1)*p),p=1-fcdf(F,3,17)T2 =9.7388F =2.9045p =0.0649在显著性水平0.05下,接受原假设。
第二类错误的计算,用非中心的F分布计算,非中心的参数为p67页,中间的参数。
ncfcdf(3.2,3,17,20*(mean(x)-[4 50 10])*inv(cov(x))*(mean(x)-[4 50 10])')ans =0.36218248472391例3.2.2x=[3.7 48.5 9.3;5.7 65.1 8;3.8 47.2 10.9;3.2 53.2 12;3.1 55.5 9.7; 4.6 36.1 7.9;2.4 24.8 14;7.2 33.1 7.6;6.7 47.4 8.5;5.4 54.1 11.3;3.9 36.9 12.7;4.5 58.8 12.3;3.5 27.8 9.8;4.5 40.2 8.4;1.5 13.5 10.1;8.5 56.4 7.1;4.5 71.6 8.2;6.5 52.8 10.9;4.1 44.1 11.2;5.5 40.9 9.4]S=cov(x),[v,d]=eig(S),n=20;p=3;c2=(n-1)*p*3.2/ (n*(n-p)),d123=diag(sqrt(d))*sqrt(c2)S =2.8794 10.0100 -1.809110.0100 199.7884 -5.6400-1.8091 -5.6400 3.6277v =-0.8175 0.5737 0.05080.0249 -0.0530 0.9983-0.5754 -0.8173 -0.0291d =1.3014 0 00 4.5316 00 0 200.4625c2 =0.5365d123 =0.83561.559210.37032、联立置信区间由3.2.4式计算的T2区间为:x=[3.7 48.5 9.3;5.7 65.1 8;3.8 47.2 10.9;3.2 53.2 12;3.1 55.5 9.7; 4.6 36.1 7.9;2.4 24.8 14;7.2 33.1 7.6;6.7 47.4 8.5;5.4 54.1 11.3;3.9 36.9 12.7;4.5 58.8 12.3;3.5 27.8 9.8;4.5 40.2 8.4;1.5 13.5 10.1;8.5 56.4 7.1;4.5 71.6 8.2;6.5 52.8 10.9;4.1 44.1 11.2;5.5 40.9 9.4]S=cov(x),[v,d]=eig(S),n=20;p=3;c2=(n-1)*p*3.2/ (n*(n-p)),d123=diag(sqrt(d))*sqrt(c2)[ mean(x)'-sqrt((n-1)*p*3.2/(n-p))*sqrt(diag(S )/n)mean(x)'+sqrt((n-1)*p*3.2/(n-p))*sqrt(diag(S)/ n)]ans =3.3971 5.882935.0472 55.75288.5700 11.3600按3.2.5计算的区间为:[ mean(x)'-tinv(0.975,n-1)*sqrt(diag(S)/n) mean(x)'+tinv(0.975,n-1)*sqrt(diag(S)/n)] ans =3.8458 5.434238.7848 52.01529.0736 10.8564§3.3例3.3.1一、假定两总体方差相同x=[65 35 25 60;75 50 20 55;60 45 35 65;75 40 40 70;70 30 30 50;55 40 35 65;60 45 30 60;65 4025 60;60 50 30 70;55 55 35 75]y=[55 55 40 65;50 60 45 70;45 45 35 75;50 50 50 70;55 50 30 75;60 40 45 60;65 55 45 75;50 60 35 80;40 45 30 65;45 50 45 70]n=10;m=10;p=4;mx=mean(x)',my=mean(y)',A1=( n-1)*cov(x),A2=(m-1)*cov(y),D2=(n+m-2)*(mx-my) '*inv(A1+A2)*(mx-my),T2=n*m*D2/(m+n),F=(n+m-p-1)*T2/((n+m-2)*p),p=1-fcdf(F,4,15)mx =64.000043.000030.500063.0000my =51.500051.000040.000070.5000A1 =490.0000 -170.0000 -120.0000 -245.0000-170.0000 510.0000 10.0000 310.0000-120.0000 10.0000 322.5000 260.0000-245.0000 310.0000 260.0000 510.0000A2 =502.5000 60.0000 175.0000 -7.500060.0000 390.0000 50.0000 195.0000175.0000 50.0000 450.0000 -100.0000-7.5000 195.0000 -100.0000 322.5000D2 =5.9725T2 =29.8625F =6.2214p =0.0037二、假定两总体方差不相同z=x-y;n=10;p=4,T2=(n-1)*n*mean(z)*inv((n*c ov(z,1)))*mean(z)',F=(n-p)*T2/((n-1)*p),p=1-fc df(F,p,n-p)p =4T2 =31.55365.2589p =0.0364在显著性水平0.05下拒绝原假设。
多元统计分析 第3章 假设检验
![多元统计分析 第3章 假设检验](https://img.taocdn.com/s3/m/e49bb59f8762caaedd33d428.png)
a 1 a 1 n n
X (X1, X2 ,, X p ) Y (Y 1, Y 2 ,, Yp )
给定检验水平 ,查 F 分布表,使 p F F ,可确定 出临界值 F ,再用样本值计算出 F ,若 F F ,则否定 H 0 , 否则接受 H 0 。
一个正态总体均值向量的检验-已知
设 X (1) , X (2) ,, X ( n) 是 来 自 p 维 正 态 总体 N p ( μ , Σ ) 的 样
n 1 n 本,且 X X ( ) , S ( X ( a ) X )( X ( a ) X ) . n 1 a 1
( X 0 ) 2 z n 已知时,用统计量
当假设成立时,该统计量服从标准正态分布,从 而否定域为 | z | z /2 ,z / 2 为 N (0,1) 的 / 2 上分位 点 z 2 n( X 0 )( 2 )1 ( X 0 ) ~ (1)
注意到,上式 t 统计量可以表示为:
2 ( X ) /1 2 2 1 t n ( X ) ( s ) ( X ) 2 s /n 2 对于多元变量而言,可以将 t 分布推广为 Hotelling T 分布。
Hotelling T2 分布
定义 3.1 设 X ~ N p ( μ , Σ ) , W ~ Wp (n, Σ ) 且 X 与 W 相互独立,n p , 则称统计量 T nX W X 的 分 布 为 非 中 心 HotellingT2 分 布 , 记 为
否则接受 H 0 .
一个正态总体均值向量的检验-已知
第3章 多元正态总体参数的假设检验3.1
![第3章 多元正态总体参数的假设检验3.1](https://img.taocdn.com/s3/m/f1f658422b160b4e767fcfbc.png)
n
则称随机阵 W X X X (i) X (i) 的分布为威沙特分布,
记为W ~ Wp (n ,)
i 1
X(i) ~ N p(,) (i 1,L , n) 相互独立
1 L p
则称 W X X 服从非中心参数为
MM
M
1 L p
非中心威沙特分布,记为 W ~ W p (n, , ),其中 MM
性质1 设X(i) ~ Np (,) (i 1,L , n)相互独立,
则样本离差阵A 服从威沙特分布
n
A ( X(i) X )( X(i) X ) ~ W p (n 1,) i 1
证明:A d
n1
Z
t
Z
t
,
t 1
Zt ~ N p (0, ) t 1, 2,L , n 1 相互独立
则称随机阵 W X X X (i) X (i) 的分布为威沙特分布,
记为W ~ Wp (n ,) n
i 1
p 1 时 W
X2 (i)
~ 2 2 (n) W1(n, 2 )
i =1
一般地,设X(i) ~ N p(,) (i 1,L , n) 相互独立
1
2
A
A A2,且 rank( A) r(r n)
2. 一般 p 维正态随机向量的二次型 结论1 设X ~ N p (,), 0,
则 X 1X ~ 2 ( p, ) 其中 1.
证明: 0 CC (C为非退化方阵)
1 L
记
M
M
p
M
r
1n
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章 多元正态总体参数的假设检验
所涉及的最大似然估计量—单个总体
ˆ X时 (4) 当 0 (0 0巳知)时, 取 似然函数达最大值:
L( X , 0 ) 2
np 2
0
n 2
n 1 etr - 0 A 2
19
第三章 多元正态总体参数的假设检验
15
第三章 多元正态总体参数的假设检验
所涉及的最大似然估计量—单个总体
单个p维正态总体Np(μ,Σ),设X(i)(i=1,…,n)为来自p 维总体的随机样本.样本的似然函数为
L( , ) 2
np 2
1 ˆ A时, 似然函数达最大值 : ˆ X , (1)当 n n np A 2 A np L( X , ) 2 2 exp - n n 2
9
第三章 多元正态总体参数的假设检验
§3.6正态性检验--p维数据的正态性检验
D2(1)≤ D2(2) ≤…≤ D2(n) 统计量 D2 的经验分布函数取为
.
其中H(D2(t) |p)表示χ2 (p)的分布函数在D2(t)的值. 设χ2 分布的pt分位数为χt2 ,显然χt2满足: H(χt 2 |p)= pt. 即χ2 分布的pt 分位数χt2 =H-1(pt |p). 由经验分布得到样本的pt 分位数D2(t)=Fn-1(pt ). 若H(x|p)≌Fn(x),应有D2(t) ≌ χt2 ,绘制点(D2(t) , χt2 )的散 布图,当X为正态总体时,这些点应散布在一条直线上. 10
(1) (1) ( 2) ( 2)
np 2
A1 A2 n
(t )
np 2 2
e
X )( X
(t ) (i )
X )(t 1,2)
21
第三章 多元正态总体参数的假设检验
所涉及的最大似然估计量—两个总体
(2)当
(1)
2
( 2) nt
时, 取
1 1 (t ) ˆ T时, ˆ X X (i ) , n t 1 i 1 n 似然函数达最大值:
设X(α)=(Xα1 , …, Xαp)′ (α=1,…,n)是来自p元总体X的 样本, 检验 H0: X~Np(μ,Σ),H1:X不服从Np (μ,Σ).
1. χ2统计量的Q-Q图检验法(或P-P图检验法)
这是由正态分布的性质④构造的检验法. 在 H0下,样品X到总体中心 μ的广义平方距离 (或称马 氏距离)D2(X,μ)记为D2 ,则有 D2 =(X-μ)′Σ-1(X-μ)~χ2(p) 以 下 构 造 的 检 验 方 法 就 是 检 验 统 计 量 D2 是 否 ~ χ2(p). 直观的想法是:由样品 X(α) 计算 D2α(α=1,…,n), 对D2α排序:
第三章 多元正态总体参数的假设检验
§3.6正态性检验--二维数据的正态性检验
2. 二维数据的χ2 因二维数据的χ2图检验法与p维数据的χ2图 检验法原理完全相同.故关于二维数据的χ2 图检 验方法请参阅下面p维数据的χ2图检验方法.
8
第三章 多元正态总体参数的假设检验
§3.6正态性检验--p维数据的正态性检验
第三章 多元正态总体参数的假设检验
§3.6正态性检验--一维边缘分布的正态性检验
在实际应用中如果经过从多方面得到的检验结果与 正态分布均无显著性差异,也就认为该总体X与p元正 态无显著差异. 设 p 维 随 机 向 量 X=(X1,…,Xp)′, 检 验 分 量 Xi~ N(μi,σ2) (i=1,…,p) ,把p维正态性检验化为 p个一 维数据的正态性检验.常用的检验方法有以下几种. 1. χ2检验法 这是适用于连续型或离散型随机变量分布的拟合优 度检验方法,也称为Pearson χ2 检验法. 2. 柯氏(Kolmogorov,A.N.)检验法 这是适用于连续型分布的拟合优度检验方法.
所涉及的最大似然估计量—两个总体
两个p维正态总体Np(μ(1),Σ)和Np(μ(2),Σ),设 X(t)(i)( t=1,2; i=1,…,nt)为来自p维总体的随机样 本.样本的似然函数为(n=n1 + n2 )
L( , ) 2 nt 2 1 1 (t ) (t ) (t ) (t ) etr ( X )( X ) ( i ) ( i ) 2 t 1 i 1
np 1 1 L( X , T ) 2 2 T n n n np 2 2
e
22
第三章 多元正态总体参数的假设检验
所涉及的最大似然估计量—两个总体
其中总离差阵 T A B(称B为组间离差阵 ), B nt ( X
应用多元统计 分析
第三章 多元正态总体
参数的假设检验(二)
1
第三章 多元正态总体参数的假设检验
目
录 (二)
§3.6 正态性检验
第三章所涉及的最大似然估计量小结
2
第三章 多元正态总体参数的假设检验
§3.6 正态性检验
在均值和协差阵的检验中 ,以及以后将介绍的一些 统计方法中都是假定样本来自 p 元正态总体 . 所作统计 推断的结论是否正确 ,在某种意义上取决于实际总体与 正态总体接近的程度如何?因此建立一些方法来检验多 元观测数据与多元正态数据的差异是否显著是十分必 要的. 设X(α)=(Xα1 , …, Xαp)′ (α=1,…,n)是来自p元总体X的样 本,试问总体X是否服从Np(μ,Σ)分布? 若总体 X=(X1,…,Xp)′~Np(μ,Σ), 利用多元正态分布的 一些性质可知(记μ=(μ1,…,μp)′,Σ=(σij)p×p ):
14
第三章 多元正态总体参数的假设检验
§3.6正态性检验--p维数据的正态性检验
p维观测数据提供的信息大部分可由前几个 新变量所提供.这时p维数据的正态性检验可化 为几个相互独立的新变量的一元数据的正态性 检验 . 这些新变量在第七章主成分分析中被称 为主成分.故此检验法称为主成分检验法. 如果正态性假设不能成立,一般应考虑对 数据进行变换,使非正态数据更接近正态,然 后对变换后的数据进行统计分析 . 有关变换的 方法请见参考文献[5]、[6]或[7].
12
第三章 多元正态总体参数的假设检验
§3.6正态性检验--p维数据的正态性检验
(5) 以平方距离为横坐标,χ2 分位数为纵坐标作为 平面坐标系,用n个点(D2(t) ,χt2 )绘制散点图,即得 到卡方分布的Q-Q图;或者用另n个点(pt , H(D2(t) | p)) 绘制散点图,即得卡方分布的P-P图. (6) 考察这n个点是否散布在一条通过原点,斜率为 1的直线上 .若是 ,接受数据来自 p 维正态总体的假设 ; 否则拒绝正态性假设.
13
第三章 多元正态总体参数的假设检验
§3.6正态性检验--p维数据的正态性检验
2. 主分量检验法
设 X(i)=(Xi1, Xi2,…, Xip)′(i=1,…,n) 为 来 自 p 维 总 体 X=(X1,…,Xp)′的观测数据(样本).检验 H0: X~Np(μ,Σ),H1:X不服从Np(μ,Σ). 设 样本协差阵 S 的特征值为 λ1≥λ2≥…≥λp>0,相应的特 征向量为l1,l2,…,lp.记lt=(l1t , l2t ,… , lpt)′.令 Zt= l1t X1+ l2t X2+…+ lptXp (t=1,2,…,p) 即新变量Z1,…,Zp 是X1,…,Xp的线性组合.且可以证明: Z1,…,Zp 是相互独立的.
n i 1 n
np 2
A0 n
2
np exp - 2
其中A0 ( X (i ) 0 )( X ( i ) 0 ) A ( X ( i ) X )( X (i ) X )
i 1
17
第三章 多元正态总体参数的假设检验
所涉及的最大似然估计量—单个总体
第三章 多元正态总体参数的假设检验
§3.6正态性检验--p维数据的正态性检验
这种检验法其实就是卡方分布的Q-Q图检验法. 类似地也可以绘制点(pt , H(D2(t) |p))的散布图,当 X为正态总体时,这些点也应散布在一条直线上.这种 检验法其实就是卡方分布的P-P图检验法. 具体检验步骤如下: (1) 由n个p维样本点X(α) (α=1,…,n)计算样本均值X, 样本协差阵S:
5
第三章 多元正态总体参数的假设检验
§3.6正态性检验--一维边缘分布的正态性检验
3. 偏峰检验法 4. W (Wilks)检验和D 5. Q-Q (Quantile Quantile)图检验法 6. P-P (Probability Probability )图检验法 7. “3σ”原则检验法 8. A2和W2统计量检验法 方法3至方法8都是只适用于正态分布的检验 法.
20
np 2
n 2
第三章 多元正态总体参数的假设检验
所涉及的最大似然估计量—两个总体
其中A A1 A2 (称A为组内离差阵 ), At ( X
i 1 nt (t ) (i )
1 L( X , X , A) 2 n
(1) ( 2)
(t )
1 ˆ ˆ X , ˆ X , ( A1 A2 )时 (1)当 n n 似然函数达最大值:
(3) 当 0 (0 0巳知, 未知)时,
2 2
1 1 ˆ X , ˆ 取 tr(0 A)时 np 似然函数达最大值:
2
ˆ 0 ) 2 L( X ,
2
np 2
tr( 0 A) np
1
np 2
0
-
n 2
np exp - 2
3
第三章 多元正态总体参数的假设检验