多元正态分布

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2 i 1
(i)
(i)
( 2 ) p n 2 et x ( r 1 p 1 n[ ( x )x ( ) ']
2i 1
(i)
(i)
.
对数似然函数为:
lL n (, ) n 2 lp 2 n n 2 l|n | 1 2 t( r 1 i n 1(x ( i))x ( ( i)))'] n l2 p n n l|n | 1 t( r 1 S n 1 ( X )X ( ))'
1.单个正态总体 (1) 协方差矩阵 已知时均值向量的检验
H0:μμ0(μ0为已知向 H1:μ量 μ0)
检验统计量
T 0 2 n ( X μ 0 ) ( ) 1 ( X μ 0 ) ~ 2 ( p )(当H0成立时)
设水平为 ,查表确定 ,使得
拒绝域为:P (T 0 2 )
T02
(1 ,2) , 1 1 1 1 22 1 2 1 2 2 2
EX1 1, EX2 2, DX1 11DX1 22, cov(X1, X2) 112. 2
(10,20,1)
为X1和X2的相关系数。
当 0 时X1与X2不相关,对于正态分布来说不相关和独立
等价。因为:
X1, X2
(2)p n 2ex 1 n p (x[ ) 1 (x)]
2 i 1
(i)
(i)
(2)p n 2ex 1 n p t(r x [) 1 (x)]
2 i 1
(i)
(i)
( 2)p n 2 ex 1 np t( r 1 [ (x)x ())']
nlp n 2 n[l| n| t(r 1S)]
22
n
nlp 2 n n [|lS n | l|n 1S | t(r 1S )] 2 2n n n
n l2 p n n [|l S |n l|n 1 2S 1 2| t( r 1 2S 1 2 )]
2 2n n
例子:为了对几个行业的服务质量进行评价,消费者协会在 零售业、旅游业、航空公司、家电制造业分别抽取了不同的 企业作为样本。每个行业中所抽取的样本在服务对象、服务 内容、企业规模等基本上是相同的,统计出消费者对23家企业 的投诉次数,现判断几个行业的服务质量是否有差别。投诉 次数如下表:
.
零售业
旅游业 57 66 49 40 34 53 44

T2nXS1X 类似
并且
t2 n (X ˆ 2)2 n (X ) (ˆ2 ) 1 (X )~ F ( 1 ,n 1 )
.
基本性质: 定理:设 X~N p(μ , )S ,~ W p(n , ) 且X与S相互独立, 令
T2nXS1X 则
np1T2~F(p,np1) np
.
一、多元正态总体均值向量的假设检验
.
二元正态分布曲面(11=2,22=4,12=0.75)
.
二、多元正态分布的性质
性质1:若 X(X 1 ,X p)~N p(μ ,, )是对角矩阵,则 X1, Xp
相互独立。 性质2:若 X~Np(μ,) A为 sp阶常数d为 矩 s维 阵常 ,数向

A d X ~ N s ( A μ d ,A A )
f(x 1 , xp )(2)1 p 1 /2ex 1 2 p (x μ ) 1 (x μ )
其中, x(x1,xp),μ 是p维向量 是p阶
正定矩阵,则称X服从p维正态分布,记为 X~Np(μ,)
.
定义2:独立标准正态变量 X1, Xp 的有限线性组合
Y1
X 1
Y
Y p
性质3:若 X~Np(μ,) ,将 X, μ, 作剖分:
X (1) q
(1) q
X , ,
X (2) p q
(2) p q
1 1 21
12 q
22
p
q

X (1 )~ N q ((1 ), 1)1 X ,(2 )~ N q ((2 ), 2)2
.
特别地,二元正态分布: X (X 1 ,X 2 )~ N 2 (μ , ),
,即n 1 1 S 是无偏估计。
2. X , 1 S分别是 μ, 的最小方差无偏估量。
n 1
3.
3X. ,
1S( 1 S) n n1
分别是μ,
的一致估计。
.
三、正态总体下的抽样分布 维斯特(Wishart)分布---一元 2 分布的推广
定义: 设 n个随机向量 X ( i) (X i1 ,X i2 , ,X i) p ( i 1 ,2 ,3 , ,n )
第一章多元正态分布及其参数估计
多元正态分布的重要性: (1)多元统计分析中很多重要的理论和方法都是直接或间接
地建立在正态分布 基础上的,许多统计量的极限分布往往和 正态分布有关。 (2)许多实际问题涉及的随机向量服从多元正态分布或近似 服从正态分布。因此多元正态分布是多元统计分析的基础。 一、多元正态分布的定义 定义1:若p维随机向量 X(X1,Xp) 的密度函数为:
A
21 1
32
1
n(n1)
1 n 1 21 1 32
1. n(n 1)
1
n
0
2 32
1
n(n 1)
1 n 0
0
1 n(n 1)
1 n
0
0
(n1)
n(n1)
做变换
Y1 X 1
Y2
Yn
A
X2 Xn
Y1 1nin1Xi nX
n
n
Yi2 YY XAAX XX Xi2
i1
xi1 X 1
n xi2
i
1
X
2
xi1
x1
xi2 x2
xip
X
p
xip x p
( xi1 x1 ) 2
n ( xi 2 x1 )( xi1 x 2 )
i
1
(
x
ip
x p )( xi1
x1 )
( xi1 x1 )( xi 2 x2 ) (xi2 x2 )2
.
当原假设成立时
X~Np(0,1n)
Z1
令Z
n1/
2(X
0)
Z2
Zp
T02 ZZ
EZ0,DZIp
Z~Np(0,Ip)
.
(2) 协方差矩阵 未知时均值向量的检验
H0:μμ0(μ0为已知向 H1:μ量 μ0)
检验统计量 (n1)p1T2~F(p,np) (n1)p
T 2 ( n 1 )n [ ( X 0 ) S 1 n ( X 0 ) ~ T ] 2 ( p , n p )
分布,记为 T2~T2(p,n,),当 μ 0 时称为中心
的Hotelling T2分布。记为 T2 ~T2(p,n)。 一元t分布:
设总体 X~N(,2) X1, Xn 是一组样本 ,则统计量
.
其中
t n(X ˆ)~t(n1)
ˆ n11in1(Xi X)2
t2n (X ˆ 2)2n (X )( ˆ2) 1(X )
11
x1, lnx, x4 ,x2 如果想使值变大,则采用变换: x2, x3 不管使用哪种幂变换,还应该对变换后的数据的正态性做检验 (如Q-Q图方法)
.
§2多元正态分布的参数估计
一、多元样本及其样本数字特征
1.多元样本
x11 x12 x1p
X
x21
x22
x2
p
xn1
xn2
xnp
n
nlpn 2n pnln |S|
2
22 n
(引理:设A为p阶正定矩阵,则 tr(A)lnAp 当A=I
等号成立。
A1/2S n1/2Ip时等号成 立 n S ,即
.
最大似然估计的性质
1. E(X)μ ,即 X 是 μ的无偏估计 。
2.
E(1S)n1 nn
,即
1 n
S
不是 的无偏估计。
3.
E( 1 S) n1
i1
i1
n
(Xi X)2 nX2
i1
n
n
S2 Yi2Y12 Yi2
i1
i2
.
第三章多元正态总体参数的假设检验
Hotelling T2分布— 一元t分布的推广 定义 设 X~N p(μ , )S ,~ W p(n , ),且X与S相互独立, n p ,
则称统计量 T2nXS1X的分布为非中心的Hotelling T2
二、多元正态总体的最大似然估计及其性质
利用最大似然法求出 μ和 的最大似然估计为:
μˆ X
ˆ 1S n
.
求解过程
似然函数为:
L (, ) f(x ( 1 ))f(x (2 )) f(x (n ))
n (2) p2 1 2ex 1 (x p [) 1 (x)]
i 1
2(i)
(i)
(1)
X
~Np(μ,
1) n
(2) S~Wp(n1,)
(3) X , S 相互独立。
(4) S为正定矩阵的充分必要条件是 n>p 。
11
.
一元正态总体:
X1, Xn 为来自一元正态总体的一组样本
X1 ni n1Xi
n
S (XiX)2
i1
定理: X与S是相互独立的。
证明: 构造正交矩阵
1 n
1
( xip x p )( x2 x2 )
( xi1
x1 )(
xip
xp
)
( xi 2 x1 )( xip x p )
( xip x p )2
s11 s12 s1 p
s
21
s 22
s2 p
( sij
)
p
p
s
p1
sp2
s
pp
.
样本协方差矩阵
V 1S n

V 1 S n 1
的边缘密度函数为:
f1(x1) 211 1ex p(x12 1 211)2 f2(x2) 21 22ex p(x22 2 222)2
.
三、正态分布数据的变换 若一批多元数据不满足正态分布时,一般要对数据进行正态变换。 一般来说常采用幂变换,如果想使值变小可以采用变换:
拒绝域为:
{(n(n1)1)pp1T2F}
.
2.协方差阵相等时,两个正态总体均值向量的检验
.
3.协方差阵不相等时,两个正态总体均值向量的检验
.
.
4.多个正态总体均值向量的检验(多元方差分析)
一元方差分析
一、方差分析的概念及有关术语 方差分析研究的是分类型自变量对数值型因变量的影响,
包括它们之间有没有关系、关系的强度如何等,所采用的方 法就是检验各个总体的均值是否相等来判断分类型自变量对数 值型因变量是否有显著影响。
222
n l2 p n n l|n | 1 t( r 1 S ) n ( X ) '1 ( X ))
222
2
nlp n 2 nln | |1t(r 1S)
2 22
仅当 X时等号成立
.
lL n (X , ) nlp 2 n n l|n | 1 t( r 1 S ) 2 22
n
独立同分布于 Np(μ,), 则随机矩阵 W (i)(i)
为n的非中心维斯特分布,记为
i1
W~Wp(n,,μ)
服从自由度
随机矩阵的分布:
X11 X12 X1p
X
X21
X22
X2p
Baidu Nhomakorabea
Xn1 Xn2 Xnp
将该矩阵的列向量(或行向量)连接起来组成的长向量称为拉直 向量,拉直向量的分布定义为该矩阵的分布,如果是对称矩阵则 只取其下三角的部分拉直即可。
A
pm
X
m
μ
称为m维正态随机变量,记为 Y~Np(μ,) 其中 AA 但是 AA 的分解一般不是唯一的。
定其义中3t为:实若向随量机,向则量称X的X服特从征p函元数正为态:分布(t。)特ex征pit函μ数12t定t义的优
点在于可以包含 0 的情况。
.
二元正态分布曲面(11=1,22=1,12=0)

X (i) (x i1 ,x i2 , x ip ) i 1 ,2 n
.
2、多元样本的数字特征 样本均值
1nin1(i) 1n xxx111n21 xxx222n21 xxx1nn12n X X X12p
.
样本离差阵 n
S p p ( X (i ) X )( X (i ) X )
.
性质: (1)若W1和W2独立,其分布分别 Wp(n1,)和 Wp(n2,),则 W1W2 分布为 W p(n1n2,),即维斯特(Wishart)分布有可加性。
(2)W~Wp(n,),C为m×p阶的矩阵,则 CWC 的分布
为 W m(n,C C ) 分布。
.
定理: 设 X , S 分别是来自正态总体 Np(μ,)的样本均值 和离差阵 ,则
航空公司 家电制造业
68
31
44
39
49
51
29
21
65
45
34
77
56
40
58
51
要分析4个行业的服务质量是否有显著差异,实际上就是判断 “行业”对投诉次数是否有显著影响,做出这种判断最终归结 为检验4个行业被投诉次数的均值是否相等。如果相等则认为 行业因素对投诉次数是没有影响的,如果均值不全相等,则意 味着行业因素对服务质量有影响。 方差分析主要用来对多个总体均值是否相等作出假设检验。
相关文档
最新文档