第二章多元正态分布

合集下载

多元统计分析:第二章 多元正态分布及

多元统计分析:第二章   多元正态分布及
17
1 2 exp( it ) exp( s j ) 2 j 1
) E(e
isqU q
)
第二章 多元正态分布及参数的估计
§2.2
记Σ=AA′,则有以下定义。 定义2.2.2 若p维随机向量X的特征函数 t ' t 为:
X (t ) exp[ it '
,d为s×1常向量,令Z=BX+d,则
Z~Ns(Bμ+d , BΣB ).
该性质指出正态随机向量的任 意线性组合仍为正态分布.
19
第二章 多元正态分布及参数的估计
§2.2 多元正态分布的性质2
证明 因Σ ≥0, Σ可分解为Σ=AA ,其中A 为p×q 矩阵.已知X~Np(μ,Σ),由定义 2.2.1可知 X = AU+μ
是对称非负定阵. 即 =´ , ´ ≥0 (为任给的p维常量).
7
第二章 多元正态分布及参数的估计
§2.1 随机向量—
(4) Σ=L2 ,其中L为非负定阵.
由于Σ≥0(非负定),利用线性代数中实对称阵的对角化定理,存 在正交阵Γ,使
1 0 LL

1 0 ' 0 p
并设:
i 0(i 1,, q), q1 0,, p 0.
10
第二章 多元正态分布及参数的估计
§2.2
在一元统计中,若U~N(0,1),则U的任意 线性变换X=σU+μ~N(μ,σ2)。利用这一性质, 可以从标准正态分布来定义一般正态分布:
若U~N(0,1),则称X =σU+μ的分布为 一般正态分布,记为X ~N(μ, σ2 )。
如例2.1.1,证明了X1,X2均为一元正态 分布,但由(X1,X2) 联合密度函数的形式易见 它不是二元正态.

第二章 多元正态分布及其抽样分布

第二章  多元正态分布及其抽样分布
1 2
Σ Σ11 Σ22
f ( x1 , x2 , , x p ) ( 2 )
(2 )
p 2
p 2
1 Σ22
1 exp[ (x μ)Σ 1 (x μ)] 2
1 2
Σ11
1 2
Σ22
1 (x1 μ1 ) Σ 1 11 exp[ (x1 μ1 ) (x2 μ 2 ) ] 1 2 Σ22 (x2 μ 2 )
n
六、x ~ N p (μ, Σ) ,则(x - μ)Σ-1 (x - μ) ~ 2 ( p)分布。

y Σ (x μ) Var(y ) Var[ Σ (x μ)] Σ Var(x μ)Σ
1 2 1 2 1 2

1 2
Σ ΣΣ Ι
2 y是p维标准正态分布,故yy服从( p)分布。
服从p维正态分布,且均值向量为
E ( x ) ( Ex1 , Ex 2 , , Ex p ) ( 1 , 2 , , p )
x的协方差矩阵为
Var (x) E(x )(x )
E AuuA
AE uu A
AIA
AA Σx
系数,定义为
ij.k 1,, p
ij.k 1,, p ii.k 1,, p jj .k 1,, p
它度量了在值 xk 1 ,, xp给定的条件下,xi 与 x j ( i, j k )相关性的强弱。
例 设X~N6( ,),其协方差矩阵为,计算偏相 关系数。
7.033 2.168 3.540 4.981 2.874 30.530
为 x 2 给定的条件下 x1 数学期望。

第二章 多元正态分布

第二章 多元正态分布

Σ11 Σ= Σ 21
Σ12 k Σ 22 k − p
µ1 k µ= µபைடு நூலகம்2 p − k
x1 k x= x 2 p − k
则给定 x 2 时 x1 的条件分布为 N k ( µ1⋅2 , Σ11⋅2 ) ,其中
µ1⋅2 = µ1 + Σ12 Σ −1 (x 2 − µ 2 ). 22
7.033 2.168 3.540 4.981 2.874 30.530 Σ=
1.681 1.276 4.638 3.107
1.276 5.213 1.161 2.939 5.864 19.532 1.851 4.069 3.860 4.525 27.363
p 元正态分布;
若 rank(A) < p( p ≤ q),则Σ−1不存在, = Au + µ是退化 x
p元正态分布,不存在密度函数。
1 0 例:设随机向量 u ~ N2 (0, I ) , = Au, = 0 1 ,则 x 的分布是 A x 退化的三元正态分布。 1 1
1 1 =I = O 1
二、一般的正态分布 设随机向量 x = (x1, x2 ,L, xp )′ ,若其的密度函数为
f (x1, x2 ,L, xp ) = (2π )
− ∞ < xi < +∞
协方差为
−p 2
Σ
−1 2
1 exp[− (x − µ)′Σ−1(x − µ)] 2
1 0 1 0 1 0 11 0 1 = 0 1 1 Σ = AA′ = 0 1 1 1 1 1 1 2 1 0 1 0 1 1 = 1 1 + 0 1 = 2 −1−1 = 0 Σ= 1 2 1 1 1 1 2

第二章多元正态分布的参数估计

第二章多元正态分布的参数估计

就是剔除了 X2 Xk1, , X p 得(线性)影响之后,Xi和
Xj之间得协方差。
给定X2时Xi 和Xj得偏相关系数(partial correlation
coefficient)定义为: ij k1, , p
ij k1, , p
,
ii k1, , p jj k1, , p
其中 Σ11 2 ij k1, , p 。
μ12
μ1
Σ12
Σ
1 22
x2 μ2
Σ112
Σ11
Σ12
Σ
1 22
Σ
21
μ1·2和Σ11·2分别就是条件数学期望和条件协方差矩
阵,Σ11·2通常称为偏协方差矩阵。
这一性质表明,对于多元正态变量,其子向量得条件分布仍
就是(多元)正态得。
例5 设X~N3(μ, Σ),其中
1
16 4 2
μ
0 2
μ(1) μ(2)
11 Σ 21
31
12 22 32
13 23 33
Σ11
Σ
21
Σ12
22

X (1)
X1
X
2
~
N2 ( μ(1) ,
Σ11)
其中
μ (1)
1
2
Σ11
11 21
12
22
在此我们应该注意到,如果 X ( X1, X 2 , , X p ) 服从 p
aX
(0,1,
0)
X
2
X2
~
N (aμ, aΣa)
X3
1

(0,1,
0)
2
2
3
11 12 aΣa (0,1, 0) 21 22

多元统计分析_第2章_多元正态分布_s

多元统计分析_第2章_多元正态分布_s

第2章多元正态分布§2.1 多元分布§2.2 多元正态分布的定义及基本性质§2.3 正态分布的条件分布和独立性§2.4 矩阵正态分布§2.5 参数的极大似然估计§2.6 极大似然估计的性质13),21′=p ξξξ (ξ随机向量:pn ij ξξ×=)(随机矩阵:注:随机矩阵拉直后就是随机向量,二者都是由多个随机变量组成,只是摆放形势不同.4一、多元分布函数1212121122122.1.1 (,,,)()(,,,) ()(,,,)(,,,)(,,,)~.p p p p p pp ξξξξξξF x F x x x P ξx ξx ξx x x x x R F ξξ′===≤≤≤′=∈ 定义设是一随机向量,它的多元分布函数的联合分布函数定义为式中,记作512122112(1)(,,,)(1,2,,)(2)0(,,,)1(3)(,,,)(,,,)(,,,)0(4)(,,,)1p i p p p F x x x x i p F x x x F x x F x x F x x F =≤≤−∞=−∞==−∞=+∞+∞+∞= 是每个变量的单调非降右连续函数.多元分布函数的性质:71)( )2( ,0)( )1()(=∈∀≥⋅∫dx x f R x x f R f pR pp 当且仅当随机向量的分布密度,中某个能作为一个多元函数9二、边缘分布.)( 3.1.2)1(的边缘分布的分布称为个分量组成的随机向量的维随机向量,由它为若定义ξξξp q q p <10),,,,,,(),,,,,),,)111111)1()2()1(∞∞∞=∞≤∞≤≤≤=≤≤=≤⎟⎟⎠⎞⎜⎜⎝⎛=+ q p q q q q q u u F u ξu ξP u ξu ξP u ξP ξξξξξξ((((1)的分布函数为,则不妨假设11(1)(1212112111)(,,)(,,)q q u u u p p u u u p q p q P ξu f t t dt dt dt f t t dt dt dt dt ∞∞∞−∞−∞−∞−∞−∞−∞∞∞∞+−∞−∞−∞−∞−∞−∞≤=⎡⎤=⎢⎥⎣⎦∫∫∫∫∫∫∫∫∫∫∫∫ 若ξ有分布密度函数f (x ),则12p q p q q q dt dt t t x x f x x f ξ1111)1(),,,,,(),,(++∞∞−∞∞−∞∞−∫∫∫=的边缘分布密度为(1)13注:(1)有分布密度函数,则它的任何边缘分布也有分布密度函数;(2)若的任何边缘分布有分布密度函数,并不能推出有分布密度.ξξξ两个随机向量独立的充分必要条件:①联合分布函数等于边缘分布函数的乘积;②若随机向量为连续型的,联合分布密度等于边缘分布密度的乘积;③若随机向量为离散型,联合分布列等于边缘分布列的乘积;④联合特征函数等于边缘特征函数的乘积.1621).()(~),(~),(~,)4(t t t t ηηηξηξηξΦΦ+ΦΦξξ则量的随机向是相互独立且维数相同与若).()(),( ,)()(,,)5()2()1()2()1(t t t t t t q p ηξξΦΦ=Φ⇔ΦΦ⎟⎟⎠⎞⎜⎜⎝⎛Φ独立和则的特征函数和分别为和特征函数的表示维随机向量和分别为和若ηξηξηξηξη22(7) .p a ξξ′若为维随机向量,则它的分布由一切形如的分布所唯一决定).()exp()( ,),(~ )6(t A a t i t a A t ′Φ′=Φ+=Φξηξηξ则若ξ23).()exp()])([exp()exp()][exp()exp())]([exp()][exp()(t A a t i t A i E a t i A t i E a t i a A t i E t i E t ′Φ′=′′′=′′=+′=′=Φξηξξξη证明:(6)24.,3,,),()][exp()1( 1)][exp()( )7(:的分布它决定了知由性质的特征函数恰好是的函数把它看成得取的特征函数为证明ξξξξa a a i E t a it E t a a a Φ=′=Φ=′=Φ′′′ξξξξ25五、矩2.1.6 ()(), 1, 2, , ,1, 2, , ,()(), .ij ij ij n p E i n j p E ξξξεξξξ=×=== 定义设为随机矩阵,假定存在且有限记称为随机矩阵的均值)()( ij E ξξε=26,(1) ,,,( )(),()()A B C A B C A B CA A εξεξξεξεξ+=+=若为常数矩阵则特别当为随机向量时有注:以下总假定公式中用到的随机矩阵的矩是存在的.均值的性质:27)]([)]([)] )4()()( , )3()()( ,, )2(ξεξεξξηεξεηξεηεξεηξεA tr A tr A E n p A p n b a b a b a B A B A B A ==××+=++=+[tr()()(则常数矩阵,为随机矩阵,为若为常数,则若则为常数矩阵若注:以上四个性质均体现均值的线性性.28().),,cov()(),cov(])()][([),cov( ),,cov(,)(),), 7.2.1 2121的协方差称为时,记作当即其元素是矩阵定义为一个简称协差阵阵的协方差维随机向量,它们之间维和分别为和设定义ξξξξηξηξηεηξεξεηξηξηηηηξ===′−−=×′=′=D p n p n ξξξj i j i p n ((29() ),cov(),cov( j i ηξηξ=()),cov(),cov(j i ξξξξ=31.])(][)([)())()()( ,)2(.})(){() (),cov(,})(){() (),cov()1(′−−+=′−−=+′−′=′−′=a a D a a D a D a ξεξεξξξεξξξεξεξξεξξηεξεηξεηξ(则为常向量若特别协差阵的性质:32A AD A DB A B A B A ′=′=)()( ),cov(),cov( ,)3(ξξηξηξ特别则为常数矩阵和设协差阵的性质(续)35则记值和协差阵存在的均若随机向量定理 ),( ),( ,),,, 1.1.221ξξεμD ξξξξn =Σ=′= ()()( μμξξA A tr A E ′+Σ=′36μμμμξξξξξξA A tr A tr A Etr A Etr A E ′+Σ=′+Σ=′=′=′)()}({)()()(μμξξεξεξεξξεξ′+Σ=′′−′=) (,})(){() ()(:所以因为证明D。

第二章多元正态分布

第二章多元正态分布

联合概率分布
均值向量量是向
协方差矩阵Σ
•多元正态分布在多元统计分析中的重要地位,就 如同一元统计分析中一元正态分布所占重要地位 一样,多元统计分析中的许多重要理论和方法都 是直接或间接建立在正态分布的基础上。
•原因是: (1)许多实际问题研究中的随机向量确 实遵从正态分布,或者近似遵从正态分布;
(2)对于多元正态分布,已经有一套统计推断方法, 并且得到了许多完整的结果。
若某个随机变量X 的密度函数是
1
1(x)2
f(x)22 ex2 p{ 2 },x (, )
则称X服从一元正态分布,也称X是一元正态随 机变量(其中有两个参数)。
记为 X ~ N(。,2)
可以证明:其期望(也叫均值)正好是参数μ,
方差正好是 , 它2 是一非负数 。
有时候,仅仅用一个随机变量来描述随机现象就 不够了,需要用多个随机变量来共同描述的随机 现象和问题,而且这些随机变量间又有联系,所 以必须要将它们看做一个整体来研究(即不能一 个一个地单独研究多个一元随机变量),这就出 现了多元随机向量的问题和概念.
二元联合分布函数的几何意义演示图:
F(x,y)=
Y
P(X≤x,Y≤y) ,
y
(x,y)
{ X≤x , Y≤yy } x
X
F(x,y)值为随 机点落入黄色 矩形区域内的 概率
对于p元的随机向量来说,就对应地需要 用联合分布函数来刻画其概率分布。
联合分布函数的定义:
设 X(X 1,X 2,..X .p,) 是一随机向量, 它的联合分布函数定义为
其中,x和μ都是p维向量,Σ是p阶正定阵,则称
随机向量X(X 1,X 2,..X .p,) 服从p元正态分布,

第二章 多元正态分布及参数的估计

第二章   多元正态分布及参数的估计

27
北大数学学院
第二章 多元正态分布及参数的估计
§2.2 多元正态分布的定义与基本性质—简单例子
y BxB


0 0 1
1 0 0
100 110
1 2 0
003 100
0 0 1
1 0 0



1 0 1
2 0 1
003 100
2
北大数学学院
第二章 多元正态分布及参数的估计
目录
§2.1 随机向量 §2.2 多元正态分布的定义与
基本性质
§2.3 条件分布和独立性 §2.4 随机矩阵的正态分布 §2.5 多元正态分布的参数估计
3
北大数学学院
第二章 多元正态分布及参数的估计
§2.1 随 机 向
本课程所讨论的是多变量总体.把 p个随机变量放在一起得
第二章 多元正态分布及参数的估计
§2.2 多元正态分布性质2的推论
例2.1.1
f (x1, x2
()X1,X212)的e联 12合( x12密 x22度) [1函数x为1 x2e

1 2
(
x12

x22
)
]
我们从后面将给出的正态随机向量的联合密
度函数的形式可知, (X1,X2)不是二元正态随机向 量.但通过计算边缘分布可得出:
本节有关随机向量的一些概念(联合分布, 边缘分布,条件分布,独立性;X的均值向量,X 的协差阵和相关阵,X与Y的协差阵)要求大家 自已复习.
三﹑ 均值向量和协方差阵的性质 (1) 设X,Y为随机向量,A,B为常数阵,则
E(AX)=A·E(X) E(AXB)=A·E(X)·B
6

厦门大学《应用多元统计分析》第02章_多元正态分布的参数估计

厦门大学《应用多元统计分析》第02章_多元正态分布的参数估计
+∞ +∞
( 2) )
−∞ −∞
∫∫
e − ( x1 + x2 ) dx1dx2 =
+∞ +∞
∫∫
0 0
e − ( x1 + x2 ) dx1dx2
=
=
+∞

0
0 +∞
+∞ − ( x1 + x2 ) dx1 dx2 ∫ e 0
− x2
∫e
dx2 = − e
− x2 +∞ 0
=1
维随机向量, 定义 2.4 设 X = ( X 1 , X 2 ,L , X p )′ 是 p 维随机向量,称 由 它 的 q (< p ) 个 分 量 组 成 的 子 向 量 的边缘( 或边际) X (i ) = ( X i1 , X i2 ,L , X iq )′ 的分布为 X 的边缘( 或边际 ) 分布, 的分布称为联合分布。 分布 ,相对地把 X 的分布称为联合分布。通过变换 X 中 各分量的次序, 总可假定 X (1) 正好是 X 的前 q 个分量, 个分量, 各分量的次序, 其 余 p − q 个分量为 X
f ( x1 , x 2 , L , x p ) , 使 得 对 一 切 x = ( x1 , x2 , L, x p )′ ∈ R p 有
F ( x)∆F ( x1 , x2 ,L , x p ) =
x1
xp
−∞
∫L∫
f (t1 , t2 ,L , t p )dt1 L dt p (2.3) )
−∞
表 2.1 变量 序号 1 2
数据
X1
X2
L
Xp
X 11
X 12

多元统计分析第二章 多元正态分布

多元统计分析第二章 多元正态分布

第2章 多元正态分布多元正态分析是一元正态分布向多元的自然推广。

多元正态分布是多元分析的基础,多元分析的许多理论都是建立在多元正态总体基础上的。

虽然实际的数据不一定恰好是多元正态的,但是正态分布常常是真实的总体分布的一种有效的近似。

所以研究多元正态分布在理论上或实际上都有重大意义。

限于篇幅,本章仅简介多元正态简单理论,细节可参看王学民(2004),张尧庭(2002),余锦华(2005),Richard (2003),朱道元(1999)等。

现实世界的许多问题都可以纳入正态理论的范围内,正态分布可以作为许多统计量的近似的抽样分布。

2.1随机向量2.1.1随机向量定义2.1.1:称每个分量都是随机变量的向量为随机向量。

类似地,所有元素都是随机变量的矩阵称为随机矩阵。

设()1,,p X X X '= 是1p ⨯随机向量,其概率分布函数定义为:(){}111,,,,p p p F x x P X x X x =≤≤ ,1,,p x x 为任意实数多元分布函数()1,,p F x x 有如下性质: (1)()10,,1p F x x ≤≤ ;(2)()1,,p F x x 是每个变量,1,2,,i x i p = 的非降右连续函数; (3)(),,1F ∞∞= ;(4)()()()211,,,,,,,0p p F x x F x x F x -∞=-∞==-∞= 。

多元分布和一元分布一样也分为离散型和连续型。

连续型随机向量()1,,pX X X '= 的分布函数可以表示为 : ()()1111,,,,px x p p p F x x f t t dt dt -∞-∞=⎰⎰,()1,,pp x x R ∈ (2.1)称()1,,p f x x 是()1,,p X X X '= 的多元联合概率密度,简称多元概率密度或多元密度。

多元概率密度()1,,p f x x 有以下性质: (1)()1,,p f x x 非负; (2)()11,,1p p f x x dx dx ∞∞-∞-∞=⎰⎰ ;(3)()()111,,,,p p p nF x x f x x x x ∂=∂∂2.1.2边缘分布、条件分布和独立性 边缘分布设()1,,p X X X '= 是p 维连续型随机向量,由其q 个分量组成的向量()1X (不妨设()()11,,q X X X '= )的分布称为的边缘分布,其边缘概率密度为:()()()1111,,,,X q p q p f x x f x x dx dx ∞∞+-∞-∞=⎰⎰ (2.2)条件分布设()1,,p X X X '= 是p 维连续型随机向量,()()11,,q X X X '= ,()()()()2112,,,,,0q p X q p X X X f x x ++'=> ,在给定()2X 的条件下,()1X 的条件概率密度函数为:()()()()21111,,,,,,,,p q q p X q p f x x f x x x x f x x ++=(2.3)独立性设()1,,n X X 是连续型随机向量,则1,,n X X 相互独立当且仅当()()()111,,n n X X n f x x f x f x = 对任意1,,n x x 成立。

第二章 多元正态分布 《应用多元统计分析》 ppt课件

第二章 多元正态分布 《应用多元统计分析》 ppt课件
写字母表示; 随机变量用大写字母表示,其实现值用小写字母表示。
1
一、随机向量
在理论上,对多维随机向量的研究和对一维随机 变量的研究思路是类似的,通过分布及其特征进 行刻画。不同的是,可能要考虑变量之间的相关 关系。
在统计应用上,对多维随机向量的研究和对一维 随机变量的研究思路也是一样的,要通过样本资 料来推断总体。
19
二、多元正态分布的数字特征
若 X ~ Np μ, Σ ,则 E(X) μ,D(X) Σ ,即 μ 恰好是
多维随机向量 X的均值向量, Σ 恰好是多维随机 向量 X 的协差阵。其中,
1
μ
2

p
11 12
Σ
21
22
p1 p2
1p
2
p
pp
20
三、多元正态分布的参数估计
若 X 的联合分布密度为 f (x1, x2 , , xp ),则 X(1) 的边缘 密度函数为:
f (x1, x2 , , xq )
f (x1, x2 ,
, xq , xq1,
, xp )dtq1
dt,p (2.3)
多维随机向量的独立性。若 p个随机变量
X1, X 2 ,, X p的联合分布密度等于各自边缘分布的 乘积,则称 X1, X 2 ,, X p是互相独立的。
1
x)(x( )
x)
n
(x1 x1)2
1
1 n
n
(x1 x1)(x 2 x2 )
1
n
(x 2 x2 )2
1
n
x 2
1
n
x
p
1
n
( x 1
x1)(x p
xp

第2章多元正态分布参数估计

第2章多元正态分布参数估计

第2章多元正态分布参数估计多元正态分布是多元随机变量的一种常见模型。

在实际问题中,我们常常需要通过已有的数据对多元正态分布的参数进行估计,便于进行后续的统计分析和预测。

多元正态分布的参数估计主要包括均值向量和协方差矩阵的估计。

对于均值向量的估计,最简单的方法是直接计算样本均值。

假设我们有一个包含n个样本的数据集,其中每个样本有d个维度的观测值,我们可以将样本数据表示为一个n×d的矩阵X。

则样本均值向量的估计值μ可以通过以下公式得到:μ = (1/n) * Σxi其中,xi表示第i个样本观测值。

对于协方差矩阵的估计,最常用的方法是样本协方差矩阵的估计。

样本协方差矩阵S的估计值可以通过以下公式得到:S = (1/n) * Σ(xi - μ)(xi - μ)T其中,T表示矩阵的转置。

需要注意的是,样本协方差矩阵的估计是基于样本的二阶矩估计,因此在数据量较小的情况下,估计结果可能存在偏差。

为了减小估计结果的偏差,可以使用修正样本协方差矩阵的估计。

修正样本协方差矩阵的估计值可以通过以下公式得到:S = ((n-1)/n) * Σ(xi - μ)(xi - μ)T其中,n-1是修正系数。

除了样本协方差矩阵,也可以使用样本相关系数矩阵来估计多元正态分布的协方差矩阵。

样本相关系数矩阵R的估计值可以通过以下公式得到:rij = sij / (si * sj)其中,sij表示样本协方差矩阵的元素,si和sj分别表示样本标准差。

需要注意的是,当样本量较小或者存在样本相关系数为1的情况时,样本相关系数矩阵的估计结果可能不可靠,此时推荐使用样本协方差矩阵来估计。

在实际问题中,参数估计是多元正态分布分析的重要步骤。

通过对样本数据进行参数估计,我们可以对多元正态分布的均值和协方差矩阵有一个初步的认识,从而便于进行后续的模型建立、参数推断和预测。

同时,合理的参数估计方法也有助于提高分析结果的精度和可靠性。

总之,多元正态分布参数估计是一个对多元随机变量的观测数据进行统计分析的重要任务。

第二章_多元正态分布的参数估计要点

第二章_多元正态分布的参数估计要点

x
|ρ|越小,长轴越短 ,短轴越长,即椭圆越圆;
|ρ|=1时椭圆退化为一条线段;|ρ|=0时即为圆。
§2.2 多元正态分布的性质
(1)多元正态分布的特征函数是: 1 ' ' X ( t ) exp( it t t ) , AA' . 2 (2)设X是一个p维随机向量,则X服从多元正态分布,
性质(2)知,X1,X2, ⋯,Xn的联合分布必为多元正态 分布,于是命题“一元正态变量的联合分布必为多元 正态分布”成立,从而矛盾。
例 2 若 X ( X1 , X 2 , X3 ) ~ N3 ( μ, Σ ) 其中,
11 12 21 22 31 32 1 0 0 设 a (0,1,0) , A ,则 0 0 1 1 2 3
13 23 33
( 1)
X1 X ~ N (aμ, aΣa ) aX (0,1, 0) X 2 2 X3
其中
1 aμ (0,1, 0) 2 2 3 11 12 13 0 1 aΣa (0,1, 0) 22 23 22 21 0 32 33 31
( 2)
1 AX 0
其中
X1 0 0 X 1 AΣA ) X 2 X ~ N (Aμ , 0 1 X 3 3 1 0 0 1 2 0 1 3 3
1 exp 2 2 1


二元正态分布的密度曲面图
下图是当 , 0.75 时二元正态分布的钟形密

多元统计分析第二章多元正态分布

多元统计分析第二章多元正态分布

多元统计分析第二章多元正态分布多元正态分布(Multivariate Normal Distribution),是指多个随机变量服从正态分布的情况。

在统计学中,多元正态分布是一个重要的概率分布,广泛应用于多个领域,如经济学、金融学、生物学、工程等。

多元正态分布的概率密度函数可以表示为:f(x;μ,Σ) = (2π)^(-k/2) ,Σ,^(-1/2) exp(-(x-μ)'Σ^(-1)(x-μ)/2)其中,x表示一个k维向量(k个随机变量),μ是一个k维向量,表示均值向量,Σ是一个k*k维协方差矩阵,Σ,表示协方差矩阵的行列式,'表示向量的转置,Σ^(-1)表示协方差矩阵的逆矩阵,exp表示指数函数。

多元正态分布具有以下特点:1.对称性:多元正态分布的密度函数是关于均值向量对称的。

2.线性组合:多元正态分布的线性组合仍然服从正态分布。

3.条件分布:给定其他变量的取值,多元正态分布的边缘分布和条件分布仍然服从正态分布。

4.独立性:多元正态分布的随机变量之间相互独立的充要条件是它们的协方差矩阵为对角矩阵。

对于多元正态分布,可以使用协方差矩阵来描述不同随机变量之间的相关程度。

协方差矩阵的对角线元素表示各个随机变量的方差,非对角线元素表示各个随机变量之间的协方差。

多元正态分布的参数估计也是统计学中一个重要的问题。

通常可以使用最大似然估计方法来估计均值向量和协方差矩阵。

在实际应用中,多元正态分布可以用来描述多个相关变量的联合分布。

例如,在金融学中,可以使用多元正态分布来建模多个股票的收益率。

在生物学中,可以使用多元正态分布来建模多个基因的表达水平。

除了多元正态分布,还存在其他的多元分布,如多元t分布、多元卡方分布等。

这些分布可以用来处理更一般的随机变量,具有更广泛的应用领域。

总之,多元正态分布是统计学中一个重要的概率分布,具有许多重要的性质和应用。

通过对多元正态分布的研究,可以更好地理解和分析多个相关变量的联合分布,推断和预测相关变量的取值,并为实际问题提供可靠的解决方案。

第二章多元正态分布的参数估计

第二章多元正态分布的参数估计

第二章多元正态分布的参数估计多元正态分布是在多个随机变量之间存在相互依赖关系时使用的一种概率分布。

它在许多统计分析和机器学习领域中都有广泛的应用。

在实际应用中,我们通常需要使用样本数据对多元正态分布的参数进行估计。

多元正态分布由均值向量和协方差矩阵两个参数来描述。

均值向量表示各个随机变量的平均值,而协方差矩阵表示各个随机变量之间的协方差。

参数估计的目标就是通过样本数据来估计这两个参数。

首先,我们需要收集一个具有充分样本量的数据集。

对于一个具有n个样本的多元正态分布,我们可以将样本数据表示为一个n行d列的矩阵X,其中每一行是一个d维的样本向量。

其中n表示样本数量,d表示随机变量的个数。

接下来,我们可以根据样本数据来估计多元正态分布的均值向量和协方差矩阵。

1.均值向量的估计:多元正态分布的均值向量可以通过样本均值向量来估计。

样本均值向量的计算公式如下:μ = (1/n) * Σxi其中μ是估计得到的均值向量,xi表示样本矩阵X的第i行。

2.协方差矩阵的估计:多元正态分布的协方差矩阵可以通过样本协方差矩阵来估计。

Σ=(1/(n-1))*(X-μ)'*(X-μ)其中Σ是估计得到的协方差矩阵,X是样本矩阵,μ是估计得到的均值向量。

需要注意的是,在计算协方差矩阵时,我们使用的是样本协方差矩阵而不是总体协方差矩阵。

这是因为样本协方差矩阵能更好地反映样本数据的真实情况。

以上就是多元正态分布的参数估计方法。

通过样本数据,我们可以使用样本均值向量和样本协方差矩阵来估计多元正态分布的参数。

这些参数估计能为我们提供关于多元正态分布的统计属性和特征,进而用于进一步的分析和应用。

《多元统计分析》第二章 随机向量和多元正态分布

《多元统计分析》第二章  随机向量和多元正态分布

《多元统计分析》MOOC2.1 多元分布王学民一、多元概率分布函数v随机向量:一个向量,若它的分量都是随机变量。

v 随机变量x 的分布函数:v 随机变量x 1和x 2的联合分布函数:v 随机向量的分布函数:v本课程主要讨论连续型的分布。

()12,,,p x x x '=x ()()F a P x a =≤()()121122,,,,,,p p p F a a a P x a x a x a =≤≤≤ ()()121122,,F a a P x a x a =≤≤二、多元概率密度函数v一元的情形:v二元的情形:vp 元的情形:v概率密度函数,简称概率密度或密度函数或密度。

()()d a F a f x x -∞=⎰12121212(,)(,)d d a a F a a f x x x x -∞-∞=⎰⎰1111(,,)(,,)d d pa a p p pF a a f x x x x -∞-∞=⎰⎰分布函数的概念主要用于理论上的讨论,本课程仅在此提一下,后面将不再提及。

分布用密度来描述较为方便。

概率密度的性质v一元密度f (x )的性质:v多元密度f (x 1,⋯,x p )的性质:1111(,,)0,,(,,)d d 1p p p p f x x x x f x x x x ∞∞-∞-∞≥=⎰⎰(1),对一切实数;(2)。

()0()d 1f x x f x x ∞-∞≥=⎰(1),对一切实数;(2)。

三、边缘分布v 边缘分布:p 维随机向量 的任意子向量的分布。

v边缘分布可以是关于一个变量,两个变量,…,p −1个变量的边缘分布。

()12,,,p x x x '=x四、条件分布v条件分布:在一些已知条件下的分布。

v例1研究某人群,x1——身高,x2——体重,该人群中x2的分布为f(x2)。

如果已知某人的x1=1.80(米),则对该人体重的推断应依据f(x2|x1=1.80),而不是f(x2)。

第2章 多元正态分布的参数估计

第2章 多元正态分布的参数估计

布函数即边缘分布函数为:
F ( x1 , x2 , , xq ) P( X 1 x1 , , X q xq ) P( X 1 x1 , , X q xq , X q 1 , , X p ) F ( x1 , x2 , , xq , , , )
机向量的密度函数的主要条件是:
p (1)f ( x1 , x2 ,, x p ) 0, ( x1 , x2 ,, x p ) R ;

(2)

f ( x , x ,, x
1 2

p
)dx1 dxp 1
2016/2/24
19
【例2.1】 试证函数 e ( x x ) , f ( x1 , x 2 ) 0,
1 2
x1 0, x 2 0 其它
为随机向量 X ( X1, X 2 ) 的密度函数。
证:只要验证满足密度函数两个条件即可
(1)显然,当 x1 0, x2 0 时有 f ( x1 , x2 ) 0

(2)

2016/2/24



( x1 x2 ) e dx1dx2
当 X 有分布密度 f ( x1 , x2 ,, x p ) 时(联合分布密 度),则 X (1)也有分布密度,即边缘密度函数为 :

f1 ( x1 , x2 ,, xq ) f ( x1 ,, x p )dxq1 ,, dxp

24
2016/2/24
例如:设随机变量X在1、2、3、4四个整数中等 可能地取值,另一个随机变量Y在1~X中等可能地 取一个整数值,则有边缘分布: X 1 Y 1
13,200 21,000 12,000

多元统计分析多元正态分布

多元统计分析多元正态分布

为X的方差或协方差矩阵
D(X) 或∑
X,Y的协方差矩阵
定义7
设X=( X1,…,Xp )´Y=( Y1,…,Yp )´称
Cov(X,Y)=E(X-E(X))(Y-E(Y))´
Cov(X1, Y1) Cov(X1, Y2) … Cov(X1, Yp)
= Cov(X2, Y1) Cov(X2, Y2) … Cov(X2, Yp)
其中:X,Y为随机向量, A,B为常数矩阵。
(2) X的方差或协方差矩阵
定义7 设X=( X1,…,Xp )´ 称
D(X)=E(X-E(X))(X-E(X))´
(或∑) Cov(X1, X1) Cov(X1, X2) … Cov(X1, Xp)
= Cov(X2, X1) Cov(X2, X2) … Cov(X2, Xp) …… Cov(Xp, X1) Cov(Xp, X2) … Cov(Xp, Xp)
第二章 多元正态分布
第一节 基本概念
1、随机向量的概率分布
定义1、将P个随机变量X1,…,Xp的
整体称为P维随机向量,记为
X=( X1,…, Xp )´
多维随机向量的分布函数定义
定义2、设X=( X1,…, Xp )´是P维随机向量, 它的分布函数定义为: F(x)=F ( x1,…,xp ) =P(X1 ≤x1, X2 ≤ x2 , …, Xp ≤ xp) 其中x= ( x1,…,xp )´属于P维欧氏空间。
离散型随机向量
定义3 设X=( X1,…, Xp )´是P维随机向量,
若存在有限个或可列个P 维列随机向量 x1, x2 …,记P(X= xk)=pk (k=1,2, …)
且满足p1+ p2+ …=1
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

协方差为
(x1 1)2
(x1 1)(x2 2 )
E (x2 2 )(x1 2 )
(x2 2 )2
(xp
)(x1
1 )
(xp p )(x2 2 )
(x1 1)(xp p ) (x2 2 )(xp p )
(xp p )2
称 x (x1, x2, , xp ) 服从均值为E(X),协方差为的正态分布。
例 设X~N6( ,),其协方差矩阵为,计算偏相关 系数。
7.033
2.168 4.981
3.540 2.874 30.530
1.681 1.276 4.638 3.107
1.276 1.161 5.864 1.851 3.860
5.213
2.939
19.532
4.069
4.525
0var x1
x2
Σ Σ1 21 11
I
I
0var x1
x2
Σ Σ1 21 11
I
I
0 Σ11
Σ21
Σ12 Σ22
Σ Σ1 21 11
I
Σ11
Σ12
Σ Σ 1 11 12 I
Σ12 Σ12 0
所以x1与x2 Σ21Σ111x1相互独立。
十一、将 x, , 作如下的分块:
三、一般的正态分布和标准正态分布的关系
设 x Au,其中 A 是一个 p 阶非退化矩阵,u (u1,u2, ,up )
服从 p 维标准正态分布,则 x Au 服从 p维正态分布,且均
值向量为
E(x) (Ex1, Ex2, , Exp ) (1, 2, , p )
协方差为
Var(x) E(x )(x )
三、 X服从 p 维正态分布,则 y Cx b ,其中C为 r p 常数矩阵, b为 r 维的常数向量,则
y ~ Nr (C b,CC)
四、设 x ~ N p (,) ,则 x 的任何子向量也服从多元正态 分布,其均值为 的相应子向量,协方差为 的相应子矩 阵。
五、设 x1, x2, , xn , xi ~ N p (i ,i ) i, 1,2, , n 相互独立, 且,则对任意 n 个常数 k1, ,kn ,有
Σ
Σ11 Σ21
Σ12 k Σ22 k p
μ
μ1 μ2
p
k
k
x
x1 x2
p
k
k
则给定 x2时x1 的条件分布为 Nk (12,112 ) ,其中
μ12
μ1
Σ Σ1 12 22
(x2
μ2 ).
为x2 给定的条件下 x1数学期望。
Σ11.2 Σ11 Σ12Σ221Σ21是x2的条件下x1的条件协条件协方差。
exp[
1 2
(x2
μ2

1
22
(x
2
μ2
)]
f (x) f1(x1) f2 (x2 )
故x1和x
相互独立。
2
八、设 x ~ Nn (0,I) ,y Ax ,z Bx ,其中 A 是 p n 阶矩阵, B 是q n 阶矩阵,rank( A) p ,rank(B) q , 则 Z 与 Y 相互独立,当且仅当 AB 0 。
同上可证。
十、将 x, , 作如下的分块:
11 21
12 k 22 k p
1 2
p
k
k
x
x1 x2
p
k
k
则 X1与X 2
1
21 11
X
相互独立,X
1
与2
X1
12
1 22
X
2
相互独立

证: 令
cov(x1,z) I
x1 I
0
x1 x2
z
Σ Σ1 21 11
I x1 x2
2.056
(x1, x2 , x3, x4 / x5, x6 )
1 0.292 0.057 0.214
1
0.025 0.191
1 0.136
1
u2u
p
u
2 p
二、一般的正态分布
设随机向量 x (x1, x2, , xp ) ,若其的密度函数为
f
( x1 ,
x2 ,
,
xp )
(2
) p
2
1
2
exp[ 1 (x 2
)1 ( x
)]
xi
其中 x (x1, x2, , xp ) 的均值为E(x) (1, 2, , p )
退化的三元正态分布。
1 1
1 0
1 0 1
AA 0 1
1 1
1 0
0 1
1 1
0 1
1 1
1 2
1 0
0 1
1 1
1 1
10
21
1 211 0
1
1 1 2
§2 多元正态分布的性质
一、多元正态分布的特征函数
(t) exp(it 1 tt)
2
二、x是一个服从p维正态分布,当且仅当它的任何 线性函数 ax 服从一元正态分布 N p (,) 。
Σ12 0
充分性 Σ12 0
Σ1
Σ1 11 0
0
Σ1 22
Σ Σ11 Σ22
Σ1
Σ1 11
Σ
1 22
f
(x1, x2,
, xp)
(2
) p
2
1 2
exp[ 1 (x 2
μ)Σ1(x
μ)]
(2
)k
/
2
11
1 2
exp[
1 2
(x1
μ)Σ
1
11
(x1
μ)]
.(2
)(
pk )/ 2
22
1ห้องสมุดไป่ตู้2
cov(y, z) E(y Ey)(z Ez)
E(Ax EAx)(Bx EBx)
AE(x Ex)(x Ex)B AVar(x)B AIB AB
九、设x ~ Nn (0,) ,y Ax ,z Bx ,其中 A 是 p n 阶矩阵, B 是q n 阶矩阵,rank(A) p ,rank(B) q, 则 Z 与 Y 相互独立,当且仅当 AB 0。
十二、偏相关系数
矩阵Σ11.2称为条件协方差矩阵,它的元素用 ij.k1, , p
表示。是当 x2 给定的条件下,xi

x

j
i,
j k )的偏相关
系数,定义为
ij.k 1, , p
ij.k 1, , p ii.k 1, , p jj.k 1, , p
它度量了在值 xk1, , xp给定的条件下,xi 与 xj ( i, j k )相关性的强弱。
第二章 多元正态分布
§1 多元正态分布的定义
一、标准多元正态分布
设 随 机 向 量 u (u1,u2 , ,up ) , u1,u2 , ,up 独 立 同 分 布 于N (0,1) ,则的 u (u1,u2, ,up ) 密度函数为
n
f
(x1, x2 ,
,
xp )
i1
1
2
exp(
1 2
xi2 )
1.608 4.665
0.181 0.776 16.588
0.906 0.839 1.734 2.502
0.414
0.675
2.634
1.178
3.112
1
(x1, , x5 / x6 )
0.303 1
0.018 0.088
1
0.233 0.246 0.269
1
0.096 0.177 0.367 0.442
27.363
1
0.366 1
0.242 0.233
1
0.360 0.324 0.476
1
0.245 0.265 0.540 0.534
1
0.376
0.252
0.676
0.441
0.440
1
7.033 2.168 3.540 1.681 1.276
4.981 2.874 1.276 1.161
E ( x2
(x1 1)2 2 )(x1
2 )
(x1 1)(x2 2 ) (x2 2 )2
(xp
)( x1
1 )
(xp p )(x2 2 )
AA
( x1 ( x2
1 )( x p 2 )(xp
pp))
(xp p)2
Var(x) AVar(u)A AA
J(u x) A 1 AA 1 2
11.2
11 1221221
30.530 4.638 5.864
3.107 1.851
3.860
5.213
1
2.939
19.5325.132
27.363
4.069
4.525
2.939
19.532
4.069
4.525
6.040 (x1, , x5 / x6 )
七、将 x, ,作如下的分块:
11 21
12 k 22 k p
1 2
p
k
k
x
x1 x2
p
k
k
子 x1, x2 向量相互独立,当且仅当 12 0。 证:必要性

x1和 x 2相互独立 Σ12 E[(x1 μ1 )( x2 μ2 )]
Σ12 E(x1 μ1 )E( x2 μ2 )]
n
kixi
~
N
p
(
相关文档
最新文档