第二章多元正态分布及参数的估计

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

则称 E( X ) ( E( X1 ), E( X 2 ), 容易推得均值（向量）具有以下性质：（1） E ( AX ) AE ( X ) （2） E ( AXB) AE ( X ) B （3） E ( AX BY ) AE ( X ) BE (Y ) 其中， X 、 Y 为随机向量， A 、 B 为大小适合运算的常数矩阵。
若 X ( X1, X 2 , , X p ) 的协差阵存在，且每个分量的方差大于零，则称随机向量 X 的相关阵为 R Corr ( X ) ( ij ) p p ，其中
ij
Cov( X i , X j ) D( X i ) D( X j )

ij ii jj
简记为 X。定义 2.1 将 p 个随机变量 X1 , X 2 , 维随机向量，记为 X ( X1 , X 2 ,
, X p 的整体称为 p
, X p ) 。
二、多元分布
定义 2.2 设 X ( X1 , X 2 ,
, X p ) 是 p 维随机向量，它 , X p xp )
（2.2）
定义 2.7 设 X ( X1 , X 2 ,
, X p ) ， Y (Y1, Y2 , Cov( X,Y )E( X E(Y ))( X E(Y ))
, Yp ) ，称
Cov( X ,Y )E( X E( X ))(Y E(Y ))
Cov ( X 1 , Y p ) Cov( X 1 , Y1 ) Cov ( X 1 , Y2 ) Cov ( X , Y ) Cov ( X , Y ) Cov ( X , Y ) 2 1 2 2 2 p （2.5） Cov( X , Y ) Cov ( X , Y ) Cov ( X , Y ) p 1 p 2 p p 当 X = Y 时，即为 D( X ) 。若 Cov( X , Y ) 0 ，则称 X 和 Y 不相关.
i, j 1,, p
（2.6）
为 X i 与 X j 的相关系数。
四、欧氏距离和马氏距离
（一）欧氏距离
X x1 , x2 , , x p 和Y y1 , y2 ,
2
之间的欧氏距离为 , y p
2
d X ,Y
平方欧氏距离为
x1 y1 x2 y2
D( X ) Cov( X, X )E( X E( X ))( X E( X ))
Cov( X 1 , X p ) Cov( X 1 , X 1 ) Cov( X 1 , X 2 ) Cov( X 2 , X 1 ) Cov( X 2 , X 2 ) Cov( X 2 , X p ) （2.4） Cov( X , X ) Cov( X , X ) Cov ( X , X ) p 1 p 2 p p 为 X 的方差或协差阵，有时把 D( X ) 简记为 Σ ， Cov( X i , X j ) 简记为 ij ，
表示对第 j 个变量 X j Байду номын сангаас n 次观测数值。
因此，表 2.1 所反映出的样本资料可用矩阵表示为
X 11 X 21 X X n1 X 12 X 22 X n2 X1 p X (1) X2p X (2) ( X 1 , X 2，，X p ) X np X (n) （2.1）
马哈拉诺比斯（Mahalanobis，1936年）提出的“马氏距离”的概念。
（二）马氏距离 X x1 , x2 , , x p 和Y y1 , y2 ,
X x1 , x2 ,
, y p 之间的平方马氏
距离定义为 d 2 X ,Y X Y Σ 1 X Y

xp yp
2
d
2
X ,Y x1 y1 x2 y2
2
2

xp yp
2
X Y X Y
欧氏距离经变量的标准化之后能够消除各变量的单位或方差差异的影响，但不能消除变量之间相关性的影响，以致有时用欧
氏距离显得不太合适。为此，我们引入一个由印度著名统计学家
x1 xp
, xp ) ，若存在一个非负函数
f ( x1 , x2 ,, x p ) ，使得对一切 x ( x1, x2 , , xp ) R p 有
F ( x)F ( x1 , x2 , , x p )

f (t , t ,
1 2
, t p )dt1
dt p （2.3）
，而全体n个样品组成一个样本。
表 2.1 变量序号 1 2
数据
X1
X2
Xp
X 11
X 12 X 22
X1 p X2 p
X 21
n
X n1
X n2
X np
在这里横看表 2.1，记为
,X p )， 1, 2 , n, 表示第个样品的观测值。竖看表 2.1，第 j 列的元素 X j ( X1 j , X 2 j , , X nj ) ， j 1, 2 , p, X ( ) ( X 1, X 2,
, x p 到总体π 的平方马氏距离定义为 d 2 X , X μ Σ 1 X μ
第二节多元正态分布
一、多元正态分布的定义
我们先来回顾一元正态分布的密度函数，即为
1 2 f ( x) e 2 , 0 2 上式可以改写为 1 1 2 1 （2.8） f ( x) exp ( x ) ( ) ( x ) 1/ 2 2 1/ 2 (2 ) ( ) 2 由于（ 2.8）式中的 x ，均为一维的数字，可以用 ( x ) 代表 ( x ) 的转置。定义 2.8 若 p 维随机向量 X ( X1, , X p ) 的密度函数为：
设X X1, 定义2.5 ：
2
定X X X X ,
1 1
, X p 是p维连续型的随机向量，在给 2 , X p f 2 x 0 的条件下， q 1 , , X q 的条件密度定义为：

, xp
f x1 ,
, xq | xq 1 ,
, xq , ,
, )
当 X 有分布密度 f ( x1 , x2 ,, x p ) 时（亦称联合分布密度函数），则
X (1) 也有分布密度，即边缘密度函数为：
f1 ( x1 , x2 ,, xq ) f ( x1 ,, x p )dxq1 ,, dxp

从而有 Σ ( ij ) p p 。
协差阵Σ 既包含了x各分量的方差，也包含了每两个分量之间的协方差。显然，Σ 是一个对称矩阵。
例 :随机向量一分为二后，其协差阵分为四块：
Cov X ,Y X D X D D Y Y Cov Y , X
分布，或虽本身不是正态分布，但它的样本均值近似于正态分
布。因此现实世界中许多实际问题的解决办法都是以总体服从正态分布或近似正态分布为前提的。在实际问题中，多元正态分布中均值向量和协差阵通常是未知的，一般的做法是由样本来估计。
第一节基本概念
一、随机向量
我们所讨论的是多个变量的总体。我们把这个p指标表示
则称 X 为连续型随机变量，称 f ( x1 , x2 ,, x p ) 为分布密度函数，简称为密度函数或分布密度。一个 p 元函数 f ( x1 , x2 ,, x p ) 能作为 R p 中某个随机向量的密度函数的主要条件是：
（1） f ( x1 , x2 ,, x p ) 0 ， ( x1 , x2 ,, x p ) R p ；
其中，对角线块为子向量的协差阵，非对角线块为两个子向量之间的协差阵。
协差阵的性质
当 A 、 B 为常数矩阵时，由定义可以推出协方差阵有如下性质：（1）对于常数向量 a ，有 D( X a) D( X ) （2） D( AX ) AD( X ) A AΣA （3） Cov( AX , BY ) ACov( X , Y ) B 这里我们应该注意到，对于任何的随机向量 X ( X1 , X 2 , , X p ) 来说，其协差阵 Σ 都是对称阵，同时总是非负定（半正定）的，大多数情况是正定的。
的多元分布函数定义为
F ( x)F ( x1, x2 ,
, xp ) P( X1 x1, X 2 x2 ,
记为 X ~ F ( x ) ，其中 x ( x1, x2 ,
p , xp ) R ，多维随
机向量的统计特性可用它的分布函数来完整地描述。
定义 2.3 设 X ~ F ( x)F ( x1, x2 ,
为X1
，X2，„，Xp，常用向量 X X 1 , X 2 ,

, X p 表示对同一

个体观测的p个变量。如果构成总体的个体是具有p个需要观测指标的个体，我们称这样的总体为p维总体（或p元总体）。这里“维”（或 “元”）的概念，表示共有几个分量。若观测了n个个体，则可得到如表2.1的数据，称每一个个体的p个变量为一个样品
当 X 的分布函数是 F ( x1, x2 , 数为： F ( x1, x2 ,
X (1) 的分布函数即边缘分布函 , xq ) 时，
, xq ) P( X1 x1,
, X q xq ) , X q xq , X q1 , , X p )
P( X1 x1,
F ( x1, x2 ,
第二章多元正态分布及参数的估计
多元统计分析涉及到的都是随机向量或多个随机向量放在一起组成的随机矩阵。如研究国家财政收入时，税收收入、企业收入、债务收入、国家能源交通重点建设基金收入、基本建设贷款归还收入、国家预算调节基金收入、其他收入等都是需要同时考察的指标。在实用中遇到的随机向量常常是服从正态分布或近似正态
f 2 xq 1 ,
f x1 ,
, xp
, xp
或表达为
f x |x

1
(2)
f x
(2) 2
f x
独立性 • 两个连续型随机向量的独立
f x , y f X x fY y
• n个连续型随机向量的独立
f x1 , , xn f1 x1
认为它们之间是相互独立的。
f n xn
• 在实际应用中，若随机向量之间的取值互不影响，则
三、随机向量的数字特征
定义 2.6 设 X ( X1 , X 2 ,
, X p ) ，若 E ( X i ) (i 1, , p) 存在且有限，
, E( X p )) 为 X 的均值（向量）或数学期望，有时也把 E ( X ) 和 E ( X i ) 分别记为 μ 和 i ，即 μ (1 , 2 , , p ) ，
X 的边缘（或边际）分布，相对地把 X 的分布称为联合分布。通过变换 X 中各分量的次序，总可假定 X (1) 正好是 X 的前 q 个
分量，其余 p q 个分量为 X
(2)
X ，则 X (2) ， X p q
(1)
q
x (1) 相应的取值也可分为两部分 x (2) 。 x

（2）

f ( x , x ,, x
1 2

p
)dx1 dxp 1
定义 2.4 设 X ( X1 , X 2 ,
称由它 , X p ) 是 p 维随机向量，
的 q( p) 个分量组成的子向量 X (i ) ( X i1 , X i2 ,
, X iq ) 的分布为