第二章 多元正态分布及参数的估计汇总
第二章多元正态分布
第二章多元正态分布(一)教学目的通过本章的学习,要求对多元分布的基本概念有所了解,掌握多元正态分布数字特征及其参数估计,尤其是多元正态分布的假设检验。
(二)基本要求要求了解多元分布的基本概念,掌握多元正态分布的参数估计和假设检验。
(三)教学要点1、多维随机向量的边缘密度、条件分布、数字特征2、多元正态分布数字特征及其参数估计3、三个常用的抽样分布4、正态分布总体均值向量的检验(四)教学时数3课时(五)教学内容1、多元分布的基本概念2、多元正态分布数字特征及其参数估计3、三个常用的抽样分布及多元正态分布的假设检验第一节多元分布的基本概念多元统计分析主要方法是建立在多元正态分布的假设之上的。
而多元正态分布又是多元分布中应用最广泛的一种.为此,在介绍多元统计分析方法之前,首先有必要介绍多元正态分布的有关内容.另外,多元统计分析涉及到的都是随机向量或着将多个随机向量放在一起组成的随机矩阵。
为此,学习多元正态分布还需要首先从随机向量的基本概念开始。
多元统计分析,简称多元分析,是指当总体的分布是多维(多元)概率分布时,处理该类总体的数理统计理论和方法的总称,是统计学中的一个重要的分支学科。
早在19世纪就出现了处理二维正态总体的一些方法,但系统地处理多维概率分布总体的统计分析问题,则开始于20世纪。
人们常把1928年维希特(Wishart)分布的导出作为多元分析成为一个独立学科的标志。
20世纪30年代,R。
A。
费希尔、H。
霍特林、许宝騄以及S.N。
罗伊等人做出了一系列奠基性的工作,使多元统计分析在理论上得到了迅速的进展。
20世纪40年代,多元分析在心理、教育、生物等方面获得了一些应用。
由于应用时常需要大量的计算,加上第二次世界大战的影响,使其发展停滞了相当长的时间。
50年代中期,随着电子计算机的发展和普及,它在地质、气象、标准化、生物、图像处理、经济分析等许多领域得到了广泛的应用,也促进了理论的发展。
一、随机向量我们知道,所谓随机变量通俗理解就是“其值随机会而定”的变量.比如,在某厂大批产品中随机地抽取出100个,其中所含废品数X 就是一个随机变量。
应用多元统计分析课后习题答案详解北大高惠璇(第二章部分习题解答) (2).ppt
4 3
u1u2
1
2
exp[
1 2
(2u12
u22
2u1u2 )]du1du2
1
2
u12
u1e 2
1
2
u2e
1 2
(
u2
u1
)
2
du2
du1
1
2
u12
u1e 2
1
2
(u2
u1
)e
1 2
(u2
u1
)
2
du2
u1
e
1 2
(
u2
u1
)
2
du2
du1
1
2
u e
2
u12 2
2
x12
22
x1
65
x12
14
x1
49)
1 2
(
x2
x1
7)2
e e dx2
2
1 e
1 2
(
x12
8
x1
16)
2
1
2
e dx
1 2
(
x2
x1
7
)
2
2
1 e
1 2
(
x1
4
)
2
2
X1 ~ N(4,1).
类似地有
f2 (x2 ) f (x1, x2 )dx1
1
e
1 4
(
x2
3)2
X
X X
(1) (2)
~
N
2
p
(1) (2)
,
1 2
2 1
,
其中μ(i) (i=1,2)为p维向量,Σi (i=1,2)为p阶矩阵,
第二章 多元正态分布的参数估计
第二章多元正态分布的参数估计1.随机向量:将p个随机变量的整体称作p维随机向量,记为同时对p个指标(变量)进行了n次观测,这p个指标为,常用向量表示对同一个体观测的p个变量注:横看表示为第a个样品的观测值,记为竖看表示为对第j个变量的n次观测值,记为上表可用矩阵表示为(1)离散型随机向量:设是p维随机向量,若存在有限个或可列个p 维数向量,记,,满足,则X为离散型随机向量,为X的概率分布(2)连续型随机变量:设,若存在一个非负函数,使得对一切x均有,则X为连续型随机变量,为分布密度函数其中,应满足条件:i.ii.2.多元分布:设是p维随机向量,它的多元分布函数定义为,记为。
其中表示p维欧氏空间3.边缘(或边际)分布:设是p维随机向量,由它的q(<p)个分量组成的子向量的分布为X的边缘分布假定正好是X的前q个分量,其中p-q个分量为,则,相应的取值也分为了两部分。
当X的分布函数为时,的分布函数即边缘分布函数为;当X有分布密度时,则的边缘密度函数为注:相互独立——p个随机变量的联合分布等于各自的边缘分布的乘积4.随机向量的均值向量/数学期望:设,若存在且有限,则称为X的均值(向量)或数学期望,有时也把分别记为,即,容易得到均值(向量)有以下性质:其中,X和Y为随机向量,A和B为大小适合运算的常数矩阵5.随机变量的方差或协差阵:设,称为X的方差或协差阵,有时候把D(X)简记为,简记为,从而有随机变量X和Y的协差阵为当X=Y时,即为D(X)注:独立一定不相关,不相关不一定独立当A和B为常数矩阵时,协差阵有如下性质:注:对任何随机向量来说,其协差阵都是对称阵,大多情况下是正定的6.相关系数:若的协差阵存在,且每个分量的方差大于0,则称随机向量X的相关阵为,为的相关系数。
7.指标的标准化处理:,令,有,则即标准化数据的协差阵=原指标的相关阵8.多元正态分布:X服从p元正态分布,也称X为p维正态随机分布,简称9.多元样本的数字特征样本资料可以用矩阵表示为(1)样本均值向量:(2)样本离差阵:(3)样本协差阵:(4)样本相关阵:其中,10.①②③④11.的性质①②③12.维希特(Wishart)分布设且相互独立,则由组成的随机矩阵:的分布称为非中心Wishart分布,记为。
第二章多元正态分布的参数估计
就是剔除了 X2 Xk1, , X p 得(线性)影响之后,Xi和
Xj之间得协方差。
给定X2时Xi 和Xj得偏相关系数(partial correlation
coefficient)定义为: ij k1, , p
ij k1, , p
,
ii k1, , p jj k1, , p
其中 Σ11 2 ij k1, , p 。
μ12
μ1
Σ12
Σ
1 22
x2 μ2
Σ112
Σ11
Σ12
Σ
1 22
Σ
21
μ1·2和Σ11·2分别就是条件数学期望和条件协方差矩
阵,Σ11·2通常称为偏协方差矩阵。
这一性质表明,对于多元正态变量,其子向量得条件分布仍
就是(多元)正态得。
例5 设X~N3(μ, Σ),其中
1
16 4 2
μ
0 2
μ(1) μ(2)
11 Σ 21
31
12 22 32
13 23 33
Σ11
Σ
21
Σ12
22
则
X (1)
X1
X
2
~
N2 ( μ(1) ,
Σ11)
其中
μ (1)
1
2
Σ11
11 21
12
22
在此我们应该注意到,如果 X ( X1, X 2 , , X p ) 服从 p
aX
(0,1,
0)
X
2
X2
~
N (aμ, aΣa)
X3
1
aμ
(0,1,
0)
2
2
3
11 12 aΣa (0,1, 0) 21 22
应用多元统计分析课后习题答案高惠璇第二章部分习题解答学习资料
1 2 [y ( 1 7 )2 (y 2 4 )2]
g(y1,y2)
设函数 g(y1, y2) 是随机向量Y的密度函数.
15
第二章 多元正态分布及参数的估计
(3) 随机向量
YYY12~N274,
I2
(4) 由于 XX X121011Y Y12CY
1 0 1 1 7 4 3 4 , 1 0 1 1 I2 1 0 1 1 1 1 2 1
e e d x e 2
2
1 2 (x 1 7 )2
9
第二章 多元正态分布及参数的估计
1 1 2(2x1 22x2 16 5 x1 2 1x4 14)91 2(x2x17)2
e e dx 2
2
2 1e 2 1 e dx 1 2(x1 28x1 1)6
1 2(x2x17)2 2
1(
1 e2
(22)(22)0
可得Σ的特征值 1 2 (1 )2 , 2 (1 ).
22
第二章 多元正态分布及参数的估计
λi (i=1,2)对应的特征向量为 1
1
l1
2 1 2
l1
2 1 2
由(1)可得椭圆方程为 2(1y 1 2)b22(1y 2 2)b21
其 b 2 中 2 la n ( 2 ) [ | |1 /2 ] 2 l2 n2 [ 1 2 a ]
解二:比较系数法 设 f(x 1,x2)2 1ex 1 2 p (2 x 1 2x2 2 2 x 1x2 2x 1 2 1x2 4 6) 5
2 1 2 11 2ex 2 p 1 2 2 2 1 (1 2)[2 2(x 1 1)2 2 1 2(x 1 1)x (2 2) 1 2(x2 2)2]
第二章 多元正态分布及参数的估计
27
北大数学学院
第二章 多元正态分布及参数的估计
§2.2 多元正态分布的定义与基本性质—简单例子
y BxB
0 0 1
1 0 0
100 110
1 2 0
003 100
0 0 1
1 0 0
1 0 1
2 0 1
003 100
2
北大数学学院
第二章 多元正态分布及参数的估计
目录
§2.1 随机向量 §2.2 多元正态分布的定义与
基本性质
§2.3 条件分布和独立性 §2.4 随机矩阵的正态分布 §2.5 多元正态分布的参数估计
3
北大数学学院
第二章 多元正态分布及参数的估计
§2.1 随 机 向
本课程所讨论的是多变量总体.把 p个随机变量放在一起得
第二章 多元正态分布及参数的估计
§2.2 多元正态分布性质2的推论
例2.1.1
f (x1, x2
()X1,X212)的e联 12合( x12密 x22度) [1函数x为1 x2e
1 2
(
x12
x22
)
]
我们从后面将给出的正态随机向量的联合密
度函数的形式可知, (X1,X2)不是二元正态随机向 量.但通过计算边缘分布可得出:
本节有关随机向量的一些概念(联合分布, 边缘分布,条件分布,独立性;X的均值向量,X 的协差阵和相关阵,X与Y的协差阵)要求大家 自已复习.
三﹑ 均值向量和协方差阵的性质 (1) 设X,Y为随机向量,A,B为常数阵,则
E(AX)=A·E(X) E(AXB)=A·E(X)·B
6
应用多元统计分析课后习题答案高惠璇(第二章部分习题解答
2
x12
22
x1
65
x12
14
x1
49)
1 2
(
x2
x1
7)2
e e dx2
2
1 e
1 2
(
x12
8
x1
16)
2
1
2
e dx
1 2
(
x2
x1
7
)
2
2
1 e
1 2
(
x1
4
)
2
2
X1 ~ N(4,1).
类似地有
f2 (x2 ) f (x1, x2 )dx1
1
e
1 4
(
x2
3)2
注意:由D(X)≥0,可知 (Σ1-Σ2) ≥0.
8
第二章 多元正态分布及参数的估计
2-11 已知X=(X1,X2)′的密度函数为
f
( x1 ,
x2 )
1
2
exp
1 2
(2 x12
x22
2 x1 x2
22 x1
14 x2
65)
试求X的均值和协方差阵.
解一:求边缘分布及Cov(X1,X2)=σ12
应用多元统计分析
第二章部分习题解答
第二章 多元正态分布及参数的估计
2-1 设3维随机向量X~N3(μ,2I3),已知
002,
A
0.5 0.5
1 0
00.5.5, d 12.
试求Y=AX+d的分布.
解:利用性质2,即得二维随机向量Y~N2(y,y),
其中:
2
第二章 多元正态分布及参数的估计
2-2 设X=(X1,X2)′~N2(μ,Σ),其中
多元正态分布及参数估计
2019/11/6
应用统计方法
22
2、性质 1) 设为常数,则 E (a X )a(E X ); 2)设 A,B,C 分别为常数矩阵,则
E ( A C X ) A E ( X B ) B C
3)设 X 1,X 2, ,X n为 n个同阶矩阵,则
E ( X 1 X 2 X n ) E X 1 E X 2 E X n
对一切 x、y成立,则称 x和 y相互独立。
2、设 x和 y是两个连续随机向量, x和 y相互
独立,当且仅当
f(x|y)fx(x)或 F (x ,y ) F x(x )F y(y )
对一切
2019/11/6
x
、y
成立。 应用统计方法
19
3、设 x1,x2, ,xn是 n个随机向量,若
F ( x 1 , x 2 , , x m ) F 1 ( x 1 ) F 2 ( x 2 ) F m ( x m ) mn
2019/11/6
应用统计方法
23
二、协方差矩阵
1、定义:设 x (x 1 ,x2, ,xp)和 y (y 1 ,y2, ,y q)分 别为 p维和 q维随机向量,则其协方差矩阵为
Exx2 1 E E ((xx1 2))y1E(y1)
y2E(y2) yqE(yq)
降的右连续函数;
2019/11/6
应用统计方法
4
② 分布函数的取值范围为[0,1],即
0F(a1,a2, ,ap)1
③ 分布函数当变量取值为无穷大时,函数值收敛到1,即
F(,, ,)1
2019/11/6
应用统计方法
5
二、两个常用的离散多元分布
多元正态分布的参数估计
多元正态分布的参数估计参数估计是根据观测到的随机样本,通过对概率模型的估计得到未知参数的估计值。
对于多元正态分布,参数估计的问题包括均值向量和协方差矩阵的估计。
对于多元正态分布的均值向量的估计,最简单的估计是样本均值向量,即将每个变量的样本观测值求平均。
记有n个样本观测,每个观测有p个变量,那么第j个变量的样本均值为:(1/n) * Σ(xij),其中i=1到n,j=1到p其中xij表示第i个样本的第j个变量的观测值。
用样本均值向量估计多元正态分布的均值向量是一种无偏估计,即其期望等于真实均值向量。
对于多元正态分布的协方差矩阵的估计,可以使用样本协方差矩阵。
样本协方差矩阵是由各变量之间的样本协方差组成的矩阵。
第i行第j列的元素是第i个变量和第j个变量的样本协方差。
样本协方差的计算公式为:(1/(n-1)) * Σ((xi - μ)(xi - μ)T)其中xi表示第i个样本向量,μ表示均值向量,T表示转置。
样本协方差矩阵的估计是协方差矩阵的无偏估计。
然而,如果样本量较小的话,样本协方差矩阵可能不可逆,这会导致参数估计的困难。
为了克服这个问题,可以使用正则化方法,如Ledoit-Wolf估计方法或迹范数估计方法。
Ledoit-Wolf估计方法通过引入一个收缩系数对样本协方差矩阵进行正则化,并与单位矩阵进行加权平均。
这个收缩系数可以根据样本大小来选择,以平衡估计的方差和偏差。
迹范数估计方法通过对样本协方差矩阵的特征值进行调整,使其满足一定的迹范数条件。
迹范数是将矩阵的特征值求和得到的值,可以作为矩阵的一种度量。
除了样本均值向量和样本协方差矩阵,还有其他的参数估计方法,如极大似然估计、贝叶斯估计等。
这些方法可以根据不同的假设条件和观测数据来选择合适的参数估计方法。
在实际应用中,参数估计对于多元正态分布是非常重要的。
可以利用参数估计来推断各个变量之间的相关性和平均值,并进行统计推断、预测和建模分析。
因此,对参数估计的准确性和稳定性的研究是非常有价值的课题。
第2章多元正态分布参数估计
第2章多元正态分布参数估计多元正态分布是多元随机变量的一种常见模型。
在实际问题中,我们常常需要通过已有的数据对多元正态分布的参数进行估计,便于进行后续的统计分析和预测。
多元正态分布的参数估计主要包括均值向量和协方差矩阵的估计。
对于均值向量的估计,最简单的方法是直接计算样本均值。
假设我们有一个包含n个样本的数据集,其中每个样本有d个维度的观测值,我们可以将样本数据表示为一个n×d的矩阵X。
则样本均值向量的估计值μ可以通过以下公式得到:μ = (1/n) * Σxi其中,xi表示第i个样本观测值。
对于协方差矩阵的估计,最常用的方法是样本协方差矩阵的估计。
样本协方差矩阵S的估计值可以通过以下公式得到:S = (1/n) * Σ(xi - μ)(xi - μ)T其中,T表示矩阵的转置。
需要注意的是,样本协方差矩阵的估计是基于样本的二阶矩估计,因此在数据量较小的情况下,估计结果可能存在偏差。
为了减小估计结果的偏差,可以使用修正样本协方差矩阵的估计。
修正样本协方差矩阵的估计值可以通过以下公式得到:S = ((n-1)/n) * Σ(xi - μ)(xi - μ)T其中,n-1是修正系数。
除了样本协方差矩阵,也可以使用样本相关系数矩阵来估计多元正态分布的协方差矩阵。
样本相关系数矩阵R的估计值可以通过以下公式得到:rij = sij / (si * sj)其中,sij表示样本协方差矩阵的元素,si和sj分别表示样本标准差。
需要注意的是,当样本量较小或者存在样本相关系数为1的情况时,样本相关系数矩阵的估计结果可能不可靠,此时推荐使用样本协方差矩阵来估计。
在实际问题中,参数估计是多元正态分布分析的重要步骤。
通过对样本数据进行参数估计,我们可以对多元正态分布的均值和协方差矩阵有一个初步的认识,从而便于进行后续的模型建立、参数推断和预测。
同时,合理的参数估计方法也有助于提高分析结果的精度和可靠性。
总之,多元正态分布参数估计是一个对多元随机变量的观测数据进行统计分析的重要任务。
多元统计分析第二章多元正态分布
多元统计分析第二章多元正态分布多元正态分布(Multivariate Normal Distribution),是指多个随机变量服从正态分布的情况。
在统计学中,多元正态分布是一个重要的概率分布,广泛应用于多个领域,如经济学、金融学、生物学、工程等。
多元正态分布的概率密度函数可以表示为:f(x;μ,Σ) = (2π)^(-k/2) ,Σ,^(-1/2) exp(-(x-μ)'Σ^(-1)(x-μ)/2)其中,x表示一个k维向量(k个随机变量),μ是一个k维向量,表示均值向量,Σ是一个k*k维协方差矩阵,Σ,表示协方差矩阵的行列式,'表示向量的转置,Σ^(-1)表示协方差矩阵的逆矩阵,exp表示指数函数。
多元正态分布具有以下特点:1.对称性:多元正态分布的密度函数是关于均值向量对称的。
2.线性组合:多元正态分布的线性组合仍然服从正态分布。
3.条件分布:给定其他变量的取值,多元正态分布的边缘分布和条件分布仍然服从正态分布。
4.独立性:多元正态分布的随机变量之间相互独立的充要条件是它们的协方差矩阵为对角矩阵。
对于多元正态分布,可以使用协方差矩阵来描述不同随机变量之间的相关程度。
协方差矩阵的对角线元素表示各个随机变量的方差,非对角线元素表示各个随机变量之间的协方差。
多元正态分布的参数估计也是统计学中一个重要的问题。
通常可以使用最大似然估计方法来估计均值向量和协方差矩阵。
在实际应用中,多元正态分布可以用来描述多个相关变量的联合分布。
例如,在金融学中,可以使用多元正态分布来建模多个股票的收益率。
在生物学中,可以使用多元正态分布来建模多个基因的表达水平。
除了多元正态分布,还存在其他的多元分布,如多元t分布、多元卡方分布等。
这些分布可以用来处理更一般的随机变量,具有更广泛的应用领域。
总之,多元正态分布是统计学中一个重要的概率分布,具有许多重要的性质和应用。
通过对多元正态分布的研究,可以更好地理解和分析多个相关变量的联合分布,推断和预测相关变量的取值,并为实际问题提供可靠的解决方案。
第二章多元正态分布的参数估计
第二章多元正态分布的参数估计多元正态分布是在多个随机变量之间存在相互依赖关系时使用的一种概率分布。
它在许多统计分析和机器学习领域中都有广泛的应用。
在实际应用中,我们通常需要使用样本数据对多元正态分布的参数进行估计。
多元正态分布由均值向量和协方差矩阵两个参数来描述。
均值向量表示各个随机变量的平均值,而协方差矩阵表示各个随机变量之间的协方差。
参数估计的目标就是通过样本数据来估计这两个参数。
首先,我们需要收集一个具有充分样本量的数据集。
对于一个具有n个样本的多元正态分布,我们可以将样本数据表示为一个n行d列的矩阵X,其中每一行是一个d维的样本向量。
其中n表示样本数量,d表示随机变量的个数。
接下来,我们可以根据样本数据来估计多元正态分布的均值向量和协方差矩阵。
1.均值向量的估计:多元正态分布的均值向量可以通过样本均值向量来估计。
样本均值向量的计算公式如下:μ = (1/n) * Σxi其中μ是估计得到的均值向量,xi表示样本矩阵X的第i行。
2.协方差矩阵的估计:多元正态分布的协方差矩阵可以通过样本协方差矩阵来估计。
Σ=(1/(n-1))*(X-μ)'*(X-μ)其中Σ是估计得到的协方差矩阵,X是样本矩阵,μ是估计得到的均值向量。
需要注意的是,在计算协方差矩阵时,我们使用的是样本协方差矩阵而不是总体协方差矩阵。
这是因为样本协方差矩阵能更好地反映样本数据的真实情况。
以上就是多元正态分布的参数估计方法。
通过样本数据,我们可以使用样本均值向量和样本协方差矩阵来估计多元正态分布的参数。
这些参数估计能为我们提供关于多元正态分布的统计属性和特征,进而用于进一步的分析和应用。
应用多元统计分析课后习题解答详解北大高惠璇(第二章部分习题解答)
2 2
X 2 ~ N (3,2).
10
第二章 多元正态分布及参数的估计
12 Cov( X1, X 2 ) E[( X1 E( X1))( X 2 E( X 2 )]
E[( X1 4)( X 2 3)]
(x1 4)(x2 3) f (x1, x2 )dx1dx2
令uu21
x1 x2
X
X X
(1) (2)
~
N2 p
(1) (2)
,
1 2
2 1
,
其中μ(i) (i=1,2)为p维向量,Σi (i=1,2)为p阶矩阵,
(1) 试证明X(1) +X(2)和X(1) -X(2) 相互独立.
(2) 试求X(1) +X(2) 和X(1) -X(2) 的分布.
解 :(1) 令
Y
2
x12
22
x1
65
x12
14
x1
49)
1 2
(
x2
x1
7)2
e e dx2
2
1 e
1 2
(
x12
8
x1
16)
2
1
2
e dx
1 2
(
x2
x1
7
)
2
2
1 e
1 2
(
x1
4
)
2
2
X1 ~ N(4,1).
类似地有
f2 (x2 ) f (x1, x2 )dx1
1
e
1 4
(
x2
3)2
4
第二章 多元正态分布及参数的估计
(2) 因
Y
X1 X1
第二章_多元正态分布的参数估计 ppt课件
故此时偏相关系数与条件相关系数是同一个值,从而
ρij∙k+1,⋯,p同时也度量了在Xk+1, ⋯,Xp值给定的条件下Xi和 Xj间相关关系的强弱。
§3.5 X 和(N − 1)S2的抽样分布
一、X 的抽样分布 二、 (n − 1)S的抽样分布
一、X 的抽样分布
1.正态总体
设X~Np (μ, Σ), Σ>0 ,X1,X2, ⋯,Xn是从总体X中抽取的 一个样本,则
X3
1
aμ
(0,1,
0)
2
2
3
11 12 aΣa (0,1, 0) 21 22
31 32
13 0
23
1
22
33 0
(2) 其中
AX
1
0
0 0
0 1
X X X
1 2 3
X1
X
3
~
N
(Aμ
,AΣA
)
Aμ
1 0
0 0
0 1
1 2 3
X X
1 2
X
np
X p
(2)样本离差阵定义为
n
S p p ( X (a) X )( X (a) X ) (sij ) pp a 1 (2.11)
这里,
n
( X (a) X )( X (a) X )
a 1
n
X a1 Xa2
X1 X2
(
X
a1
X1,
μˆ
X
1 n
n a 1
X (a)
(X1, X2,
, X p )
(2.10)
其中
X11 X 21
1
n
第二章_多元正态分布的参数估计
1 exp 2 2 1
二元正态分布的密度曲面图
下图是当 , 0.75 时二元正态分布的钟形密
2 1 2 2
度曲面图。
二元正态分布等高线
等高(椭圆)线:
x1 1 x1 1 x2 2 x2 2 2 2 c 1 1 2 2
1 f ( x1 , x2 ) e 2
2 2 x1 x2 2
(1 sin x1 sin x2 )
x1 , x2 R
§2.2 多元正态分布的性质
正态变量的线性组合未必就是正态变量。
证明: 反证法。若命题 “一元正态变量X1,X2, ⋯,Xn
的一切线性组合一定是一元正态变量” 成立,则由
12 1 2 Σ 2 2 1 2
易见,ρ是X1和 X2的相关系数。当|ρ|<1时,可得X的 概率密度函数为:
f x1 , x2 1 2 1 2 1 2
2 x 2 x x x 1 1 1 2 2 2 2 1 2 1 1 2 2
12 22 32 42
13 23 33 43
14 24 34 44
2
x2 2 x2 2 2 ; c 2 2
X 1 1 11 14 (ii) ; ~ N , X 2 44 4 4 41
§2.2 多元正态分布的性质
(5)设X1,X2, ⋯,Xn相互独立,且Xi~N p (μi, Σi) ,
多元正态分布的参数估计
第一节 引言 第二节 基本概念 第三节 多元正态分布 第四节 多元正态分布的参数估计 第五节 多元正态分布参数估计的
实例与计算机实现
第一节 引言
多元统计分析涉及到的都是随机向量或多个随机向量放在一 起组成的随机矩阵。例如在研究公司的运营情况时,要考虑 公司的获利能力、资金周转能力、竞争能力以及偿债能力等 财务指标;又如在研究国家财政收入时,税收收入、企业收 入、债务收入、国家能源交通重点建设基金收入、基本建设 贷款归还收入、国家预算调节基金收入、其他收入等都是需 要同时考察的指标。
5
ቤተ መጻሕፍቲ ባይዱ
变量 序号
1 2
表 2.1 数据
X1
X2
X 11
X 12
X 21
X 22
n
X n1
X n2
在这里横看表 2.1,记为
X ( ) ( X1, X 2 , , X p ) , 1, 2, , n 表示第 个样品的观测值。竖看表 2.1,第 j 列
X j ( X1 j , X 2 j , , X nj ) , j 1, 2, , p
k
型随机变量,称 P( X xk ) pk ,(k 1, 2, ) 为 X 的概率分 布。设 X ~ F(x) ,若存在一个非负函数 f (x) ,使得一切实数
x
x 有: F(x) f (t)dt ,则称 f (x) 为 X 的分布密度函数,
简称为密度函数。
8
一个函数 f (x) 能作为某个随机变量 X 的分布密度函数的
显然,如果我们只研究一个指标或是将这些指标割裂开分别 研究,是不能从整体上把握研究问题的实质的,解决这些问 题就需要多元统计分析方法。为了更好的探讨这些问题,本 章我们首先论述有关随机向量的基本概念和性质。
15统计第02章_多元正态分布的参数估计
和
Σ
1 2
9 3
253
令y1=2x1−x2+4x3,y2=x2−x3,y3=x1+3x2−2x3,试求y=(y1,y2,y3)′的数学 期望和协方差矩阵。
若 X ( X1, X 2 , , X p ) 的协差阵存在,且每个分量的方差大
于零,则称随机向量 X 的相关阵为 R Corr( X ) (ij ) p p ,
表示对第 j 个变量 X j 的 n 次观测数值。
因此,表 2.1 所反映出的样本资料可用矩阵表示为
X11 X12
X
X
21
X 22
X1p
X(1)
X2
p
(
X1,
X
,
2
,X
p
)
X (2)
X
n1
Xn2
X
np
X
(n)
(2.1)
简记为 X。
定义 2.1 将 p 个随机变量 X1, X 2 , , X p 的整体称为 p 维随
E(X AX ) tr(AΣ) μAμ
这里我们应该注意到,对于任何的随机向量
X ( X1, X 2 , , X p ) 来说,其协差阵 Σ 都是对称阵,同
时总是非负定(半正定)的。大多数情况是正定的。
例 设随机向量x=(x1,x2,x3)′的数学期望和协方差矩阵分别为
5
4 1 2
μ
2 7
进行标准化!
标 “ 标 准 化 ”, 即 进 行 如 下 变 换
X
* j
X
j
E(X j) D(X j )
,
j 1, , p (2.7)
那么由(2.7)构成的随机向量 X* (X1*, X2*,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
方法之前,首先介绍多元正态分布的定义、性质及多元正态分布中参
数的估计问题.
目录
§2.1 随机向量
§2.2 多元正态分布的定义与基本性质
§2.3 条件分布和独立性
§2.4 多元正态分布的参数估计
§2.1 随机向量
本课程所讨论的是多变量总体.把 p 个随机变量放在一起得 X=(X1,X2,…,Xp)′为一个 p 维随机向量,如果同时对 p 维总体进行一 次观测,得一个样品为 p 维数据.常把 n 个样品排成一个 n×p 矩阵, 称为样本资料阵.
E(AX)=A·E(X), E(AXB)=A·E(X)·B D(AX)=A·D(X)·A' COV(AX,BY)=A·COV(X,Y)·B' (2) 若 X,Y 相互独立,则 COV(X,Y)=O;反之不成立. 若 COV(X,Y)=O,我们称 X 与 Y 不相关.故有: 两随机向量若相互独立,则必不相关;
O
O
.
p
若 Σ ≥ 0( 非 负 定 ), 必 有 p × q 矩 阵 1 使 得 Σ= 11 ′
1
其中 A1 1
O
O
q
( q p ).
这里记Γ=(Γ1 | Γ2) , Γ1 为 p×q 列正交阵(p ≥ q).并设:
i 0(i 1,, q), q1 0,, p 0.
§2.2 多元正态分布的定义
§2.2 多元正态分布的性质 1
在一元统计中,若 X ~ N(u, 2 ), 则 X 的特征函数为
(t)
E (e itX
)
exp itu
1 2
t 2
2 .
(t ) E (eitX )
1
2
e e itx
(
x ) 2 2
2
dx
u ( x ) /
1
2
e e it (u )
u2 2
du
eit
定义 2.2.1 设 U=(U1 ,…,Uq)′为随机向量, U1 ,…,Uq 相互独立 且同 N(0,1)分布;设μ为 p 维常数向量,A 为 p×q 常数矩阵,则称 X=AU + μ的分布为 p 维正态分布,或称 X 为 p 维正态随机向量,记 为 X ~ Np(μ, AA′)。
简单地说,称 q 个相互独立的标准正态随机变量的一些线性组合 构成的随机向量的分布为多元正态分布。
0
L•L
0
1
'•
p
0
0
'
p
1
其中 L
O
O , L L , 故 L 0 .
p
1
当矩阵Σ>0(正定)时,矩阵 L 也称为Σ的平方根矩阵,记为 2 .
当 矩 阵 Σ >0( 正 定 ) 时 , 必 有 p × p 非 退 化 矩 阵 A 使 得
Σ=AA′
1
其中 A
函数为ΦX(t)= E(eitX)= E(eit (AU+μ) )
exp(it ) E(eit AU )
令 t′A=s′=( s1 ,… sq )
exp(it ) E(ei ( s1U1 sqU q ) ) exp(it ) E(eis1U1 eisqU q )
(因U1 ,…, Uq相互独立,乘积的期望等于期望的乘积)
exp(it ) E(eis1U1 ) E(eisqU q )
exp( it )
q j 1
exp(
1 2
s
2 j
)
exp( it ) exp[
1 2
( s12
s
2 q
)]
exp( it 1 s s ) exp( it 1 t A At )
2
2
§2.2 多元正态分布的第二种定义
在一元统计中,若 U~N(0,1),则 U 的任意线性变换 X=σU+μ~ N(μ, 2 )。利用这一性质,可以从标准正态分布来定义一般正态分 布:若 U~N(0,1),则称 X =σU+μ的分布为一般正态分布,记为 X ~ N(μ, 2 )。
此定义中,不必要求σ>0,当σ退化为 0 时仍有意义。把这种新 的定义方式推广到多元情况,可得出多元正态分布的第一种定义。ຫໍສະໝຸດ 两随机向量若不相关,则未必相互独立.
(3) 随机向量 X=(X1,X2,…,Xp)′的协差阵 D(X)= 是对称非负
定阵.即 =´ , ´ ≥0 ( 为任给的 p 维常量).
(4) Σ=L2 ,其中 L 为非负定阵.
由于Σ≥0(非负定),利用线性代数中实对称阵的对角化定理,存
在正交阵Γ,使
1
性质 1 设 U= (U1 ,…,Uq)′为随机向量, U1 , …,Uq 相互
独立且同 N(0,1)分布;令 X=μ+AU,则 X 的特征函数为
X (t )
exp[
i t
1 t A A t ]. 2
这里 t=( t1 ,…, t p ), 故ΦX(t)为 p 元函数.
性质 1 的证明:
根据随机向量特征函数的定义和性质,经计算即可得出 X 的特征
第二章 多元正态分布及参数的估计
在多元统计分析中,多元正态分布占有相当重要的地位.这是因
为许多实际问题涉及到的随机向量服从正态分布或近似服从正态分
布;当样本量很大时,许多统计量的极限分布往往和正态分布有关;此
外,对多元正态分布,理论与实践都比较成熟,已有一整套行之有效的
统计推断方法.基于这些理由,我们在介绍多元统计分析的种种具体
1
2
1 [u 2 2itu (it ) 2 (it ) 2 ]
e 2
du
e it
1
2
1 ( u it ) 2
1 ( it ) 2
e 2
e2
du
exp[it 1 t 2 2 ]
2
exp[it 1 t 2 2 ]
2
1
1 (u it )2
e2
du
2
当 X~N(0,1)时,φ(t)=exp[-t 2 /2].
记Σ=AA′,则有以下定义。
X
x11
x21
x12
x22
x1 p
x2 p
def
X (1)
X (2)
xn1 xn2 xnp X (n)
=(X1,X2,…,Xp)
其中 X(i)( i=1,…,n)是来自 p 维总体的一个样品. 在多元统计分析中涉及到的都是随机向量,或是多个随机向量放 在一起组成的随机矩阵. 本节有关随机向量的一些概念(联合分布,边缘分布,条件分布, 独立性;X 的均值向量,X 的协差阵和相关阵,X 与 Y 的协差阵)要求大 家自已复习. 三﹑ 均值向量和协方差阵的性质 (1) 设 X,Y 为随机向量,A,B 为常数阵,则