第三章多元正态分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
测数据一般都属于横截面数据,
即在同一时间不同空间上的数据。
二、多元样本的数字特征
定义:设 X(1),X(2),,X(n) 为来自p元总体的样本,其中: X (a ) (X a 1 ,X a 2 , ,X a) p ,( a 1 ,2 , ,n )
则:样本均值向量定义为:
因为:
X1 nan 1X(a)X1,X2, ,Xp
Co(Xv1,X1) Co(Xv1,X2) Co(Xv1,Xp)
Co(Xv2,X1)
Co(Xv2,X2)
Co(Xv2,Xp)
Co(Xvp,X1) Co(Xvp,X2) Co(Xvp,Xp)
为X的方差阵或协差阵.
D ( X ) 简 , C 记 ( X i , o X j ) 为 v i, 简 j 从 记 ij p p 而 为有
C(oXiv ,Xj) Va (Xir) Va (Xrj)
ij ii jj
5.协方差阵和相关系数矩阵的关系
设标准离差阵为
1
11
V2
0
1
1
则: V2RV2
0
di(a1g ,1 2,2 , P)P
PP
协差阵有如下数学性质:
D(X)0 即X的协差阵为非负定阵。
F ( x ) F x 1 , x 2 , , x p x 1 x p ft 1 , t 2 , , t p d 1 d 2 td t p t
则称X为连续型随机向量,称 fx1,x2, ,xp
为分布密度函数。
它具有两个性质: 二、随机向量的数字特征
f(x) 21exp(x22)2
则称X服从正态分布。
2.卡方分布
设X~N(0,1), x1,x2,,xn
n
为抽自总体的一个样本,其平方和
x
2 i
i1
服从自由度为n的 2 分布,记为: x ~ 2(n)
3.t分布 设x~N(0,1), y ~ 2(n)
且x与y相互独立,则随机变量
Co(vX2,Yq)
Co(vXp,Y1) Co(vXp,Y2) Co(vXp,Yq)
当X=Y时,即D(X)
4.随机向量的相关系数矩阵
若 XX1,X2, ,Xp 的协差阵存在,且每个分量的方差都大于0,则随机向量的
相关阵为 Rrij pp
rij
它具有两个性质:
1 . f ( x ) 0;
2
.
f
( x )dx
1
二、随机变量的数字特征 (一)离散型随机变量的数字特征
若X为离散型随机变量,其概率分布为 P (X x k)p k,(k 1 ,2 , ),
则X的数学期望(或称均值)和方差分别定义为:
E(X) xkpk k1
t x yn
的分布称为t分布。记为 t ~t(n)
4. F分布
设随机变量 x ~ 2(n)
y ~ 2(m)
且x与y相互独立,则随机变量
F xn ym
服从自由度为(n,m)的F分布,记为 F~F(n,m)
第二节 多元统计分析中的基本概念
一、随机向量及概率分布 (一)随机向量
将p个随机变量 X1,X2,,Xp 的整体称为p维随机向量,记为:
当 0 时,也有正态分布的定义。
二、多元正态变量的基本性质
1、若 X X 1 ,X 2 , ,X p~ N P (, ) ,是对角阵,则 X1,X2,,Xp
相互独立。
2、 X X 1 ,X 2 , ,X p~ N P (, )A为s×p阶常数阵,d为s维常数向量,则:
(二)概率分布函数
随机变量X的概率分布函数(简称分布函数)定义为: F(x)=P(X≤x)。
F (x)Hale Waihona Puke Baidu
1、离散型随机变量的概率分布 若随机变量X在有限或可列个值上取值,记 P (X x k)p k,(k 1 ,2 , ),
且 pk 1 则称X为离散型随机变量,并称 P (Xx k)p k,(k 1 ,2 , )
第三章 多元正态分布
第一节
一元统计分析中的有关概念
一、随机变量和概率分布函数
(一)随机变量
随机变量是随机事件的数量表现。用X、Y、Z表示
有两个特点:
1、取值的随 先机 不性 能X , 取 够即 哪 确事 个 定值 2、取值的统 即计 完规 全律 可 X取 性 以 某 , 确 个 X在 定 值 某 或 个区间取
1.f(x1,x2,xp)0;
2. f x1,x2,,xpd1xd2xdxp 1
1.随机 向量的数学期望
设 XX1,X2, ,Xp 若 EiX ,(i1,2, p) 存在且有限,则称 E X ( E 1 ,E X 2 , X E P ) X 为X的均值向量或数学期望
此把每个分量的n个样品值作成直方图,如果断定不是正态分布,就可以
断定随机向量 XX1,,Xp 不服从正态分布。
第四节 多元正态分布的参数估计
一、多元样本的概念
多元分析研究的总体是多元总体,从多元总体中随机抽取n个个体:X(1),X(2),,X(n)
若 X(1),X(2),,X(n) 相互独立,且与总体同分布,则称 X(1),X(2),,X(n)
1 n
n a1
X(a)
1nXXX111p21XXX222p21XXXnnn12p
其中: xx1,x2, ,xpRp
1、离散型随机向量的概率分布
定义:若 XX1,X2, ,Xp 是p维随机向量,若存在有限或可列个p维随机向量
x1,x2,,xp 记 P (X x k)p k,(k 1 ,2 , ), 且 pk 1
则称X为离散型随机向量,并称 P (X x k)p k,(k 1 ,2 , ),
为离散型随机变量X的概率分布。
它具有两个性质:
pk 0,k 1,2,;
pk 1
2、连续型随机变量的概率分布
对于随机变量X的分布函数,F (x) 若存在一个非负函数f(x),使得对
一切实数x有:
x
F(x) f(t)dt
则称X为连续型随机变量,称f(x)为X的分布密度函数。
对随机向量有连续型和离散型两类。
(二)概率分布
设 XX1,X2, ,Xp 是维随机向量,它的多元分布函数定义为:
F ( x ) F ( x 1 , x 2 , , x p ) P ( X 1 x 1 , X 2 x 2 , , X p x p )记,为 X ~F(x)
2 D (X ) V(X a ) r x E (X )2f(x )dx
2 D ( X ) V ( X a ) E ( r X 2 ) [ E ( X )2]
数学期望有如下的数学性质:
1.设C是常数,则E(C)=C 2.设X是随机变量,C是常数,则E(CX)=CE(X) 3.设X、Y是任意两个随机变量,则E(X+Y)=E(X)+E(Y) 4.设X、Y是两个相互独立的随机变量,则E(XY)=E(X)E(Y)
X11 X12 X1P X(1)
X
X21
X22
X2P
X(2)
Xn1
Xn2
Xnp
X(n)
值得注意的是: 1、多元样本中的每个样品,对p 个指标的观测值往往是有相关关 系的,但不同样品之间的观测值 一定是相互独立的。 2、多元分析所处理的多元样本观
方差有如下数学性质: 1.设C是常数,则D(C)=0 2.设X是随机变量,C是常数,则D(CX)=C2D(X) 3、设X、Y是两个相互独立的随机变量,则D(X+Y)=D(X)+D(Y)
三、一些重要的一元分布
1.正态分布 连续型随机变量X的概率密度函数为:
f (x) 1 e(x22)2
2
为该总体的一个随机样本 。每个 X (a ) (X a 1 ,X a 2 , ,X a)p (a 1 ,2 , ,n ) 称为一个样品, x aj 为第a个样品对第j个指标的观测值,显然每个样品都
是一个随机向量,将n个样品对p个指标都进行观测,得到如下一个随机
矩阵(观测矩阵、样本资料阵):
均值向量有以下性质:
1.E(AX)=AE(X) 2.E(AXB)=AE(X)B 3.E(AX+BY)=AE(X)+BE(Y) 其中:X、Y为随机变量,A、B为适合运算的常数矩阵。
2.随机向量的协方差矩阵
设 XX1,X2, ,Xp 称
D (X ) E (X E)X ( E)X
XX1,X2, ,XP
在多元统计分析中,仍将所研究对象的全体称为总体。如果构成总体中的个 体是由p个需要观测指标的个体,称这样的总体为p维总体,或p元总体。由 于从p维总体中随机抽到一个个体,其p个指标观测值是不能事先精确知道, 它依赖于被抽到的个体,因此,p维总体可用p维随机向量来表示,这里的维 或元表示共有几个分量。例如,要研究某类企业的三项经济效益指标,则所 有这类企业的三项经济效益指标就构成了一个三元总体。
A d X ~ N s(A d ,A A )
即正态随机向量的线性函数还是正态的。
3、 X X 1 ,X 2 , ,X p~ N P (, ) ,将 X,, 做如下剖析:
X(1)q X X(2) pq,
((1 2)) q pq, 1 21 1 1 2 2 2q pq
则
X(1) ~Nq( (1),11 ) X(2) ~Npq( (2),2)2
多元分析中的许多方法,大都假定数据来自多元正态总体。但 要 判断已有的一批数据是否来自多元正态总体,是很困难的。可是 反过来要肯定数据不是来自多元正态总体,比较容易。即如果
XX 1, ,X p~N p(, ) 则它的每个分量必服从一元正态分布,因
2 D ( X ) V ( X a ) E r X E ( X ) 2x k E ( X ) 2 p k k 1
(二)连续型随机变量的数字特征 若X为连续型随机变量,其密度函数为f(x),则X的数学期 望(或称均值)和方差分别定义为:
E(X)x(fx)d(x)
对于常数向量a,有D(X+a)=D(X) 设A为常数矩阵,则 D (A)X A(X D )A
C(A o,B v X ) Y AC (X ,Y o )B v
其中,a,A,B为大小 适合运算的常数向量和 矩阵。
第三节 多元正态分布的定义及基本性质
一、多元正态分布的定义
定义1:若p维随机向量 XX1,X2, ,Xp 的密度函数为:
为离散型随机变量X的概率分布。
它具有两个性质:
pk 0,k 1,2,;
pk 1
2、连续型随机向量的概率分布
定义:设 X ~ F ( x ) F x 1 ,x 2 , ,x p 若存在一个非负函数 fx1,x2, ,xp
使得对一切 xx1,x2, ,xpRp 有:
3.随机向量X和Y的协差阵
XX1,X2, ,Xp YY1,Y2,,Yq
C (X o ,Y ) v E (X E )X X ( E ) Y
Co(vX1,Y1) Co(vX1,Y2) Co(vX1,Yq)
Co(vX2,Y1)
Co(vX2,Y2)
f(x 1 ,x 2 , ,x p )21 p 12e x 1 2 p (x) 1 (x)
其中: xx1,x2, ,xp 是p维均值向量, 是p阶正定阵,则称X服
从p元正态分布 ,记为:X~Np(,) 当p等于1时,即为一元正态分布。