海南大学应用多元统计分析 复习真题

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

定义2.1 将p 个随机变量12,,,p X X X L 的整体称为p 维随机向量,记为12(,,,)p X X X '=L X 。

定义 2.2 设12(,,,)p X X X '=L X 是p 维随机向量,它的多元分布函数定义为

121122()(,,,)(,,,)p p p F x F X X X P X x X x X x ∆=≤≤≤L L (2.2)

记为~()F x X ,其中12(,,,)p p x x x R '=∈L x ,p R 表示p 维欧氏空间。 多维随机向量的统计特性可用它的分布函数来完整地描述。 定义 2.3 设12(,,,)p X X X '=L X 是p 维随机向量,若存在有限个或可列个p 维数向量,,,21Λx x ,记()k k P X x p ==,(1,2,)k =L 且满足121=++Λp p ,则称X 为离散型随机向量,称()k k P X x p ==,(1,2,)k =L 为X 的概率分布。

设12~()(,,,)p F x F x x x ∆L X ,若存在一个非负函数),,,(21p x x x f Λ,使得对一切12(,,,)p

p x x x R '=∈L x 有1

12121()(,,,)(,,,)p

x x p p p F x F x x x f t t t dt dt -∞

-∞

∆=⎰⎰

L L

L L (2.3)

则称X 为连续型随机变量,称),,,(21p x x x f Λ为分布密度函数,简称为密度函数或分布密度。

一个p 元函数),,,(21p x x x f Λ能作为p R 中某个随机向量的密度函数的主要条件是:

(1)0),,,(21≥p x x x f Λ,p p R x x x ∈'∀),,,(21Λ; (2)⎰⎰+∞

∞-+∞

-=1),,,(12

1

p p

dx dx x

x x f ΛΛΛ

离散型随机向量的统计性质可由它的概率分布完全确定,连续型随机向量的统计性质可由它的分布密度完全确定。 定义2.4 设12(,,,)p X X X '=L

X 是p 维随机向量,称由它的)(p q <个

分量组成的子向量1

2

()(,,,)q

i i i i X X X '=L X 的分布为X 的边缘(或边际)分布,相对地把X 的分布称为联合分布。

当X 的分布函数是12(,,,)q F x x x L 时,(1)X 的分布函数即边缘分布函

数为:

1211(,,,)(,,)q q q F x x x P X x X x =≤≤L L

111(,,,,,)q q q p P X x X x X X +=≤≤≤∞≤∞L L 12(,,,,,,)q F x x x =∞∞L L 当X 有分布密度),,,(21p x x x f Λ时(亦称联合分布密度函数),则(1)X 也有分布密度,即边缘密度函数为:

⎰⎰+∞

-+∞

-+=p q p

q dx dx x

x f x x x f ,,),,(),,,(11

211ΛΛΛ

Λ

定义 2.5 若p 个随机变量12,,,p X X X L 的联合分布等于各自的边

缘分布的乘积,则称12,,,p X X X L

是相互独立的。

定义2.6 设12(,,,)p X X X '=L X ,若()(1,,)i E X i p =L 存在且有限,则称12()((),(),,())p E E X E X E X '=L X 为X 的均值(向量)或数学期望,有时也把()E X 和()i E X 分别记为μ和i μ,即12(,,,)p μμμ'=L μ,容易推得均值(向量)具有以下性质: (1)()()E E =AX A X (2)()()E E =AXB A X B

(3)()()()E E E +=+AX BY A X B Y

其中,X 、Y 为随机向量,A 、B 为大小适合运算的常数矩阵。 定义 2.7 设12(,,,)p X X X '=L X ,12(,,,)p Y Y Y '=L Y ,称()(())(())D E E E '∆--X X X X X

111212122

212(,)(,)(,)(,)(,)(,)(,)(,)(,)p p p p p p Cov X X Cov X X Cov X X Cov X X Cov X X Cov X X Cov X X Cov X X Cov X X ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥

⎢⎥⎣⎦

L L

M M M

L

(2.4)

为X 的方差或协差阵,有时把()D X 简记为Σ,(,)i j Cov X X 简记为ij σ,从而有()ij p p σ⨯=Σ;称随机向量X 和Y 的协差阵为 ()(())(())Cov E E E '∆--,X Y X X Y Y 111212122

212(,)(,)(,)(,)(,)(,)(,)(,)(,)p p p p p p Cov X Y Cov X Y Cov X Y Cov X Y Cov X Y Cov X Y Cov X Y Cov X Y Cov X Y ⎡⎤⎢⎥⎢

⎥=⎢⎥⎢⎥

⎢⎥⎣⎦

L L

M M M

L (2.5)

当=X Y 时,即为()D X 。

若()=Cov ,0X Y ,则称X 和Y 不相关,由X 和Y 相

互独立易推得()=Cov ,0X Y ,即X 和Y 不相关;但反过 来,当X 和Y 不相关时,一般不能推知它们独立。

当A 、B 为常数矩阵时,由定义可以推出协方差阵有如下性质: (1)对于常数向量a ,有()()D D +=X a X (2)()()D D ''==AX A X A A ΣA (3)(,)(,)Cov Cov '=AX BY A X Y B

(4)设X 为n 维随机向量,期望和协方差存在,记()E =μX ,()D =ΣX ,A 为n n ⨯常数阵,则 ()()E tr ''=+X AX A ΣμA μ

这里我们应该注意到,对于任何的随机向量12(,,,)p X X X '=L

X 来

说,其协差阵Σ都是对称阵,同时总是非负定(半正定)的。大多数情况是正定的。

若12(,,,)p X X X '=L X 的协差阵存在,且每个分量的方差大于零,则称随机向量X 的相关阵为()()ij p p Corr ρ⨯==R X ,其中

(,)ij Cov X X σρ=

=

p j i ,,1,Λ= (2.6)

为i X 与j X 的相关系数。 在数据处理时,为了克服由于指标的量纲不同对统计分析结果带来的影响,往往在使用各种统计分析之前,常需要将每个指标“标准化”

,即进行如下变换*()j X E X X -=

, 1,,j p =L (2.7)

那么由(2.7)构成的随机向量***

*12(,,,)p X X X '=L X 。令,

1122(,,,)pp diag σσσ=L C ,有: *1(())E -=-X C X X

那么,标准化后的随机向量*X 均值和协差阵分别为

*11()[(())][(())]0

E E E E E --=-=-=X C X X C X X

*111

1

1

1

1

()[(())][(())]()D D E D E D -------=-=-===X C X X C X X C C X C C ΣC R

即标准化数据的协差阵正好是原指标的相关阵。 定理2.1 设~(,)P N X μΣ,则有()E =X μ,()D =X Σ

相关文档
最新文档