第二章 随机向量
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
随机向量
一、多元概率分布
一个向量,若它的分量都是随机变量,则称之为随 机向量。 随机变量x的分布函数:
F a P x a
随机向量 x x1 , x2 ,
, x p 的分布函数:
F a1, a2 , , a p P x1 a1, x2 a2 , , x p a p
三、多元概率密度函数
一元的情形:
F (a) f x d x,
a
多元的情形: a1 F (a1 , , a p )
f ( x1 ,
d F x f x dx
ap
f ( x1 ,
, x p )d x1 F ( x1 , , xp )
d xp
x1 x p 多元密度f (x1, ⋯,xp)的性质: (1) f ( x1 , , x p ) 0, 对一切实数x1 ,
, xp )
p
, x p;
(2)
f ( x1 ,
, x p )d x1
d x p 1。
四、边缘分布
设x是p维随机向量,由它的q(<p) 个分量组成的向量 x(1)的分布称为x的关于x(1)的边缘分布。 不妨设 x1 x1 , , xq ,则对连续型的分布,有
f1 ( x1, , xq )
f ( x1, , x p )d xq1
d xp
五、条件分布
设 x x1 ,
, x p 是p维连续型的随机向量,在给 定 x 2 xq 1 , , x p f 2 x 2 0 的条件下, x1 x1 , , xq 的条件密度定义为
, xp
f x1 ,
或表达为
, xq | xq 1 ,
f 2 xq 1 ,
f x1 ,
, xp
, xp
f x1 | x 2
f x
f 2 x 2
六、独立性
两个连续型随机向量的独立 f x, y f x x f y y n个连续型随机向量的独立 f x1 , , xn f1 x1 f n xn
在实际应用中,若随机向量之间的取值互不影响, 则认为它们之间是相互独立的。
数字特征
一、数学期望(均值)
二、协方差矩阵 三、相关矩阵
一、数学期望(均值)
E x E x , E x , , E x 1 2 p 记为μ=(μ1,μ2,⋯,μp)′。 随机矩阵X=(xij)的数学期望 E x11 E x12 E x1q E x21 E x22 E x2 q E X E xij E x p1 E x p 2 E x pq
随机向量 x ( x1, x2 , , x p )的数学期望
随机矩阵X的数学期望的性质
(1)设a为常数,则
E(aX)=aE(X) (2)设A,B,C为常数矩阵,则 E(AXB+C)=AE(X)B+C 特别地,对于随机向量x,有 E(Ax)=AE(x) (3)设X1,X2,⋯,Xn为n个同阶的随机矩阵,则 E(X1+X2+⋯+ Xn)=E(X1)+E(X2)+⋯+E(Xn)
二、协方差矩阵
协方差定义为 Cov x, y E x E x y E y 若Cov(x,y)=0,则称x和y不相关。 两个独立的随机变量必然不相关,但两个不相关的 随机变量未必独立。 当x=y时,协方差即为方差,也就是 Cov x, x V x 和y y , y , , y x x , x , , x 1 2 p 1 2 q 的协方差矩阵 (简称协差阵)定义为
Cov( x , y ) E [ x E( x )][ y E( y )]' x1 E( x1 ) E y1 E( y1 ), yq E( yq ) x p E( x p ) E [ x1 E( x1 )][ y1 E( y1 )] E [ x1 E( x1 )][ yq E( yq )] E [ x E( x )][ y E( y )] E [ x E( x )][ y E( y )] p p 1 1 p p q q cov( x1 , y1 ) cov( x1 , yq ) cov( x , y ) cov( x , y ) p 1 p q
x和y的协方差矩阵与y和x的协差阵互为转置关系,即有 Cov x, y Cov y , x 若Cov(x,y)=0,则称x和y不相关。 两个独立的随机向量必然不相关,但两个不相关的随机向量 未必独立。 x=y时的协差阵Cov(x,x)称为x的协差阵,记作V(x),即 V x E x E x x E x V x1 Cov x1 , x2 Cov x1 , x p Cov x2 , x1 V x2 Cov x2 , x p Cov x p , x1 Cov x p , x2 V xp V(x)亦记作Σ=(σij),其中σij=Cov(xi,xj)。
协差阵Σ既包含了x各分量的方差,也包含了每两个 分量之间的协方差。显然,Σ是一个对称矩阵。 例2.3.1 随机向量一分为二后,其协差阵分为四块: Cov x, y x V x V V y y Cov y, x 其中,对角线块为子向量的协差阵,非对角线块为 两个子向量之间的协差阵。熟悉这四块子矩阵的含 义很有益处。
协差阵的性质
(1)协差阵是非负定阵,即Σ≥0。 推论 若|Σ|≠0,则Σ>0。 (2)设A为常数矩阵,b为常数向量,则 V Ax b AV x A 当p=1时,上述等式就是我们熟知的如下等式: V ax b a 2V x
例2.3.2
设随机向量x=(x1,x2,x3)′的数学期望和 协方差矩阵分别为
5 μ 2 和 7 4 1 2 Σ 1 9 3 2 3 25
令y1=2x1−x2+4x3, y2=x2−x3, y3=x1+3x2−2x3, 试求y=(y1,y2,y3)′的数学期望和协方差矩阵。
例2.3.3 Σ 0 x 的分量之间存在线性关系(以 概率1)。 在实际问题中,有时|Σ|=0,其原因是指标之间存在 着线性关系,如某一指标是其他一些指标的汇总值, 这在一般数据报表中是常出现的。我们通常可以通 过删去“多余”指标的办法来确保|Σ|≠0。因此,我 们总假定 Σ>0并不失一般性,这样可保证Σ−1存在, 从而可使数学问题得以简化。
(3)设A和B为常数矩阵,则
Cov Ax , By A Cov x , y B
(4)设 A1 , A2 ,
, An和B1, B2 , , Bm 为常数矩阵,则
m n n m Cov Ai xi , B j y j Ai Cov xi , y j Bj j 1 i 1 i 1 j 1
m n n m 推论 Cov xi , y j Cov xi , y j j 1 i 1 i 1 j 1 证明 (先证推论,再证性质(4))
m n Cov xi , y j j 1 i 1
E xi E xi y j E y j i 1 i 1 j 1 j 1 n m E xi E xi y j E y j i 1 j 1
n n m m
Cov xi , y j
i 1 j 1
n
m
m n n m Cov Ai xi , B j y j Cov Ai xi , B j y j j 1 i 1 i 1 j 1
Ai Cov xi , y j Bj
i 1 j 1
n
m
(5)设k1,k2, ⋯,kn是n个常数,x1,x2, ⋯,xn是n个相互 独立的p维随机向量,则
n n 2 V ki xi ki V xi i 1 i 1
三、相关矩阵
随机变量x和y的相关系数定义为 Cov x, y x, y V x V y
x ( x1, x2 , , x p )和y ( y1, y2 , , yq ) 的相关阵定义为
x1 , y1 x1 , y2 x2 , y1 x2 , y2 x, y x p , y1 x p , y2 x2 , yq x p , yq
x1 , yq
若ρ(x,y)=0,则表明x和y不相关。 x=y时的相关阵ρ(x,x)称为x的相关阵,记作R=(ρij), 这里ρij=ρ(xi,xj), ρii=1。即 1 p 1 12 1 2 p 21 R 1 p1 p 2 R=(ρij)和Σ =(σij)之间有关系式: R=D−1ΣD−1 其中D diag 11 , 22 , , pp ;R和Σ的相应元 素之间的关系式为
ij
前述关系式即为
12 1 1 21 p1 p 2 1 11 0 0 1 p 2 p
1 0 0
ij ii jj
0 1
22
0
1
pp
12 11 21 22 p1 p 2
1 p 2p pp
1
11
0
0 1
0 0
22
0
0
1
pp
标准化变换
在数据处理时,常常因各变量的单位不完全相同而 需要对每个变量作标准化变换,最常用的标准化变 换是令 xi i * xi , i 1,2, , p
* * 记 x * ( x1 , x2 ,
E x* 0, V x* R
,于是 , x* p)
ii
即标准化后的协差阵正好是原始向量的相关阵。可 见,相关阵R也是一个非负定阵。
一、多元概率分布
一个向量,若它的分量都是随机变量,则称之为随 机向量。 随机变量x的分布函数:
F a P x a
随机向量 x x1 , x2 ,
, x p 的分布函数:
F a1, a2 , , a p P x1 a1, x2 a2 , , x p a p
三、多元概率密度函数
一元的情形:
F (a) f x d x,
a
多元的情形: a1 F (a1 , , a p )
f ( x1 ,
d F x f x dx
ap
f ( x1 ,
, x p )d x1 F ( x1 , , xp )
d xp
x1 x p 多元密度f (x1, ⋯,xp)的性质: (1) f ( x1 , , x p ) 0, 对一切实数x1 ,
, xp )
p
, x p;
(2)
f ( x1 ,
, x p )d x1
d x p 1。
四、边缘分布
设x是p维随机向量,由它的q(<p) 个分量组成的向量 x(1)的分布称为x的关于x(1)的边缘分布。 不妨设 x1 x1 , , xq ,则对连续型的分布,有
f1 ( x1, , xq )
f ( x1, , x p )d xq1
d xp
五、条件分布
设 x x1 ,
, x p 是p维连续型的随机向量,在给 定 x 2 xq 1 , , x p f 2 x 2 0 的条件下, x1 x1 , , xq 的条件密度定义为
, xp
f x1 ,
或表达为
, xq | xq 1 ,
f 2 xq 1 ,
f x1 ,
, xp
, xp
f x1 | x 2
f x
f 2 x 2
六、独立性
两个连续型随机向量的独立 f x, y f x x f y y n个连续型随机向量的独立 f x1 , , xn f1 x1 f n xn
在实际应用中,若随机向量之间的取值互不影响, 则认为它们之间是相互独立的。
数字特征
一、数学期望(均值)
二、协方差矩阵 三、相关矩阵
一、数学期望(均值)
E x E x , E x , , E x 1 2 p 记为μ=(μ1,μ2,⋯,μp)′。 随机矩阵X=(xij)的数学期望 E x11 E x12 E x1q E x21 E x22 E x2 q E X E xij E x p1 E x p 2 E x pq
随机向量 x ( x1, x2 , , x p )的数学期望
随机矩阵X的数学期望的性质
(1)设a为常数,则
E(aX)=aE(X) (2)设A,B,C为常数矩阵,则 E(AXB+C)=AE(X)B+C 特别地,对于随机向量x,有 E(Ax)=AE(x) (3)设X1,X2,⋯,Xn为n个同阶的随机矩阵,则 E(X1+X2+⋯+ Xn)=E(X1)+E(X2)+⋯+E(Xn)
二、协方差矩阵
协方差定义为 Cov x, y E x E x y E y 若Cov(x,y)=0,则称x和y不相关。 两个独立的随机变量必然不相关,但两个不相关的 随机变量未必独立。 当x=y时,协方差即为方差,也就是 Cov x, x V x 和y y , y , , y x x , x , , x 1 2 p 1 2 q 的协方差矩阵 (简称协差阵)定义为
Cov( x , y ) E [ x E( x )][ y E( y )]' x1 E( x1 ) E y1 E( y1 ), yq E( yq ) x p E( x p ) E [ x1 E( x1 )][ y1 E( y1 )] E [ x1 E( x1 )][ yq E( yq )] E [ x E( x )][ y E( y )] E [ x E( x )][ y E( y )] p p 1 1 p p q q cov( x1 , y1 ) cov( x1 , yq ) cov( x , y ) cov( x , y ) p 1 p q
x和y的协方差矩阵与y和x的协差阵互为转置关系,即有 Cov x, y Cov y , x 若Cov(x,y)=0,则称x和y不相关。 两个独立的随机向量必然不相关,但两个不相关的随机向量 未必独立。 x=y时的协差阵Cov(x,x)称为x的协差阵,记作V(x),即 V x E x E x x E x V x1 Cov x1 , x2 Cov x1 , x p Cov x2 , x1 V x2 Cov x2 , x p Cov x p , x1 Cov x p , x2 V xp V(x)亦记作Σ=(σij),其中σij=Cov(xi,xj)。
协差阵Σ既包含了x各分量的方差,也包含了每两个 分量之间的协方差。显然,Σ是一个对称矩阵。 例2.3.1 随机向量一分为二后,其协差阵分为四块: Cov x, y x V x V V y y Cov y, x 其中,对角线块为子向量的协差阵,非对角线块为 两个子向量之间的协差阵。熟悉这四块子矩阵的含 义很有益处。
协差阵的性质
(1)协差阵是非负定阵,即Σ≥0。 推论 若|Σ|≠0,则Σ>0。 (2)设A为常数矩阵,b为常数向量,则 V Ax b AV x A 当p=1时,上述等式就是我们熟知的如下等式: V ax b a 2V x
例2.3.2
设随机向量x=(x1,x2,x3)′的数学期望和 协方差矩阵分别为
5 μ 2 和 7 4 1 2 Σ 1 9 3 2 3 25
令y1=2x1−x2+4x3, y2=x2−x3, y3=x1+3x2−2x3, 试求y=(y1,y2,y3)′的数学期望和协方差矩阵。
例2.3.3 Σ 0 x 的分量之间存在线性关系(以 概率1)。 在实际问题中,有时|Σ|=0,其原因是指标之间存在 着线性关系,如某一指标是其他一些指标的汇总值, 这在一般数据报表中是常出现的。我们通常可以通 过删去“多余”指标的办法来确保|Σ|≠0。因此,我 们总假定 Σ>0并不失一般性,这样可保证Σ−1存在, 从而可使数学问题得以简化。
(3)设A和B为常数矩阵,则
Cov Ax , By A Cov x , y B
(4)设 A1 , A2 ,
, An和B1, B2 , , Bm 为常数矩阵,则
m n n m Cov Ai xi , B j y j Ai Cov xi , y j Bj j 1 i 1 i 1 j 1
m n n m 推论 Cov xi , y j Cov xi , y j j 1 i 1 i 1 j 1 证明 (先证推论,再证性质(4))
m n Cov xi , y j j 1 i 1
E xi E xi y j E y j i 1 i 1 j 1 j 1 n m E xi E xi y j E y j i 1 j 1
n n m m
Cov xi , y j
i 1 j 1
n
m
m n n m Cov Ai xi , B j y j Cov Ai xi , B j y j j 1 i 1 i 1 j 1
Ai Cov xi , y j Bj
i 1 j 1
n
m
(5)设k1,k2, ⋯,kn是n个常数,x1,x2, ⋯,xn是n个相互 独立的p维随机向量,则
n n 2 V ki xi ki V xi i 1 i 1
三、相关矩阵
随机变量x和y的相关系数定义为 Cov x, y x, y V x V y
x ( x1, x2 , , x p )和y ( y1, y2 , , yq ) 的相关阵定义为
x1 , y1 x1 , y2 x2 , y1 x2 , y2 x, y x p , y1 x p , y2 x2 , yq x p , yq
x1 , yq
若ρ(x,y)=0,则表明x和y不相关。 x=y时的相关阵ρ(x,x)称为x的相关阵,记作R=(ρij), 这里ρij=ρ(xi,xj), ρii=1。即 1 p 1 12 1 2 p 21 R 1 p1 p 2 R=(ρij)和Σ =(σij)之间有关系式: R=D−1ΣD−1 其中D diag 11 , 22 , , pp ;R和Σ的相应元 素之间的关系式为
ij
前述关系式即为
12 1 1 21 p1 p 2 1 11 0 0 1 p 2 p
1 0 0
ij ii jj
0 1
22
0
1
pp
12 11 21 22 p1 p 2
1 p 2p pp
1
11
0
0 1
0 0
22
0
0
1
pp
标准化变换
在数据处理时,常常因各变量的单位不完全相同而 需要对每个变量作标准化变换,最常用的标准化变 换是令 xi i * xi , i 1,2, , p
* * 记 x * ( x1 , x2 ,
E x* 0, V x* R
,于是 , x* p)
ii
即标准化后的协差阵正好是原始向量的相关阵。可 见,相关阵R也是一个非负定阵。