4.3 协方差与相关系数及矩与协方差矩阵
4.3 协方差与相关系数及矩与协方差矩阵
( 3)连续型 : cov( X ,Y ) [ x E ( X )][ y E (Y )] f ( x , y )dxdy.
ex1.设(X,Y)均匀分布于以坐标原点为中心,单位长为 半径的圆的内部,求cov(X,Y),并问X,Y是否不相 关?是否相互独立? 1 2 2 x y 1 解 f ( x , y ) , 0 其它 1 1 EX x dxdy 0, EY y dxdy 0, x 2 y 2 1 x 2 y 2 1
ex3.设随机变量X的概率分布密度为 1 x f ( x) e x , 2 (1)求X的数学期望E(X)和方差D(X). (2)求cov(X,|X|),并问X与|X|是否不相关? (3)问X与|X|是否相互独立?为什么? 1 x 解 (1) EX xf ( x )dx x e dx 0, 2 DX E[ X E ( X )]2 E ( X 2 )
性质8 XY 1;
性质9
XY 1的充分必要条件是 与Y以概率1线性相关, X
即P{Y aX b} 1, 其中a , b是常数.
ex2.已知X和Y分别服从正态分布 N (1,32 )和N (0,42 ), 1 X Y 且X与Y的相关系数 XY , 设Z 2 3 2 (1)求Z的数学期望E(Z)和方差D(Z);
概率论方差
第四章数字特征4.1 数学期望
4.2 方差
4.3 协方差与相关系数
4.4 矩与协方差矩阵
()()2
2
()Var X E X
E X =−⎡⎤⎣⎦
证明:()Var X =()()2
2
2E X XE X EX ⎡⎤
=−+⎣⎦()()2
2
2[()][]
E X
E EX X E EX =−+()()()()()2
2
2c E X E X E X E X E X ==−+⎡⎤⎡⎤⎡⎤⎣⎦⎣⎦⎣⎦
代回
()()E X E X c
==
为常数
设)
()(22
2
c E cX E EX +−()()(),E cX cE X E c c ==⎡⎤⎣⎦
()()22
2E X
cE X c =−+()()2
2
.E X E X =−⎡⎤⎣⎦
()()()2
2
2
2E X E X E X =−+⎡⎤⎡⎤⎣⎦⎣⎦()0Var X ≥()()2
2
.
E X
E X ∴≥⎡⎤⎣⎦
注:由知:()2
E X EX ⎡⎤−⎣⎦
()()2
2
().
Var X E X
E X ∴=−⎡⎤⎣⎦
(方差的简算公式)
x y
=1
x= 0594
.
()()().E XY E X E Y =⋅随机变量X 与Y 相互独立,则(与数学期望对比来学习)
n X X Y X ,,,,1⋯设为随机变量,c 为常数。().0=c Var 性质1性质2 性质3,()()()2cov(,)X Y Var X Y Var X Var Y X Y ±=+±对于任意、有如果记:()()()EY Y EX X E Y X −−=),cov(的协方差与为称Y X Y X ),cov(().c c E =性质1 ()().
协方差矩阵和相关系数矩阵
协方差矩阵和相关系数矩阵
协方差矩阵和相关系数矩阵是统计学中常用的两个矩阵,用于描述两个或多个随机变量之间的关系。协方差矩阵衡量了不同随机变量之间的相关性和变异性,而相关系数矩阵则是协方差矩阵的归一化形式。
首先,让我们来谈谈协方差矩阵。协方差矩阵是一个对称矩阵,它的元素是随机变量之间的协方差。协方差反映了两个随机变量的共同变动程度。具体而言,协方差的正负表示了两个变量是否呈现同向或反向的关系,而协方差的数值大小则反映了变量之间变动的幅度。协方差矩阵由各对随机变量之间的协方差构成,是一个方阵。
与协方差矩阵相关的是相关系数矩阵。相关系数矩阵是由协方差矩阵标准化得出的,用于消除量纲的影响并提供更直观的信息。相关系数是将协方差除以各变量的标准差得到的。相关系数矩阵的元素取值范围在-1到1之间,其中-1表示完全的反向相关,1表示完全的同向相关,而0表示无相关性。
协方差矩阵和相关系数矩阵在统计学和金融学中有广泛的应用。它们可以帮助我们研究变量之间的关系,了解它们是否存在线性关联以及关联的强度。通过分析协方差矩阵和相关系数矩阵,我们可以得出一些重要的结论,如哪些变量具有较强的相关性,哪些变量可以用来预测其他变量等等。
总结而言,协方差矩阵和相关系数矩阵是用于描述随机变量之间关系的重要工具。协方差矩阵衡量了相关性和变异性,而相关系数矩阵进行了标准化以提供更直观的信息。通过分析这些矩阵,我们可以深入了解变量之间的关联性,并在实际应用中做出更准确的判断和预测。
数学期望
求X的数学期望.
解 由已知可得
E( X )
xf ( x)dx
1500
1500
0
3000 x 3000 - x x dx x dx 2 2 1500 1500 1500
说明:如果积分
x f x dx 不收敛 ,则称随机变
量X的数学期望不存在。
例4 设随机变量X 服从柯西分布,其密度函数为
f ( x) 1 , - x 2 (1 x )
试证X的数学期望不存在. 证 因为
x f ( x)dx
0
j 1
于是有 E ( X ) xi P{X xi } xi ( pij ) xi pij
i 1 i 1 j 1 i 1 j 1
同理可得
E (Y ) y j P{Y y j } y j ( pij ) y j pij
由于概率是频率的稳定中心,以 E ( X甲) 表示甲的平均击 中环数, 则 E X ) 8 0.3 9 0.1 10 0.6 9.3 (
随机变量的数学期望公开课一等奖优质课大赛微课获奖课件
k2 (n k)!(k 2)!
n2
n(n 1) p2
(n 2)! piqni2
i0 (n i 2)!i!
n(n 1) p2 ( p q)n2 n(n 1) p2
第17页
例2、已知X~N(0,1),求E(X4)
EX 4 x4 f (x)dx 1
x4e
x2 2
dx
2
3
2
)e 2 2
dx
2
1
(
x
)e
(
x )2 2 2
dx
2
1
e dx
(
x) 2 2
2
2
0 1
第13页
4.1.3 随机变量函数数学盼望
定理4.1:设Y是随机变量X函数,即 Y g(X )(g 是连续函数), (1)若X是离散型随机变量,其分布律为
P( X xk ) pk , k 1,2,
)
,
1
12 (1 r 2 )
r
1 2 (1 r 2
)
1
2
r (1
r
2
)
1
2 2
(1
r
2
)
第44页
1、定义:
f (x1, x2 )
1
21 2
1 r2
exp
2(1
1
概率论与数理统计(协方差及相关系数、矩)
(2) X的k阶中心矩:
k E {[ X E ( X )] }, k 1 , 2 ,
(3) X和Y的k + l阶混合矩:
kl E ( X Y ), k , l 1 , 2 ,
(4) X和Y的k + l阶混合中心矩:
显然,X的数学期望E(X)是X的一阶原点矩, X的方差D(X)是X的二阶中心矩, X 和 Y 的协方差 Cov(X,Y)=0 是 X 和 Y 的二阶混合中心 矩.
4.3.1
协方差
D ( Y ) D ( X ) 153 / 2800 ,
Cov ( X , Y ) E ( XY ) E ( X ) E ( Y ) 19 / 400 ,
D ( X Y ) D ( X ) D ( Y ) 2 Cov ( X , Y ) 143 / 700 .
4.3.2
相关系数
由协方差的性质 (5)
当随机变量X与Y相互独立时,有Cov(X,Y) = 0.
易知
定理4.3 若X与Y相互独立,则XY = 0,即X与Y不 相关,反之不真. 这意味着,X与Y不相关仅指 X与Y之间不存在线 性关系,并不能说明X与Y不具有其他关系.
4.3.2
相关系数
【例4.24】设随机变量Z服从(–,)上的均匀分布, 又X = sinZ,Y = cosZ,试求相关系数XY.
协方差矩阵和相关系数矩阵的关系
协方差矩阵和相关系数矩阵的关系
协方差矩阵与相关系数矩阵是统计学中常见的概念,它们之间有一定的关系,可以为统计学中的问题提供指导。首先,本文将讨论协方差矩阵和相关系数矩阵的定义及其之间的关系。然后,本文将提供一个简单的数学例子,来讨论两者之间的关系。最后,本文将简要提出洞察协方差矩阵和相关系数矩阵的关系的理论依据。
什么是协方差矩阵以及相关系数矩阵?协方差矩阵是一个方阵,它用来表示两个或更多的变量之间的关系,它的大小可以从实际的数据得到。每一个元素Cij表示第i个变量与第j个变量之间的协方差,它可以为正,负或零。另一方面,相关系数矩阵是由相关系数组成的方阵,它与协方差矩阵相关,但具有更多的特征。相关系数表示两个变量之间的线性关系,它可以在-1到1之间取值,当两个变量之间的相关系数为1时,表明他们之间存在强烈的正相关;当相关系数为-1时,表明他们之间存在强烈的负相关;而当相关系数为0时,则表明他们之间不存在相关。
协方差矩阵和相关系数矩阵之间的关系可以通过数学方法来描述。假设有两个变量X和Y,他们之间的协方差矩阵表示为Cov(X,Y),而它们之间的相关系数矩阵表示为ρ(X,Y),则协方差矩阵和相关系数矩阵之间的关系可以用下式表示:
ρ(X,Y)=Cov(X,Y) / (σX *Y)
其中,σX表示X的标准差,σY表示Y的标准差。
计算可以看出,协方差矩阵和相关系数矩阵之间的关系是:协方
差矩阵的值除以变量的标准差的乘积,就可以得到相关系数矩阵。由此可见,协方差矩阵和相关系数矩阵之间的关系是紧密的,它们可以结合使用,以更好地了解变量之间的关系。
概率论第章协方差相关性协方差矩阵
1 2
1 2
1
2 2
经计算,( X
)T C 1( X
)
1
1 2
[
(
x1
1 12
)2
2
(x1 1)(x2 2 ) 1 2
(x2 2 )2
2 2
]
于是( X1, X 2 )的概率密度可写成:f (x1, x2 )
,
Xn
n
E(Xn)
C是( X1, X 2 , X n )的协方差矩阵,
( X1, X 2 , X n )的概率密度定义为:
f (x1, x2 , xn )
1
(2
)
n 2
C
1 2
exp
1 ( X )T C 1( X )
2
12
工程中常用均方误差meansquareerrormse来计算两个物理量测量量的相似性程度相关系数是一个用来表征之间线性关系紧密程度的量较大时较小表明线性关系的程度较好
§3 协方差及相关系数
对于二维随机变量(X,Y),除了讨论X与Y的数学期 望和方差外,还需讨论描述X与Y之间相互关系的数字 特征。这就是本节的内容。
1
(2
协方差和相关系数矩和协方差矩阵
(2). 对于n维随机向量(X1,X2,…,Xn)的二阶中心矩
Cij Cov( X i , X j ) E{[ X i - E( X i )][ X j - E( X j )]}
i,j=1,2,…,n
C11 C12 C13 C1n
则协方差矩阵为C C21
C22
C23
C2
n
显然,协方差矩阵是对称阵。 Cn1
3.设X是随机变量,Y=aX+b(a≠0),
证明
: XY
1 -1
a0 a0
4.设随机变量X的概率密度为 f (x) 1 e- x (- x ) 2
求X与|X|的协方差,问X和|X|是否不相关,是否相互独立.
首页
上页
返回
下页
结束
§4.4 矩和协方差矩阵
1.矩的概念 设X、Y为随机变量,k,l为自然数,即(k,l=1,2,…) 若 E(Xk)存在,则称它为X的k 阶原点矩。
首页
上页
返回
下页
结束
由协方差的性质(2)知,协方差取值的大小要受到量纲的影响,
为了消除量纲对协方差值的影响,我们把X,Y标准化后再求协方
差
X * X - E X Y * Y - E Y
DX
DY
Cov( X *,Y *) E{[ X * - E( X *)][Y * - E(Y *)]} E( X *Y *)
4.3协方差及相关系数及其性质
所以(X,YFra Baidu bibliotek的均值为μ=(μ1,μ2) (X,Y)协方差矩阵为
12 1 2
1 2 2 2
3. 协方差矩阵的性质
(1)协方差矩阵对角线上的元素Cii为Xi的方差即Cii=D(Xi) i=1,2,…,n;
为随机变量 X 与 Y 的相关系数.
无量纲 的量
若 XY 0, 称 X ,Y 不相关.
2. 说明
若随机变量 X 和 Y 相互独立 Cov( X ,Y ) E{[ X E ( X )][Y E (Y )]} E[ X E ( X )]E[Y E (Y )] 0.
4.3协方差与相关系数
一、基本概念 二、n 维正态变量的性质
问题的提出
对于二维随机变量(X ,Y ):
已知联合分布
边缘分布
对二维随机变量,除每个随机变量各自的 概率特性外, 相互之间还有某种联系,问题是用 一个怎样的数去反映这种联系.
若随机变量 X 和 Y 相互独立, 那么
D( X Y ) D( X ) D(Y ).
[ x E ( X )][ y E (Y )] f ( x, y)dxdy
法2.
4. 性质
(1) Cov( X ,Y ) E ( XY ) E ( X ) E (Y );
概率论与数理统计课件:4-3 协方差20121026
解:易知 EX=0,DX=4 EY=4,DY=4 cov( X ,Y ) = ρ XY ⋅ DX DY
= 1⋅2⋅2 = 2 2
E(X+Y)2=D(X+Y)+(E(X+Y))2 =D(X)+D(Y)+2cov(X,Y)+(E(X)+E(Y))2
=28
例4.3.7 设(X,Y)的联合分布律为
3
+∞
∫ EY = E cos(X ) = cos xf ( x)dx −∞
∫=
2π
1
cos x ⋅ dx
=0
0
2π
∫ E( XY ) = E( X cos(X ))
=
+∞
x cos xf ( x)dx
−∞
∫=
2π
x cos x ⋅
1
dx
0
2π
=0
故
ρXY=0
例4.3.6 设X∼N(0,4), Y∼π(4), ρXY =1/2, 求
= dx
r2 −x2
1
xy dy
−r
− r2 −x2
πr 2
=0
例4.3.2 设(X,Y)的联合密度函数为
f(x,y) =
1
( ) − x2 + y2
e 2σ 2
协方差矩阵,相关系数矩阵
协⽅差矩阵,相关系数矩阵
变量说明:
设为⼀组随机变量,这些随机变量构成随机向量,每⼀个随机变量有m个样本,则有样本矩阵
(1)
当中相应着每⼀个随机向量X的样本向量,相应着第i个随机单变量的全部样本值构成的向量。
单随机变量间的协⽅差:
随机变量之间的协⽅差能够表⽰为
(2)
依据已知的样本值能够得到协⽅差的预计值例如以下:
(3)
能够进⼀步地简化为:
(4)
协⽅差矩阵:
(5)
当中,从⽽得到了协⽅差矩阵表达式。
假设全部样本的均值为⼀个零向量,则式(5)能够表达成:
(6)
补充说明:
1、协⽅差矩阵中的每个元素是表⽰的随机向量X的不同分量之间的协⽅差,⽽不是不相同本之间的协⽅差,如元素C ij就是反映的随机变
量X i, X j的协⽅差。
2、协⽅差是反映的变量之间的⼆阶统计特性,假设随机向量的不同分量之间的相关性⾮常⼩,则所得的协⽅差矩阵差点⼉是⼀个对⾓矩
阵。对于⼀些特殊的应⽤场合,为了使随机向量的长度较⼩,能够採⽤主成分分析的⽅法,使变换之后的变量的协⽅差矩阵全然是⼀个对⾓矩阵,之后就能够舍弃⼀些能量较⼩的分量了(对⾓线上的元素反映的是⽅差,也就是交流能量)。特别是在模式识别领域,当模式向量的维数过⾼时会影响识别系统的泛化性能,常常须要做这种处理。
3、必须注意的是,这⾥所得到的式(5)和式(6)给出的仅仅是随机向量协⽅差矩阵真实值的⼀个预计(即由所測的样本的值来表⽰的,
随着样本取值的不同会发⽣变化),故⽽所得的协⽅差矩阵是依赖于採样样本的,⽽且样本的数⽬越多,样本在整体中的覆盖⾯越⼴,则所得的协⽅差矩阵越可靠。
第13讲 协方差及相关系数 矩及协方差矩阵
上描述两个随机变量的联系程度.
当然, 从数学上看, 这是不可能的
因为联合分布的信息量为许多个数, 甚至无穷多个数, 因此一个数不可能反映出无穷多个数携带的信息. 但是我们仍然希望能够找到描述它们之间相互关系的一 个数, 至少在大多数实际情况下能够描绘两个随机变量 联系的紧密程度, 例如, 如果这个数字越接近于零, 说 明这两个随机变量的联系越差, 越接近于相互独立, 反 之则联系越紧密, 越接近于相互之间有关系.
对于离散型随机变量, 假设X,Y的概率函数为P(X=Xi,Y=yj)=pij, (i,j=1,2,...),则
E(XY) xiyjpij
i j
对于连续型随机变量, 假设X,Y的联合概率密度为j(X,y), 则
E(XY)
xy(x,y)dydx
例1
假设X,Y的联合概率函数如下表所示 X Y 0 1/3 1
到要用协方差和相关系数的原因.
一、协方差
对于两个随机变量X和Y当它们是完全相等的时候, 联系是 最紧密的了.而当它们相互独立的时候, 联系是最差的了. 因此我们先研究它们的和X +Y的方差: D(X+ Y)=E{X + Y -E(X + Y)}2
4.3 协方差与相关系数
z .
因 为 P{X Y} P{X Y 0} , 设 Z1 X Y , 则 Z1 X Y 服 从 N (80,302+252)
4.3.3 矩与协方差矩阵
所以
P{X Y} P{Z1 0}
P{Z1 80 1525
80 } 1525
C 1( X
) .
其中C 是( X1,X 2,…,X n) 的协方差阵,|C |是C 的行列式,C 1
表示C 的逆矩阵, X 和 是n维列向量, X T 表示 X 的转置.
4.3.3 矩与协方差矩阵
n 元正态分布的几条重要性质: 性质 1 X =( X1, X 2,…, X n)T 服从n元正态分布的充分必 要 条 件 是 对 一 切 不 全 为 0 的 实 数 a1 , a2 , … , an , a1X1 a2 X2 an X n服从正态分布.
同样,得 E(Y)=0,
所以,Cov(X,Y)=E(XY)-E(X) E(Y)=0 .
此外,Var(X) > 0,Var(Y) > 0 .所以,XY =0,即 X 与 Y 不相关.
但是,在例 3.13 已计算过: X 与 Y 不独立.
4.3.2 相关系数
相关系数的性质:
性质 1 | | 1 ;
x2 y21
概率论与数理统计(协方差及相关系数、矩)
π
∫ πcos zdz = 0, ∫ πsin z cos zdz = 0
−
1 E ( XY ) = 2π
π
因而Cov(X,Y) = 0,ρXY = 0. , 因而 , . 不相关, 相关系数ρXY = 0,说明随机变量 与Y不相关, ,说明随机变量X与 不相关 但是, 所以X与 不独立 不独立. 但是,由于 X 2 + Y 2 = 1 ,所以 与Y不独立.
(1) 期望 期望E(X)、E(Y)、E(XY) 、 、 (2) 方差 方差D(X)、D(Y) 、 (3) 协方差 协方差Cov(X,Y) , (4) 相关系数ρXY
实验准备: 实验准备: (1) 函数 函数SUMPRODUCT的使用格式: 的使用格式: 的使用格式 SUMPRODUCT(array1,array2,array3, ...) 功能: 返回多个区域array1,array2,array3, ... 对 功能 : 返回多个区域 应数值乘积之和. 应数值乘积之和. (2) 函数 函数MMULT的使用格式: 的使用格式: 的使用格式 MMULT(array1,array2) 功能:返回两数组的矩阵乘积. 功能 : 返回两数组的矩阵乘积 . 结果矩阵的行数 的行数相同, 的列数相同. 与array1的行数相同,列数与 的行数相同 列数与array2的列数相同. 的列数相同
4.3.3 矩 (1) X的k阶原点矩 E(Xk),k = 1,2,… 阶原点矩: 的 阶原点矩 , , , (2) X的k阶中心矩 阶中心矩: 的 阶中心矩
协方差与相关系数
第四章数字特征4.1 数学期望
4.2 方差
4.3 协方差与相关系数
4.4 矩与协方差矩阵
§4.3 协方差与相关系数
对于二维随机向量(X ,Y ), 除了其分量X 和Y 的期望与方差之外, 还有一些数字特征, 用以刻画X 与Y 之间的相关程度,其中最主要的就是下面要讨论的协方差和相关系数。
定义1:若 E {[ X -E (X )][Y -E(Y )]} 存在,则称其为X 与Y 的协方差,记为Cov(X ,Y ), 即
4.3.1 协方差cov(,)X Y =上节推出:()()()
E XY E X E Y −()()()()cov(,)X Y E X E X Y E Y ⎡⎤=−−⎣⎦
,X Y 当相互独立时,有()()()
E XY E X E Y =()()()cov(,)0
X Y E XY E X E Y ∴=−=
(3). Cov(X 1+X 2, Y )= Cov (X 1, Y ) + Cov (X 2, Y ) ;
(1). Cov(X , Y) = Cov(Y , X );
协方差性质
(2). 设 a , b , c , d 是常数,则Cov( aX+b , cY+d ) = ac Cov(X , Y )
(4). Cov(X , Y ) =E(XY )-[E(X )][E(Y )] ,
(6). Var(X +Y )=Var(X )+Var(Y )+2Cov(X , Y ) . 当 X 和 Y 相互独立时,Cov(X , Y )=0;若 X 1, X 2, …, X n 两两独立,则性质(5)可推广到 n 个随机变量的情形:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 1 1 DX DY XY DX DY 9 4 3
1 1 1 1 9 16 3 4 3. 9 4 3 2 X Y cov X , X cov X , Y ( 2) cov( X , Z ) cov X , 3 3 2 2 1 1 cov( X , X ) cov( X ,Y ) 3 2 1 1 DX XY DX DY 3 2 1 2 1 1 3 3 4 0, 3 2 2 XZ 0.
P ( X a, X a ) P ( X a ) P ( X a ),
即X与|X|不独立.
三、矩与协方差矩阵的概念 定义4 设X,Y是两个随机变量,
(1)若E ( X k )( k 1,2,)存在, 则称它为X的k阶原点矩,
记为 k E ( X k ).
( 2)若E[ X E ( X )]k ( k 1,2,)存在பைடு நூலகம் 则称它为X的k阶 中心矩, 记为 k E[ X E ( X )]k . ( 3)若E ( X Y )( k , l 1,2,)存在,
性质6 若X ,Y相互独立, 则cov( X ,Y ) 0;
性质7 若U ,V为随机变量, 且E (U 2 ), E (V 2 )都存在, 则
[ E (UV )]2 E (U 2 ) E (V 2 );
取U X E ( X ),V Y E (Y ), 则有 [cov( X ,Y )]2 D( X ) D(Y ).
定义3 若 cov( X ,Y ) 0或 XY 0,
则称随机变量X与Y不相关.
几点说明:
(1) cov( X ,Y ) E ( XY ) E ( X ) E (Y ), cov( X , X ) D( X ).
( 2)离散型 : cov( X ,Y ) [ xi E ( X )][ y j E (Y )] pij .
cov( X ,Y ) E ( XY ) EX EY E ( XY )
x y 1
2 2
xy dxdy 0,
1
从而可知X与Y不相关.
1 x 2 1 1 x 2 dy x 1 而f X ( x ) f ( x , y )dy 0 其它 2 1 x2 y x 1 , 0 o x 其它
故X与|X|不相关.
(3)对给定的0 a , ( X a ) ( X a ),
且P ( X a ) 0, P ( X a ) 1,
P ( X a, X a ) P ( X a ). 但P ( X a ) P ( X a ) P ( X a ),
定义5
设二维随机变量 X ,Y )的四个二阶中心矩存在记为 ( ,
c11 E[ X E ( X )]2 ,
c12 E{[ X E ( X )][Y E (Y )]}, c21 E{[Y E (Y )][ X E ( X )]},
c22 E[Y E (Y )]2 ,
Chapter 4(3)
协方差与相关系数 及矩与协方差矩阵
教学要求:
1. 了解协方差、相关系数的概念与性质,并会计算;
2. 了解矩、协方差矩阵的概念与性质,并会计算.
一. 协方差与相关系数 二. 协方差与相关系数的性 质
三. 矩与协方差矩阵的概念
一、协方差与相关系数
E {[ X E ( X )][Y E (Y )]} E[ XY XE (Y ) YE ( X ) E ( X ) E (Y )] E ( XY ) E ( X ) E (Y ) E (Y ) E ( X ) E ( X ) E (Y ) E ( XY ) E ( X ) E (Y )
i j
( 3)连续型 : cov( X ,Y ) [ x E ( X )][ y E (Y )] f ( x , y )dxdy.
ex1.设(X,Y)均匀分布于以坐标原点为中心,单位长为 半径的圆的内部,求cov(X,Y),并问X,Y是否不相 关?是否相互独立? 1 2 2 x y 1 解 f ( x , y ) , 0 其它 1 1 EX x dxdy 0, EY y dxdy 0, x 2 y 2 1 x 2 y 2 1
性质8 XY 1;
性质9
XY 1的充分必要条件是 与Y以概率1线性相关, X
即P{Y aX b} 1, 其中a , b是常数.
ex2.已知X和Y分别服从正态分布 N (1,32 )和N (0,42 ), 1 X Y 且X与Y的相关系数 XY , 设Z 2 3 2 (1)求Z的数学期望E(Z)和方差D(Z);
c11 c12 将它们排成矩阵的形式: , c21 c22
这个矩阵叫做 X ,Y )的协方差矩阵 ( .
一般地,
设n维随机变量( X1 , X 2 ,, X n )的二阶中心矩存在记为 ,
cij cov( X i , X j ) E{[ X i ( X i )][ X j E ( X j )]} ( i 1,2,, n)
2 1 y2 y 1 同理, fY ( y ) , 0 其它
由f ( x , y ) f X ( x ) fY ( y )可得X与Y不独立.
注意 1、设有随机变量X,Y,下列事实是等价的:
(1) cov( X ,Y ) 0
( 2) X与Y不相关
( 3) E ( XY ) E ( X ) E (Y ) (4) D( X Y ) D( X ) D(Y )
性质2 cov(aX , bY ) ab cov( X ,Y ), a , b为常数;
性质3 cov( X1 X 2 ,Y ) cov( X1 ,Y ) cov( X 2 ,Y ); 性质4 D( X Y ) D( X ) D(Y ) 2 cov( X ,Y ); 性质5 cov( X ,Y ) XY D( X ) D(Y );
ex3.设随机变量X的概率分布密度为 1 x f ( x) e x , 2 (1)求X的数学期望E(X)和方差D(X). (2)求cov(X,|X|),并问X与|X|是否不相关? (3)问X与|X|是否相互独立?为什么? 1 x 解 (1) EX xf ( x )dx x e dx 0, 2 DX E[ X E ( X )]2 E ( X 2 )
定义2
设( X ,Y )是二维随机变量 若 cov( X ,Y ), D( X ), D(Y )都 , cov( X ,Y ) 存在, 且D( X ) 0, D(Y ) 0, 则称 为随 D( X ) D(Y ) 机变量X与Y的相关系数或标准协方 , 记为 XY ,即 差
XY
cov( X ,Y ) . D( X ) D(Y )
1 2 x 1 x e dx 20 x e dx 2, 2 2 (2) cov( X , X ) E ( X X ) EX E X E ( X X ) 2 x
1 x x x f ( x )dx x x e dx 0, 2
故当X、Y相互独立时, 有 E {[ X E ( X )][Y E (Y )]} 0. 这就意味着当 E {[ X E ( X )][Y E (Y )]} 0 时X与Y不相互独立,而存在着一定的联系.
但这种联系不像函数关系那样具有确定的对应关系, 即不能用函数关系来描述,通常称这种联系为相关 性关系。这里用协方差与相关系数来刻划相关性关 系中的线性相关.
k l
则称它为X ,Y的k l阶混合原点矩. (4)若E{[ X E ( X )]k [Y E (Y )]l }(k , l 1,2,)存在, 则称它为X ,Y的k l阶混合中心矩.
所以,数学期望、方差、协方差都是矩,是特殊的矩.
• 如果随机变量的概率分布关于期望值是 对称的,则对一切奇数阶中心矩都等于 零。 • 通常用一个无量纲的量 3 / 来度量随 机变量分布的不非对称性,称它为偏态 系数。 • 四阶中心矩可以描述随机变量分布的尖 4 / 4 3来度量分布的 峭程度,通常用 尖峭程度,峰态系数
c11 c12 c21 c22 c n1 cn 2 c1n c2 n cnn
称矩阵 : (cij )n n
为n维随机变量( X1 , X 2 ,, X n )的协方差矩阵 .
协方差矩阵为实对称矩阵. The end
( 2)求X与Z的相关系数 XZ .
解 (1) EX 1, DX 9; EY 0, DY 16,
1 1 0 1 X Y 1 EZ E EX EY . 2 3 2 3 3 2 3
X Y X Y X Y DZ D D D 2 cov , 3 2 3 2 3 2 1 1 1 DX DY cov( X ,Y ) 9 4 3
定义1
设( X ,Y )是二维随机变量 若E ( X ), E (Y ), D( X ), D(Y ) , 都存在, 则称E{[ X E ( X )][Y E (Y )]}为随机变量X 与Y的协方差, 记为cov( X ,Y )或 XY ,即
cov( X ,Y ) E{[ X E ( X )][Y E (Y )]}.
2、X与Y不相关,是指X与Y之间不存在线性关系, 并非它们之间什么关系也没有. 3、独立性与不相关性,在一般情形是不等价的, X与Y独立时必有X与Y不相关,但反过来不一 定成立.
4、当(X,Y)服从二维正态分布时,X与Y独立与X与Y 不相关是等价的 .
二、协方差与相关系数的性质 性质1 cov( X ,Y ) cov(Y , X );