协方差和相关系数的计算.ppt
第13讲 协方差与相关系数 太原理工大学工程硕士概率论与数理统计
22
[例] 已知 解
X 服从 0, 2π
上的均匀分布,求 E ( X 2 ), E (sin X )
X 的概率密度
1 , 0 ≤ x ≤ 2π, f ( x) 2 π 其他, 0,
E( X 2 )
1 2 x f ( x)dx 2π
2π 0
3 2 2 π 1 x 4 π x 2 dx 2π 3 0 3
则: 2 X Y ~ N (0,25)
( 2) D(2 X Y ) 4 DX DY 2 2COV ( X , Y ) 1 25 - 4 XY DX DY 25 4 2 3 13 2
则: 2 X Y ~ N (0,13)
20
小结
本讲首先介绍二维随机向量 (X,Y) 的分量 X与Y 的协方差及相关系数的概念、性质和计 算;然后介绍随机变量的各种矩(k 阶原点矩、 k 阶中心矩、k+m 阶混合原点矩、k+m 阶混 合中心矩),n 维随机向量的协方差阵的概念、 性质和计算;最后简单介绍了n 元正态分布 的概念和三条重要性质。
则(Y1,Y2, …, Yk)'服从k 元正态分布。
这一性质称为正态变量的线性变换不变性。
17
(3) 设(X1,X2, …,Xn)服从n元正态分布,则 “X1, X2, …, Xn 相互独立” 等价于 “X1,X2, …,Xn两两不相关”。
18
例2 设X和Y相互独立,且X~N(1, 2), Y~N(0, 1)。 求 Z = 2X-Y+3 的概率密度。 解: 由X~N(1,2), Y~N(0,1),且X与Y相互独立,
c22 E{[ X 2 E ( X 2 )]2 } c11 c12 排成一个2×2矩阵 , c 21 c 22
概率论与数理统计-协方差和相关系数01
=
9
证: 对任意的 对任意的a,b,令 令
刻画了Y与 刻画了 与a+bX的偏离程度 的偏离程度 e=E{[Y-(a+bX)]2}=E(Y2)+b2E(X2)+a2 -2bE(XY)+2abE(X)-2aE(Y)
要使 与 的某个线性函数 最为接近 就是要找a,b使得误差 最为接近 就是要找 数 要使Y与X的某个线性函数a+bX最为接近,就是要找 使得误差 视为关于a,b的二元函数 视为关于 的二元函数,求驻点: 平方e值最 值最小 平方 值最小. 将e视为关于 的二元函数,求驻点: 字 特 征 解得
X与Y不相关 只说明 与Y之间没有线性关系,但可以有 与 不相关 只说明X与 之间没有线性关系 不相关,只说明 之间没有线性关系, 非线性关系; 非线性关系; 而X与Y独立是指 独立是指X,Y之间既无线性关系, 之间既无线性关系, 与 独立是指 之间既无线性关系 也无非线性关系, 也无非线性关系,故“独立”必然不相关,但反之不然。 独立”必然不相关,但反之不然。 不相关 但是,对于二维正态分布,独立与不相关等价。 但是,对于二维正态分布,独立与不相关等价。 与不相关等价 2 若二维r.v ( X , Y ) ~ N ( µ 1 , µ 2 ; σ 12 , σ 2 ; ρ ) 即:若二维 则X与Y相互独立 与 相互独立
D(X)=p (1-p ) D(X)=np(1-p) D(X)=
E(X) = µ
a +b E(X) = 2 1 E(X) =
D(X)= σ
λ
2
(b − a)2 D(X)= 12
(5) 切比雪夫不等式 =
第14讲 协方差与相关系数
X 和 Y 独立时 X 和 Y 不相关, 反之不一定成立。 但对下述情形,独立与不相关是一回事: 若(X, Y )服从二维正态分布,则
X 与Y 独立的充分必要条件是X与Y不相关。 参见P70-例3.6.3: X与Y独立 XY=0
练习2 1) X ~ U (0,1), Y X 2 , 求 XY
2 1 x2 1 2 dy = 1 x -1 x 1 1 x2 f X ( x) 0, 其他 1 2 E( X ) x 1 x2 d y 0
1
E ( XY )
1
x 2 y 2 1 1 1
( xy/ ) dxdy
期望、方差、协方差的性质对比
期望
E(c)=C E(aX)=aE(X), E(X+Y) =E(X)+E(Y) 当X与Y独立时 E(XY)=E(X)E(Y)
方差
D(c)=0 D(aX)=a2D(X),
协方差
Cov(c,X)=0
Cov(aX,bY) =abCov(X,Y) D(X+Y)=D(X)+ Cov(X+Y,Z) D(Y)+2Cov(X,Y) =Cov(X,Z) +Cov(Y,Z)
y 1
1 y 2 1 y 2
xdx dy
1 0 dy 0.
所以,Cov(X, Y)= E(XY)-E(X) E(Y) = 0 . 此外,Var(X) > 0, Var(Y) > 0 . 所以,XY = 0,即 X 与 Y 不相关。 但是,在第三章已计算过: X与Y不独立。
第十四讲 协方差与相关系数
前面我们介绍了随机变量的数学期望 和方差,对于多维随机变量,反映分量之 间关系的数字特征中,最重要的,就是本 讲要讨论的 协方差和相关系数
概率论与数理统计课件 协方差与相关系数
试求二维正态随机变量的边缘概率密度 .
p( x, y)
1
e 1 2(1 ρ2
)
(
x
μ1 σ12
)2
2
ρ(
x
μ1 )( σ1σ2
y
μ2
)
(
y
μ2 σ22
)2
2πσ1σ2 1 ρ2
pX (x) pY ( y)
1
e ,
(
x μ1 2 σ12
)2
2πσ1 1
e
(
y μ2 2σ22
)2
1
2πσ1σ2
1 ρ2
( x μ1 )( y μ2 )
e e d y d x.
(
x μ1 2σ12
)2
1 2(1
ρ2
)
y
μ2 σ2
ρ
x
μ1 σ1
2
令t
1 1
ρ2
y
μ2 σ2
ρ
x
μ1 σ1
,
u x μ1 , σ1
2019/4/24
4-3—协方差和相关系数
3 .不相关与相互独立的关系
相互独立 不相关
2019/4/24
4-3—协方差和相关系数
10
例1 设 ( X ,Y ) 在圆域 x2 y2 1 上服从均匀分布, (1)问X与Y是否独立? (2)求相关系数
例2 X ~N(0,1),Y X 2, 证明X与Y不相关且不独立
解:E( XY ) E( XX 2 ) x3 ( x)dx 0 Cov( X ,Y ) E( XY ) E( X )E(Y ) 0 故X与Y不相关
2019/4/24
4-3—协方差和相关系数
概率论教学课件第四章4.4协方差与相关系数
一、协方差
对于二维随机变量(X,Y),讨论描述X与Y之间相互 依赖关系的数字特征.
X与Y相互独立 E[(X EX )(Y EY )] 0
或者:E[(X EX )(Y EY )] 0 X与Y一定不相互独立
定义1. 若E[(X EX )(Y EY )]存在, 则称E[(X EX )(Y EY )]为X与Y的协方差.
(连续型).
-
3
或者用以下公式计算
Cov(X , Y ) E(XY ) EX EY
Cov (X , Y ) E[(X EX )(Y EY )]
E(XY XEY YEX EXEY ) E(XY ) EX EY EX EY EX EY E(XY ) EX EY
4
定义2* 设 DX 0 , DY 0,称X,Y的标准化随机变量
X , Y 的协方差 Cov ( X , Y ) 为X与Y的相关系数.
记 为 XY , 即
XY Cov( X , Y ) E( X Y ) EX EY E( X Y )
E[( X EX )(Y EY )] Cov( X ,Y ) .
其逆命题不真!
注:若Cov X,Y 0,即E XY EXEY,则X与Y不相互独立.
4. D(X Y ) DX DY 2Cov(X , Y ).
5
例4.14 设二维随机变量(X,Y )的联合分布列为
XY 0 1 pi 0 0.2 0.3 0.5 1 0.5 0 0.5
p j 0.7 0.3
1 R
2
R
dx
R
R2 x2
xydy
R2 x2
0,
Cov(X , Y ) E(XY ) EXEY 0 00 0 .
8
Cov(X , Y ) E(XY ) EXEY 0 .
随机变量的协方差和相关系数
协方差的大小在一定程度上反映了X和Y相互间 的关系,但它还受X与Y本身度量单位的影响.
为了克服这一缺点,对协方差进行标准化,这 就引入了相关系数 .
二、相关系数
定义: 设D(X)>0, D(Y)>0, 称
XY
cov(X,Y) D(X)D(Y)
为随机变量 X 和 Y 的相关系数 .
在不致引起混淆时,记 XY 为 .
注: X Y 反应了X与Y的线性关系密切程度;X与Y不相关
表明两者没有线性关系,但不等于说没有其他关系。
独立与不相关的关系: 若 X 与 Y 独立,则X与Y不相关, 但由X与Y不相关,不一定能推出X与Y独立.
但可以证明对下述情形,独立与不相关等价
若(X,Y)服从二维正态分布,则
X与Y独立 X与Y不相关
注:协方差cov(X,Y)是X和Y的二阶混合中心矩.
六、例题讲解
1、设 X ~ N (,2 )Y ,~ N (,2 ),X 且 , Y 相 设 互
试Z求 1XY和 Z2XY的相关 (其系 中 , 数
是不全为零的常数)。
1、解 D (X)D (Y)2
D ( Z 1 ) D ( X Y ) 2 D ( X ) 2 D ( Y ) ( 2 2 ) 2 D ( Z 2 ) D ( X Y ) 2 D ( X ) 2 D ( Y ) ( 2 2 ) 2
随机变量的协方差和相关系数
第三节 随机变量的协方差和相关系数
协方差
协方差矩阵 相关系数矩阵 原点矩、中心矩
前面我们介绍了随机变量的数学期望和方差, 对于二维随机变量(X,Y),我们除了讨论X与Y 的数学期望和方差以外,还要讨论描述X和Y之间 关系的数字特征,这就是本讲要讨论的
协方差和相关系数
协方差和相关系数的计算
P(Y E(Y ) t0 ( X E( X ))) 1
时,等式成立—Cauchy-Schwarz不等式.
证明 令
g(t) E[(Y E(Y )) t( X E( X ))]2 D(Y ) 2t cov( X ,Y ) t 2D( X )
若D (X) > 0, D (Y) > 0 ,称
E ( X E( X ))(Y E(Y ) cov( X ,Y ) D( X ) D(Y ) D( X ) D(Y )
为X,Y 的相关系数,记为
XY
cov( X ,Y ) D( X ) D(Y )
事实上, XY cov( X ,Y ).
D[(Y E(Y )) t0 ( X E( X ))] 0 P[(Y E(Y )) t0 ( X E( X )) 0] 1 P[(Y E(Y )) t0 ( X E( X )) 0] 1 即 P[(Y E(Y )) t0 ( X E( X ))] 1
即Y 与X 有线性关系的概率等于1,这种线性关 系为
对任何实数 t ,g (t) 0
4 cov 2 ( X ,Y ) 4D( X )D(Y ) 0
即 | cov( X ,Y ) |2 D( X )D(Y )
等号成立
g (t) 0 有两个相等的实零点
t0
cov( X ,Y D(X )
)
g(t0 ) 0 即
D(Y ) D(X )
E[(Y E(Y )) t0 ( X E( X ))]2 0 又显然 E[(Y E(Y )) t0 ( X E( X ))] 0
解 cov(U ,V ) E(UV ) E(U )E(V ) a2E( X 2 ) b2E(Y 2 )
随机变量的协方差和相关系数
cov(X,Y)=E[X-EX][Y-EY]=EXY-EXEY
1) 当(X,Y)是离散型随机变量时,
cov( X , Y ) ( xi EX )( y j EY ) pij量时,
cov( X , Y )
( x EX )( y EY ) f ( x, y)dxdy.
存在,称它为X的k阶中心矩. 注:均值 E(X)是X一阶原点矩, 方差D(X)是X的二阶中心矩.
设 X 和 Y 是随机变量,若
E( X Y )
k
l
k,l=1,2,… 存在,
称它为 X 和 Y 的 k+l 阶混合原点矩.
若 E{[ X E ( X )]k [Y E (Y )]l } 存在, 称它为X 和 Y 的 k+l 阶混合中心矩. 注:协方差cov(X,Y)是X和Y的二阶混合中心矩.
例1 设X~N(0,1), Y=X2, 求X和Y的相关系数。
4. 若 XY 0 ,则称X和Y(线性)不相关。
定理:若随机变量X与Y的数学期望和方差都存 在,且均不为零,则下列四个命题等价: (1) XY 0 ; (2)cov(X ,Y) = 0;
(3)E(XY)=EXEY;
(4)D(X ±Y)=DX+DY。
n2
为(X1,X2, …,Xn) 的相关系数矩阵。
由于 i i
cov( X i , X i ) 1, D( X i ) D( X i )
故相关系数矩阵的主对角元素均为1.
五、 原点矩和中心矩
定义 设X和Y是随机变量,若
E ( X k ), k 1,2, 存在,称它为X的k阶原点矩,简称 k阶矩. 若 E{[ X E ( X )]k }, k 2,3,
随机变量的方差、协方差与相关系数
目 录
• 随机变量的方差 • 随机变量的方差 • 随机变量的协方差 • 相关系数 • 方差、协方差与相关系数的关系 • 实例分析
01
CATALOGUE
随机变量的方差
协方差的定义
协方差是衡量两个随机变量同时偏离其各自期望值程度的量,表示两个随机变量 之间的线性相关程度。
03
当两个随机变量的尺度相差很大时,直接计算协方差可能 得出不准确的结果,此时归一化的相关系数更为适用。
方差、协方差与相关系数的应用场景
方差在统计学中广泛应用于衡量数据的离散程度,例如在计算平均值、中位数等统计量时需要考虑数 据的离散程度。
协方差在回归分析、时间序列分析等领域中有着广泛的应用,用于衡量两个变量之间的线性相关程度。
3
当只考虑一个随机变量时,方差即为该随机变量 与自身期望值之差的平方的期望值,因此方差是 协方差的一种特例。
协方差与相关系数的关系
01
相关系数是协方差的一种归一化形式,用于消除两个随机变量 尺度上的差异,计算公式为 $r = frac{Cov(X,Y)}{sigma_X sigma_Y}$。
02
相关系数的取值范围是 [-1,1],其中 1 表示完全正相关,1 表示完全负相关,0 表示不相关。
详细描述
对称性是指如果随机变量X和Y的相关系数是r,那么随机变量Y和X的相关系数也是r。有界性是指相关 系数的绝对值不超过1,即|r|≤1。非负性是指相关系数的值总是非负的,即r≥0。
相关系数的计算
总结词
相关系数的计算方法有多种,包括皮尔 逊相关系数、斯皮尔曼秩相关系数等。
VS
详细描述
皮尔逊相关系数是最常用的一种,其计算 公式为r=∑[(xi-x̄)(yi-ȳ)]/[(n-1)sxy],其 中xi和yi分别是随机变量X和Y的第i个观测 值,x̄和ȳ分别是X和Y的均值,sxy是X和 Y的协方差。斯皮尔曼秩相关系数适用于 有序分类变量,其计算方法是根据变量的 秩次进行计算。
第13讲 协方差及相关系数 矩及协方差矩阵
因此
2 2 3 2 Eη E(ξ 2, 因ξ 而 i ξ ) 3 i ξ ~ N(0, ), 3 3 i1
2
1 1 cov(ξ ξ ) E[(ξ 0, i ξ , i ξ ) ξ ] E(ξ i ξ ) E ξ 3 3 即ξ 而它们都是正态分布, i ξ 与 ξ 互不相关,
则
ρ XY
Cov(X,Y) D(X) D(Y)
称为随机变量X与Y的相关系数. XY是一个无量纲的量.
现证明||1
令X'=X-EX,Y'=Y-EY, 则X',Y'都是期望值为0的随机变量. 对于任给的实数t, 相信E(X'+tY')20, 即 EX'2+2tE(X'Y')+t2EY'20, 即是说关于t的一元二次方程 EX'2+2tE(X'Y')+t2EY'2=0最多只有单个实根或者没有实根, 也就说明判别式 b2-4ac0
四、矩
定义 设X和Y是随机变量, 若 E(Xk), k=1,2,... 存在, 称它为X的k阶原点矩, 简称k阶矩. 若 若 E{[X-E(X)]k}, k=1,2,... E(XkYl), k,l=1,2,...
存在, 称它为X的k阶中心矩.
存在, 称它为X和Y的k+l阶混合矩.
若
E{[X-E(X)]k[Y-E(Y)]l}, k,l=1,2,...
定理
两个随机变量X和Y呈线性关系的充分必要条件,
是它们的相关系数的绝对值为1, 即 ||=1
而另一方面, 如果X与Y相互独立, 则它们的相关系数必为0,
概率论与数理统计协方差及相关系数详解演示文稿
故有 D[Y (a0 b0 X )] 0 E[Y (a0 b0 X )] 0
从而有 P{Y (a0 b0 X )} 1,即P{Y a0 b0 X} 1
第十四页,共35页。
(2) 若存在常数a*,b*使得P{Y=a*+b*X}=1,则有P{[Y(a*+b*X)]2=0}=1.即得E {[Y-(a*+b*X)]2}= 0,又由
特别, 若X=Y,则 cov(X,X)=E(X-E(X))2=D(X) 因此,方差是协方差的特例,协方差刻画两个随机
变量之间的“某种”关系.
第七页,共35页。
3. 计算 对于任意随机变量X与Y,总有
D( X Y ) D( X ) D(Y ) 2Cov( X ,Y )
由协方差定义得
cov(X ,Y ) E{[ X E( X )][Y E(Y )]}
Cov(X ,Y ) E[(XY ) YE(X ) XE(Y ) E(X )E(Y )]
Cov(X,Y)=E(XY)-E(X)E(Y)
这是计算协方差的常用公式.
可见,若X与Y独立,则 Cov(X,Y)= 0 .
第八页,共35页。
4.协方差的性质
(1) Cov(X,Y)=Cov(Y,X)
(对称性)
(1) 求 Z 的数学期望和方差. (2) 求 X 与 Z 的相关系数.
解 (1)由E( X ) 1, D( X ) 9, E(Y ) 0, D(Y ) 16.
得 E(Z ) E( X Y ) 1 E( X ) 1 E(Y )
32 3
2
1. 3
第二十五页,共35页。
D(Z ) D( X ) D(Y ) 2Cov( X ,Y )
0 E{[Y (a* b*X )]2}
随机变量的协方差和相关系数
3. X和Y独立时, =0,但其逆不真 .
证: 由于当X和Y独立时,cov(X,Y)= 0, 故
cov一定能推出X和Y 独立.
例1 设X~N(0,1), Y=X2, 求X和Y的相关系数。
4. 若XY 0 ,则称X和Y(线性)不相关。
v12 E{[ X1 E( X1)][ X 2 E( X 2 )]}
v21 E{[ X 2 E( X 2 )][ X1 E( X1)]}
v22 E{[ X 2 E( X 2 )]2}
这是一个非
排成矩阵的形式:
v11 v21
v12 v22
负定对称矩阵
称此矩阵为(X1,X2)的协方差矩阵.
D(X )
D(Y- bX)= D(Y ) [cov( X ,Y )]2
D(X )
[cov( X ,Y )]2
D(Y )[1
] D(Y )[1 2 ]
D( X )D(Y )
2. XY 1
存在常数 a,b(b≠0), 使 P{Y= a + b X}=1,
即 X 和 Y 以概率 1 线性相关.
cov(X,Y)=E[X-EX][Y-EY]=EXY-EXEY
1) 当(X,Y)是离散型随机变量时,
cov(X ,Y )
(xi EX )( y j EY ) pij ,
ij
2) 当(X,Y)是连续型随机变量时,
cov(X ,Y )
(x EX )( y EY ) f (x, y)dxdy.
1、解 D( X ) D(Y ) 2
D(Z1) D(X Y ) 2D( X ) 2D(Y ) ( 2 2 ) 2 D(Z2 ) D(X Y ) 2D( X ) 2D(Y ) ( 2 2 ) 2
协方差与相关系数
3 E ( X ) x 3 xdydx 3x xdx . 0 0 0 4 1 x 1 x2 3 E (Y ) y 3xdydx 3x dx . 0 0 0 2 8
Cov( X , Y ) E ( XY ) E ( X ) E (Y )
1
1 x
0 0
xy 3xdxdy
2 3 x 2 3x dx 0 10 2
2019/4/14
11
二维随机变量的协方差 例3 设( X ,Y)是二维离散型随机变量,其概率密度为
试求( X ,Y)的协方差。
1 x
3x,0 y x 1, f ( x, y ) 0, 其它.
2019/4/14
17
协方差的定义 设 n 维随机变量( X1 , X 2 ,..., X n )的二阶混合中心矩
cij Cov( X i , Yj ) E{[ X i E( X i )][ X j E( X j )]}
c11 c 21 都存在,则称矩阵 C ... c1n c12 c22 ... c2 n ... c1n ... c2 n ... ... ... cnn
2019/4/14
7
二维随机变量的协方差 例2 设( X ,Y)是二维离散型随机变量,其概率密度为 3 2 xy , 0 x 1, 0 y 2, f ( x, y ) 4 0, 其它. 试求( X ,Y)的协方差。 1 2 2 3 2 1 1 2 3 2 E ( X ) x xy dydx 3x dx 3 y dy . 0 0 0 4 12 0 4 1 2 2 3 2 3 1 3 3 E (Y ) y xy dydx 2 xdx 4 y dy . 0 0 0 0 4 32 2
概率论与数理统计:4-3协方差及相关系数
协方差的计算公式
1 CovX ,Y EXY EX EY 2 DX Y DX DY 2CovX ,Y .
性质
1. CovX ,Y CovY , X . 2. CovaX ,bY abCovX ,Y . a ,b为常数. 3. CovX1 X2 ,Y CovX1,Y CovX2 ,Y .
易知E(X)=0,E(Y)=5/2,E(XY)=0,于是 xy 0,
X,Y不相关.这表示X,Y不存在线性关系.
但,P{X=-2,Y=1}=0 P{X=-2}P{Y=1},知X,Y不
是相互独立的.事实上,X和Y具有关系:Y=X2,Y 的值完全可由X的值所确定.
例2
设X ,Y ~
N
1
,
2
,
2 1
2
1 2
1
2tu
1 2u2
u2 t2
e 2 2 dtdu
1 2 2
u2e
u2 2
du
e
t2 2
dt
1
2
1
2
2
ue
u2 2
du
te
t2 2
dt
1 2 2 2 , 2
故有 CovX ,Y 1 2 .
于是
XY
CovX ,Y DX DY .
得出结论
二维正态分布密度函数中,参数代表了X与Y
协方差及相关系数
协方差与相关系数的概念及性质 相关系数的意义
一、协方差与相关系数的概念及 性质
提出问题
若随机变量X和Y相互独立
DX Y DX DY 若随机变量X和Y不相互独立 DX Y ?
DX Y EX Y 2 EX Y 2 DX DY 2EX EX Y EY .
《协方差和相关系数的计算》课件模板
pij X
Y
1
1
p
0
0
0
0 < p <1
0
p+q=1
q
求 cov (X,Y),XY .
解
X 10 P pq
Y 10 P pq
XY 1 0 P pq
例2 设 ( X ,Y ) ~ N ( 1,12,2,22,), 求 XY .
解
co X ,Y v ) ( (x1 )y (2)f(x ,y )dx dy
当D(X ) > 0, D(Y ) > 0 时,当且仅当
P ( Y E ( Y ) t 0 ( X E ( X ) ) 1 )
时,等式成立—Cauchy-Schwarz不等式.
证明 令
g ( t) E [Y (E ( Y ) t ) ( X E ( X )2 )] D ( Y ) 2 tcX o ,Y ) v t2 D ( ( X )
故
UV
aa22
b2 b2
继续讨论:a,b 取何值时,U,V 不相关?
此时,U,V 是否独立?
协方差和相关系数的性质
协方差的性质
c X , Y ) o c Y , X v ) o E ( X ( ) v E ( X ) E Y ( Y ( ) ca o,b X v ) Y a (cb X o ,Y ) v( cX o Y , Z ) v c ( X o , Z ) c v Y , o Z ( )v( co X ,X v ) D ((X ) |co X ,Y v )|2 ( D (X )D (Y )
对任何实数 t ,g(t)0
4 c2 ( o X ,Y ) v 4 D ( X ) D ( Y ) 0
随机变量的协方差和相关系数
独立与不相关的关系: 若 X 与 Y 独立,则X与Y不相关, 但由X与Y不相关,不一定能推出X与Y独立.
但可以证明对下述情形,独立与不相关等价
若(X,Y)服从二维正态分布,则
X与Y独立 X与Y不相关
三、协方差矩阵
将二维随机变量(X1,X2)的四个数量指标
v11 E{[ X1 E( X1)]2}
cov(X,Y)=E[X-EX][Y-EY]=EXY-EXEY
1) 当(X,Y)是离散型随机变量时,
cov(X ,Y )
(xi EX )( y j EY ) pij ,
ij
2) 当(X,Y)是连续型随机变量时,
cov(X f (x, y)dxdy.
为(X1,X2, …,Xn) 的协方差矩阵.
这是一个非 负定对称矩阵
四、相关系数矩阵
若 i j
cov( X i , X j )
D(Xi ) D(X j )
都存在, 则称
vij
( i, j=1,2,…,n )
vii v jj
11
矩阵
R
21
12
22
1n 2n
n1 n2 nn
这是一个非 负定对称矩阵
注:均值 E(X)是X一阶原点矩,
方差D(X)是X的二阶中心矩.
设 X 和 Y 是随机变量,若
E( X kY l ) k,l=1,2,… 存在,
称它为 X 和 Y 的 k+l 阶混合原点矩. 若 E{[ X E( X )]k [Y E(Y )]l} 存在, 称它为X 和 Y 的 k+l 阶混合中心矩.
注:协方差cov(X,Y)是X和Y的二阶混合中心矩.
六、例题讲解
1、设X ~ N (, 2 ),Y ~ N (, 2 ),且设X,Y相互独立 试求Z1 X Y和Z2 X Y的相关系数(其中,
协方差相关矩阵相关系数
协⽅差相关矩阵相关系数通过两组统计数据计算⽽得的协⽅差可以评估这两组统计数据的相似程度。
样本:A = [a1, a2, ..., an]B = [b1, b2, ..., bn]平均值:ave_a = (a1 + a2 +...+ an)/nave_b = (b1 + b2 +...+ bn)/m离差(⽤样本中的每⼀个元素减去平均数,求得数据的误差程度):dev_a = [a1, a2, ..., an] - ave_adev_b = [b1, b2, ..., bn] - ave_b协⽅差协⽅差可以简单反映两组统计样本的相关性,值为正,则为正相关;值为负,则为负相关,绝对值越⼤相关性越强。
cov_ab = ave(dev_a x dev_b)cov_ba = ave(dev_b x dev_a)案例:计算两组数据的协⽅差,并绘图观察。
import numpy as npimport matplotlib.pyplot as mpa = np.random.randint(1, 30, 10)b = np.random.randint(1, 30, 10)#平均值ave_a = np.mean(a)ave_b = np.mean(b)#离差dev_a = a - ave_adev_b = b - ave_b#协⽅差cov_ab = np.mean(dev_a*dev_b)cov_ba = np.mean(dev_b*dev_a)print('a与b数组:', a, b)print('a与b样本⽅差:', np.sum(dev_a**2)/(len(dev_a)-1), np.sum(dev_b**2)/(len(dev_b)-1))print('a与b协⽅差:',cov_ab, cov_ba)#绘图,查看两条图线的相关性mp.figure('COV LINES', facecolor='lightgray')mp.title('COV LINES', fontsize=16)mp.xlabel('x', fontsize=14)mp.ylabel('y', fontsize=14)x = np.arange(0, 10)#a,b两条线mp.plot(x, a, color='dodgerblue', label='Line1')mp.plot(x, b, color='limegreen', label='Line2')#a,b两条线的平均线mp.plot([0, 9], [ave_a, ave_a], color='dodgerblue', linestyle='--', alpha=0.7, linewidth=3)mp.plot([0, 9], [ave_b, ave_b], color='limegreen', linestyle='--', alpha=0.7, linewidth=3)mp.grid(linestyle='--', alpha=0.5)mp.legend()mp.tight_layout()mp.show()相关系数协⽅差除去两组统计样本的乘积是⼀个[-1, 1]之间的数。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
P??Y ? E(Y) ? ? X ? E( X) ?? ? 1
? D(Y)
D(X) ?
相关系数的性质
? | ? XY |? 1
? | ? XY |? 1 Cauchy-Schwarz 不等式的等号成
若 ? XY ? 0, 称 X,Y不相关.
无量纲 的量
协方差和相关系数的计算
—— 利用函数的期望或方差计算协方差
? cov(X,Y) ? E( XY) ? E( X)E(Y) ? ? 1 ?D(X ? Y) ? D( X) ? D(Y)?
2
? 若(X,Y)为离散型,
??
cov(X,Y) ? ?? (xi ? E( X))( yj ? E(Y))pij i?1 j?1
故
? UV
?
a2 a2
? ?
b2 b2
继续讨论: a,b 取何值时, U,V 不相关?
此时,U,V 是否独立?
协方差和相关系数的性质
协方差的性质
? cov( X ,Y ) ? cov(Y , X ) ? E(XY ) ? E( X )E(Y ) ? cov(aX ,bY) ? ab cov(X,Y) ? cov(X ? Y, Z) ? cov(X, Z) ? cov(Y, Z) ? cov(X, X) ? D( X) ? | cov(X,Y) |2? D( X)D(Y)
协方差和相关系数的定义
定义 称 E?( X ? E(X))(Y ? E(Y))?为X,Y的
协方差.记为 cov(X,Y) ? E?(X? E(X))(Y? E(Y))?.
称
? ?
D(X)
cov( X ,Y) ??
?cov(X,Y) D(Y) ?
为(X,Y)的协方差矩阵 .
可以证明协方差矩阵为半正定矩阵.
XY 1 0 P pq
E(X) ? p, E(Y) ? p, D(X) ? pq, D(Y) ? pq, E(XY) ? p, D(XY) ? pq,
cov(X,Y) ? pq, ? XY ? 1
例2 设 ( X ,Y ) ~ N ( ? 1,? 12,?2,? 22,?), 求 ? XY.
解
?? ??
相互独立
X,Y 不相关.
例3 设 X,Y 相互独立,且都服从 N (0,? 2), U = aX + bY ,V= aX - bY,a,b为常数,且都不为零, 求? UV .
解 cov(U ,V) ? E(UV) ? E(U )E(V) ? a 2E( X 2 ) ? b2E(Y2 )
? ?aE (X) ? bE(Y)?a?E ( X) ? bE(Y)?
由 E( X) ? E(Y) ? 0,
E(X2) ? ? 2
D( X) ? D(Y) ? ? 2
E(Y2) ? ? 2
cov(U ,V) ? (a 2 ? b2)? 2
而 D(U ) ? a 2D( X) ? b2D(Y) ? (a 2 ? b2 )? 2
D(V) ? a 2D( X) ? b2D(Y) ? (a 2 ? b2 )? 2
? 若(X,Y)为连续型,
? ? cov(X,Y) ? ?? ?? (x ? E(X))(y ? E(Y)) f (x, y)dxdy. ?? ??
例1 已知 X,Y的联合分布为:
pij X
Y
1
0
1
p
0
0
0
q
求 cov (X,Y),?XY.
解
0 < p <1 p+q= 1
X 10 P pq
Y 10 P pq
??
??
t(?
Байду номын сангаас
t
?
?
u)e
dudt u2
2(1? ?
2)?12t2
2? 1? ?2 ?? ??
? ? ? ? 1? 2?
e du t e dt u2
? ? ? 2(1? ? 2 )
??
2
?
1 t
2
2
2? 1? ? 2 ??
??
? ? 1? 2?
? XY ? ?
若 ( X,Y ) ~ N (? 1,? 12,? 2,? 22,?),则X,Y
对任何实数 t ,g(t) ? 0
4cov2 (X,Y) ? 4D(X)D(Y) ? 0
即 | cov(X,Y) |2 ? D( X)D(Y)
等号成立
g(t) ? 0 有两个相等的实零点
t0
?
cov( X,Y) D( X)
?
??? ?
g(t0 ) ? 0 即
D(Y) ?? D(X) ?
E[(Y ? E(Y)) ? t0( X ? E( X))]2 ? 0 又显然 E[(Y ? E(Y)) ? t0 ( X ? E( X))] ? 0
D[(Y ? E(Y)) ? t0( X ? E( X))] ? 0 P[(Y ? E(Y)) ? t0( X ? E( X)) ? 0] ? 1 P[(Y ? E(Y)) ? t0 ( X ? E( X)) ? 0] ? 1 即 P[(Y ? E(Y)) ? t0( X ? E( X))] ? 1
当D(X ) > 0, D(Y ) > 0 时,当且仅当
P(Y ? E(Y) ? t0 ( X ? E( X))) ? 1
时,等式成立 —Cauchy-Schwarz 不等式.
证明 令
g(t) ? E[(Y ? E(Y)) ? t(X ? E(X))]2 ? D(Y) ? 2t cov(X,Y) ? t 2D( X)
§3.3.1 协方差和相关系数
问题 对于二维随机变量 (X ,Y):
已知联合分布
边缘分布
这说明对于二维随机变量,除了每个随机变量各 自的概率特性以外,相互之间可能还有某种联系 .问 题是用一个什么样的数去反映这种联系 .
数 E(( X ? E( X))(Y ? E(Y))) 反映了随机变量 X ,
Y 之间的某种关系.
若D (X) > 0, D (Y) > 0 ,称
E??( X ? E( X))(Y ? E(Y) ?? ? ? D( X) D(Y) ?
为X,Y 的相关系数 ,记为
cov( X,Y) D( X) D(Y)
? XY ?
cov( X , Y) D ( X ) D (Y)
事实上,? XY ? cov( X? ,Y? ).
? ? cov(X,Y) ? ?? ?? (x ? ?1)(y ? ? 2) f (x, y)dxdy
令x??1? s
?1
? ? y??2?t
?2
?
? 1? 2
2? 1? ?2
ste dsdt ?? ??
?
1 2(1? ? 2
(s? )
?
t)2?
1t 2
2
?? ??
? ? 令s?? t?u ?
?1? 2