随机变量的相关系数和相关性
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3 y 2x
2
E(Y ) 5 , D(Y ) 7 .
3
18
O
1
x
E(XY )
xy f ( x, y)dxdy
1
dx
3x
2xy dy
5
,
0
2x
4
Cov( X , Y ) E( XY ) E( X ) E(Y ) 5 ,
36
XY
Cov( X ,Y )
5
0.9449 .
这表示X,Y 不存在线性关系.
但, P{X 2,Y 1} 0 P{X 2} P{Y 1}
知X,Y 不独立.
事实上, X,Y 具有非线性关系: Y X 2 .
21
例5 设 A 和 B 是试验 E 的两个事件,且P(A) 0 ,
P(B) 0 ,并定义随机变量 X,Y 如下:
X
10,,
计算公式:
XY
Cov( X ,Y ) D( X )D(Y )
6
例1 设(X,Y )的联合分布律为 XY 0 1
求协方差Cov( X , Y )及
1 0.2 0.1 0.3
相关系数 XY .
解 先求出边缘分布,
2 0.4 0.3 0.7
0.6 0.4
E( X ) xi pi• 1.1, E(Y ) y j p• j 0.4,
相关系数是随机变量之间线性关系强弱的一个
度量(参见如下的示意图).
Y
Y
0 XY 1
Y
XY 1
XY 1
1 XY 0
X
X
X
| |的值越接近于1, Y与X的线性相关程度越高; | |的值越接近于0, Y与X的线性相关程度越弱.
18
定义 如 果 XY 0 , 称 X 与 Y 不相关。
从而 A 和 B 、 A 与 B、A 与B 也相互独立,于是
22
所以 P( AB) P( A)P(B) , 即A与B相互独立,
i
j
E( X 2 )
x
2 i
pi
•
3.1,
i
D( X ) E( X 2 ) [E( X )]2 3.1 1.12 1.89,
E(Y 2 )
y
2 j
p •
j
0.4,D(Y ) 0.24 ,
j
E(XY )
xi y j pij
ij
0 0.2 (1) 0.1 0 0.4 2 0.3 0.5, 7
其中
E(
XY
)
xi y j pij
ij
-
xy f ( x, y)dxdy
(离散型);
(连续型).
2
Cov( X , Y ) E[( X EX )(Y EY )] E( XY ) E( X ) E(Y )
协方差的性质:
1. 对称性: Cov( X ,Y ) Cov(Y , X ) 2. 线性性: Cov(aX ,Y ) a Cov( X ,Y )
y)
2 , 0 ,
0
x
1, 2x else
y
3x ,
2
求协方差Cov ( X , Y )及相关系数 XY . O
解 先求出边缘密度,
y 3x
y 2x
1
x
f X ( x)
f
( x,
y ) dy
02
x ,
,
0 x else
1,
fY ( y)
f
(
x,
y ) dx
2y/ 32,y
/
3
0 ,
1
4 2
1 y2 242
24
. ( x1)2 y2 18 32
15
例3 已 知X与Y分 别服 从 正态 分 布N (1,32 )和N (0,42 ),
(2) 若 XY
1,Z 2
X 3
Y 2
,求E(Z ),D(Z )和 XZ .
解 (2) E(Z ) E( X Y ) 1 E( X ) 1 E(Y )
xi y j pij
0
i
j
0.2
(1)
0.1
0
0.4
2
0.3
0.5
,
Cov( X , Y ) E( XY ) E( X ) E(Y ) 0.06,
XY
Cov( X ,Y )
D( X )D(Y )
0.06 0.089 . 1.89 0.24
8
y
例2 设(X,Y )的联合密度函数为
3
f (x,
2 2 XY 0,
1 XY 1, 即得 | XY | 1 .
性质2 若 Y a bX ,则 XY 1 (b 0) 证 E(Y ) a bE( X ) , D(Y ) b2D( X ) ,
E( XY ) E[X (a bX )] aE( X ) bE( X 2 ) ,
Cov ( X1 X2 , Y ) Cov ( X1, Y ) Cov ( X2 , Y ) 3. 若X和Y相互独立,则 Cov( X ,Y ) 0
因为X和Y相互独立 E( XY ) E( X ) E(Y )
注意:反之未必成立。
3
4. D( X Y ) D( X ) D(Y ) 2Cov( X , Y )
0
2
D( X ) E( X 2 ) [E( X )]2 1 , 18
类似地, E(Y ) 5 , E(Y 2 ) 19 , D(Y ) 7 .
3
6
18
10
f (x,
y)
2 , 0 ,
0
x
1, 2x else
y
3x ,
E( X ) 2 , D( X ) 1 ,
3
18
y y 3x
类似地有 D( X Y ) D( X ) D(Y ) 2Cov( X , Y ) .
推广:D
n
X i
n
D( X i ) 2 Cov( X i , X j )
i1 i1
i j
因此,若X1,X2, …,Xn两两独立,,则有
D
n i 1
Xi
n i 1
D( X i )
4
二、相关系数的概念及其性质
19
二维正态分布
(X
,
Y
)
~
N (1,
2
,
2 1
,
2 2
,
)
.
f (x, y)
1
1
2(1
2
)
(
x 1
2 1
)2
2
(
x 1 )( y 2 2 1 2
)ห้องสมุดไป่ตู้
(
y2
2 2
)2
e 2 1 2 1 2
前面已证: X,Y 相互独立 0 .
可以计算得 XY .
于是,对二维正态随机变量(X,Y )来说, X和Y 不相关与X和Y 相互独立是等价的.
3
E(Y )
yf ( x, y)dxdy
1
dx
3x
2
y
dy
5
,
0
2x
3
E(Y 2 )
1
dx
3x
2
y2
dy
19
.
0
2x
6
实际上,第一种方法限定了求积分的次序,有时不方便.
12
相关系数的性质:
性质1 | XY | 1
证 D( X Y ) D( X ) D(Y ) 2Cov ( X , Y )
协方差的大小在一定程度上反映了X和Y相互间的 关系,但它还受X与Y本身度量单位的影响. 例如:
Cov(kX, kY)=k2Cov(X,Y)
为了消除量纲的影响,下面提出随机变量标准 化的概念 .
我 们 把 X X E( X ) 称 为 X 的 标 准 化 随 机 变 量 . D( X )
可以验证,E( X ) 0 , D( X ) 1 .
下列事实彼此等价:
(1) X 与 Y 不 相 关 (即 XY 0 );
(2) Cov ( X , Y ) 0; (3) E( XY ) E( X ) E(Y ); (4) D( X Y ) D( X ) D(Y ) .
定理 若X与Y 相互独立,则X与Y 不相关。 注意: (1) 逆命题不成立,即X与Y 不相关时,不一定独立. (2) 在正态分布的场合,独立性与不相关性是一致的。
D( X ) D(Y )
D( X ) D(Y )
aE( X ) bE( X 2 ) E( X )[a bE( X )] D( X ) b2D( X )
b E( X 2 ) [E( X )2
D( X ) b
b b
1 1
b0 b0
14
例3 已 知X与Y分 别服 从 正态 分 布N (1,32 )和N (0,42 ),
D( X )D(Y ) 2 7
11
f (x,
y)
2 , 0 ,
0
x
1, 2x else
y
3x ,
y y 3x
3 y 2x
注:实际上,本题不必求边缘密度, 2
可以直接用以下公式计算E(X)、
E(Y )等.
O
1
x
E( X )
xf ( x, y)dxdy
1
dx
3x
2x
dy
2
,
0
2x
标准化随机变量消除了量纲的影响。
5
X X E( X ) D( X )
Y Y E(Y ) D(Y )
定义 设 D(X)>0, D(Y)>0, 将 标 准 化 变 量 X 与Y 的 的 协 方 差 Cov ( X , Y ) , 称为 X 与 Y 的相关系数 ,
记 为 XY , 即 XY Cov ( X , Y )
2
y
y
2
3
,
0 ,
else
9
f X ( x)
f
( x,
y ) dy
2x 0 ,
,
0 x else
1,
fY ( y)
f
(
x,
y)
dx
2y
/3, 2y
/
3
0 ,
2
y
y
2
3
,
0 ,
else
E( X )
xf ( x)dx
1
x
2x
dx
2
,
0
3
E( X 2 ) x2 f ( x)dx 1 x2 2 x dx 1 ,
第四节
1
一、协方差的概念及其性质
对随机向量来说,除了研究每个分量的数学期望 和方差以外,还希望知道分量之间的相关程度,因此 引进协方差和相关系数这两个概念。
定义 称 E[( X EX )(Y EY )] 为 随 机 变 量 X 和 Y 的
协 方 差 , 记 为 Cov ( X , Y ) 。
计算公式: Cov( X , Y ) E( XY ) E( X ) E(Y )
D( X Y ) EX Y E( X Y )2 E( X EX ) (Y EY )2
E ( X EX )2 (Y EY )2 2( X EX )(Y EY )
E( X EX )2 E(Y EY )2 2E( X EX )(Y EY )
D( X ) D(Y ) 2cov(X ,Y ),
(1) 若 XY 0,求( X ,Y )的联合密度;
(2) 若 XY
1,Z 2
X 3
Y 2
,求E(Z ),D(Z )和 XZ .
解 (1) 由 XY 0,知X与Y相互独立,
所以( X ,Y )的联合密度为
f ( x, y) f X ( x) fY ( y)
e e e 1 3 2
( x1)2 232
Cov( X , X ) Cov( X , Y )
3
2
1 Cov( X , X ) 1 Cov( X ,Y )
3
2
1 D( X ) 1 Cov( X ,Y )
3
2
1 9 1 (6) 0 , 32
所以 XZ
Cov( X , Z ) 0 . D( X ) D(Z )
17
三、随机变量的线性相关性
E( X )
xi pi• 1.1,E(Y )
y
j
p •
j
0.4
,
i
E( X 2 ) xi2 pi• 3.1,
j
i
D( X ) E( X 2 ) [E( X )]2 3.1 1.12 1.89,
E(Y 2 )
y
2 j
p •
j
0.4,
D(Y ) 0.24 ,
j
E(XY )
32 3
2
1 1 1 0 1 ,
32
3
Cov(
X 3
,Y 2
)
1 3
1 2
XY
D( X )
D(Y )
1( 1 ) 32 42 1, 62
D(Z ) D( X Y ) 1 D( X ) 1 D(Y ) 2Cov( X ,Y ) 3 .
32 9
4
32
16
Cov( X , Z ) Cov( X , X Y ) 32
20
例4 设( X,Y )的分布律为
X Y
2
1
1
2
E( X ) 0 ,
1 0 1/ 4 1/ 4 0 1/ 2 E(Y ) 5 / 2 ,
4 1/ 4 0 0 1/ 4 1/ 2 E( XY ) 0 ,
1/4 1/4 1/4 1/4
所以 Cov( X , Y ) 0 , 于是 XY 0 .
若A发 生 若A不 发 生
Y
1, 0,
若B发 生 若B不 发 生
证明若 XY 0 , 则 X 和 Y 必定相互独立.
证 E(X ) P(A), E(Y ) P(B),E( XY ) P( AB),
因为 XY 0 , 即 E( XY ) E( X )E(Y ) , 所以 P( AB) P( A)P(B) , 即A与B相互独立,
13
性质2 若 Y a bX ,则 XY 1 (b 0)
证 E(Y ) a bE( X ) , D(Y ) b2D( X ) , E( XY ) E[X (a bX )] aE( X ) bE( X 2 ) ,
XY
Cov( X , Y ) E( XY ) E( X ) E(Y )
2
E(Y ) 5 , D(Y ) 7 .
3
18
O
1
x
E(XY )
xy f ( x, y)dxdy
1
dx
3x
2xy dy
5
,
0
2x
4
Cov( X , Y ) E( XY ) E( X ) E(Y ) 5 ,
36
XY
Cov( X ,Y )
5
0.9449 .
这表示X,Y 不存在线性关系.
但, P{X 2,Y 1} 0 P{X 2} P{Y 1}
知X,Y 不独立.
事实上, X,Y 具有非线性关系: Y X 2 .
21
例5 设 A 和 B 是试验 E 的两个事件,且P(A) 0 ,
P(B) 0 ,并定义随机变量 X,Y 如下:
X
10,,
计算公式:
XY
Cov( X ,Y ) D( X )D(Y )
6
例1 设(X,Y )的联合分布律为 XY 0 1
求协方差Cov( X , Y )及
1 0.2 0.1 0.3
相关系数 XY .
解 先求出边缘分布,
2 0.4 0.3 0.7
0.6 0.4
E( X ) xi pi• 1.1, E(Y ) y j p• j 0.4,
相关系数是随机变量之间线性关系强弱的一个
度量(参见如下的示意图).
Y
Y
0 XY 1
Y
XY 1
XY 1
1 XY 0
X
X
X
| |的值越接近于1, Y与X的线性相关程度越高; | |的值越接近于0, Y与X的线性相关程度越弱.
18
定义 如 果 XY 0 , 称 X 与 Y 不相关。
从而 A 和 B 、 A 与 B、A 与B 也相互独立,于是
22
所以 P( AB) P( A)P(B) , 即A与B相互独立,
i
j
E( X 2 )
x
2 i
pi
•
3.1,
i
D( X ) E( X 2 ) [E( X )]2 3.1 1.12 1.89,
E(Y 2 )
y
2 j
p •
j
0.4,D(Y ) 0.24 ,
j
E(XY )
xi y j pij
ij
0 0.2 (1) 0.1 0 0.4 2 0.3 0.5, 7
其中
E(
XY
)
xi y j pij
ij
-
xy f ( x, y)dxdy
(离散型);
(连续型).
2
Cov( X , Y ) E[( X EX )(Y EY )] E( XY ) E( X ) E(Y )
协方差的性质:
1. 对称性: Cov( X ,Y ) Cov(Y , X ) 2. 线性性: Cov(aX ,Y ) a Cov( X ,Y )
y)
2 , 0 ,
0
x
1, 2x else
y
3x ,
2
求协方差Cov ( X , Y )及相关系数 XY . O
解 先求出边缘密度,
y 3x
y 2x
1
x
f X ( x)
f
( x,
y ) dy
02
x ,
,
0 x else
1,
fY ( y)
f
(
x,
y ) dx
2y/ 32,y
/
3
0 ,
1
4 2
1 y2 242
24
. ( x1)2 y2 18 32
15
例3 已 知X与Y分 别服 从 正态 分 布N (1,32 )和N (0,42 ),
(2) 若 XY
1,Z 2
X 3
Y 2
,求E(Z ),D(Z )和 XZ .
解 (2) E(Z ) E( X Y ) 1 E( X ) 1 E(Y )
xi y j pij
0
i
j
0.2
(1)
0.1
0
0.4
2
0.3
0.5
,
Cov( X , Y ) E( XY ) E( X ) E(Y ) 0.06,
XY
Cov( X ,Y )
D( X )D(Y )
0.06 0.089 . 1.89 0.24
8
y
例2 设(X,Y )的联合密度函数为
3
f (x,
2 2 XY 0,
1 XY 1, 即得 | XY | 1 .
性质2 若 Y a bX ,则 XY 1 (b 0) 证 E(Y ) a bE( X ) , D(Y ) b2D( X ) ,
E( XY ) E[X (a bX )] aE( X ) bE( X 2 ) ,
Cov ( X1 X2 , Y ) Cov ( X1, Y ) Cov ( X2 , Y ) 3. 若X和Y相互独立,则 Cov( X ,Y ) 0
因为X和Y相互独立 E( XY ) E( X ) E(Y )
注意:反之未必成立。
3
4. D( X Y ) D( X ) D(Y ) 2Cov( X , Y )
0
2
D( X ) E( X 2 ) [E( X )]2 1 , 18
类似地, E(Y ) 5 , E(Y 2 ) 19 , D(Y ) 7 .
3
6
18
10
f (x,
y)
2 , 0 ,
0
x
1, 2x else
y
3x ,
E( X ) 2 , D( X ) 1 ,
3
18
y y 3x
类似地有 D( X Y ) D( X ) D(Y ) 2Cov( X , Y ) .
推广:D
n
X i
n
D( X i ) 2 Cov( X i , X j )
i1 i1
i j
因此,若X1,X2, …,Xn两两独立,,则有
D
n i 1
Xi
n i 1
D( X i )
4
二、相关系数的概念及其性质
19
二维正态分布
(X
,
Y
)
~
N (1,
2
,
2 1
,
2 2
,
)
.
f (x, y)
1
1
2(1
2
)
(
x 1
2 1
)2
2
(
x 1 )( y 2 2 1 2
)ห้องสมุดไป่ตู้
(
y2
2 2
)2
e 2 1 2 1 2
前面已证: X,Y 相互独立 0 .
可以计算得 XY .
于是,对二维正态随机变量(X,Y )来说, X和Y 不相关与X和Y 相互独立是等价的.
3
E(Y )
yf ( x, y)dxdy
1
dx
3x
2
y
dy
5
,
0
2x
3
E(Y 2 )
1
dx
3x
2
y2
dy
19
.
0
2x
6
实际上,第一种方法限定了求积分的次序,有时不方便.
12
相关系数的性质:
性质1 | XY | 1
证 D( X Y ) D( X ) D(Y ) 2Cov ( X , Y )
协方差的大小在一定程度上反映了X和Y相互间的 关系,但它还受X与Y本身度量单位的影响. 例如:
Cov(kX, kY)=k2Cov(X,Y)
为了消除量纲的影响,下面提出随机变量标准 化的概念 .
我 们 把 X X E( X ) 称 为 X 的 标 准 化 随 机 变 量 . D( X )
可以验证,E( X ) 0 , D( X ) 1 .
下列事实彼此等价:
(1) X 与 Y 不 相 关 (即 XY 0 );
(2) Cov ( X , Y ) 0; (3) E( XY ) E( X ) E(Y ); (4) D( X Y ) D( X ) D(Y ) .
定理 若X与Y 相互独立,则X与Y 不相关。 注意: (1) 逆命题不成立,即X与Y 不相关时,不一定独立. (2) 在正态分布的场合,独立性与不相关性是一致的。
D( X ) D(Y )
D( X ) D(Y )
aE( X ) bE( X 2 ) E( X )[a bE( X )] D( X ) b2D( X )
b E( X 2 ) [E( X )2
D( X ) b
b b
1 1
b0 b0
14
例3 已 知X与Y分 别服 从 正态 分 布N (1,32 )和N (0,42 ),
D( X )D(Y ) 2 7
11
f (x,
y)
2 , 0 ,
0
x
1, 2x else
y
3x ,
y y 3x
3 y 2x
注:实际上,本题不必求边缘密度, 2
可以直接用以下公式计算E(X)、
E(Y )等.
O
1
x
E( X )
xf ( x, y)dxdy
1
dx
3x
2x
dy
2
,
0
2x
标准化随机变量消除了量纲的影响。
5
X X E( X ) D( X )
Y Y E(Y ) D(Y )
定义 设 D(X)>0, D(Y)>0, 将 标 准 化 变 量 X 与Y 的 的 协 方 差 Cov ( X , Y ) , 称为 X 与 Y 的相关系数 ,
记 为 XY , 即 XY Cov ( X , Y )
2
y
y
2
3
,
0 ,
else
9
f X ( x)
f
( x,
y ) dy
2x 0 ,
,
0 x else
1,
fY ( y)
f
(
x,
y)
dx
2y
/3, 2y
/
3
0 ,
2
y
y
2
3
,
0 ,
else
E( X )
xf ( x)dx
1
x
2x
dx
2
,
0
3
E( X 2 ) x2 f ( x)dx 1 x2 2 x dx 1 ,
第四节
1
一、协方差的概念及其性质
对随机向量来说,除了研究每个分量的数学期望 和方差以外,还希望知道分量之间的相关程度,因此 引进协方差和相关系数这两个概念。
定义 称 E[( X EX )(Y EY )] 为 随 机 变 量 X 和 Y 的
协 方 差 , 记 为 Cov ( X , Y ) 。
计算公式: Cov( X , Y ) E( XY ) E( X ) E(Y )
D( X Y ) EX Y E( X Y )2 E( X EX ) (Y EY )2
E ( X EX )2 (Y EY )2 2( X EX )(Y EY )
E( X EX )2 E(Y EY )2 2E( X EX )(Y EY )
D( X ) D(Y ) 2cov(X ,Y ),
(1) 若 XY 0,求( X ,Y )的联合密度;
(2) 若 XY
1,Z 2
X 3
Y 2
,求E(Z ),D(Z )和 XZ .
解 (1) 由 XY 0,知X与Y相互独立,
所以( X ,Y )的联合密度为
f ( x, y) f X ( x) fY ( y)
e e e 1 3 2
( x1)2 232
Cov( X , X ) Cov( X , Y )
3
2
1 Cov( X , X ) 1 Cov( X ,Y )
3
2
1 D( X ) 1 Cov( X ,Y )
3
2
1 9 1 (6) 0 , 32
所以 XZ
Cov( X , Z ) 0 . D( X ) D(Z )
17
三、随机变量的线性相关性
E( X )
xi pi• 1.1,E(Y )
y
j
p •
j
0.4
,
i
E( X 2 ) xi2 pi• 3.1,
j
i
D( X ) E( X 2 ) [E( X )]2 3.1 1.12 1.89,
E(Y 2 )
y
2 j
p •
j
0.4,
D(Y ) 0.24 ,
j
E(XY )
32 3
2
1 1 1 0 1 ,
32
3
Cov(
X 3
,Y 2
)
1 3
1 2
XY
D( X )
D(Y )
1( 1 ) 32 42 1, 62
D(Z ) D( X Y ) 1 D( X ) 1 D(Y ) 2Cov( X ,Y ) 3 .
32 9
4
32
16
Cov( X , Z ) Cov( X , X Y ) 32
20
例4 设( X,Y )的分布律为
X Y
2
1
1
2
E( X ) 0 ,
1 0 1/ 4 1/ 4 0 1/ 2 E(Y ) 5 / 2 ,
4 1/ 4 0 0 1/ 4 1/ 2 E( XY ) 0 ,
1/4 1/4 1/4 1/4
所以 Cov( X , Y ) 0 , 于是 XY 0 .
若A发 生 若A不 发 生
Y
1, 0,
若B发 生 若B不 发 生
证明若 XY 0 , 则 X 和 Y 必定相互独立.
证 E(X ) P(A), E(Y ) P(B),E( XY ) P( AB),
因为 XY 0 , 即 E( XY ) E( X )E(Y ) , 所以 P( AB) P( A)P(B) , 即A与B相互独立,
13
性质2 若 Y a bX ,则 XY 1 (b 0)
证 E(Y ) a bE( X ) , D(Y ) b2D( X ) , E( XY ) E[X (a bX )] aE( X ) bE( X 2 ) ,
XY
Cov( X , Y ) E( XY ) E( X ) E(Y )