协方差相关系数(PPT课件)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
36
20
例4
x y , 0 x 2, 0 y 2; p x, y 8 其它. 0,
求:
2
Cov( X , Y )
2 2 0 0
XY 。
又 E( X )
1 2 2 2 x px, y dxdy x dx ( x y )dy 5 0 8 0 3
2
2 2
5 7 11 DX E ( X ) ( EX ) 3 6 36
2
11 同理 DY 36
故 XY
1 1 Cov( X , Y ) 36 . 11 11 DX DY 36
21
例5
已知二维随机变量 ( X , Y ) 的联合分布列为
X和Y分别服从正态分布
X和Y的相关系数 (1) 求Z 数学期望
17
例2 已知随机变量
X和Y分别服从正态分布 X和Y的相关系数
服从二维正态分布,并且
和
设
(2) 求 X 与Z 的相关系数
解 (2) 与 的协方差为
18
例3
(X,Y)在以原点为圆心的单位圆内服从均匀分布 求 Cov ( X, Y ) .
Cov(aX , bY ) E[( aX aEX )(bY bEY )] abE[( X EX )(Y EY )] abCov( X , Y ).
和 的相关系数存在,则
11
5、 设随机变量 1)
5、 设随机变量
1) 证明
和
的相关系数存在,则
由方差的非负性可得
12
1
Y
X -1 1
-2
0
1
0.3 0.1
0.12 0.18
0.18 0.12
求: 解
X pi
Cov( X , Y ) XY 。 X , Y边缘分布列为 Y 2 1 1 p j 0.4 0.6 0.4
0 0.3
1 0.3
EX 1 0.6 1 0.4 0.2 EY 2 0.4 0 0.3 1 0.3 0.5
COV( X,Y )=E(XY) -EXEY
可见,E ( XY ) EX
EY 存在的必要条件为
Cov( X , Y ) 0 COV( X,Y )= 0 . 即 XY DX DY 可见,若X与Y 独立,COV ( X , Y ) 0.
9
COV( X,Y )=E(XY) -EXEY
一 、独立性与不相关性 二、随机变量的矩
28
可见, E ( XY ) EX
EY 存在的必要条件为
XY
Cov( X , Y ) 0 DX DY
COV( X,Y )= 0 .
即
可见,若X与Y 独立,COV ( X , Y ) 0.
D(X士Y) = D X + DY士2COV( X,Y ) 即 D(X士Y) = D X + DY
4
那么要问:父亲及其成年儿子身高是一种什么关系呢?
类似的问题有: 吸烟和患肺癌有什么关系?
受教育程度和失业有什么关系?
高考入学分数和大学学习成绩有什么关系? 为了研究诸如此类的两变量的相互关系问题, 我们需要从理论上对两变量的相互关系加以研究.
这一讲就来讨论这个问题.
5
一、 协方差与相关系数的概念
1 , x 2 y 2 1; p x, y 其它. 0,
EX
1 1
解 因
x px, y dxdy
同理
1
1
1
xdx
1 x 2
1
1 x
dy
2x 1 x2
1 x 1 1 0. E ( XY ) xypx, y dxdy xdx ydy 1 x 1
下面求 X , Y 的方差:
E ( X 2 ) (1)2 0.6 12 0.4 1
2 0.4
E (Y 2 ) (2)2 0.4 02 0.3 12 0.3 1.9 DX E ( X 2 ) ( EX )2 1 (0.2)2 0.96 DY E (Y 2 ) ( EY )2 1.9 (0.5)2 1.65
6
定义4.5
设二维随机变量(X ,Y),若
E[(X-E X )(Y-E Y )] 则称它为X与Y的协方差,记为 COV ( X,Y)。 存在, 即 COV ( X,Y )= E[(X-E X )(Y-E Y )]
称 XY
Cov( X , Y ) E[( X EX )(Y EY )] DX DY DX DY
为随机变量X与Y的相关系数。
7
协方差
COV ( X,Y )=E[(X-E X ) (Y-E Y )]
若随机变量 X, Y 为离散型.
COV ( X , Y ) COV ( X , Y )
( x EX )( y
i i j
j
EY ) Pij
若随机变量 X, Y 为连续型.
Cov( X , Y ) 相关系数 XY DX DY E[( X EX )(Y EY )] DX DY X EX Y EY E[ ] DX DY
22
Y X -1 1
-2 0.3 0.1
0 0.12 0.18
1 0.18 0.12
E ( XY ) 1 (2) 0.3 (1) 0 0.12 (1) 1 0.18 1 (2) 0.1 1 0 0.18 11 0.12 0.34 EX 0.2
2 1
dx 0,
EY 0 .
故
Cov(X,Y)=E(XY)-EX EY 0.
19
例4 已知( X,Y )的密度函数为
x y , 0 x 2, 0 y 2; p x, y 8 其它. 0,
求: Cov( X , Y ),
2 2
XY .
协方差和相关系数
2
在讨论这个问题之前,我们先看一个例子。
在研究子女与父母的相象程度时,有一项是关于
父亲的身高和其成年儿子身高的关系.
3
这里有两个变量:一个是父亲的身高, 一个是成 年儿子身高.为了研究二者关系.英国统计学家皮尔逊 收集了1078个父亲及其成年儿子身高的数据, 画出了 一张散点图.
例2: 已知随机变量 X和Y分别服从正态分布 X和Y的相关系数 (1) 求Z 数学期望 解: (1) Z 的数学期望为
服从二维正态分布,并且
和 设 和方差
(2) 求 X 与Z 的相关系数
XY
Cov( X , Y ) DX DY
又
16
例2
已知随机变量
服从二维正态分布,并且
和 设 和方差
( x EX )( y EY ) px, y dxdy
8
二. 协方差和相关系数的计算公式
COV( X,Y )=E( XY ) -EXEY
证明:由协方差的定义及期望的性质,可得 Cov(X,Y )=E[(X - EX )(Y - EY )] = E(XY) - EX EY - EYEX+EXEY = E( XY ) - EX EY 即
2 1 2 7 解 因 EX 0 0 x px, y dxdy 8 0 xdx0 ( x y)dy 6 7 同理 EY . 6 2 2 2 2 1 4 E ( XY ) xyp x, y dxdy xdx y ( x y )dy 0 0 0 8 0 3 1 故 Cov(X,Y)=E(XY)-EX EY .
为了克服这一缺点,对协方差进行标准化:
Cov( X , Y ) E[( X EX )(Y EY )] X EX Y EY E( , ) DX DY DX DY DX DY
这就引入了相关系数: XY Cov( X , Y ) DX DY
27
第四节
第四章
独立性与不相关、矩
定义: 若 COV ( X , Y ) 0 称X与Y不相关。
10
三、协方差与相关系数的性质
COV ( X,Y )=E[(X-E X ) (Y-E Y )] 1. COV( X,X )= E[( X- EX )2] = DX ; 2. COV( X,Y )= COV( Y , X ) ; 3. COV( aX, bY )= ab COV( X,Y ), a,b是常数; 4. COV( X1+X2 ,Y )= COV( X1,Y )+ COV( X2,Y ). 证明3.
D( X Y ) E[( X Y ) ( EX EY )]
2 2
2
E[( X EX ) (Y EY )]
2
E ( X EX ) E (Y EY ) 2E[( X EX )(Y EY )]
D(X+Y )=DX +DY+2E [(X-EX ) (Y-EY)] D(X-Y )=DX +DY -2E[(X-EX )(Y-EY)] 定义:若 E[(X-E X )(Y-EY )] 存在,称 COV ( X,Y ) = E[( X-E X )(Y-E Y )] 为随机变量 X, Y 的协方差. 方差与协方差的关系: D(X士Y) = D X + DY士2COV( X,Y )
注 ρXY=0 仅说明X, Y 之间没有线性关系,但可 以有其他非线性关系.
13
例1
设 X , Y~N(0,4),且X,Y相互独立,W=2X+3Y,
Z = 2X - 3Y, 求 解
14
例1 设 X, Y~N(0,4),且X,Y相互独立,W = 2 X + 3 Y,
Z = 2X - 3Y, 求
15
X 与 Y 的协方差为:
EY 0.5
Cov( X , Y ) E ( XY ) EX EY 0.34 (0.2) (0.5) 0.24
23
Y
X
-1 1
-2 0.3 0.1
0 0.12 0.18
1 0.18 0.12
X pi Y p j
1 0.6
1 0.4 0 0.3 1 0.3
1 2 1 1 n . Cov( X 1 , X 1 ) Cov( X 1 , X i ) D( X 1 ) n n i 2 n n
26
协方差的大小在一定程度上反映了X 和Y 相互
间的关系,但它还受X 与Y 本身度量单位的影响. 例如:
Cov(kX, kY )=k2Cov(X,Y )
第三节
第四章
协方差、相关系数
一 、协方差和相关系数的概念 二、协方差的计算公式 三 、协方差和相关系数的性质
1
前面我们介绍了随机变量的数学期望和方差, 数学期望反映了随机变量在概率意义下的平均值,
方差则反映了随机变量相对于其均值的离散程度, 但对于二维 这对我们了解随机变量有一定的帮助。
随机变量 X , Y , 我们除了关心 X , Y的期望和方差外, 还希望知道之间的关系, 在反映分量之间关系的数字 特征中,最重要的就是本讲要讨论的
存在常数 a, b (b≠0),
即 X 和 Y 以概率1线性相关. 使 P{Y=a+bX}=1, 相关系数
是衡量两个随机变量之间线性相关程度的数字特征.
定义 设随机变量X, Y 的相关系数存在,
1)ρXY=1, 称 X, Y 正相关;
2)ρXY=-1, 称 X, Y 负相关; 3)ρXY=0, 称 X, Y 不相关.
X与Y
XY
的相互关系数为: Cov( X , Y ) 0.24 Cov( X , Y ) 0.24 0.19 24 DX DY 0.96 1.65
作业
P219 11; 12; 13 18; 19; 20
25
例4
设随机变量
X 1 , X 2 , X n , (n 1)
相互独立同 分Байду номын сангаас,且其方差为 2 0 ,令
1 n Y X i . 计算协方差 Cov( X1 , Y ). n i 1
解
因 X 1,X 2, X n 相互独立,故
Cov( X1 , X i ) E ( X 1 X i ) E ( X1 ) E ( X i ) 0, (i 2,3,, n)
n 1 Cov( X 1 , Y ) Cov( X 1 , X i ) n i 1