第4.3节 协方差与相关系数——概率论与数理统计(李长青版)讲解
§4.3协方差和相关系数
故 Cov( X ,Y ) = 0
D( X )D(Y )
但由=0并不一定能推出X和Y 独立. 请看下例.
例3. 设X服从(-1/2, 1/2)内的均匀分布,而Y=cos (X),求X, Y的相关系数.
解:不难求得 Cov(X,Y)=0.
( 因E(X ) 0, E( XY )
DE((XXY) ) DE(Y[X)E(2YC)]ov(EX[Y,EY()X )] E(X )E(Y)
对任意常数E(aX,Yb )有 E(X )E(Y )
Cov(aX ,bY) E[(aX E(aX ))(bY E(bY))] abE[(X E(X ))(Y E(Y ))] abCov(X ,Y )
E[( X E(X ))k (Y E(Y ))l ] (k,l 1, 2,)
为 k l 阶混合中心矩.
E(X ) D(X ) Cov(X ,Y )
1 阶原点矩 2 阶中心矩 2 阶混合中心矩
对于二维r.v ( X1,,X记2 )
c11 E[( X1 E( X1 ))2 ] D( X1)
0 , | y | 1
f (x, y) fX (x) fY ( y) ( | x | 1, | y | 1)
X ,Y 不独立 又因为
fX (x), 均fY (为y)偶函数
E(
X
)
xf
X
(x)dx
0
E(Y
)
yfY
(
y)dy
0
E(
XY
)
xyf
(x,
y)dxdy
1
xydxdy 0
x2 y2 1
E{[X E(X )][aX b E(aX b)]}
概率论与数理统计:协方差和相关系数
协方差和相关系数对二维随机变量),(Y X ,我们除了讨论X 与Y 的期望和方差之外,还需讨论X 与Y 之间相互关系的数字特征,本节主要讨论这方面的数字特征。
§ 协方差和相关系数 协方差的定义与性质定义 设(,)X Y 是二维随机变量.若{[()][()]}E X E X Y E Y --存在,则称它为随机变量X 与Y 的协方差,记为Cov(,)X Y ,即Cov(,){[()][()]}X Y E X E X Y E Y =--.常用下面的式子计算协方差Cov(,){[()][()]}X Y E X E X Y E Y =--()()()E XY E X E Y =-.注:(1)X 与Y 的协方差),(Y X Cov 实质上是二维随机变量X 与Y 的函数)]([()]([(Y E Y X E X -⋅-的期望,它是一个常数。
(2)当),(Y X 为二维离散型随机变量时,其分布律为}{),2,1,,2,1(,, =====j i y Y x X P P j i ij ,则ij i i ji P Y E y X E x Y X Cov )]()][([),(11--=∑∑∞=∞=;(3)当),(Y X 为二维连续型随机变量时,),(y x f 为),(Y X 的联合概率密度函数,则dxdy y x f Y E y X E x Y X Cov ),())(())((),(--=⎰⎰+∞∞-+∞∞-。
(4)利用期望的性质可得到协方差有下列计算公式:)()()(),(Y E X E XY E Y X Cov -=证明:)()()( )()()()()()()( )]()()()([ )]())(([(),(Y E X E XY E Y E X E Y E X E Y E X E XY E Y E X E Y XE Y X E XY E Y E Y X E X E Y X Cov -=+--=+--=--=此公式是计算协方差的重要公式,特别地取Y X =时,有)()]())(([(),(X D X E X X E X E X X Cov =--=,易见,方差是协方差的特例,协方差是方差的推广。
第四章 第三节 协方差与相关系数
§4.3 协方差与相关系数还需要讨论X 与Y 之间相互关系的数字特征.本节我们讨论关于这方面的问题.1. 协方差及其性质定义4.3.1 对于二维随机变量(,)X Y ,称()()EX E X Y E Y --为,X Y 的协方差.记作cov (,)X Y 。
即cov (,)()()X Y E X EX Y EY =--.cov 2(,)()()()X X E X EX X EX E X EX DX =--=-=.当(,)X Y 为离散型时,有cov 11(,)()()ij ij i j X Y xEX y EY p ∞∞===--∑∑.当(,)X Y 为连续型时,有cov (,)()()(,)X Y x EX y EY p x y dxdy ∞∞-∞∞=--⎰⎰.计算协方差时,还常用公式cov (,)()()X Y EXY EX EY =-协方差等于乘积的期望减去期望的乘积例4. 3.1 已知二维随机变量(,)X Y 的联合分布如表 4.3.1所示.试求cov (,).X Y .表4.3.1解 先求边缘分布,并记入表4.3.1中,.然后求数学期望与协方差.11523,222EX =⨯+⨯= 1111(4)(1)140,4444EY =-⨯+-⨯+⨯+⨯= 又 []12(4)243(1)310,4EXY =⨯-+⨯+⨯-+⨯=故 cov (,)()()0.X Y EXY EX EY =-=例4.3.2 已知二维随机变量(,)X Y 服从二维正态分布N (ρσσμμ,,,,222121). 求cov (,).X Y解 由例3.2.3知,221122(,),(,),XN Y N μσμσ故1,EX μ= 2.EY μ=于是,协方差为cov (,)X Y 12()()()()E X EX Y EY E X Y μμ=--=--=()()()()dxdyey x y y x x ⎰⎰∞∞-∞∞-⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫⎝⎛-+---⎪⎪⎭⎫ ⎝⎛------22221212112)1(2121221121σμσσμμρσμρμμρσπσ.引入变换u x =-11σμ,v y =-22σμ.于是 cov (,)X Y2222222122(1)u uv v v v uvedudv ρρρρ⎡⎤--++-∞∞⎣⎦--∞-∞⎰⎰=()()[]dudv uvev v u ⎰⎰∞∞-∞∞--+----2221)1(2122112ρρρρπσσ()2222(1)2u v v vedv uedu ρρ--∞∞---∞-∞⎧⎫⎪⎬⎪⎭,()222(1)2u v v vedv du ρρ--∞∞---∞-∞⎧⎫⎪⎪=⎨⎬⎪⎪⎩⎭⎰⎰上式大括号中的积分恰好是服从正态分布2(,1)N v ρρ-的随机变量的数学期望,cov (,)X Y =dv ev v ⎰∞∞--222122πσρσ =12ρσσ. ,X Y ρρ=协方差的性质(1)cov(,)cov(,),X Y Y X =(2) cov 1122((),())a X b a Y b ++=12a a cov (,)X Y , (3)cov 12(,)X X Y +=cov 1(,)X Y +cov 2(,)X Y . (4) ()2cov(,),D X Y DX DY X Y ±=+±并且当X 与Y 相互独立时,cov (,)0.X Y = 2. 相关系数及其性质定义4.3.2 对于二维随机变量(,)X Y ,如果0,0,DX DY ≠≠.则称,X Y ρ=为随机变量X 与Y 的相关系数.相关系数的性质 (1)1.XY ρ≤(2)1XY ρ=的充要条件是{} 1.P Y aX b =+=其中,a b 为常数,且0.a ≠一般地,当|XY ρ|的值越来越大而接近于1时,表明X 与Y 的线性关系程度越密切. 反之,当|XY ρ|的值越来越小而接近于0时,表明X 与Y 的线性关系程度很微弱.特别地当XY ρ=0时, 称X 与Y 不相关.若X 与Y 相互独立,则cov(,)0,X Y =于是0,XY ρ=即X 与Y 不相关。
43 协方差和相关系数精品PPT课件
4
12
45
XY
1 12 0.968 1 4 12 45
2) E( X ) 0, E( XY ) 0
XY 0
XY
0.968
:有96.8%的线性相似度,即在[0,1]之间,
y=x2与某条直线y=ax+b的图像差别不大。
XY 0 :根本就没有线性相关性,但有其他相关性。
三. 矩
XY
COV ( X ,Y ) 1 D( X )D(Y ) 2
例6 1) X ~ U (0,1),Y X 2 ,求 XY
2)X ~ U (1,1),Y X 2 ,求 XY
解1)
E( X ) 1 , E(Y ) 1 , E( XY ) 1 , D( X ) 1 , D(Y ) 4
2
3
解 DX 3, DY 1,
D(V ) 16D( X ) 9D(Y ) 24Cov( X ,Y ) 33, D(W ) 4D( X ) 16D(Y ) 16Cov( X ,Y ) 44,
Cov(V ,W ) Cov(4X 3Y 1,2X 4Y ) 8D( X ) 16Cov( X ,Y ) 6Cov(Y , X ) 12D(Y ) 22.
)
1 0
x 0
x
2dy
dx
2 3
D(X )
1 0
x 0
x2
2dy
dx
4 9
1 18
x=y D 1
E(Y
)
1 0
x 0
y
2dy
dx
1 3
D(Y )
1 x
0 0
y2
2dy
dx
1 9
1 18
E(XY )
《概率论》第4章§3协方差及相关系数
0 0
第四章 随机变量的数字特征
§3 协方差及相关系数
7/14
Cov( X ,Y) D(X ) 其中 a0 = E(Y) − b0E( X ) = E(Y) − E( X ) Cov( X ,Y) D(X )
b0 =
min E[(Y − (a + bX ))2 ] = E[(Y − (a0 + b0 X ))2 ] a,b 2 = D(Y)(1− ρXY )
E( X ) = ∫−∞ xfX (x)dx = 0 ∞ E(Y) = ∫−∞ yfY ( y)dy = 0
∞
又因为
1 E( XY) = ∫−∞ ∫−∞ xyf (x, y)dxdy= π ∫∫ xydxdy = 0
∞ ∞
∴ E[( X − E( X ))(Y − E(Y))] = E( XY) − E( X )E(Y) = 0 故 X ,Y 不相关 第四章 随机变量的数字特征
x2+ y2≤ 1
§3 协方差及相关系数
11/14 11/14
2 的相关系数. 设 ( X ,Y) ~ N(µ1, µ2,σ12 ,σ2 , ρ), 求 X ,Y 的相关系数. C ( X ,Y) = E[( X − µ1)(Y − µ2 )] ov
f (x, y) =
1 2(1− ρ2 ) 2πσ1σ2 1− ρ2 (x − µ1)2 (x − µ1)( y − µ2 ) ( y − µ2 )2 × [ − 2ρ + ]} 2 2 exp{−
1
2
2
1 ∞ ∞ (σ σ 1− ρ2tu + ρσ σ u2 )e−(t2 +u2 )/ 2dtdu = ∫−∞ ∫−∞ 1 2 1 2 2π
概率论与数理统计课件:4-3 协方差20121026
例4.3.3 设(X,Y)在圆域
{ D = (x, y); x2 + y2 ≤ r 2} (r > 0)
上服从均匀分布,判断X,Y是否不相关。
解:由例2知Cov(X,Y)=0
故 ρ XY = 0
即:X和Y不相关
例4.3.4 设(X, Y)服从二维正态分布
N
(µ1,σ
2 1
;
µ2,
,
σ
2 2
,
ρ
)
+2abE(X)-2aE(Y)
求a,b使e最小
令 解得
∂e ∂a
=
2a
+
2bE( X ) −
2E(Y )
=
0
∂e
∂b
=
2bE( X
2
)
−
2E( XY
)
+
2aE( X
)
=
0
Cov( X ,Y ) b0 = D( X )
a0 = E(Y ) − b0 E( X )
将a0,b0代入e,用a0+b 0X来近似Y,则最小误
cov( X ,Y ) = E( XY ) − E( X ) ⋅ E(Y )
= p(λ2 + λ ) − λ ⋅ pλ = pλ
ρ XY
=
cov( X ,Y ) DX DY
=
pλ = λ pλ
p
3. 随机变量X, Y 独立与X, Y 相关的关系
(1) 假设ρXY 存在,若X, Y相互独立, 则 ρXY=0,即X, Y不相关。反之,若X, Y不
0
−r≤ x≤r 其他
所以
+∞
∫ EX = −∞ xfX (x)dx
概率论与数理统计 第四章 第三节+++协方差,相关系数
1.当( X ,Y )的联合概率密度f x,y时:
CovX,Y x E(X ) y E Y f x, ydxdy
2.当(X ,Y )有联合分布律P X=xi,Y yj pij ,
(i, j 1, 2, )时:
CovX,Y xi E(X ) yj E Y pij. i1 j1
9E
Y
2
4
D
X
E
X
2
9
D
Y
E
Y
2
4D X 9DY 16 36 20
CovW, Z EWZ EW EZ EWZ 20
例 设X,Y的概率密度为:
f
x,y
x 0
y
求CovX,Y.
0 x 1,0 y 1 其它
解:
E
XY
1
0
1
0
xy
x
y
dxdy
1. 3
fX x
1 y2
y 1
E X
xf X
xdx
1 2x
1
1 x2 dx 0
E Y
yfY
y dy
1 2y
1
1 y2 dy 0
ห้องสมุดไป่ตู้
E XY xyf x, ydxdy
1 xydxdy
x2 y2 1
2
d
1 1r3 sin cos dr 0
0
0
COV X ,Y E XY E X E Y 0
(5) D(XY)=D(X)+D(Y) 2COV(X, Y).
(6) Cov X ,Y D X DY
二.相关系数
1. 定义 若r.v. X,Y的方差和协方差均存在,
概率论§4.3 协方差和相关系数
性质4 性质4 设X,Y 为随机变量,则有 , 为随机变量, D(X±Y)=D(X)+D(Y)±2Cov(X,Y) ± ± 性质5 性质5 设X,Y 为任意随机变量,则有 , 为任意随机变量, [Cov(X, Y)]2 ≤ D(X) D(Y) 证明: 证明: [Cov(X, Y)]2 =(E{[ X-E(X)][Y-E(Y)]})2 ≤ E{[X-E(X)]2}·E{[Y-E(Y)]2} = D(X)·D(Y) 柯西柯西许瓦兹 不等式
5
协方差的性质
性质1 协方差的计算与X, 性质1 协方差的计算与 ,Y 的次序无关 Cov(X, Y) = Cov(Y, X) 性质2 性质2 对任意常数 a1,a2,b1,b2 有 Cov(a1X+b1, a2Y+b2) = a1a2Cov(X, Y) 性质3 为随机变量, 性质3 设X1,X2 , Y1,Y2为随机变量,则有 Cov(X1+X2, Y)=Cov(X1, Y)+Cov(X2, Y) Cov(X, Y1+Y2)=Cov(X, Y1)+Cov(X, Y2)
= 4D(X) + D(Y) −4Cov( X,Y )
= 4×1+ 4 − 4×1 = 4
12
Cov(ξ,η) = Cov( X −2Y,2X −Y )
= 2Cov( X, X ) −4Cov(Y, X ) −Cov( X,Y) + 2Cov(Y,Y)
= 2D(X) −5Cov( X,Y ) + 2D(Y)
同理可得
5 E(Y ) = 12
2
15
D(X)=E(X2)−E2(X) − 同理可得
5 7 2 11 = −( ) = 144 12 12
概率论与数理统计 --- 第四章{随机变量的数字特征} 第三节:协方差及相关系数
4. 随机变量和的方差与协方差的关系
D(X±Y)= D(X)+D(Y) ± 2cov(X,Y)
协方差的大小在一定程度上反映了X 和Y 相互间的关系, 但它还受 X 与Y 本身度量单位的影响. 例如: cov(kX, kY)=k2cov(X, Y) 为了克服这一缺点, 对协方差进行标准化, 这就引入了相关系数.
第三节 协方差及相关系数
协方差
相关系数
一、协方差 (covariance)
1. 定义:量E{ [X-E(X)][Y-E(Y)] }称为随机变量
X和Y的协方差, 记为 cov(X,Y) , 即: cov(X,Y)=E{ [X-E(X)][Y-E(Y)] }
2. 简单性质: (1) cov(X, Y) = cov(Y, X) (2) cov(aX, bY) = ab cov(X, Y), a, b 是常数 (3) cov(C, X) = 0, C 是常数
(称 Y 不相关) 完全相关) 3) X 和 1 存在常数 a, b(b≠0), 使 P{ Y=aX+b }=1, 即: X 和 Y 以概率 1 线性相关. 相关系数刻划了X 和Y 间“线性相关”的程度.
可见, 若 ρ = ±1, Y 与 X 有严格线性关系;
若 ρ = 0, Y 与 X 无线性关系;
(4) cov(X1+X2, Y) = cov(X1, Y) + cov(X2, Y)
3. 计算协方差的一个简单公式
cov(X, Y)=E{ [X-E(X)][Y-E(Y)] } =E(XY)-E(X)E(Y)-E(Y)E(X)Y)
即: cov(X,Y)=E(XY) -E(X)E(Y) 可见, 若 X 与 Y 独立, cov(X, Y) = 0.
概率论与数理统计(协方差及相关系数、矩)
实验步骤: 实验步骤: (1) 整理数据如图 所示. 整理数据如图4-5所示 所示.
图4-5 整理数据
(2) 计算边缘概率 计算边缘概率P{X = xi}和P{Y = yj} 和 在单元格G2中输入公式 : 在单元格 中输入公式: = SUM(B2:F2), 并将 中输入公式 , 其复制到单元格区域G3:G6 其复制到单元格区域 在单元格B7中输入公式: 在单元格 中输入公式:=SUM(B2:B6),并将其 中输入公式 , 复制到单元格区域C7:F7 复制到单元格区域 (3) 计算期望 计算期望E(XY) 首先在单元格B9中输入公式: 首先在单元格 中输入公式: 中输入公式 =MMULT(B1:F1,B2:F6), ,
−
π
∫ πcos zdz = 0, ∫ πsin z cos zdz = 0
−
1 E ( XY ) = 2π
π
因而Cov(X,Y) = 0,ρXY = 0. , 因而 , . 不相关, 相关系数ρXY = 0,说明随机变量 与Y不相关, ,说明随机变量X与 不相关 但是, 所以X与 不独立 不独立. 但是,由于 X 2 + Y 2 = 1 ,所以 与Y不独立.
Cov ( X , Y ) = E ( XY ) − E ( X ) E (Y ) = 19 / 400,
所以
ρ XY =
Cov( X , Y ) 19 / 400 133 = = = 0.87 D( X ) D(Y ) 153 / 2800 153
4.3.2 相关系数 下面不加证明地给出相关系数的两条性质: 下面不加证明地给出相关系数的两条性质: (1) |ρXY | ≤ 1; ; 的充要条件是, (2) |ρXY | = 1的充要条件是,存在常数 ,b,使 的充要条件是 存在常数a, P{Y = aX + b} = 1. . 定义4.6 若ρXY = 0,称X与Y不相关.0 < ρXY ≤ 1,称 定义 , 与 不相关. , 不相关 X与Y正相关,– 1 ≤ ρXY < 0,称X与Y负相关. 正相关, 负相关. 与 正相关 , 与 负相关 事实上,相关系数 事实上 相关系数ρXY是X与Y线性关系强弱的一个 与 线性关系强弱的一个 度量,X与 的线性关系程度随着 的线性关系程度随着| 的减小而减弱, 度量 与Y的线性关系程度随着 ρXY|的减小而减弱 的减小而减弱 的线性关系最强, 时 与 的线性关系最强 当|ρXY| = 1时X与Y的线性关系最强, 的不存在线性关系, 当ρXY = 0时,意味 与Y的不存在线性关系,即X 时 意味X与 的不存在线性关系 不相关. 与Y不相关 不相关
概率论与数理统计_---_第四章{随机变量的数字特征}_第三节:协方差及相关系数
E
X
E(
X
) gY
E (Y
)
D( X )D(Y ) D( X ) D(Y )
cov( X *,Y * ) E( X *Y * ).
2. 相关系数的性质:
概率论
1) | | 1
2) X 和 Y 独立时, ρ=0(此时称X 和 Y 不相关), 但其逆不真.
由于当X 和Y 独立时, cov(X,Y)= 0.
故: cov( X ,Y ) 0
D( X )D(Y )
但由 ρ =0 并不一定能推出 X 和 Y 独立.
若 X 与 Y 独立, 则 X 与 Y 不相关, 但 X 与 Y 不相关, 不一定能推出 X 与 Y 独立.
例1: 设 X服从 (-1/2, 1/2)内的均匀分布, 而 Y=cosX,
不难求得: cov(X,Y)=0, 事实上, X的密度函数:
f
(x)
1
1 x 1
2
2
可得:E( X ) 0
0 其它,
1
E( XY ) E( X cos X )
2 1
x
cos
xf
(
x)dx
0
2
cov( X ,Y ) E( XY ) E( X )E(Y ) 0.
因而 ρ=0, 即 X和 Y不相关 .
但Y 与X 有严格的函数关系,即 X 和 Y 不独立 .
概率论
3) 1 存在常数 a, b(b≠0),使 P{ Y=aX+b }=1,
即: X 和 Y 以概率 1 线性相关. 相关系数刻划了X 和Y 间“线性相关”的程度.
概率论
可见, 若 ρ = ±1, Y 与 X 有严格线性关系;(称X 和 Y 完全相关)
概率论协方差与相关系数
*
*
由此可得 | XY | 1 .
* * D ( X Y ) 2(1 XY ) ,易知 (2) 由上述证明,得
XY 1 的充分必要条件是
例1 已知 X ,Y 的联合分布为
Y
pij X
1 p 0
0 0 q 0 < p <1 p+q=1
1
0
求 Cov (X ,Y ), XY
解
X P 1 0 Y P 1 0 XY P 1 0
p q
p q
p
q
E ( X ) p, E (Y ) p, D( X ) pq, D(Y ) pq,
D( X * Y * ) 0 ,
* * * * E ( X Y ) E ( X ) E ( Y ) 0 及方差的性质知, 再由 上式
等价于
X E ( X ) Y E (Y ) P 0 1 , D(Y ) D( X )
取
则X ,Y 相互独立
0
X ,Y 不相关
例3 设 ( X ,Y ) ~ N ( 1,1,4,4,0.5 ), Z = X + Y , 求 XZ 解 D ( X ) D (Y ) 4,
Cov( X , Y ) XY DX DY 2 Cov( X , Z ) Cov( X , X ) Cov( X , Y ) 6
D( Z ) D( X Y ) D( X ) D(Y ) 2Cov( X , Y ) 12 3 故 XZ 3 / 12 2 .
例4 设 X , Y 服从圆域x2 y2 r 2上的均匀分布,证明
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
XY 0
X ,Y 相互独立
X , Y 不相关
cov( X ,Y ) 0
E(XY ) EX EY D(X Y) DX DY
X , Y 不相关
当 XY 1 时,X 与 Y 之间以概率1存在线性关系; XY 越接近于0时, X 与 Y 之间的线性关系越弱;
当 XY 0 时,X 与 Y 之间不存在线性关系(不相关).
EY EX 7, EY 2 EX 2 5 .
6
3
cov(X ,Y ) E(XY ) EX EY 4 49 1 , 3 36 36
DY DX EX 2 (EX )2 5 (7)2 11, 3 6 36
D(X Y ) DX DY 2cov(X ,Y ) 5, 9
0 08
6
EX 2 x2 f (x, y)dxdy 2 2 x2 (x y)dxdy 5,
0 08
3
2 2 xy
4
E(XY)
xyf (x, y)dxdy
(x y)dxdy .
0 08
3
由x,y 在f (x,y)的表达式中的对称性, 可知
时, 等式成立.
协方差的数值虽然在一定程度上反映了X和Y 相互间的联系, 但其值还受X和Y本身取值大小的 影响, 比如X和Y同时增大到k倍, 即X1= kX, Y1= kY, 这时X1和Y1间的相互联系与X和Y间的相互联系是 相同的, 然而协方差却增大到了k2倍, 即
cov(X1 ,Y1) k 2 cov(X,Y ).
33 8
88
E(XY )
xi yi pij
j 1 i 1
(1)(1) 1 (1)1 1 1 (1) 1 11 1 0
8
8
8
8
可得 E(XY ) EX EY 因此 XY 0
故X, Y是不相关的. 又
P{X 0,Y 0} 0 P{X 0}P{Y 0} 2 2 88
cov(X ,Y ) DX DY
XY .
由此知, 相关系数确实克服了协方差的不足.
相关系数的意义和性质
相关系数是表征随机变量X与Y之间线性关系紧密 程度的量.
| XY | 1
| XY | 1
即Y 与X 有线性关系的概率等于1, 这种线性关系为
PY E(Y) t0[X E(X )] 1
例1 设随机变量(X,Y)的分布律为
X Y
-1 0 1
-1
01
1/8
1/8 1/8
1/8
0 1/8
1/8
1/8 1/8
试验证和X是Y不相关, 但X和Y不是相互独立的. 证 先求出X和Y的边缘分布律如下:
X -1 0 1 pk 3/8 2/8 3/8
Y -1 0 1 pk 3/8 2/8 3/8
EX EY (1) 3 0 2 1 3 0
XY
cov(X ,Y ) DX DY
1. 11
例3 设 ~U(0,2) , X=cos , Y=cos( + ),
是给定的常数,求 XY
XY
cov( X ,Y ) D( X ) D(Y )
为X ,Y 的相关系数
若 XY 0, 称 X ,Y 不相关.
无量纲 的量
相关系数就是标准化随机变量间的协方差, 并且有
(kX )(kY )
cov(kX , kY ) D(kX ) D(kY )
k 2 cov( X ,Y ) k 2 DX k 2 DY
故X, Y不独立.
例2 设随机变量(X,Y)的概率密度函数
f
(x,
y)
1 8
(x
y),
0≤x≤2, 0≤y≤2,
0,
其它.
求 cov(X,Y) 和 D(X Y ),XY .
.
解 由期望的计算公式可得
EX
2
xf (x, y)dxdy .
2 x(x y)dxdy 7,
X与Y之间没有线性关系并不表示它们之间没有关系 .
协方差和相关系数的计算
若 ( X ,Y ) 为离散型,
cov(X ,Y)
[xi E(X )][ y j E(Y )]pij
i1 j1
若 ( X ,Y ) 为连续型,
cov(X ,Y) [x E(X )][y E(Y)] f (x, y)dxdy
第三节 协方差及相关系数 问题 对于二维随机变量(X ,Y ):
已知联合分布
边缘分布
对二维随机变量,除每个随机变量各自的概率特性外,
相互之间可能还有某种联系, 问题是用一个怎样的数
去反映这种联系.
数 E(X EX )(Y EY )
反映了随机变量 X , Y 之间的某种关系
协方差的定义
定义 称 E(X EX )(Y EY ) 为 X ,Y 的协方差.
记为
cov(X ,Y) E(X EX )(Y EY)
称
DX cov(X ,Y )
cov(
X
,Y
)
DY
为(X , Y )的协方差矩阵 可以证明 协方差矩阵为半正定矩阵
协方差的性质 cov(X ,Y) cov(Y, X ) E(XY ) EXEY cov(aX ,bY ) ab cov( X ,Y ) a, b 为常数;
cov( X Y,Z) cov( X ,Z) cov(Y,Z) cov(X , X ) DX
| cov(X ,Y ) |2 DX DY — Cauchy-Schwarz不等式
当DX > 0, t0[X E(X )] 1
为了克服协方差的这一缺点, 将随机变量标准化,取
X * X EX , Y * Y EY ,
DX
DY
则
cov( X
,Y )
E
(X
E( X ))(Y E(Y ) D(X ) D(Y )
cov( X ,Y ) D(X ) D(Y )
相关系数的定义
若D X > 0, DY > 0 ,称