协方差与相关系数
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
wk.baidu.com
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
例1 设二维随机变量的联合分布律为 X 0 1 Y 0 q 0 1 0 p 其中p+q=1,求相关系数ρXY. 其中 ,求相关系数ρ 的联合分布律, 解 由(X,Y)的联合分布律,可得 与Y的边缘分布律为 的联合分布律 可得X与 的边缘分布律为 X 0 1 Y 0 1 P q p P q p 均为0-1分布 分布, 均为 分布,于是有
X 1 2 3
Y
1 0
2 1/6
3 1/12 1/4 1/6 1/2 0 1/4 求ρXY
1/6 1/6 1/12 1/6
23 6
1 6
Cov(X, Y) = 23/6 – 4 = - 1/6 ;
解 E(X) = 2 , E(Y) = 2; ;
E(XY) = ∑∑ xi y j pij =
i j
. E(X2) = 9/2 , E(Y2) = 9/2; D(X) =1/2, D(Y) = 1/2. ;
2aE[Y E (Y )][ X E ( X )] + 2 E[Y E (Y )][ E (Y ) aE ( X ) b]
2 aE [ X E ( X )][ E (Y ) aE ( X ) b ]
= D(Y ) + a D( X ) + [ E (Y ) aE ( X ) b] 2a cov( X , Y )
≈ 0.5708 + (0.7854)2 ≈ 0.0461
π
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
由协方差的性质 知, 协方差取值的大小要受到量纲 协方差的性质(2)知 的性质 的影响, 为了消除量纲对协方差值的影响,我们把 我们把X,Y标准 的影响 为了消除量纲对协方差值的影响 我们把 标准 化后再求协方差 Y E (Y ) X E(X ) * * X = , Y = D( X ) D (Y )
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
证明 (1) D ( X * ± Y * ) = D ( X * ) + D (Y * ) ± 2 cov( X * , Y * ) )
=1+1± 2cov( X *,Y* ) = 2(1 ± ρ XY ) ≥ 0,
即 1 ± ρ XY ≥ 0, |ρ XY |≤ 1. (2) 由方差性质得
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
服从二维正态分布, 的相关系数. 例4 设(X, Y)服从二维正态分布,求X, Y的相关系数. 服从二维正态分布 的相关系数
的联合密度f(x,y)及边缘密度 fX(x), fY(y) 如下: 如下: 解 X,Y的联合密度 的联合密度 及边缘密度
( x 1 ) 2 ( x 1 )( y 2 ) ( y 2 ) 2 1 [ 2 ρ + 2 σ 1σ 2 2 (1 ρ 2 ) σ 12 σ2
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
§4.3 协方差和相关系数
4.3.1 协方差
1. 定义 若E[X-E(X)][Y-E(Y)]存在,则称其为随机变量 与Y 存在, 存在 则称其为随机变量X与 的协方差.记为cov(X, Y)或Cov(X, Y), 即 的协方差.记为 或 协方差 Cov(X,Y) = E[XE(X)][YE(Y)]
解 D(Y ) = D(aX + b) = a 2 D( X ),
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
+[ E (Y ) aE ( X ) b]2 = 0
cov( X , Y ) 的充要条件是 a , b = E (Y ) aE ( X ), 且 D( X )
cov( X , Y ) 1 = 0, D ( X ) D(Y )
2
1 a>0 = 1 a < 0
1 x 4.设随机变量X的概率密度为 f ( x) = e (∞ < x < ∞) 2
的协方差, 是否不相关, 的协方差 是否不相关 是否相互独立. 求X与|X|的协方差,问X和|X|是否不相关,是否相互独立.
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
选例1 选例
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
设二维( 例2 设二维(X,Y)随机变量的密度函数为
π π 1 cos( x + y ), 0 ≤ x ≤ , - ≤ y ≤ 0 f ( x, y ) = 2 2 2 其它 0, 求 cov( X ,Y )
1 2 0 π 解 因为 E ( X ) = ∫ ∫ π x cos( x + y )dxdy = ≈ 0.7854, 2 0 -2 4 π 2 1 2 0 2 π π 2 D( X ) = ∫ ∫ π x cos( x + y)dxdy -[ E( X )] = + 2 ≈ 0.1876 2 0 -2 16 2 同理可得 E (Y ) ≈ 0.7854, D(Y ) ≈ 0.1876, 1 π 0 π 2 E ( XY ) = ∫ ∫ π xy × cos( x + y )dxdy1 ≈ -0.5708, 2 0 -2 2 cov( X , Y ) = E ( XY ) - E ( X ) E (Y )
D ( X ) D(Y )
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
4.3.1 相关系数(标准协方差) 相关系数(标准协方差)
1. 定义 对于随机变量 和Y, 若D(X)≠0, D (Y)≠0, 则称 对于随机变量X和 0 0
ρ XY =
Cov( X , Y ) D ( X ) D(Y )
即 从而
2 1 ρ XY = 0,
|ρ XY |= 1.
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
是否不相关? 例3 若X~N(0, 1), Y=X2, 问X与Y是否不相关? 与 是否不相关 解 因为X~N(0, 1), 密度函数 f ( x) =
为偶函数,所以 为偶函数 所以 E ( X ) = E ( X 3 ) = 0 于是由: 于是由
ρ XY =
Cov ( X , Y ) D ( X ) D (Y ) = 1 2 = 1 3
1 2
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
选例2 设随机变量X的方差 的方差D(X)≠0且 Y=aX+b (a≠0), 选例 设随机变量 的方差 0 0 的相关系数ρ 求X和Y的相关系数 XY 和 的相关系数
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
练 习 题
1.将一枚不均匀硬币投掷 次 1.将一枚不均匀硬币投掷n次,以X和Y分别表示出现正面和 将一枚不均匀硬币投掷 反面的次数, 反面的次数,则X和Y的相关系数为 (A)-1 (B)0 (D) 1 . (A)-1; (B)0; (C) ; 2.设随机变量 独立同分布, 2.设随机变量X和Y独立同分布,记U=X+Y, V=X-Y,则U和V 则 (A)不独立 不独立; (B)独立 独立; (A)不独立; (B)独立; (C)相关系数为 相关系数为0 (C)相关系数为0; (D)相关系数不为0. )相关系数不为0 3.设 是随机变量, 3.设X是随机变量,Y=aX+b (a≠0), 证明 : ρ XY 0
P{Y = aX + b} = P{Y aX b = 0} = 1
成立的充分必要条件为
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
D(Y aX b) = E[(Y aX b) 2 ] [ E (Y aX b)]2
而
= E[(Y aX b) 2 ] = 0
2
E[(Y aX b) ] = E[(Y E (Y )) a ( X E ( X )) + ( E (Y ) aE ( X ) b)]2 = E[(Y E (Y )]2 + a 2 E[ X E ( X )]2 + E[ E (Y ) aE ( X ) b]2
2.协方差的计算 协方差的计算 离散型随机向量 cov( X , Y ) =
∑∑[ x E ( X )][ y
i i j
j
E (Y )]pij
其中 P{X=xi ,Y=yj}=pij i, j=1, 2, 3, …. 连续型随机向量
+∞ +∞
cov( X , Y ) = ∫
∞
∫
∞
[ x E ( X )][ y E (Y )] f ( x, y )dxdy
为随机变量X和 的相关系数(标准协方差) 为随机变量 和Y的相关系数(标准协方差) . 2.性质 性质 (1)|ρXY| ≤ 1; ) ; 其中a, 为常数 为常数. (2)|ρXY| = 1当且仅当 P{Y=aX+b}=1 , 其中 b为常数. ) 当且仅当 相关系数ρ 刻划了随机变量X和 的线性相关程度 的线性相关程度. 相关系数 XY刻划了随机变量 和Y的线性相关程度. 不相关. 当ρXY = 0时 , 称X与Y不相关. 时 与 不相关
E ( X ) = p, D ( X ) = pq, E (Y ) = p, D (Y ) = pq . cov( X , Y ) = E ( XY ) E ( X ) E (Y ) = 0 × 0 × q + 0 × 1× 0 + 1× 0 × 0 + 1× 1× p p × p 2 = p p = pq , 所以 cov( X , Y ) pq ρ XY = = = 1. D( X ) D(Y ) pq pq
f ( x, y ) =
1 2πσ 1σ 2 1 ρ
( x 1 ) 2
2 2σ 1
2
e
1 f X ( x) = e 2π σ 1
Cov ( X , Y ) = ∫
+∞ +∞ ∞ ∞
,
fY ( y ) =
1 2π σ 2
e
( y 2 )2
2 2σ 2
,
∫
( x 1 )( y 2 ) f ( x, y ) dxdy
* * Cov( X * , Y * ) = E{[ X * E ( X * )][Y * E (Y * )]} = E ( X Y )
= E[ =
=
X E ( X ) Y E (Y ) D( X ) D (Y )
]
E{[ X E ( X )][Y E (Y )]} D ( X ) D(Y ) Cov( X , Y )
1 e 2π
x2 2
cov( X , Y ) = E ( XY ) E ( X ) E (Y ) = E ( X 3 ) E ( X ) E ( X 2 ) = 0
得
ρ XY =
cov( X , Y ) =0 D( X ) D(Y )
这说明X与 是不相关的 是不相关的, 这说明 与Y是不相关的 但 Y = X 2 显然, 与 是不相互独立的 显然,X与Y是不相互独立的
2 2
cov( X , Y ) 2 cov( X , Y ) 2 = D( X )[a ] + D(Y )[1 ( ) ] + [E(Y ) aE( X ) b]2 , D( X ) D( X ) D(Y )
E[(Y aX b) 2 ] cov( X , Y ) 2 cov( X , Y ) 2 = D( X )[a ] + D(Y )[1 ( ) ] D( X ) D( X ) D(Y )
= ρσ 1σ 2
ρ xy =
ρσ 1σ 2 = =ρ σ 1σ 2 D ( X ) D (Y )
Cov ( X , Y )
ρ=0, ,
从而说明二维正态分布随机变量X, 相互独立 从而说明二维正态分布随机变量 ,Y相互独立 相互独立与不相关是等价的. 即X,Y相互独立与不相关是等价的. , 相互独立与不相关是等价的
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
3. 协方差计算公式
Cov(X,Y)=E(XY )-E(X)E(Y)
独立,则 注 (1)若 X与Y独立 则Cov(X, Y)=0 ) 与 独立 (2)D(X±Y) = D(X) + D(Y)±2Cov(X, Y) ) ± ± 4. 协方差的性质 (1)Cov(X, Y) = Cov(Y, X) ) (2)Cov(aX, bY) = abCov(X, Y), a,b 为常数 ) (3)Cov(X1+X2, Y) = Cov(X1,Y) + Cov(X2,Y) ) 相互独立时, (4)当X与Y相互独立时,有Cov(X, Y) = 0 ) 与 相互独立时
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
例1 设二维随机变量的联合分布律为 X 0 1 Y 0 q 0 1 0 p 其中p+q=1,求相关系数ρXY. 其中 ,求相关系数ρ 的联合分布律, 解 由(X,Y)的联合分布律,可得 与Y的边缘分布律为 的联合分布律 可得X与 的边缘分布律为 X 0 1 Y 0 1 P q p P q p 均为0-1分布 分布, 均为 分布,于是有
X 1 2 3
Y
1 0
2 1/6
3 1/12 1/4 1/6 1/2 0 1/4 求ρXY
1/6 1/6 1/12 1/6
23 6
1 6
Cov(X, Y) = 23/6 – 4 = - 1/6 ;
解 E(X) = 2 , E(Y) = 2; ;
E(XY) = ∑∑ xi y j pij =
i j
. E(X2) = 9/2 , E(Y2) = 9/2; D(X) =1/2, D(Y) = 1/2. ;
2aE[Y E (Y )][ X E ( X )] + 2 E[Y E (Y )][ E (Y ) aE ( X ) b]
2 aE [ X E ( X )][ E (Y ) aE ( X ) b ]
= D(Y ) + a D( X ) + [ E (Y ) aE ( X ) b] 2a cov( X , Y )
≈ 0.5708 + (0.7854)2 ≈ 0.0461
π
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
由协方差的性质 知, 协方差取值的大小要受到量纲 协方差的性质(2)知 的性质 的影响, 为了消除量纲对协方差值的影响,我们把 我们把X,Y标准 的影响 为了消除量纲对协方差值的影响 我们把 标准 化后再求协方差 Y E (Y ) X E(X ) * * X = , Y = D( X ) D (Y )
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
证明 (1) D ( X * ± Y * ) = D ( X * ) + D (Y * ) ± 2 cov( X * , Y * ) )
=1+1± 2cov( X *,Y* ) = 2(1 ± ρ XY ) ≥ 0,
即 1 ± ρ XY ≥ 0, |ρ XY |≤ 1. (2) 由方差性质得
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
服从二维正态分布, 的相关系数. 例4 设(X, Y)服从二维正态分布,求X, Y的相关系数. 服从二维正态分布 的相关系数
的联合密度f(x,y)及边缘密度 fX(x), fY(y) 如下: 如下: 解 X,Y的联合密度 的联合密度 及边缘密度
( x 1 ) 2 ( x 1 )( y 2 ) ( y 2 ) 2 1 [ 2 ρ + 2 σ 1σ 2 2 (1 ρ 2 ) σ 12 σ2
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
§4.3 协方差和相关系数
4.3.1 协方差
1. 定义 若E[X-E(X)][Y-E(Y)]存在,则称其为随机变量 与Y 存在, 存在 则称其为随机变量X与 的协方差.记为cov(X, Y)或Cov(X, Y), 即 的协方差.记为 或 协方差 Cov(X,Y) = E[XE(X)][YE(Y)]
解 D(Y ) = D(aX + b) = a 2 D( X ),
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
+[ E (Y ) aE ( X ) b]2 = 0
cov( X , Y ) 的充要条件是 a , b = E (Y ) aE ( X ), 且 D( X )
cov( X , Y ) 1 = 0, D ( X ) D(Y )
2
1 a>0 = 1 a < 0
1 x 4.设随机变量X的概率密度为 f ( x) = e (∞ < x < ∞) 2
的协方差, 是否不相关, 的协方差 是否不相关 是否相互独立. 求X与|X|的协方差,问X和|X|是否不相关,是否相互独立.
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
选例1 选例
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
设二维( 例2 设二维(X,Y)随机变量的密度函数为
π π 1 cos( x + y ), 0 ≤ x ≤ , - ≤ y ≤ 0 f ( x, y ) = 2 2 2 其它 0, 求 cov( X ,Y )
1 2 0 π 解 因为 E ( X ) = ∫ ∫ π x cos( x + y )dxdy = ≈ 0.7854, 2 0 -2 4 π 2 1 2 0 2 π π 2 D( X ) = ∫ ∫ π x cos( x + y)dxdy -[ E( X )] = + 2 ≈ 0.1876 2 0 -2 16 2 同理可得 E (Y ) ≈ 0.7854, D(Y ) ≈ 0.1876, 1 π 0 π 2 E ( XY ) = ∫ ∫ π xy × cos( x + y )dxdy1 ≈ -0.5708, 2 0 -2 2 cov( X , Y ) = E ( XY ) - E ( X ) E (Y )
D ( X ) D(Y )
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
4.3.1 相关系数(标准协方差) 相关系数(标准协方差)
1. 定义 对于随机变量 和Y, 若D(X)≠0, D (Y)≠0, 则称 对于随机变量X和 0 0
ρ XY =
Cov( X , Y ) D ( X ) D(Y )
即 从而
2 1 ρ XY = 0,
|ρ XY |= 1.
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
是否不相关? 例3 若X~N(0, 1), Y=X2, 问X与Y是否不相关? 与 是否不相关 解 因为X~N(0, 1), 密度函数 f ( x) =
为偶函数,所以 为偶函数 所以 E ( X ) = E ( X 3 ) = 0 于是由: 于是由
ρ XY =
Cov ( X , Y ) D ( X ) D (Y ) = 1 2 = 1 3
1 2
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
选例2 设随机变量X的方差 的方差D(X)≠0且 Y=aX+b (a≠0), 选例 设随机变量 的方差 0 0 的相关系数ρ 求X和Y的相关系数 XY 和 的相关系数
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
练 习 题
1.将一枚不均匀硬币投掷 次 1.将一枚不均匀硬币投掷n次,以X和Y分别表示出现正面和 将一枚不均匀硬币投掷 反面的次数, 反面的次数,则X和Y的相关系数为 (A)-1 (B)0 (D) 1 . (A)-1; (B)0; (C) ; 2.设随机变量 独立同分布, 2.设随机变量X和Y独立同分布,记U=X+Y, V=X-Y,则U和V 则 (A)不独立 不独立; (B)独立 独立; (A)不独立; (B)独立; (C)相关系数为 相关系数为0 (C)相关系数为0; (D)相关系数不为0. )相关系数不为0 3.设 是随机变量, 3.设X是随机变量,Y=aX+b (a≠0), 证明 : ρ XY 0
P{Y = aX + b} = P{Y aX b = 0} = 1
成立的充分必要条件为
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
D(Y aX b) = E[(Y aX b) 2 ] [ E (Y aX b)]2
而
= E[(Y aX b) 2 ] = 0
2
E[(Y aX b) ] = E[(Y E (Y )) a ( X E ( X )) + ( E (Y ) aE ( X ) b)]2 = E[(Y E (Y )]2 + a 2 E[ X E ( X )]2 + E[ E (Y ) aE ( X ) b]2
2.协方差的计算 协方差的计算 离散型随机向量 cov( X , Y ) =
∑∑[ x E ( X )][ y
i i j
j
E (Y )]pij
其中 P{X=xi ,Y=yj}=pij i, j=1, 2, 3, …. 连续型随机向量
+∞ +∞
cov( X , Y ) = ∫
∞
∫
∞
[ x E ( X )][ y E (Y )] f ( x, y )dxdy
为随机变量X和 的相关系数(标准协方差) 为随机变量 和Y的相关系数(标准协方差) . 2.性质 性质 (1)|ρXY| ≤ 1; ) ; 其中a, 为常数 为常数. (2)|ρXY| = 1当且仅当 P{Y=aX+b}=1 , 其中 b为常数. ) 当且仅当 相关系数ρ 刻划了随机变量X和 的线性相关程度 的线性相关程度. 相关系数 XY刻划了随机变量 和Y的线性相关程度. 不相关. 当ρXY = 0时 , 称X与Y不相关. 时 与 不相关
E ( X ) = p, D ( X ) = pq, E (Y ) = p, D (Y ) = pq . cov( X , Y ) = E ( XY ) E ( X ) E (Y ) = 0 × 0 × q + 0 × 1× 0 + 1× 0 × 0 + 1× 1× p p × p 2 = p p = pq , 所以 cov( X , Y ) pq ρ XY = = = 1. D( X ) D(Y ) pq pq
f ( x, y ) =
1 2πσ 1σ 2 1 ρ
( x 1 ) 2
2 2σ 1
2
e
1 f X ( x) = e 2π σ 1
Cov ( X , Y ) = ∫
+∞ +∞ ∞ ∞
,
fY ( y ) =
1 2π σ 2
e
( y 2 )2
2 2σ 2
,
∫
( x 1 )( y 2 ) f ( x, y ) dxdy
* * Cov( X * , Y * ) = E{[ X * E ( X * )][Y * E (Y * )]} = E ( X Y )
= E[ =
=
X E ( X ) Y E (Y ) D( X ) D (Y )
]
E{[ X E ( X )][Y E (Y )]} D ( X ) D(Y ) Cov( X , Y )
1 e 2π
x2 2
cov( X , Y ) = E ( XY ) E ( X ) E (Y ) = E ( X 3 ) E ( X ) E ( X 2 ) = 0
得
ρ XY =
cov( X , Y ) =0 D( X ) D(Y )
这说明X与 是不相关的 是不相关的, 这说明 与Y是不相关的 但 Y = X 2 显然, 与 是不相互独立的 显然,X与Y是不相互独立的
2 2
cov( X , Y ) 2 cov( X , Y ) 2 = D( X )[a ] + D(Y )[1 ( ) ] + [E(Y ) aE( X ) b]2 , D( X ) D( X ) D(Y )
E[(Y aX b) 2 ] cov( X , Y ) 2 cov( X , Y ) 2 = D( X )[a ] + D(Y )[1 ( ) ] D( X ) D( X ) D(Y )
= ρσ 1σ 2
ρ xy =
ρσ 1σ 2 = =ρ σ 1σ 2 D ( X ) D (Y )
Cov ( X , Y )
ρ=0, ,
从而说明二维正态分布随机变量X, 相互独立 从而说明二维正态分布随机变量 ,Y相互独立 相互独立与不相关是等价的. 即X,Y相互独立与不相关是等价的. , 相互独立与不相关是等价的
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
3. 协方差计算公式
Cov(X,Y)=E(XY )-E(X)E(Y)
独立,则 注 (1)若 X与Y独立 则Cov(X, Y)=0 ) 与 独立 (2)D(X±Y) = D(X) + D(Y)±2Cov(X, Y) ) ± ± 4. 协方差的性质 (1)Cov(X, Y) = Cov(Y, X) ) (2)Cov(aX, bY) = abCov(X, Y), a,b 为常数 ) (3)Cov(X1+X2, Y) = Cov(X1,Y) + Cov(X2,Y) ) 相互独立时, (4)当X与Y相互独立时,有Cov(X, Y) = 0 ) 与 相互独立时