4.3协方差及相关系数及其性质
协方差与相关系数公式详解了解变量之间的关联程度
协方差与相关系数公式详解了解变量之间的关联程度协方差与相关系数公式详解:了解变量之间的关联程度在统计学中,协方差和相关系数是了解变量之间关联程度的重要指标。
它们能够帮助我们判断两个或多个变量之间的关系以及它们对彼此的影响程度。
本文将详细解释协方差和相关系数的公式以及如何使用它们来进行分析。
一、协方差协方差用于衡量两个变量的总体误差。
它的公式如下:协方差= Σ[(Xi- X均) * (Yi - Y均)] / N其中,Xi和Yi是样本的观测值,X均和Y均是样本的均值,N是样本量。
协方差具有以下几个性质:1. 如果两个变量的协方差大于0,则它们正相关;如果协方差小于0,则它们负相关;如果协方差等于0,则它们不相关。
2. 协方差的绝对值大小不能反映出变量之间的强度和方向。
3. 协方差受到变量单位的影响,不便于比较不同数据集之间的关联程度。
二、相关系数相关系数用于衡量两个变量之间的线性关系强度和方向,它可以消除变量单位的影响。
最常用的是皮尔逊相关系数,其计算公式如下:相关系数 = 协方差 / (X标准差 * Y标准差)其中,X标准差和Y标准差分别是X和Y的标准差。
相关系数取值范围在-1到1之间,具有以下特点:1. 相关系数为1时,表示两个变量完全正相关,即存在着线性关系。
2. 相关系数为-1时,表示两个变量完全负相关,即一个变量的增加与另一个变量的减小呈线性关系。
3. 相关系数接近0时,表示两个变量之间关系较弱,接近随机关系。
4. 若相关系数为0,表示两个变量之间不存在线性关系。
通过计算相关系数,我们可以了解到变量之间关联程度的强弱。
然而,需要注意的是相关系数只能衡量线性关系,若变量之间存在非线性关系,则相关系数可能无法准确刻画它们之间的关系。
三、协方差和相关系数的应用协方差和相关系数广泛应用于金融学、经济学、社会科学等领域。
它们能够提供关于变量之间关系的重要信息,有助于数据分析和决策制定。
在金融领域,协方差和相关系数可用于评估资产之间的风险和收益关系。
协方差与相关系数 PPT
D(V ) D(2X Y ) D(2X ) D(Y ) 2Cov(2X ,Y )
4D( X ) D(Y ) 2 2 Cov( X ,Y ) 17
所以
Cov(U ,V ) Cov(2X Y , 2X Y )
Cov(2X , 2X ) Cov(2X ,Y ) Cov(Y , 2X ) Cov(Y ,Y )
所以D(t0X*-Y*)=0,由方差得性质知它等价于 P{t0X*-Y* =0}=1,即P{Y=aX+b}=1
其中a=t0σ(Y)/σ(X),b=E(Y)- t0 E(X) σ(Y)/σ(X)、
• 性质3:若X与Y相互独立,则ρXY=0、 证明 若X与Y相互独立,则E(XY)=E(X)E(Y), 又 Cov(X,Y)= E(XY)-E(X)E(Y),所以
协方差与相关系数
一、协方差得概念及性质 二、相关系数得概念及性质 三、协方差得关系式
§1 协方差
• 定义:设二维随机向量(X,Y)得数学期望 (E(X),E(Y))存在,若E[(X-E(X))(Y-E(Y))]存在,则称 它为随机变量X与Y得协方差,记为Cov(X,Y),即
Cov(X,Y)= E[(X-E(X))(Y-E(Y))] • 协方差有计算公式
9 , XY
1 3
,设
U
2X
Y
,
V 2X Y , 求 UV .
解
Cov( X ,Y ) XY
D( X ) D(Y ) 1 3
49 2
D(U ) D(2X Y ) D(2X ) D(Y ) 2Cov(2X ,Y )
4D( X ) D(Y ) 2 2 Cov( X ,Y ) 33
E( X ) (1) 0.15 1 0.35 0.20
大学数学概率篇之随机变量的数字特征——协方差与相关系数概要
解得
Cov( X ,Y ) b0 D( X )
a0 E (Y ) b0 E ( X )
特别地, 当 X与 Y 独立时,有 cov( X ,Y ) 0. 完
二、协方差的性质 1. 协方差的基本性质
(1) cov( X , X ) D( X ); (2) cov( X ,Y ) cov(Y , X ); (3) cov( aX , bY ) ab cov( X ,Y ), 其中 a , b 是 常数; (4) cov(C , X ) 0, C 为任意常数; (5) cov( X1 X 2 ,Y ) cov( X1 ,Y ) cov( X 2 ,Y ); (6) 当 X 与 Y 相互独立, 则 cov( X ,Y ) 0.
X 与 Y 不相关.
例1 设X服从(-1/2, 1/2)内的均匀分布,而 Y=cos X, 不难求得,
Cov(X,Y)=0,
(请课下自行验证)
因而 =0, 即X和Y不相关 .
但Y与X有严格的函数关系,
即X和Y不独立 .
性质3. 若 D( X ) 0, D(Y ) 0, 则
XY 1
i 1 i 1 n n 1 i j n
cov( X , X
i
j
);
② 若 X 1 , X 2 ,, X n 两两独立, 则有
D( X i ) D( X i );
i 1 i 1
n
n
③ 可以证明: 若 X ,Y 的方差存在,则协方差
第四章 第三节 协方差与相关系数
§4.3 协方差与相关系数还需要讨论X 与Y 之间相互关系的数字特征.本节我们讨论关于这方面的问题.1. 协方差及其性质定义4.3.1 对于二维随机变量(,)X Y ,称()()EX E X Y E Y --为,X Y 的协方差.记作cov (,)X Y 。
即cov (,)()()X Y E X EX Y EY =--.cov 2(,)()()()X X E X EX X EX E X EX DX =--=-=.当(,)X Y 为离散型时,有cov 11(,)()()ij ij i j X Y xEX y EY p ∞∞===--∑∑.当(,)X Y 为连续型时,有cov (,)()()(,)X Y x EX y EY p x y dxdy ∞∞-∞∞=--⎰⎰.计算协方差时,还常用公式cov (,)()()X Y EXY EX EY =-协方差等于乘积的期望减去期望的乘积例4. 3.1 已知二维随机变量(,)X Y 的联合分布如表 4.3.1所示.试求cov (,).X Y .表4.3.1解 先求边缘分布,并记入表4.3.1中,.然后求数学期望与协方差.11523,222EX =⨯+⨯= 1111(4)(1)140,4444EY =-⨯+-⨯+⨯+⨯= 又 []12(4)243(1)310,4EXY =⨯-+⨯+⨯-+⨯=故 cov (,)()()0.X Y EXY EX EY =-=例4.3.2 已知二维随机变量(,)X Y 服从二维正态分布N (ρσσμμ,,,,222121). 求cov (,).X Y解 由例3.2.3知,221122(,),(,),XN Y N μσμσ故1,EX μ= 2.EY μ=于是,协方差为cov (,)X Y 12()()()()E X EX Y EY E X Y μμ=--=--=()()()()dxdyey x y y x x ⎰⎰∞∞-∞∞-⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫⎝⎛-+---⎪⎪⎭⎫ ⎝⎛------22221212112)1(2121221121σμσσμμρσμρμμρσπσ.引入变换u x =-11σμ,v y =-22σμ.于是 cov (,)X Y2222222122(1)u uv v v v uvedudv ρρρρ⎡⎤--++-∞∞⎣⎦--∞-∞⎰⎰=()()[]dudv uvev v u ⎰⎰∞∞-∞∞--+----2221)1(2122112ρρρρπσσ()2222(1)2u v v vedv uedu ρρ--∞∞---∞-∞⎧⎫⎪⎬⎪⎭,()222(1)2u v v vedv du ρρ--∞∞---∞-∞⎧⎫⎪⎪=⎨⎬⎪⎪⎩⎭⎰⎰上式大括号中的积分恰好是服从正态分布2(,1)N v ρρ-的随机变量的数学期望,cov (,)X Y =dv ev v ⎰∞∞--222122πσρσ =12ρσσ. ,X Y ρρ=协方差的性质(1)cov(,)cov(,),X Y Y X =(2) cov 1122((),())a X b a Y b ++=12a a cov (,)X Y , (3)cov 12(,)X X Y +=cov 1(,)X Y +cov 2(,)X Y . (4) ()2cov(,),D X Y DX DY X Y ±=+±并且当X 与Y 相互独立时,cov (,)0.X Y = 2. 相关系数及其性质定义4.3.2 对于二维随机变量(,)X Y ,如果0,0,DX DY ≠≠.则称,X Y ρ=为随机变量X 与Y 的相关系数.相关系数的性质 (1)1.XY ρ≤(2)1XY ρ=的充要条件是{} 1.P Y aX b =+=其中,a b 为常数,且0.a ≠一般地,当|XY ρ|的值越来越大而接近于1时,表明X 与Y 的线性关系程度越密切. 反之,当|XY ρ|的值越来越小而接近于0时,表明X 与Y 的线性关系程度很微弱.特别地当XY ρ=0时, 称X 与Y 不相关.若X 与Y 相互独立,则cov(,)0,X Y =于是0,XY ρ=即X 与Y 不相关。
43 协方差和相关系数精品PPT课件
4
12
45
XY
1 12 0.968 1 4 12 45
2) E( X ) 0, E( XY ) 0
XY 0
XY
0.968
:有96.8%的线性相似度,即在[0,1]之间,
y=x2与某条直线y=ax+b的图像差别不大。
XY 0 :根本就没有线性相关性,但有其他相关性。
三. 矩
XY
COV ( X ,Y ) 1 D( X )D(Y ) 2
例6 1) X ~ U (0,1),Y X 2 ,求 XY
2)X ~ U (1,1),Y X 2 ,求 XY
解1)
E( X ) 1 , E(Y ) 1 , E( XY ) 1 , D( X ) 1 , D(Y ) 4
2
3
解 DX 3, DY 1,
D(V ) 16D( X ) 9D(Y ) 24Cov( X ,Y ) 33, D(W ) 4D( X ) 16D(Y ) 16Cov( X ,Y ) 44,
Cov(V ,W ) Cov(4X 3Y 1,2X 4Y ) 8D( X ) 16Cov( X ,Y ) 6Cov(Y , X ) 12D(Y ) 22.
)
1 0
x 0
x
2dy
dx
2 3
D(X )
1 0
x 0
x2
2dy
dx
4 9
1 18
x=y D 1
E(Y
)
1 0
x 0
y
2dy
dx
1 3
D(Y )
1 x
0 0
y2
2dy
dx
1 9
1 18
E(XY )
§4.3 协方差、相关系数与矩
第4章
§4.3 协方差、相关系数与矩
第10页
4.3.2 独立性与不相关性
定义4.3.2 当 XY = 0 时,称 X 和 Y不相关. 不相关 独立 但也有例外 例如二维正态分布,独立与不相关等价
“独立” 必然导致 “不相关”, 而“不相关”不一定导致 “独立”
第4章
§4.3 协方差、相关系数与矩
(3)Cov(X1+X2, Y) = Cov(X1,Y) + Cov(X2,Y)
第4章 §4.3 协方差、相关系数与矩 例1 设二维随机变量的联合分布律为 X 0 1 Y 0 q 0 1 0 p 其中p+q=1,求相关系数XY. 解 由(X,Y)的联合分布律,可得X与Y的边缘分布律为
X P 0 q 1 p Y P 0 q
注 (1)若 X与Y独立,则Cov(X, Y)=0 (2)D(X±Y) = D(X) + D(Y)±2Cov(X, Y)
第4章
§4.3 协方差、相关系数与矩
第5页
4. 协方差的性质 (1)Cov(X, Y) = Cov(Y, X) (2)Cov(aX, bY) = abCov(X, Y), a,b 为常数
第4章
§4.3 协方差、相关系数与矩
第7页
例2 设二维(X,Y)随机变量的密度函数为
1 cos( x y ), 0 x , y 0 f ( x, y ) 2 2 2 0, 其它 求 cov( X , Y )
1 2 0 解 因为 E ( X ) x cos( x y)dxdy 0.7854, 2 0 -2 4
E (Y ) / 4,
0 1 2 E ( XY ) xy cos( x y)dxdy 1 0.5708, 2 0 2 2
概率论与数理统计协方差和相关系数
X -1 0 1
pk 3/8 2/8 3/8
Y -1 0 1
pk 3/8 2/8 3/8
E( X ) (1) 3 0 2 1 3 0 同理 E(Y ) 0
8
8
8
1
②说明E(:XY虽)然 Cov(Xx,iYy)=j p0i,j 但1
i,i1
P{ X
1P{ X0 8 0}
10,Y101} P{8Y 0} 8
=相关系数刻划了X和Y间“线性相关”的程度.
=
2021/4/4
8
8
皮肌炎图片——皮肌炎的症状表现
数
• 皮肌炎是一种引起皮肤、肌肉、
字
心、肺、肾等多脏器严重损害的, 全身性疾病,而且不少患者同时
伴有恶性肿瘤。它的1症状表现如 特 下:
• 1、早期皮肌炎患者,还往往伴 征 有全身不适症状,如-全身肌肉酸
=ቤተ መጻሕፍቲ ባይዱ
2021/4/4
3
3
§3 协方差和相关系数 Covariance and
correlation coefficient
2021/4/4
4
一、协方差
1、定对于义向: 量设X(和X,YY,)是期一望随和机方向差量只,反称映E{了[X变-E(量X)各][Y自-E(的Y)情]} 况,没有
相互之间的关系。 若X、Y相互独立, E{[X-E(X)][Y-E(Y)]}=0, 因此为EX{[与X-YE的(X)协][Y方-E差(Y,)记]} 作在C一ov定(程X,度Y上)反,映即了X与Y之间的关系,称为X 与Y的协方差。 Cov(X,Y)= E{[X-E(X)][Y-E(Y)]}
② 若 E X E( X ) k 存在,则称之为X的 k阶中心矩
4-3协方差
= DY + DX ⋅
COV 2 ( X , Y )
− 2COV ( X , Y ) ⋅
COV ( X , Y ) DX
即
2 m E Y −(a+bX)] = (1− ρX )D in [ Y Y a,b
2
a ,b
= EY + b EX + a − 2aEY − 2bEXY + 2abEX 达到最小。 求a,b 使 e 达到最小。 ,
2 2 2 2
∂e Y X ∂a = 2a + 2bEX − 2 EY = 0 ⇒a = E −bE 令: ∂ e = 2bEX 2 − 2 EXY + 2aEX = 0 ∂b
协方差与相关系数
(
)
可以证明: 可以证明:X,Y相互独立的充要条件是 相互独立的充要条件是 已证: 已证:
fX ( x) = 1 2π σ 1 e
( x − µ1 ) 2 − 2 2σ 1
ρXY = ρ = 0
e
( y− µ 2 ) 2 − 2 2σ 2
, fY ( y ) =
1 2π σ 2
2 2 则:EX = µ1 , DX = σ 1 , EY = µ 2 , DY = σ 2 ,
a,b ,b
COV ( X ,Y ) ; ⇒ b0 = DX
= E (Y − EY + EX
COV ( X , Y ) COV ( X , Y ) 2 −X⋅ ) DX DX
COV ( X , Y ) 2 ) = E ((Y − EY ) − ( X − EX ) ⋅ DX
随机变量的协方差和相关系数
cov(X,Y)=E[X-EX][Y-EY]=EXY-EXEY
1) 当(X,Y)是离散型随机变量时,
cov( X , Y ) ( xi EX )( y j EY ) pij量时,
cov( X , Y )
( x EX )( y EY ) f ( x, y)dxdy.
存在,称它为X的k阶中心矩. 注:均值 E(X)是X一阶原点矩, 方差D(X)是X的二阶中心矩.
设 X 和 Y 是随机变量,若
E( X Y )
k
l
k,l=1,2,… 存在,
称它为 X 和 Y 的 k+l 阶混合原点矩.
若 E{[ X E ( X )]k [Y E (Y )]l } 存在, 称它为X 和 Y 的 k+l 阶混合中心矩. 注:协方差cov(X,Y)是X和Y的二阶混合中心矩.
例1 设X~N(0,1), Y=X2, 求X和Y的相关系数。
4. 若 XY 0 ,则称X和Y(线性)不相关。
定理:若随机变量X与Y的数学期望和方差都存 在,且均不为零,则下列四个命题等价: (1) XY 0 ; (2)cov(X ,Y) = 0;
(3)E(XY)=EXEY;
(4)D(X ±Y)=DX+DY。
n2
为(X1,X2, …,Xn) 的相关系数矩阵。
由于 i i
cov( X i , X i ) 1, D( X i ) D( X i )
故相关系数矩阵的主对角元素均为1.
五、 原点矩和中心矩
定义 设X和Y是随机变量,若
E ( X k ), k 1,2, 存在,称它为X的k阶原点矩,简称 k阶矩. 若 E{[ X E ( X )]k }, k 2,3,
随机变量的方差、协方差与相关系数
目 录
• 随机变量的方差 • 随机变量的方差 • 随机变量的协方差 • 相关系数 • 方差、协方差与相关系数的关系 • 实例分析
01
CATALOGUE
随机变量的方差
协方差的定义
协方差是衡量两个随机变量同时偏离其各自期望值程度的量,表示两个随机变量 之间的线性相关程度。
03
当两个随机变量的尺度相差很大时,直接计算协方差可能 得出不准确的结果,此时归一化的相关系数更为适用。
方差、协方差与相关系数的应用场景
方差在统计学中广泛应用于衡量数据的离散程度,例如在计算平均值、中位数等统计量时需要考虑数 据的离散程度。
协方差在回归分析、时间序列分析等领域中有着广泛的应用,用于衡量两个变量之间的线性相关程度。
3
当只考虑一个随机变量时,方差即为该随机变量 与自身期望值之差的平方的期望值,因此方差是 协方差的一种特例。
协方差与相关系数的关系
01
相关系数是协方差的一种归一化形式,用于消除两个随机变量 尺度上的差异,计算公式为 $r = frac{Cov(X,Y)}{sigma_X sigma_Y}$。
02
相关系数的取值范围是 [-1,1],其中 1 表示完全正相关,1 表示完全负相关,0 表示不相关。
详细描述
对称性是指如果随机变量X和Y的相关系数是r,那么随机变量Y和X的相关系数也是r。有界性是指相关 系数的绝对值不超过1,即|r|≤1。非负性是指相关系数的值总是非负的,即r≥0。
相关系数的计算
总结词
相关系数的计算方法有多种,包括皮尔 逊相关系数、斯皮尔曼秩相关系数等。
VS
详细描述
皮尔逊相关系数是最常用的一种,其计算 公式为r=∑[(xi-x̄)(yi-ȳ)]/[(n-1)sxy],其 中xi和yi分别是随机变量X和Y的第i个观测 值,x̄和ȳ分别是X和Y的均值,sxy是X和 Y的协方差。斯皮尔曼秩相关系数适用于 有序分类变量,其计算方法是根据变量的 秩次进行计算。
4.3协方差及相关系数及其性质
(2) ρXY 1的充要条件是存在常数a,b 使 P{Y aX b} 1.
(2)证: 由柯西一许瓦兹不等式中等号成立( ρXY)1 充要条件知 存在常数 a 使 P{Y E(Y ) a(X E(X ))} 1.
即P{Y aX aE(X ) E(Y )} 1. 取b aE(X ) E(Y ),
0, 2aE(
X
)
0.
b
解得
b0
Cov(X ,Y D( X )
),
a0
E(Y
)
E(X
)Cov(X ,Y D( X )
).
将 a0,b0 代入 e E[(Y (a bX ))2]中,得
min e min E[(Y (a bX ))2 ]
a,b
a,b
E[(Y (a0 b0 X ))2]
C1n
C2n
为向量X的协方差矩阵。
Cn1 Cn2 Cnn
例6: 设(X,Y)N(µ1, µ2,σ12,σ22,),求向量(X,Y)'的 均值μ与协方差矩阵。
解: E(X)=μ1,E(Y)=μ2,
D(
X
)
2 1
,
D(Y
)
2 2
,
Cov( X ,Y ) 1 2
所以(X,Y)的均值为μ=(μ1,μ2)
为随机变量 X 与 Y 的相关系数.
若 XY 0, 称 X ,Y 不相关.
无量纲 的量
2. 说明 若随机变量 X 和Y 相互独立
Cov(X ,Y ) E{[X E( X )][Y E(Y )]}
E[X E( X )]E[Y E(Y )] 0.
3. 协方差的计算公式
法1.若 ( X ,Y ) 为离散型,已知pij
4.3 协方差与相关系数.
两个随机变量X与Y之间的联系
对于二维随机变量(X,Y),除了关心它的各个分量 的期望和方差外,还希望知道两个随机变量X与Y之间 的联系,希望通过对其中一个随机变量的观察, 以预测另一个随机变量的取值。 例如:研究子身高Y与父身高X之间的相互关系, 以期通过父高预测他的子高,这实际上就是要求构造 一个预测函数h(x),当得到父高X的观察值x时,就以 相应的函数值y=h(x)为子高Y的预测值.
0 f X ( x) 1
D
0 FX ( x ) 1
2.下面的数学期望与方差都存在,当随机变量X、Y相互 独立时,下列关系式中错误的是( ( C ) )。
( A ) E ( XY ) = E(X )E(Y) ( B ) D ( X Y) = D(X) + D(Y) ( C ) D ( XY) = D(X) D(Y) ( D ) cov ( X,Y ) = 0
X E ( X ) Y E (Y ) E[ ] D( X ) D(Y )
结论:
相关系数实际上是随机变量X的标准化随机变量
与Y的标准化随机变量的协方差
相关系数是衡量x与y之间线性相关 程度的量
e=E{[Y-(a+bX)]2}
? e的值越小,说明a+bX 与Y的近似程度越好。
怎样使e的值越小?
解方程得 a0 E(Y ) b0 E( X )
Cov( X , Y ) b0 D( X )
Cov( X , Y ) a0 E(Y ) b0 E( X ) E (Y ) E ( X ) D( X )
Cov( X , Y ) b0 D( X )
e最小 E{[Y (a 0 b0 X )] }
协方差及相关系数
=0
ρX X
所以 X 与 X 不相关
( 3 ) 独立性由其定义来判断
对于任意的常数 a > 0 , 事件 ( X < a ) ( X < a ), 且 P ( X < a ) > 0 , P ( X < a ) < 1,因此有 P( X < a, X < a) = P( X < a) P ( X < a)P( X < a) < P( X < a) 所以 P ( X < a , X < a ) ≠ P ( X < a ) P ( X < a ) 故 X 与 X 不独立
Cov ( X , Y ) = E ( XY ) EXEY = pq Cov ( X , Y ) ρ XY = =1 DX DY
例2 设 ( X ,Y ) ~ N ( μ1, σ12,μ2,σ22,ρ), 求 ρXY 解
令 x μ1
Cov ( X ,Y ) = ∫
σ1 y μ2 =t σ2
=s
ξ ,η 为 X , Y的线性组合
所以 ξ ,η 都服从正态分布 N ( 0, + b )σ ) (a
2 2 2
在正态分布中 , 不相关与独立是等价的
所以当 a = b 时, ξ ,η 独立 当 a ≠ b 时, ξ ,η 不独立
( 3) 当ξ ,η 相互独立时 , 即a 2 = b 2 , ξ ,η 都服从
例1 已知 X ,Y 的联合分布为 X Y 1 0 p 0 0 q 1 0 0 < p <1 p+q=1
求 Cov (X ,Y ), ρXY 解 X P 1 p 0 q Y P 1 p 0 q XY P 1 p 0 q
概率论与数理统计(协方差及相关系数、矩)
实验步骤: 实验步骤: (1) 整理数据如图 所示. 整理数据如图4-5所示 所示.
图4-5 整理数据
(2) 计算边缘概率 计算边缘概率P{X = xi}和P{Y = yj} 和 在单元格G2中输入公式 : 在单元格 中输入公式: = SUM(B2:F2), 并将 中输入公式 , 其复制到单元格区域G3:G6 其复制到单元格区域 在单元格B7中输入公式: 在单元格 中输入公式:=SUM(B2:B6),并将其 中输入公式 , 复制到单元格区域C7:F7 复制到单元格区域 (3) 计算期望 计算期望E(XY) 首先在单元格B9中输入公式: 首先在单元格 中输入公式: 中输入公式 =MMULT(B1:F1,B2:F6), ,
−
π
∫ πcos zdz = 0, ∫ πsin z cos zdz = 0
−
1 E ( XY ) = 2π
π
因而Cov(X,Y) = 0,ρXY = 0. , 因而 , . 不相关, 相关系数ρXY = 0,说明随机变量 与Y不相关, ,说明随机变量X与 不相关 但是, 所以X与 不独立 不独立. 但是,由于 X 2 + Y 2 = 1 ,所以 与Y不独立.
Cov ( X , Y ) = E ( XY ) − E ( X ) E (Y ) = 19 / 400,
所以
ρ XY =
Cov( X , Y ) 19 / 400 133 = = = 0.87 D( X ) D(Y ) 153 / 2800 153
4.3.2 相关系数 下面不加证明地给出相关系数的两条性质: 下面不加证明地给出相关系数的两条性质: (1) |ρXY | ≤ 1; ; 的充要条件是, (2) |ρXY | = 1的充要条件是,存在常数 ,b,使 的充要条件是 存在常数a, P{Y = aX + b} = 1. . 定义4.6 若ρXY = 0,称X与Y不相关.0 < ρXY ≤ 1,称 定义 , 与 不相关. , 不相关 X与Y正相关,– 1 ≤ ρXY < 0,称X与Y负相关. 正相关, 负相关. 与 正相关 , 与 负相关 事实上,相关系数 事实上 相关系数ρXY是X与Y线性关系强弱的一个 与 线性关系强弱的一个 度量,X与 的线性关系程度随着 的线性关系程度随着| 的减小而减弱, 度量 与Y的线性关系程度随着 ρXY|的减小而减弱 的减小而减弱 的线性关系最强, 时 与 的线性关系最强 当|ρXY| = 1时X与Y的线性关系最强, 的不存在线性关系, 当ρXY = 0时,意味 与Y的不存在线性关系,即X 时 意味X与 的不存在线性关系 不相关. 与Y不相关 不相关
协方差和相关系数
例10. 设A和B是随机试验E的两个事件,且 P ( A) > 0, P ( B ) > 0, 定义随机变量 ξ ,η 如下: ⎧1, ξ =⎨
当A发生 ⎧1, 当B发生 η =⎨ ⎩0, 当A不发生 ⎩0, 当B不发生
验证,若 ξ ,η 不相关,则 ξ ,η 必相互独立。 解:设事件 A = {ξ = 1}, 则 A = {ξ = 0}, 事件 B = {η = 1}, 则 B = {η = 0}, 显然 E (ξη ) = P ( AB)
E (ξ ) = P( AB ) + P ( AB) E (η ) = P( A B) + P( AB)
由于 B, B 互逆,所以 P( A) = P( AB) + P( AB ) = E (ξ )
由于 A, A 互逆,所以 P( B) = P( AB) + P( A B) = E (η ) 所以 cov(ξ ,η ) = E (ξη ) − E (ξ ) E (η )
* * * * 又 E (ξ ± η ) = E (ξ ) ± E (η ) = 0
又当 D(ξ ) = 0 时,有 P(ξ = E (ξ )) = 1 ⎪ ⎪ 所以 P ξ * ± η * = 0 = 1 即 P ⎧η − E (η ) = ± ξ − E (ξ ) ⎫ = 1 ⎬ ⎨ σξ ⎪ ⎪ ση ⎭ ⎩
⎧1 ⎪ , x + y ≤1 f ( x , y ) = ⎨π ⎪0 其它 ⎩
2 2
试验证 ξ ,η 不相关却也不相互独立。 证明:容易获得
⎧2 ⎪ 1− x , f ξ ( x) = ∫ f ( x, y )dy = ⎨π ⎪ 0, ⎩
2 ∞ −∞
x <1 x ≥1
概率论与数理统计:4-3协方差及相关系数
协方差的计算公式
1 CovX ,Y EXY EX EY 2 DX Y DX DY 2CovX ,Y .
性质
1. CovX ,Y CovY , X . 2. CovaX ,bY abCovX ,Y . a ,b为常数. 3. CovX1 X2 ,Y CovX1,Y CovX2 ,Y .
易知E(X)=0,E(Y)=5/2,E(XY)=0,于是 xy 0,
X,Y不相关.这表示X,Y不存在线性关系.
但,P{X=-2,Y=1}=0 P{X=-2}P{Y=1},知X,Y不
是相互独立的.事实上,X和Y具有关系:Y=X2,Y 的值完全可由X的值所确定.
例2
设X ,Y ~
N
1
,
2
,
2 1
2
1 2
1
2tu
1 2u2
u2 t2
e 2 2 dtdu
1 2 2
u2e
u2 2
du
e
t2 2
dt
1
2
1
2
2
ue
u2 2
du
te
t2 2
dt
1 2 2 2 , 2
故有 CovX ,Y 1 2 .
于是
XY
CovX ,Y DX DY .
得出结论
二维正态分布密度函数中,参数代表了X与Y
协方差及相关系数
协方差与相关系数的概念及性质 相关系数的意义
一、协方差与相关系数的概念及 性质
提出问题
若随机变量X和Y相互独立
DX Y DX DY 若随机变量X和Y不相互独立 DX Y ?
DX Y EX Y 2 EX Y 2 DX DY 2EX EX Y EY .
概率论与数理统计电子教案:c4_3 协方差.相关系数与矩
3)C是非负定矩阵;
4)ci2j cii c jj , i, j 1,2,..., n
2020/8/27
4
协方差、相关系数、矩
二. 相关系数
定义:设二维随机变量X,Y的D(X)>0,D(Y)>0
称
XY
covX ,Y DX DY
为随机变量X与Y的相关系数。
注:1)ρXY是一无量纲的量。
a1a2 a1a2
XY
证明
相关系数是衡量两个随机变量之间线性相关程度 的数字特征.
2020/8/27
6
协方差、相关系数、矩
定义:设随机变量X,Y的相关系数存在
1)ρXY=1 称 X,Y正相关. 2)ρXY=-1 称 X,Y负相关. 3)ρXY=0 称 X,Y不相关.
注:ρXY=0仅说明X,Y之间没有线性关系,但可以 有其他非线性关系. 参见书上P116 例4.4.4.
2) XY
E
X
EX DX
Y
E
Y
D Y
E X * Y * cov X * ,Y *
2020/8/27
5
协方差、相关系数、矩
性质:设随机变量X,Y的相关系数ρ存在,则
1) |ρ|1
证明
2) |ρ|=1
X与Y依概率为1线性相关。即
, 0 s .t PY X 1
证明
3)若=a 1X+b1 , = a 2Y+b2 则
PY X 1
证明:" " 必要性 1时 由1)有
D X Y 0 E X Y 0
由 方 差 的 性 质4) 得
P X Y E X Y 1 即
P X Y 0 1
PY -
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3. 协方差的计算公式 法1.若 ( X ,Y ) 为离散型,已知pij
cov( X , Y ) [ xi E ( X )][ y j E (Y )]pij
i 1 j 1
若 ( X ,Y ) 为连续型,已知f(x,y)
cov( X , Y )
C 11 写为矩阵的形式: C 21
C 12 , C 22
称为随机变量(X1,X2)的协方差矩阵。
(2)推广 定义 设X=(X1,X2,…,Xn) 为n维随机向量,并记 μi=E(Xi), C ij Cov( X i , X j ) i , j 1,2,, n
[ x E ( X )][ y E (Y )] f ( x, y)dxdy
法2.
4. 性质
(1) Cov( X ,Y ) E ( XY ) E ( X ) E (Y );
( 2) D( X Y ) D( X ) D(Y ) 2 Cov( X ,Y ).
(1) Cov( X ,Y ) Cov(Y , X );
1. 定义
量 E { [ X E ( X ) ][Y E (Y ) ] } 称为随机变量 X C ov( X , Y ) E { [ X E ( X )][Y E (Y )]} . 与 Y 的协方差. 记为 Cov( X , Y ) , 即
若D (X ) > 0, D (Y ) > 0 ,称 Cov( X , Y ) ρ XY D ( X ) D (Y )
j 1 i 1 j 1 i 1 n n n n
E{ti [ X i E ( X i )] t j [ X j E ( X j )]}
j 1 i 1
n
n
n
E{ ti [ X i E ( X i )] t j [ X j E ( X j )]}
j 1 i 1
即 | Cov( X , Y ) | D( X ) D(Y )
所以|ρXY|≦1。
(2) ρ XY 1 的充要条件是存在常数 a, b 使 P{Y aX b} 1.
(2)证: 由柯西一许瓦兹不等式中等号成立( ρ XY 1 ) 充要条件知 存在常数 a 使 P{Y E (Y ) a( X E ( X ))} 1.
解 cov( X , Y ) ( x 1 )( y 2 ) f ( x, y )dxdy
x 1 1 y 2 2
s t
1 2
2 1 2
ste
1 2 (s t ) t 2 2 2 (1 )
为随机变量 X 与 Y 的相关系数.
无量纲 的量
若 XY 0, 称 X ,Y 不相关.
2. 说明
若随机变量 X 和 Y 相互独立 Cov( X ,Y ) E{[ X E ( X )][Y E (Y )]} E[ X E ( X )]E[Y E (Y )] 0.
不相关
4. 相关系数的性质
(1) ρ XY 1.
(2) ρ XY 1 的充要条件是 : 存在常数 a, b 使 P{Y aX b} 1.
(1)证: 由柯西一许瓦兹不等式知
[ E ( XY )]2 E ( X 2 ) E (Y 2 )
所以 | E[( X E ( X ))(Y E (Y ))] | E[( X E ( X )) 2 ] E[(Y E (Y )) 2 ]
4.3协方差与相关系数
一、基本概念 二、n 维正态变量的性质
问题的提出
对于二维随机变量(X ,Y ):
已知联合分布
边缘分布
对二维随机变量,除每个随机变量各自的 概率特性外, 相互之间还有某种联系,问题是用 一个怎样的数去反映这种联系.
若随机变量 X 和 Y 相互独立, 那么
D( X Y ) D( X ) D(Y ).
若随机变量 X 和 Y 不相互独立
D( X Y ) ?
D( X Y ) E ( X Y )2 [ E ( X Y )]2
D( X ) D(Y ) 2 E{[ X E ( X )][Y E (Y )]}.
协方差
反映了随机变量 X , Y 之间的某种关系
一 .协方差和相关系数的定义
1 1 1 D( X ) D(Y ) ρXY D( X ) D(Y ) 1 4 2 3. 9 4 3
已知随机变量 X , Y 分别服从 N (1,32 ) , N (0,42 ) , ρXY 1 2 , 设 Z X 3 Y 2 .
(1) 求 Z 的数学期望和方差.(2) 求 X 与 Z 的相关系数.
2 D( X ) 12 , D(Y ) 2 , Cov( X , Y ) 1 2
所以(X,Y)的均值为μ=(μ1,μ2) (X,Y)协方差矩阵为
12 1 2
1 2 2 2
3. 协方差矩阵的性质
(1)协方差矩阵对角线上的元素Cii为Xi的方差即Cii=D(Xi) i=1,2,…,n;
将 a0 , b0 代入 e E[(Y (a bX ))2 ] 中, 得 min e min E[(Y ( a bX )) 2 ]
a ,b a ,b
E[(Y (a0 b0 X ))2 ]
2 (1 ρXY ) D(Y ).
2. 相关系数的意义
当 ρXY 较大时 e 较小, 表明 X , Y 的线性关系联 系较紧密.
(2)协方差矩阵C为对称矩阵,即Cij=Cji ,i,j=1,2,…,n;
(3)C为非负定矩阵,即对于任意实向量t=(t1,t2,…,tn), 有tCt≥0; 证:性质(1),(2)显然,只证(3)
t Ct C ij t i t j t i E {[ X i E ( X i )][ X j E ( X j )]}t j
du t e
dt
1 2
于是 XY
Cov( X ,Y ) . D( X ) D(Y )
结论
二维正态分布密度函数 , 参数 ρ 代表了X (1) 中 与 Y 的相关系数;
) 二维正态随机变量 X 与 Y 相关系数为零等 (2 价于 X 与 Y 相互独立.
( 2) Cov( aX , bY ) ab Cov( X ,Y ) , a , b 为常数;
( 3) Cov( X 1 X 2 ,Y ) Cov( X 1 ,Y ) Cov( X 2 ,Y ).
例1
已知 X ,Y 的联合分布为
Y
pij X
1
0
1 p 0 1 0 p q
0 0 q
0 < p <1 p+q=1
二、相关系数的意义
1. 问题的提出
问 a , b 应如何选择, 可使 a bX最接近 Y ? 接近的程度又应如何来衡量 ?
设 e E[(Y (a bX ))2 ]
则 e 可用来衡量 a bX 近似表达 Y 的好坏程度. 当 e 的值越小, 表示 a bX 与 Y 的近似程度越好. 确定 a , b 的值, 使 e 达到最小.
1 0 p q
求cov (X ,Y )
XY
解
X
Y
P
XY P
1
p
0
q
P
E ( X ) p, E (Y ) p, D( X ) pq, D(Y ) pq, E ( XY ) p,
cov( X , Y ) pq,
XY 1
2 例2 设 ( X ,Y ) ~ N ( μ1 , μ2 , σ12 , σ 2 , ρ) ,求XY
三.协方差矩阵
(1).二维随机向量的协方差矩阵 二维随机变量(X1,X2)有四个二阶中心矩(设他们存在), 分别记为
C11 E{[ X 1 E ( X 1 )]2 } , C12 E{[ X 1 E ( X 1 )][ X 2 E ( X 2 )]}
C21 E{[ X 2 E ( X 2 )][ X 1 E ( X 1 )]} , C22 E{[ X 2 E ( X 2 )]2 }
即X ,Y 相互独立
X ,Y 不相关
已知随机变量 X , Y 分别服从 N (1,3 ) , N (0,4 ) , 例3 ρXY 1 2 , 设 Z X 3 Y 2 .
(1) 求 Z 的数学期望和方差 2) 求 X 与 Z 的相关系数. .(
2
2
解
(1)由E ( X ) 1, D( X ) 9, E (Y ) 0, D(Y ) 16.
e E[(Y (a bX )) ]
2
E (Y 2 ) b 2 E ( X 2 ) a 2 2bE ( XY ) 2abE ( X ) 2aE (Y ).
将 e 分别关于 a ,b 求偏导数, 并令它们等于零, 得 e a 2a 2bE ( X ) 2 E (Y ) 0, e 2bE ( X 2 ) 2 E ( XY ) 2aE ( X ) 0. b Cov( X ,Y ) Cov( X ,Y ) 解得 b0 , a0 E (Y ) E ( X ) . D( X ) D( X )
当 ρXY 较小时, X ,Y 线性相关的程度较差 .
当 ρ XY 0 时, 称 X 和 Y 不相关.
3. 注意
(1) 不相关与相互独立的关系 相互独立 (2) 不相关的充要条件
1o 2o 3o X , Y 不相关 ρ XY 0; X , Y 不相关 Cov( X ,Y ) 0; X , Y 不相关 E ( XY ) E ( X ) E (Y ).