协方差与相关系数
概率论与数理统计 5.3 协方差与相关系数
概率论
均值 EX是X一阶原点矩,方差DX是X的二阶
中心矩。
四、课堂练习
概率论
1、设随机变量(X,Y)具有概率密度
f (x, y) 81(x y) 0 x 2,0 y 2
0
其它
求E(X ), E(Y ),Cov(X ,Y ), D(X Y )。
2、设X ~ N(, 2),Y ~ N(, 2),且设X,Y相互独立 试求Z1 X Y和Z2 X Y的相关系数(其中,
Cov(aX b,cY d ) acCov( X ,Y ); Cov(aX bY ,cX dY ) acDX bdDY (ad bc)Cov( X ,Y ).
(6) D(XY) = DX+ D Y 2 Cov(X, Y) .
一般地, D(aXbY) =a 2DX + b2DY 2 abCov(X, Y).
1
1
dx
1 x 8xydy 8
0
x
15
EY
yf ( x, y)dxdy
o
1x
1
dx
1 y 8xydy 4
0
x
5
EXY
xyf ( x, y)dxdy
1
dx
0
1 xy 8xydy 4
x
9
Cov( X ,Y ) EXYEXEY 4
225
类似地,EX 2
1
X与Y不独立.
EX EY EXY 0, Cov( X ,Y ) 0, XY 0,
X与Y不相关.
例6 设 X 的分布律为
X 1 0 1 P 13 13 13
Y X 2, 求 XY , 并讨论 X 与Y 的独立性. 解 EX 0, EY EX 2 2 3, E( XY ) EX 3 0,
协方差与相关系数
• 任意两个随机变量X与Y的和的方差为 D(X+Y)=D(X)+D(Y)+2Cov(X,Y)
协方差的性质 1. 2. 3. 4.
Cov( X , X ) D( X )
Cov( X , Y ) Cov(Y , X )
Cov(aX , bY ) ab Cov(Y , X ) a,b是常数
XY
Cov( X , Y ) 0 D( X ) D(Y )
例:
已知 D( X ) 4 , D(Y ) 9 , XY
1 U 3 ,设
2X Y ,
V 2 X Y , 求 UV .
1 解 Cov( X , Y ) XY D( X ) D(Y ) 4 9 2 3
§2.1 相关系数的性质
• 性质1:随机变量X和Y的相关系数满足|ρXY|≤1. • 性质2: |ρXY|=1 的充要条件是,存在常数a,b使得 P{Y=a+bX}=1. • 性质3:若X与Y相互独立,则ρXY=0.
• 性质1:随机变量X和Y的相关系数满足|ρXY|≤1.
证明
则
令
X E( X ) X D( X )
X与Y的分布律分别为
X
P
-1
0.15
0
0.5
1
0.35
Y P
0 0.4
1 0.6
E ( XY ) (1) 1 0.08 11 0.20 0.12
E ( X ) (1) 0.15 1 0.35 0.20
E (Y ) 1 0.6 0.6
于是
Cov( X , Y ) E ( XY ) E ( X ) E (Y ) 0.12 0.20 0.6 0
协方差与相关系数
其余均方误差
e
D(Y
)(1
2 XY
).
从这个侧面也
能说明 XY 越接近1,e 越小. 反之, XY 越近于0,
e 就越大, Y与X的 线性相关性越小.
完
例3 设 ( X ,Y ) 的分布律为
X
Y
2 1 1 2 P{Y yi }
1
0 1/4 1/4 0
1/ 2
4
1/4 0 0 1/4 1/2
D(Y
)[1
2 XY
],
D(Y
)1
[cov( X ,Y )]2 D( X )D(Y )
D(Y
)[1
2 XY
],
由于方差
D(Y
)
是正的,
故必有
1
2 XY
0,
所以
XY 1.
性质2. 若 X 和 Y 相互独立,则 XY 0;
注意到此时 cov( X ,Y ) 0, 易见结论成立.
注: X 与Y 相互独立
完
例4 设 服从 [ , ] 上的均匀分布, 且
X sin , Y cos
判断 X 与 Y 是否不相关, 是否独立.
解
由于
E( X )
1
2
sind 0,
E(Y
)
1
2
cosd 0,
而
E(
XY
)
1
2
sin cosd 0.
2
因此
E( XY ) E( X )E(Y ),
从而 X 与 Y 不相关. 但由于 X 与 Y 满足关系:
完
例2 设连续型随机变量 ( X ,Y ) 的密度函数为
f
(
x,
协方差和相关系数的计算公式
协方差和相关系数的计算公式
协方差和相关系数是两个衡量两变量之间相关性的重要指标,是统计学分析中常用的概念。
协方差是一个测量两个变量之间线性关系的数量。
它衡量了两个变量之间的变化程度。
它是两个变量之间的离散程度。
如果两个变量之间的变化是相同的,那么它们的协方差就会是正的;如果两个变量之间的变化是相反的,那么它们的协方差就会是负的。
协方差的计算公式为:
Cov(X,Y)=Σ(X-X)(Y-Y) / N
其中X和Y分别为两个变量的样本值,X和Y分别为X和Y的均值,N为样本的数量。
相关系数是一种衡量两个变量之间线性关系的统计分析方法,它是最常用的衡量两个变量相关性的指标之一。
它是一种统计方法,用来衡量两个变量之间的线性相关性,用来描述两个变量之间的关系。
它的计算公式为:
Cor(X,Y) = Cov(X,Y) / (σX * σY)
其中X和Y分别为两个变量的样本值,Cov(X,Y)为X和Y的协方差,σX和σY分别为X和Y的标准差。
协方差和相关系数是统计学中重要的指标,它们可以用来衡量两组数据之间的相关性,从而帮助我们更好地理解两个变量之间的关系。
协方差与相关系数深度剖析
协方差与相关系数深度剖析协方差与相关系数是统计学中两个重要的概念,它们可以帮助我们理解变量之间的关系、相互影响程度以及变量之间的变化趋势。
在本文中,我们将对协方差与相关系数进行深入剖析,探讨它们的定义、计算方法、重要性以及实际应用。
什么是协方差?协方差是衡量两个随机变量如何一起变化的统计量。
对于两个随机变量X和Y,它们之间的协方差可以用以下公式表示:其中,和分别是变量X和Y的第i个观测值,和分别是变量X和Y的均值,n为样本容量。
协方差的数值可以为正、负或零。
当协方差为正时,表示X和Y呈正向关系,即两者一起增加或减少;当协方差为负时,表示X和Y呈负向相关,即一个增加时,另一个减少;当协方差为零时,表示X和Y之间没有线性关系。
什么是相关系数?相关系数是协方差的标准化版本,它衡量了变量之间的线性关系强度。
相关系数的取值范围在-1到1之间,当相关系数接近1时,表示变量之间呈正相关;当相关系数接近-1时,表示变量之间呈负相关;当相关系数接近0时,表示变量之间没有线性关系。
相关系数可以通过协方差和各自的标准差计算得出:其中,为X和Y的相关系数,和分别为X和Y的标准差。
协方差与相关系数的比较分析在实际应用中,协方差和相关系数都可以用来衡量变量之间的关系,但相关系数更具优势,因为它消除了量纲的影响,使得不同变量之间的比较更加客观。
此外,相关系数的取值范围在-1到1之间,便于解释两个变量之间的线性关系程度,更直观。
另外,协方差受到变量单位的影响,所以在比较不同数据集时可能会出现偏差。
而相关系数消除了这种影响,使得其在不同数据集之间的比较更加准确。
协方差与相关系数的应用协方差与相关系数在金融领域、经济学、生物学等各个领域都有着重要的应用。
在金融领域,可以用相关系数来衡量不同证券之间的相关性,从而构建投资组合。
在生物学领域,相关系数可以用来分析基因之间的相关性,帮助科研人员理解基因调控网络等。
总的来说,协方差与相关系数是统计学中重要的工具,它们能够帮助我们理解变量之间的关系,预测未来趋势,并在各个领域中发挥重要作用。
协方差和相关系数的作用
协方差和相关系数的作用
协方差和相关系数是用来衡量两个随机变量之间关系的统计指标。
协方差(Covariance)用来衡量两个随机变量的变动趋势是否一致。
具体来说,如果协方差大于0,则表示两个随机变量呈正相关,即当一个变量增大时,另一个变量也趋向增大;如果协方差小于0,则表示两个随机变量呈负相关,即当一个变量增大时,另一个变量趋向减小;如果协方差接近于0,则表示两个随机变量之间没有线性关系。
相关系数(Correlation Coefficient)是协方差的标准化形式。
相关系数的取值范围在-1到1之间。
当相关系数为1时,表示两个随机变量完全正相关;当相关系数为-1时,表示两个随机变量完全负相关;当相关系数为0时,表示两个随机变量之间没有线性关系。
协方差和相关系数在统计分析中具有重要作用。
它们可以帮助我们判断两个随机变量之间的关系强度和趋势,比如在投资领域中,可以用来分析不同资产之间的相关性,以帮助投资者进行投资组合的优化。
此外,协方差和相关系数还可以用来研究变量之间的相互影响,比如在经济学中,可以用来研究不同宏观经济指标之间的相关性,以探索它们之间的关联关系。
协方差和相关系数的计算公式
协方差和相关系数的计算公式一、协方差:协方差是用来衡量两个变量之间的关系的统计量。
具体来说,它描述了两个变量的变动趋势是否一致。
协方差的计算公式如下:Cov(X, Y) = Σ((Xi - Xavg) * (Yi - Yavg)) / (n - 1)其中,Cov(X, Y)表示X和Y的协方差,Xi和Yi分别表示第i个观测值,Xavg和Yavg分别表示X和Y的平均值,n表示总观测次数。
协方差的计算方法如下:1. 计算X和Y的平均值:Xavg = ΣXi / n,Yavg = ΣYi / n2. 计算每个观测值与平均值的差:(Xi - Xavg)和(Yi - Yavg)3. 将每个差值相乘:(Xi - Xavg) * (Yi - Yavg)4. 对所有的乘积求和:Σ((Xi - Xavg) * (Yi - Yavg))5.最后将求和结果除以(n-1)即可得到协方差。
协方差的取值范围为负无穷到正无穷。
如果协方差为正值,表示X和Y之间存在正相关关系,即当X增大时,Y也增大;如果协方差为负值,表示X和Y之间存在负相关关系,即当X增大时,Y减小;如果协方差接近于零,则表示X和Y之间没有线性相关关系。
二、相关系数:相关系数是用来衡量两个变量之间线性相关程度的统计量。
具体来说,它描述了两个变量之间的线性关系的强度和方向。
相关系数的计算公式如下:ρ(X, Y) = Cov(X, Y) / (σ(X) * σ(Y))其中,ρ(X, Y)表示X和Y的相关系数,Cov(X, Y)表示X和Y的协方差,σ(X)和σ(Y)分别表示X和Y的标准差。
相关系数的计算方法如下:1. 首先计算X和Y的协方差Cov(X, Y)2. 然后计算X和Y的标准差σ(X)和σ(Y),标准差是方差的平方根,方差的计算公式为Va r(X) = Σ((Xi - Xavg)^2) / (n - 1)3.最后将协方差除以标准差的乘积,即可得到相关系数ρ(X,Y)。
协方差和相关系数的计算
§3.3.1 协方差和相关系数
问题 对于二维随机变量(X ,Y ): 边缘分布
已知联合分布
这说明对于二维随机变量,除了每个随机变量各 自的概率特性以外,相互之间可能还有某种联系.问 题是用一个什么样的数去反映这种联系. 数 E (( X E ( X ))(Y E (Y ))) 反映了随机变量X ,
例3
设 X,Y 相互独立,且都服从 N (0, 2),
U = aX + bY,V= aX - bY,a,b为常数,且都不为零,
求UV .
解 cov(U ,V ) E (UV ) E (U ) E (V )
a 2 E ( X 2 ) b 2 E (Y 2 ) aE ( X ) bE (Y )aE ( X ) bE (Y )
又显然 E[(Y E (Y )) t0 ( X E ( X ))] 0
D[(Y E (Y )) t0 ( X E ( X ))] 0 P[(Y E (Y )) t0 ( X E ( X )) 0] 1
P[(Y E (Y )) t0 ( X E ( X )) 0] 1
由 E ( X ) E (Y ) 0,
E( X 2 ) 2 E (Y 2 ) 2
D( X ) D(Y ) 2
cov(U ,V ) (a 2 b 2 ) 2
而 D(U ) a 2 D( X ) b 2 D(Y ) (a 2 b 2 ) 2
Y 之间的某种关系.
协方差和相关系数的定义 定义 称 E ( X E ( X ))(Y E (Y )) 为X,Y的
协方差和相关系数
§4.4 协方差和相关系数随机变量的数字特征,包括数学期望、方差、协方差和相关系数等。
协方差和相关系数是考虑两个随机变量之间的某种关系。
协方差的意义不太直观,它考察两个随机变量(随机向量)与各自均值之差的加权平均值,相关系数则是考虑两个随机变量取值之间的关系。
1. 协方差定义:对两个随机变量X 、Y ,称E X EX Y EY [()()]--为X 与Y 的协方差,记为Cov (X , Y ),即 C o vX Y E X EX Y EY (,)[()()]=-- 2. 相关系数定义:对两个随机变量X 、Y ,称C o vX YD X D Y (,)()()为X 与Y 的相关系数或标准协方差,记为ρXY ,即ρXY Cov X Y D X D Y =(,)()()3. 方差、协方差的运算性质(1) D X Y D X D Y Cov X Y ()()()(,)+=++2 (2) Cov X Y E XY E X E Y (,)()()()=-⋅ 推论:若随机变量X 、Y 独立,则 Cov X Y XY (,)==ρ0Problem :若Cov X Y XY (,)==ρ0,则X 、Y 是否独立? (3) Cov X Y Cov Y X (,)(,)= (4) Cov aX bY abCov X Y (,)(,)=(5) Cov X X Y Cov X Y Cov X Y (,)(,)(,)1212+=+Cov X X Y Cov X Y Cov X Y (,)(,)(,)1212-=-4. 相关系数的性质(1) 柯西-许瓦兹(Cauchy-Schwarz)不等式:对任意两个随机变量X 、Y ,若E X E Y ()()22<∞<∞ , ,则 (())()()E XY E X E Y 222≤⋅ 证明:对任意实数t ,有q t E X tY E X t E Y tE XY ()(())()()()=+=++≥222220 因此,二次方程q t ()=0的判别式 440222(())()()E XY E X E Y -⋅≤即(())()()E XY E X E Y 222≤⋅ 证毕。
协方差cov和相关系数的关系
协方差cov和相关系数的关系协方差(covariance)和相关系数(correlation coefficient)是统计学中常用的两个概念,用于描述两个变量之间的关系。
虽然它们都可以衡量变量之间的相互关系,但在某些方面上又存在一定的区别。
协方差是用来衡量两个变量之间的总体线性关系的统计量。
它描述的是两个变量在同一时间内的变化趋势是否一致。
协方差的计算公式为变量X和Y的观测值与它们的均值之差的乘积的平均值。
如果协方差为正值,表示两个变量呈正相关关系,即当一个变量增大时,另一个变量也增大;如果协方差为负值,表示两个变量呈负相关关系,即一个变量增大时,另一个变量减小。
相关系数是用来衡量两个变量之间线性关系强度的统计量,它的取值范围在-1到1之间。
相关系数的计算公式是协方差除以两个变量的标准差的乘积。
相关系数越接近1或-1,表示两个变量之间的线性关系越强,且方向一致;相关系数越接近0,表示两个变量之间的线性关系越弱,或者呈现非线性关系。
协方差和相关系数可以用来衡量两个变量之间的关系,但是在实际应用中,相关系数更常用。
这是因为协方差的值受到变量本身单位的影响,而相关系数的值不受单位影响,更便于进行比较和解释。
另外,相关系数还可以用来判断两个变量之间的线性关系的强度和方向,以及预测一个变量的值是否可以根据另一个变量的值来推断。
在金融领域中,协方差和相关系数经常被用来衡量不同资产之间的关联程度。
投资组合的风险和收益往往与资产之间的相关性密切相关。
如果两个资产的相关系数为1,表示它们完全正相关,投资者可以通过在这两个资产之间进行适当的分配来实现风险的分散和收益的最大化;如果两个资产的相关系数为-1,表示它们完全负相关,投资者可以通过在这两个资产之间进行适当的分配来实现风险的对冲和收益的最大化。
如果两个资产的相关系数接近于0,则它们之间的关联性较弱,投资者可以通过在这两个资产之间进行适当的分配来实现风险的分散和收益的稳定。
协方差和相关系数
协方差和相关系数
协方差是衡量两个变量之间相关程度的一种数字指标,是反映两个变量间关系密切程度的指标。
它是反映两个变量间变化趋势一致性的数字。
协方差可以用公式计算: Cov(X,Y)= ∑(Xi—X).(Yi—Y)/n;
其中X和Y分别是两个变量的样本均值,Xi和Yi分别是变量X和Y 的每个样本的取值,n是样本量。
协方差的取值范围是[-无穷,+无穷],当协方差大于零时,说明横轴变量的增长伴随着纵轴变量的增长,而且X和Y的变化程度一致,当取0时,X和Y没有相关性,当协方差小于0时,X和Y具有负相关性。
相关系数是根据两个变量间的协方差计算出来的,是一个经过归一化的量,表示两个变量的相关程度,取值范围为[-1,1],当它的值为1时表示两个变量完全相关;当它的值为-1时表示两个变量完全负相关;当它的值为0时表示两个变量没有相关性。
相关系数可以用公式表示:r=Cov(X,Y)/σx σy; 其中Cov(X,Y)是X和Y的协方差,σx和σy是变量X和Y的标准差。
统计学中的相关系数和协方差
统计学中的相关系数和协方差统计学是一门研究收集、整理、分析和解释数据的学科。
在统计学中,相关系数和协方差是两个重要的概念,用于衡量两个变量之间的关系和变量之间的变化程度。
本文将介绍相关系数和协方差的定义、计算方法以及它们在实际应用中的意义。
一、相关系数相关系数用于衡量两个变量之间的线性关系强度和方向。
相关系数的取值范围在-1到1之间,其中-1表示完全负相关,1表示完全正相关,0表示无相关性。
计算相关系数的方法有多种,最常用的是皮尔逊相关系数。
它的计算公式为:r = Cov(X, Y) / (σX* σY)其中,Cov(X, Y)表示变量X和Y的协方差,σX和σY分别表示变量X和Y的标准差。
通过计算相关系数,我们可以得到两个变量之间的关系强度。
如果相关系数接近1或-1,说明两个变量之间存在较强的线性关系;如果相关系数接近0,则说明两个变量之间没有线性关系。
相关系数在实际应用中具有重要的作用。
例如,在金融领域,研究人员可以使用相关系数来衡量不同股票价格的关联程度;在医学研究中,相关系数可以用于分析不同变量之间的关系,如身高和体重之间的关系。
二、协方差协方差用于衡量两个变量之间的总体变化趋势。
协方差的取值范围是无限的,因此无法直接比较不同样本之间的协方差。
协方差的计算公式为:Cov(X, Y) = Σ((Xi - X) * (Yi - Ȳ)) / n其中,Xi表示变量X的第i个观测值,X表示变量X的平均值,Yi表示变量Y的第i个观测值,Ȳ表示变量Y的平均值,n表示样本容量。
协方差的符号表示变量之间的变化趋势,正值表示变量具有正向变动趋势,负值表示变量具有负向变动趋势。
然而,由于协方差的数值大小不可比较,因此无法衡量变量之间的关系强度。
为了解决这个问题,我们可以使用相关系数来标准化协方差。
相关系数不仅表示变量之间的关系强度,还考虑了变量的尺度。
因此,相关系数比协方差更常用。
相关系数和协方差在统计学中扮演着重要的角色。
协方差及相关系数
=0
ρX X
所以 X 与 X 不相关
( 3 ) 独立性由其定义来判断
对于任意的常数 a > 0 , 事件 ( X < a ) ( X < a ), 且 P ( X < a ) > 0 , P ( X < a ) < 1,因此有 P( X < a, X < a) = P( X < a) P ( X < a)P( X < a) < P( X < a) 所以 P ( X < a , X < a ) ≠ P ( X < a ) P ( X < a ) 故 X 与 X 不独立
Cov ( X , Y ) = E ( XY ) EXEY = pq Cov ( X , Y ) ρ XY = =1 DX DY
例2 设 ( X ,Y ) ~ N ( μ1, σ12,μ2,σ22,ρ), 求 ρXY 解
令 x μ1
Cov ( X ,Y ) = ∫
σ1 y μ2 =t σ2
=s
ξ ,η 为 X , Y的线性组合
所以 ξ ,η 都服从正态分布 N ( 0, + b )σ ) (a
2 2 2
在正态分布中 , 不相关与独立是等价的
所以当 a = b 时, ξ ,η 独立 当 a ≠ b 时, ξ ,η 不独立
( 3) 当ξ ,η 相互独立时 , 即a 2 = b 2 , ξ ,η 都服从
例1 已知 X ,Y 的联合分布为 X Y 1 0 p 0 0 q 1 0 0 < p <1 p+q=1
求 Cov (X ,Y ), ρXY 解 X P 1 p 0 q Y P 1 p 0 q XY P 1 p 0 q
通俗解释协方差与相关系数
通俗解释协方差与相关系数协方差和相关系数是统计学中常用的两个概念,用来描述随机变量之间的关系。
虽然这两个概念涉及一些数学背景,但我们可以用通俗的方式来解释它们。
协方差(Covariance)是衡量两个随机变量变化趋势一致性的度量。
简单来说,它是用来衡量两个变量的变化趋势是否一致。
协方差可以有正值、负值或零值。
如果协方差为正值,说明当一个变量增大时,另一个变量也会增大;如果协方差为负值,说明当一个变量增大时,另一个变量会减小;如果协方差为零值,说明两个变量之间没有线性关系。
协方差的计算公式如下:Cov(X, Y) = ∑((Xᵢ-μₓ)(Yᵢ-μᵧ))/(n-1)其中,Cov(X, Y)表示X和Y的协方差,Xᵢ和Yᵢ分别表示X和Y的第i个观测值,μₓ和μᵧ分别表示X和Y的均值,n表示观测值的个数。
相关系数(Correlation Coefficient)是衡量两个随机变量之间线性关系强度的度量。
相关系数的取值范围是-1到1之间。
如果相关系数接近-1,说明两个变量存在负相关关系,即一个变量增大时,另一个变量减小;如果相关系数接近1,说明两个变量存在正相关关系,即一个变量增大时,另一个变量也增大;如果相关系数接近0,说明两个变量之间没有线性关系。
相关系数的计算公式如下:ρ(X, Y) = Cov(X, Y) / (σₓ * σᵧ)其中,ρ(X, Y)表示X和Y的相关系数,Cov(X, Y)表示X和Y的协方差,σₓ和σᵧ分别表示X和Y的标准差。
通过计算协方差和相关系数,我们可以得出一些有关两个变量之间关系的信息。
例如,如果协方差和相关系数都为正值,说明两个变量呈正相关关系,即它们在一起增大或减小;如果协方差为负值,相关系数为正值,说明两个变量呈负相关关系,即一个变量变大,另一个变量变小;如果协方差为零值,相关系数为零值,说明两个变量之间没有线性关系。
在实际应用中,协方差和相关系数经常用于金融领域、经济学和社会学等领域的研究中。
协方差和相关系数
ρ XY
Cov( X ,Y ) D( X ) D(Y )
称为随机变量 X 与 Y 的相关系数 .
3. 协方差的计算公式
(1) Cov( X ,Y ) E ( XY ) E ( X ) E (Y ); ( 2) D( X Y ) D( X ) D(Y ) 2 Cov( X ,Y ).
协方差
2. 定义
( X , Y )是二维随机变量 ,量 E{[ X E ( X )][Y E (Y )]} 称为随机变量X 与 Y 的协方差. 记为 Cov( X , Y ), 或 XY ,即 C ov( X , Y ) E{[ X E ( X )][Y E (Y )]}.
而
1
解:E ( X )
x dx dy 0 2 1 - 1-x + 同理 E (Y ) ypY ( y )dy - yp ( x, y )dxdy 0
1-x 2
xp X ( x) dx
+
-
xp( x, y )dydx
2 2 σ1
, x ,
( y μ2 ) 2
2 2σ 2
2 σ 2
, y .
2 2 E ( X ) μ1 , E (Y ) μ2 , D( X ) σ1 , D(Y ) σ 2 .
而 Cov( X , Y ) ( x μ1 )( y μ2 ) p( x , y ) d x d y
证明 (1 ) Cov( X , Y ) E {[ X E ( X )][ Y E (Y )]}
E[ XY YE ( X ) XE (Y ) E ( X ) E (Y )]
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
D( X + Y ) = ? D( X + Y ) = E ( X + Y )2 − [ E ( X + Y )]2
= D( X ) + D(Y ) + 2 E {[ X − E ( X )][Y − E (Y )]}.
协方差
(2) 定义
称 E{[ X − E ( X )][Y − E (Y )]} 为随机变量 X 与 Y 的协方差. 记为 Cov( X , Y ), 即 C ov( X , Y ) = E{[ X − E ( X )][Y − E (Y )]}. 称 ρXY = Cov( X , Y ) D( X ) ⋅ D(Y ) ( D( X ) ≠ 0, D(Y ) ≠ 0)
G
O
x
D(Y ) = D( X ) = 153 / 2800,
Cov( X , Y ) = E ( XY ) − E ( X ) E (Y ) = 19 / 400 = 0.0475,
Cov( ,Y ) X ρXY = = 0.87, D( X ) ⋅ D(Y )
D( X + Y ) = D( X ) + D(Y ) + 2Cov( X ,Y ) = 0.2043.
a ,b
2 = E {[Y − (a0 + b0 X )]2 } = (1 − ρXY ) D(Y )
⇒ ρXY = 1.
(4) 不相关与相互独立的关系 若随机变量X, 相互独立 相互独立, 定理 若随机变量 ,Y相互独立, 则 ρ xy = 0 ,即X,Y不相关。 不相关。 , 不相关 不相关 注 1) 相互独立 如后面例2 如后面例2. 2) 不相关的充要条件
2) D( X +Y ) = D( X ) + D(Y ) + 2Cov( X ,Y ).
性质 1) Cov( X , Y ) = Cov(Y , X ); Cov( X , X ) = D( X );
2) Cov( aX , bY ) = ab Cov( X , Y ) , a, b 为常数 ;
3) Cov( X 1 + X 2 , Y ) = Cov( X 1 , Y ) + Cov( X 2 , Y ).
= D[Y − (a 0 + b0 X )] + [ E (Y − (a 0 + b0 X ))]2
⇒ D[Y − (a0 + b0 X )] = 0, E[Y − (a0 + b0 X )] = 0.
由方差性质知
P{Y − (a0 + b0 X ) = 0} = 1, 或 P {Y = a0 + b0 X } = 1.
确定 a , b 的值 , 使 e 达到最小 .
e = E[(Y − (a + bX ))2 ]
= E (Y 2 ) + b 2 E ( X 2 ) + a 2 − 2bE ( XY ) + 2abE ( X ) − 2aE (Y ).
将 e 分别关于 a ,b 求偏导数 , 并令它们等于零 , 得
当 ρ XY = 0时 X , Y 线性相关的程度最差 . . 定义 当 ρXY = 0 时, 称 X 和Y 不相关
(3) 相关系数的性质
1) ρXY ≤ 1.
2) ρXY = 1 的充要条件是 : 存在常数 a, b 使 P {Y = a + bX } = 1.
证明 1) min e = E[(Y − ( a + bX )) 2 ] a ,b 2 = (1 − ρXY ) D(Y ) ≥ 0
四阶中心矩 E 四阶中心矩 {[ X − E( X )]4 } 主要用来衡量 随机变量的分布在均值 附近的陡峭程度如何 .
5. 小结
(1) 协方差 定义 C ov( X , Y ) = E {[ X − E ( X )][Y − E (Y )]}.
计算公式 1) Cov( X , Y ) = E ( XY ) − E ( X ) E (Y );
围成. 其中区域 G 由曲线 y = x2 与 x = y 2 围成.求 Cov ( X , Y ), ρ XY , D( X + Y ). 2
y
解: E ( X ) = ∫ E (Y ) = ∫
1 0
1
0
∫
x
y= x
x2 x
3 xdydx = 9 / 20,
G
O
x = y2
∫ 3 ydydx = 9 / 20, E ( XY ) = ∫ ∫ 3 xydydx = 1 / 4,
1o 2o 3o
X , Y 不相关 ⇔ ρXY = 0; X , Y 不相关 ⇔ Cov( X ,Y ) = 0; X , Y 不相关 ⇔ E ( XY ) = E ( X ) E (Y ).
上的均匀分布, 例2 设 Z 是服从 [−π , π ] 上的均匀分布,又 X = sin Z , Y = cos Z,试求相关系数 ρ XY . 解
将 a0 , b0 代入 e = E[(Y − (a + bX ))2 ] 中, 得
min e = E[(Y − (a + bX ))2 ]
a ,b
= E[(Y − (a0 + b0 X ))2 ]
2 = (1 − ρXY ) D(Y ).
(2) 相关系数的意义
当 ρXY 较大时 e 较小, 表明 X ,Y 的线性关系联 系较紧密. 当 ρ XY 较小时 , X , Y 线性相关的程度较差 .
x2 1 x 0 x2
x
E( X ) = ∫
2
E (Y
2
∫ )=∫ ∫
0
1 0
1
x
x2
x
3 x 2 dydx = 9 x = y2
D( X ) = E ( X ) − [ E ( X )]2 = 9 / 35 − (9 / 20)2 = 153 / 2800,
x2 2
3 y dydx = 9 / 35,
(2) 说明
k = 2,3, L
存在 , 称它为 X 的 k 阶中心矩 .
1) 随机变量 X 的数学期望 E ( X ) 是 X 的一阶原 点矩 , 方差为二阶中心矩 , 协方差 Cov( X , Y )是 X 与 Y 的二阶混合中心矩 ;
2) 在实际应用中, 高于 4 阶的矩很少使用.
三阶中心矩 E 三阶中心矩 {[ X − E( X )]3 }主要用来衡量 偏 随机变量的分布是否有 ;
反之 , 若存在常数 a ∗ , b∗ 使
P{Y = a ∗ + b∗ X } = 1 ⇔ P {Y − (a ∗ + b∗ X ) = 0} = 1,
⇒ P {[Y − (a ∗ + b∗ X )]2 = 0} = 1,
⇒ E {[Y − (a ∗ + b∗ X )]2 } = 0.
故有
0 = E {[Y − (a ∗ + b∗ X )]2 }≥ min E[(Y − (a + bX ))2 ]
为随机变量 X 与 Y 的相关系数 .
于是有 D( X +Y ) = D( X ) + D(Y ) + 2Cov( X,Y )
(3) 说明
(1) X 和 Y 的相关系数又称为标准 协方差 , 它是一 个无量纲的量 . ( 2) 若随机变量 X 和 Y 相互独立 ⇒ Cov( X ,Y ) = E {[ X − E ( X )][Y − E (Y )]} = E[ X − E ( X )]E[Y − E (Y )] = 0. ( 3) 若随机变量 X 和 Y 相互独立
动画演示 ξ 与 η 的相关关系.
单击图形播放/ ESC键退出 单击图形播放/暂停 ESC键退出
4.矩的概念
(1)定义 (1)定义
设 设 X 和 Y 是随机变量 , 若E ( X k ), k = 1,2,L 存在, 称它为 X 的 k 阶原点矩 , 简称 k 阶矩.
若 若 E {[ X − E ( X )] k },
2 ⇒ 1 − ρXY ≥ 0
⇒ ρXY ≤ 1.
2) ρXY = 1 的充要条件是 , 存在常数 a, b 使 P {Y = a + bX } = 1. 事实上 , ρ XY = 1 ⇒ E[(Y − (a0 + b0 X ))2 ] = 0 ⇒ 0 = E[(Y − ( a0 + b0 X )) 2 ]
= E[ XY − YE ( X ) − XE (Y ) + E ( X ) E (Y )]
= E ( XY ) − 2 E ( X ) E (Y ) + E ( X ) E (Y )
= E ( XY ) − E ( X ) E (Y ).
2. 协方差的性质
(1) Cov( X , Y ) = Cov(Y , X ); Cov( X , X ) = D( X );
∂e ∂a = 2a + 2bE ( X ) − 2 E (Y ) = 0, ∂e = 2bE ( X 2 ) − 2 E ( XY ) + 2aE ( X ) = 0. ∂b
解得 b0 =
Cov( X ,Y ) Cov( X ,Y ) ,a0 = E (Y ) − E ( X ) . D( X ) D( X )
因而
Cov ( X , Y ) = 0, ρ XY = 0
不相关, 相关系数 ρ XY =0,随机变量 X 与 Y 不相关, =0, 不独立. 但是有 X 2 + Y 2 = 1 ,从而 X 与 Y 不独立.
例3 设 θ 服从 [ 0 , 2 π ] 的均匀分布 , ξ = cos θ , η = cos( θ + a ), 这里 a 是常数 , 求 ξ 和 η 的相关系数 ? 解 E (ξ ) 1 2 π cosx dx 0, = = ∫0 2π