协方差和相关系数公式_相关系数与协方差的关系
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
又由于Corr(X,Y)=-1,表明X与Y间是完全负相关的。其实,这个结论早就蕴含在线性关系式X+Y=n之中了。
综上,就说明:在某种情况下,Fra Baidu bibliotek方差和相关系数在反映X与Y间的关联程度时保持
一致性。若是这样的话,研究相关系数似乎有点多余了。因为,我们已经有一个可以反映X与Y间的关联程度的量了(即协方差),那我们能否找出相关系数更的地方呢?3协方差与相关系数的“矛盾性”
最后得协方差和相关系数为
Cov(X,Y)=E(XY)-E(X)E(Y)=0.0471
Corr(X,Y)=Cov(X,Y)p(x,y)={
σxσ=0.8243 y
这个协方差很小,但其相关系数并不小。从相关系数Corr(X,Y)=0.8243看,X与Y有相当程度的正相关;但从相应的协方差Cov(X,Y)=0.0471看,X与Y的相关性很微弱,几乎可以忽略不计。造成这种错觉的原因在于没有考虑标准差,若两个标准差都很小,即使协方差小一些,相关系数也能显示一定程度的相关性。由此可见,在协方差的基础上加工形成的相关系数是更为重要的相关性的特征数。
·若Corr(X,Y)=0,则称X与Y不相关。不相关是指X与Y没有线性关系,但也有可能有其他关系,比如平方关系、立方关系等。
·若Corr(X,Y)=1,则称X与Y完全正相关;若Corr(X,Y)=-1,则称X与Y完全,负相关。
·若0
2协方差与相关系数的一致性
从协方差与相关系数的定义和性质我们不难发现,协方差与相关系数都是反映X与Y相关程度的量。也就是说,他们有异曲同工之效。在刻画二维随机变量两个分量间相互关联程度时,他们保持了一致性。这一点我可以给出以下两个例子来说明。
协方差和相关系数公式
1协方差、相关系数的定义及性质
设(X,Y)是一个二维随机变量,若E{ [ X-E(X) ] [ Y-E(Y) ] }存在,则称此数学期望为X与Y的协方差,并记为Cov(X,Y)=E{ [ X-E(X) ] [ Y-E(Y) ] },特别有Cov(X,X)=Var(X)。
从协方差的定义可以看出,它是X的偏差“X-E(X) ”与Y的偏差“Y-E(Y)”的乘积的数学期望。由于偏差可正可负,故协方差也可正可负,也可为零,其具体表现如下:
例一设随机变量X和Y独立同服从参数为λ的泊松分布,令
U=2X+Y,V=2X-Y。
求U和V的协方差及相关系数。
解:因为
Var(U)=Var(2X+Y)=5λ,Var(V)=Var(2X-Y)=5λ.
所以
Cov(U,V)=Cov(2X+Y,2X-Y)
=Cov(2X,2X)+Cov(Y,2X)-Cov(2X,Y)-Cov(Y,Y)
Corr(X,Y)越接近1,则线性相关程度越高;Corr(X,Y)越接近0,则线性相关程度越低。而协方差看不出这一点。若协方差很小,而其两个标准差σX和σY也很小,则其比
值就不一定小,下面我们来看实例。
例三已知随机向量(X,Y)的联合密度函数为
8
3, 0
求X,Y的协方差及相关系数。
解:先计算两个边际密度函数,再分别计算E(X)、E(X2)、E(Y)、E(Y2)、Var(X)、Var(Y)及E(XY)。
设(X,Y)是一个二维随机变量,且Var(X)0,Var(Y)0.则称
Cov(X,Y)
(X)(Y)Cov(X,Y) Corr(X,Y)==σxσ y
为X与Y的(线性)相关系数。
利用施瓦茨不等式我们不难得到-1≤Corr(X,Y)≤1.也就是说相关系数是介于-1到1之间的,并且可以对它作以下几点说明:
解:因为X+Y=n,且X~b(n,1/2),Y~b(n,1/2),所以
n Var(X) =Var(Y)=,4
n Cov(X,Y)=Cov(X ,n-X)=-Cov(X,X)=-4
Corr(X,Y)= Cov(X,Y)
(X)(Y)=-n
n=-1
4
我们假定n=1,Cov(X,Y)=-1
4
我们可以得出,随着n的增大,协方差Cov(X,Y)就越来越小,随之X与Y的负相关性就表;n=100,Cov(X,Y)=-25;n=*****,Cov(X,Y)=-2500„„现得越来越强烈。就有limCov(X,Y)=-∞,X与Y间是完全负相关的。n→∞
·当Cov(X,Y)0时,称X与Y正相关,这时两个偏差[ X-E(X) ]与[ Y-E(Y) ]同时增加或同时减少,由于E(X)与E(Y)都是常数,故等价于X与Y同时增加或同时减少,这就是正相关的含义。
·当Cov(X,Y)
·当Cov(X,Y)=0时,称X与Y不相关。
也就是说,协方差就是用来描述二维随机变量X与Y相互关联程度的一个特征数。协方差Cov(X,Y)是有量纲的量,譬如X表示人的身高,单位是米(m),Y表示人的体重,单位是公斤(kg),则Cov(X,Y)带有量纲(m·kg)。为了消除量纲的影响,对协方差除以相同量纲的量,就得到一个新的概念—相关系数,它的定义如下:
=3λ
由此得
Corr(U,V)=Cov(U,V)
(U)(V)=3λ
5λ=3
5
服从参数为λ的泊松分布中得λ0,由协方差Cov(U,V)=3λ是恒大于0的,再由相关
3系数Corr(U,V)=,就很好的说明协方差与相关系数均可以反映二维随机变量关联程度。5
我们再看下一个例题,看能否能出这个结论呢?
例二将一枚硬币重复掷n次,以X和Y分别表示正面向上和反面向上的次数,试求X和Y的协方差和相关系数。
综上,就说明:在某种情况下,Fra Baidu bibliotek方差和相关系数在反映X与Y间的关联程度时保持
一致性。若是这样的话,研究相关系数似乎有点多余了。因为,我们已经有一个可以反映X与Y间的关联程度的量了(即协方差),那我们能否找出相关系数更的地方呢?3协方差与相关系数的“矛盾性”
最后得协方差和相关系数为
Cov(X,Y)=E(XY)-E(X)E(Y)=0.0471
Corr(X,Y)=Cov(X,Y)p(x,y)={
σxσ=0.8243 y
这个协方差很小,但其相关系数并不小。从相关系数Corr(X,Y)=0.8243看,X与Y有相当程度的正相关;但从相应的协方差Cov(X,Y)=0.0471看,X与Y的相关性很微弱,几乎可以忽略不计。造成这种错觉的原因在于没有考虑标准差,若两个标准差都很小,即使协方差小一些,相关系数也能显示一定程度的相关性。由此可见,在协方差的基础上加工形成的相关系数是更为重要的相关性的特征数。
·若Corr(X,Y)=0,则称X与Y不相关。不相关是指X与Y没有线性关系,但也有可能有其他关系,比如平方关系、立方关系等。
·若Corr(X,Y)=1,则称X与Y完全正相关;若Corr(X,Y)=-1,则称X与Y完全,负相关。
·若0
2协方差与相关系数的一致性
从协方差与相关系数的定义和性质我们不难发现,协方差与相关系数都是反映X与Y相关程度的量。也就是说,他们有异曲同工之效。在刻画二维随机变量两个分量间相互关联程度时,他们保持了一致性。这一点我可以给出以下两个例子来说明。
协方差和相关系数公式
1协方差、相关系数的定义及性质
设(X,Y)是一个二维随机变量,若E{ [ X-E(X) ] [ Y-E(Y) ] }存在,则称此数学期望为X与Y的协方差,并记为Cov(X,Y)=E{ [ X-E(X) ] [ Y-E(Y) ] },特别有Cov(X,X)=Var(X)。
从协方差的定义可以看出,它是X的偏差“X-E(X) ”与Y的偏差“Y-E(Y)”的乘积的数学期望。由于偏差可正可负,故协方差也可正可负,也可为零,其具体表现如下:
例一设随机变量X和Y独立同服从参数为λ的泊松分布,令
U=2X+Y,V=2X-Y。
求U和V的协方差及相关系数。
解:因为
Var(U)=Var(2X+Y)=5λ,Var(V)=Var(2X-Y)=5λ.
所以
Cov(U,V)=Cov(2X+Y,2X-Y)
=Cov(2X,2X)+Cov(Y,2X)-Cov(2X,Y)-Cov(Y,Y)
Corr(X,Y)越接近1,则线性相关程度越高;Corr(X,Y)越接近0,则线性相关程度越低。而协方差看不出这一点。若协方差很小,而其两个标准差σX和σY也很小,则其比
值就不一定小,下面我们来看实例。
例三已知随机向量(X,Y)的联合密度函数为
8
3, 0
求X,Y的协方差及相关系数。
解:先计算两个边际密度函数,再分别计算E(X)、E(X2)、E(Y)、E(Y2)、Var(X)、Var(Y)及E(XY)。
设(X,Y)是一个二维随机变量,且Var(X)0,Var(Y)0.则称
Cov(X,Y)
(X)(Y)Cov(X,Y) Corr(X,Y)==σxσ y
为X与Y的(线性)相关系数。
利用施瓦茨不等式我们不难得到-1≤Corr(X,Y)≤1.也就是说相关系数是介于-1到1之间的,并且可以对它作以下几点说明:
解:因为X+Y=n,且X~b(n,1/2),Y~b(n,1/2),所以
n Var(X) =Var(Y)=,4
n Cov(X,Y)=Cov(X ,n-X)=-Cov(X,X)=-4
Corr(X,Y)= Cov(X,Y)
(X)(Y)=-n
n=-1
4
我们假定n=1,Cov(X,Y)=-1
4
我们可以得出,随着n的增大,协方差Cov(X,Y)就越来越小,随之X与Y的负相关性就表;n=100,Cov(X,Y)=-25;n=*****,Cov(X,Y)=-2500„„现得越来越强烈。就有limCov(X,Y)=-∞,X与Y间是完全负相关的。n→∞
·当Cov(X,Y)0时,称X与Y正相关,这时两个偏差[ X-E(X) ]与[ Y-E(Y) ]同时增加或同时减少,由于E(X)与E(Y)都是常数,故等价于X与Y同时增加或同时减少,这就是正相关的含义。
·当Cov(X,Y)
·当Cov(X,Y)=0时,称X与Y不相关。
也就是说,协方差就是用来描述二维随机变量X与Y相互关联程度的一个特征数。协方差Cov(X,Y)是有量纲的量,譬如X表示人的身高,单位是米(m),Y表示人的体重,单位是公斤(kg),则Cov(X,Y)带有量纲(m·kg)。为了消除量纲的影响,对协方差除以相同量纲的量,就得到一个新的概念—相关系数,它的定义如下:
=3λ
由此得
Corr(U,V)=Cov(U,V)
(U)(V)=3λ
5λ=3
5
服从参数为λ的泊松分布中得λ0,由协方差Cov(U,V)=3λ是恒大于0的,再由相关
3系数Corr(U,V)=,就很好的说明协方差与相关系数均可以反映二维随机变量关联程度。5
我们再看下一个例题,看能否能出这个结论呢?
例二将一枚硬币重复掷n次,以X和Y分别表示正面向上和反面向上的次数,试求X和Y的协方差和相关系数。