协方差与相关系数
协方差与相关系数
• 任意两个随机变量X与Y的和的方差为 D(X+Y)=D(X)+D(Y)+2Cov(X,Y)
协方差的性质 1. 2. 3. 4.
Cov( X , X ) D( X )
Cov( X , Y ) Cov(Y , X )
Cov(aX , bY ) ab Cov(Y , X ) a,b是常数
XY
Cov( X , Y ) 0 D( X ) D(Y )
例:
已知 D( X ) 4 , D(Y ) 9 , XY
1 U 3 ,设
2X Y ,
V 2 X Y , 求 UV .
1 解 Cov( X , Y ) XY D( X ) D(Y ) 4 9 2 3
§2.1 相关系数的性质
• 性质1:随机变量X和Y的相关系数满足|ρXY|≤1. • 性质2: |ρXY|=1 的充要条件是,存在常数a,b使得 P{Y=a+bX}=1. • 性质3:若X与Y相互独立,则ρXY=0.
• 性质1:随机变量X和Y的相关系数满足|ρXY|≤1.
证明
则
令
X E( X ) X D( X )
X与Y的分布律分别为
X
P
-1
0.15
0
0.5
1
0.35
Y P
0 0.4
1 0.6
E ( XY ) (1) 1 0.08 11 0.20 0.12
E ( X ) (1) 0.15 1 0.35 0.20
E (Y ) 1 0.6 0.6
于是
Cov( X , Y ) E ( XY ) E ( X ) E (Y ) 0.12 0.20 0.6 0
协方差与相关系数 PPT
D(V ) D(2X Y ) D(2X ) D(Y ) 2Cov(2X ,Y )
4D( X ) D(Y ) 2 2 Cov( X ,Y ) 17
所以
Cov(U ,V ) Cov(2X Y , 2X Y )
Cov(2X , 2X ) Cov(2X ,Y ) Cov(Y , 2X ) Cov(Y ,Y )
所以D(t0X*-Y*)=0,由方差得性质知它等价于 P{t0X*-Y* =0}=1,即P{Y=aX+b}=1
其中a=t0σ(Y)/σ(X),b=E(Y)- t0 E(X) σ(Y)/σ(X)、
• 性质3:若X与Y相互独立,则ρXY=0、 证明 若X与Y相互独立,则E(XY)=E(X)E(Y), 又 Cov(X,Y)= E(XY)-E(X)E(Y),所以
协方差与相关系数
一、协方差得概念及性质 二、相关系数得概念及性质 三、协方差得关系式
§1 协方差
• 定义:设二维随机向量(X,Y)得数学期望 (E(X),E(Y))存在,若E[(X-E(X))(Y-E(Y))]存在,则称 它为随机变量X与Y得协方差,记为Cov(X,Y),即
Cov(X,Y)= E[(X-E(X))(Y-E(Y))] • 协方差有计算公式
9 , XY
1 3
,设
U
2X
Y
,
V 2X Y , 求 UV .
解
Cov( X ,Y ) XY
D( X ) D(Y ) 1 3
49 2
D(U ) D(2X Y ) D(2X ) D(Y ) 2Cov(2X ,Y )
4D( X ) D(Y ) 2 2 Cov( X ,Y ) 33
E( X ) (1) 0.15 1 0.35 0.20
协方差与相关系数
其余均方误差
e
D(Y
)(1
2 XY
).
从这个侧面也
能说明 XY 越接近1,e 越小. 反之, XY 越近于0,
e 就越大, Y与X的 线性相关性越小.
完
例3 设 ( X ,Y ) 的分布律为
X
Y
2 1 1 2 P{Y yi }
1
0 1/4 1/4 0
1/ 2
4
1/4 0 0 1/4 1/2
D(Y
)[1
2 XY
],
D(Y
)1
[cov( X ,Y )]2 D( X )D(Y )
D(Y
)[1
2 XY
],
由于方差
D(Y
)
是正的,
故必有
1
2 XY
0,
所以
XY 1.
性质2. 若 X 和 Y 相互独立,则 XY 0;
注意到此时 cov( X ,Y ) 0, 易见结论成立.
注: X 与Y 相互独立
完
例4 设 服从 [ , ] 上的均匀分布, 且
X sin , Y cos
判断 X 与 Y 是否不相关, 是否独立.
解
由于
E( X )
1
2
sind 0,
E(Y
)
1
2
cosd 0,
而
E(
XY
)
1
2
sin cosd 0.
2
因此
E( XY ) E( X )E(Y ),
从而 X 与 Y 不相关. 但由于 X 与 Y 满足关系:
完
例2 设连续型随机变量 ( X ,Y ) 的密度函数为
f
(
x,
协方差与相关系数
D( X + Y ) = ? D( X + Y ) = E ( X + Y )2 − [ E ( X + Y )]2
= D( X ) + D(Y ) + 2 E {[ X − E ( X )][Y − E (Y )]}.
协方差
(2) 定义
称 E{[ X − E ( X )][Y − E (Y )]} 为随机变量 X 与 Y 的协方差. 记为 Cov( X , Y ), 即 C ov( X , Y ) = E{[ X − E ( X )][Y − E (Y )]}. 称 ρXY = Cov( X , Y ) D( X ) ⋅ D(Y ) ( D( X ) ≠ 0, D(Y ) ≠ 0)
G
O
x
D(Y ) = D( X ) = 153 / 2800,
Cov( X , Y ) = E ( XY ) − E ( X ) E (Y ) = 19 / 400 = 0.0475,
Cov( ,Y ) X ρXY = = 0.87, D( X ) ⋅ D(Y )
D( X + Y ) = D( X ) + D(Y ) + 2Cov( X ,Y ) = 0.2043.
a ,b
2 = E {[Y − (a0 + b0 X )]2 } = (1 − ρXY ) D(Y )
⇒ ρXY = 1.
(4) 不相关与相互独立的关系 若随机变量X, 相互独立 相互独立, 定理 若随机变量 ,Y相互独立, 则 ρ xy = 0 ,即X,Y不相关。 不相关。 , 不相关 不相关 注 1) 相互独立 如后面例2 如后面例2. 2) 不相关的充要条件
2) D( X +Y ) = D( X ) + D(Y ) + 2Cov( X ,Y ).
协方差与相关系数
= ρσ 1σ 2
ρ xy =
ρσ 1σ 2 = =ρ σ 1σ 2 D ( X ) D (Y )
Cov ( X , Y )
ρ=0, ,
从而说明二维正态分布随机变量X, 相互独立 从而说明二维正态分布随机变量 ,Y相互独立 相互独立与不相关是等价的. 即X,Y相互独立与不相关是等价的. , 相互独立与不相关是等价的
山东农业大学
概率论与数理统计
主讲人:程述汉 苏本堂
设二维( 例2 设二维(X,Y)随机变量的密度函数为
π π 1 cos( x + y ), 0 ≤ x ≤ , - ≤ y ≤ 0 f ( x, y ) =Y )
1 2 0 π 解 因为 E ( X ) = ∫ ∫ π x cos( x + y )dxdy = ≈ 0.7854, 2 0 -2 4 π 2 1 2 0 2 π π 2 D( X ) = ∫ ∫ π x cos( x + y)dxdy -[ E( X )] = + 2 ≈ 0.1876 2 0 -2 16 2 同理可得 E (Y ) ≈ 0.7854, D(Y ) ≈ 0.1876, 1 π 0 π 2 E ( XY ) = ∫ ∫ π xy × cos( x + y )dxdy1 ≈ -0.5708, 2 0 -2 2 cov( X , Y ) = E ( XY ) - E ( X ) E (Y )
2aE[Y E (Y )][ X E ( X )] + 2 E[Y E (Y )][ E (Y ) aE ( X ) b]
2 aE [ X E ( X )][ E (Y ) aE ( X ) b ]
= D(Y ) + a D( X ) + [ E (Y ) aE ( X ) b] 2a cov( X , Y )
相关系数与协方差
相关系数与协方差相关系数和协方差是统计学中常用的两个重要概念。
它们用于衡量两个变量之间的关系,提供了关于变量之间相关程度的头绪。
相关系数(correlation coefficient)是两个变量之间线性相关关系的度量。
它以-r到1之间的数值表示两个变量之间的关系程度,具体取值范围如下:-1.0 < r < -0.7 极强的负相关-0.7 < r < -0.3 强的负相关-0.3 < r < -0.1 弱的负相关-0.1 < r < 0.1 无相关或微弱相关0.1 < r < 0.3 弱的正相关0.3 < r < 0.7 强的正相关0.7 < r < 1.0 极强的正相关其中,r=1表示两个变量完全正相关,r=-1表示两个变量完全负相关,r=0表示两个变量不存在线性关系。
协方差(covariance)是两个变量的随机变化同时偏离了各自的平均值的程度。
当变量之间存在正相关关系时,协方差为正;当变量之间存在负相关关系时,协方差为负;当变量之间没有关系时,协方差为0。
协方差的绝对值大小没有一个固定的限制,这使得它的实用价值有限。
为了让协方差具有可比性,我们可以通过将协方差除以各自的标准差,得到相对协方差,即相关系数,这样就可以将不同变量之间的关系比较一下。
相关系数和协方差的计算方法类似:都需要先计算出每个变量的平均值,然后计算每个数据点与平均值之差的乘积,最后将这些乘积相加得出结果。
相关系数还需要将结果除以两个变量各自的标准差,而协方差则不需要进行标准化处理。
尽管相关系数和协方差都可以用来衡量两个变量之间的相关性,但它们各有优缺点。
优点是,协方差可以直接反映两个变量的偏离程度,而相关系数则更加严谨地测量线性关系的强度和方向;缺点是,协方差无法比较不同单位的变量之间的相关性,而相关系数则可以将不同单位的变量标准化,使得不同变量之间的关系具有可比性。
协方差和相关系数的计算公式
协方差和相关系数的计算公式一、协方差:协方差是用来衡量两个变量之间的关系的统计量。
具体来说,它描述了两个变量的变动趋势是否一致。
协方差的计算公式如下:Cov(X, Y) = Σ((Xi - Xavg) * (Yi - Yavg)) / (n - 1)其中,Cov(X, Y)表示X和Y的协方差,Xi和Yi分别表示第i个观测值,Xavg和Yavg分别表示X和Y的平均值,n表示总观测次数。
协方差的计算方法如下:1. 计算X和Y的平均值:Xavg = ΣXi / n,Yavg = ΣYi / n2. 计算每个观测值与平均值的差:(Xi - Xavg)和(Yi - Yavg)3. 将每个差值相乘:(Xi - Xavg) * (Yi - Yavg)4. 对所有的乘积求和:Σ((Xi - Xavg) * (Yi - Yavg))5.最后将求和结果除以(n-1)即可得到协方差。
协方差的取值范围为负无穷到正无穷。
如果协方差为正值,表示X和Y之间存在正相关关系,即当X增大时,Y也增大;如果协方差为负值,表示X和Y之间存在负相关关系,即当X增大时,Y减小;如果协方差接近于零,则表示X和Y之间没有线性相关关系。
二、相关系数:相关系数是用来衡量两个变量之间线性相关程度的统计量。
具体来说,它描述了两个变量之间的线性关系的强度和方向。
相关系数的计算公式如下:ρ(X, Y) = Cov(X, Y) / (σ(X) * σ(Y))其中,ρ(X, Y)表示X和Y的相关系数,Cov(X, Y)表示X和Y的协方差,σ(X)和σ(Y)分别表示X和Y的标准差。
相关系数的计算方法如下:1. 首先计算X和Y的协方差Cov(X, Y)2. 然后计算X和Y的标准差σ(X)和σ(Y),标准差是方差的平方根,方差的计算公式为Va r(X) = Σ((Xi - Xavg)^2) / (n - 1)3.最后将协方差除以标准差的乘积,即可得到相关系数ρ(X,Y)。
协方差及相关系数
,X )
1 Cov(X 2
,Y )
1 3
D(
X
)
1 2
XY
D(X )
D(Y )
1 3
9
1 2
1 2
3
4
3
3
0
,
故 X 与 Z 的相关系数为 XZ
Cov( X ,Z) 0 . D(X ) D(Z)
(3)由 X ,Y 服从正态分布知 Z X Y 也服从正态分布,而两个正态随机变量相互独 32
立与不相关是等价的,所以由 XZ 0 即 X 与 Z 不相关,可推出 X 与 Z 相互独立.
概率论与数理统计
XY 1, 当 a 0 时.
(4-16)
1.3 随机变量的相关性
定义 4.6 随机变量 X 与Y 的相关系数为 XY ,若 XY 0 ,则称 X 与 Y 不相关,若 XY 0 ,则称 X 与Y 相关.
X与Y不相关
XY 0
Cov(X,Y)=0
E(XY)=E(X)E(Y)
D(X±Y)=D(X)+D(Y)
定义 4.5 设随机变量 X 与Y 的方差存在,且均不为零,则称
Cov(X ,Y ) D(X ) D(Y )
为 X 与Y 的相关系数,记作 XY ,或简记为 ,即
XY
Cov(X ,Y) E{[ X E(X)][Y E(Y)]} .
D(X ) D(Y )
D(X ) D(Y)
定理 4.3 若随机变量Y 是 X 的线性函数,即Y aX b (a 0) ,则 1, 当 a 0 时,
定理 4.5 设随机变量 (X ,Y ) 服从二维正态分布,则 X 与Y 不相关的充要条件是 X 与Y
相互独立.
1.3 随机变量的相关性
协方差和相关系数
§4.4 协方差和相关系数随机变量的数字特征,包括数学期望、方差、协方差和相关系数等。
协方差和相关系数是考虑两个随机变量之间的某种关系。
协方差的意义不太直观,它考察两个随机变量(随机向量)与各自均值之差的加权平均值,相关系数则是考虑两个随机变量取值之间的关系。
1. 协方差定义:对两个随机变量X 、Y ,称E X EX Y EY [()()]--为X 与Y 的协方差,记为Cov (X , Y ),即 C o vX Y E X EX Y EY (,)[()()]=-- 2. 相关系数定义:对两个随机变量X 、Y ,称C o vX YD X D Y (,)()()为X 与Y 的相关系数或标准协方差,记为ρXY ,即ρXY Cov X Y D X D Y =(,)()()3. 方差、协方差的运算性质(1) D X Y D X D Y Cov X Y ()()()(,)+=++2 (2) Cov X Y E XY E X E Y (,)()()()=-⋅ 推论:若随机变量X 、Y 独立,则 Cov X Y XY (,)==ρ0Problem :若Cov X Y XY (,)==ρ0,则X 、Y 是否独立? (3) Cov X Y Cov Y X (,)(,)= (4) Cov aX bY abCov X Y (,)(,)=(5) Cov X X Y Cov X Y Cov X Y (,)(,)(,)1212+=+Cov X X Y Cov X Y Cov X Y (,)(,)(,)1212-=-4. 相关系数的性质(1) 柯西-许瓦兹(Cauchy-Schwarz)不等式:对任意两个随机变量X 、Y ,若E X E Y ()()22<∞<∞ , ,则 (())()()E XY E X E Y 222≤⋅ 证明:对任意实数t ,有q t E X tY E X t E Y tE XY ()(())()()()=+=++≥222220 因此,二次方程q t ()=0的判别式 440222(())()()E XY E X E Y -⋅≤即(())()()E XY E X E Y 222≤⋅ 证毕。
协方差和相关系数
协方差和相关系数
协方差是衡量两个变量之间相关程度的一种数字指标,是反映两个变量间关系密切程度的指标。
它是反映两个变量间变化趋势一致性的数字。
协方差可以用公式计算: Cov(X,Y)= ∑(Xi—X).(Yi—Y)/n;
其中X和Y分别是两个变量的样本均值,Xi和Yi分别是变量X和Y 的每个样本的取值,n是样本量。
协方差的取值范围是[-无穷,+无穷],当协方差大于零时,说明横轴变量的增长伴随着纵轴变量的增长,而且X和Y的变化程度一致,当取0时,X和Y没有相关性,当协方差小于0时,X和Y具有负相关性。
相关系数是根据两个变量间的协方差计算出来的,是一个经过归一化的量,表示两个变量的相关程度,取值范围为[-1,1],当它的值为1时表示两个变量完全相关;当它的值为-1时表示两个变量完全负相关;当它的值为0时表示两个变量没有相关性。
相关系数可以用公式表示:r=Cov(X,Y)/σx σy; 其中Cov(X,Y)是X和Y的协方差,σx和σy是变量X和Y的标准差。
协方差和相关系数公式
协方差和相关系数公式
协方差和相关系数是统计学中常用的两个概念,用于描述两个变量之间的关系。
它们可以帮助我们理解和分析数据的变化趋势,从而更好地进行决策和预测。
协方差是用来衡量两个变量之间的总体误差的指标。
当协方差为正值时,表示两个变量呈正相关关系,即当一个变量增加时,另一个变量也会增加;当协方差为负值时,表示两个变量呈负相关关系,即当一个变量增加时,另一个变量会减少;当协方差接近于零时,表示两个变量之间几乎没有线性关系。
然而,协方差的数值大小受到变量单位的影响,不便于比较不同数据集之间的相关性。
为了解决这个问题,引入了相关系数的概念。
相关系数是协方差除以两个变量的标准差的乘积,它的取值范围是-1到1。
当相关系数为1时,表示两个变量完全正相关;当相关系数为-1时,表示两个变量完全负相关;当相关系数接近于0时,表示两个变量之间几乎没有线性关系。
协方差和相关系数在实际应用中具有广泛的应用。
例如,在金融领域,我们可以使用协方差和相关系数来衡量不同股票之间的相关性,从而进行投资组合的优化;在市场营销领域,我们可以使用协方差和相关系数来分析产品销量和广告投入之间的关系,从而制定更有效的市场推广策略。
协方差和相关系数是统计学中重要的工具,可以帮助我们理解和分析数据之间的关系。
通过对它们的应用,我们可以提高决策的准确性和预测的精度,从而在各个领域取得更好的成果。
协方差和相关系数的计算公式
协方差和相关系数的计算公式协方差和相关系数是统计学中常用的两个概念,用于描述变量之间的关系程度。
在概率论和统计学中,协方差表示两个变量的总体协同变动的方向和程度。
相关系数则度量两个变量之间线性相关的强度和方向。
接下来我们会分别介绍协方差和相关系数的计算公式及其详细解释。
1. 协方差(Covariance):协方差是用来衡量两个随机变量关系的一种统计量。
它表示两个随机变量在同一时间(或同一试验中)波动的程度。
总体协方差的计算公式如下:Cov(X, Y) = Σ[ (Xᵢ - μₓ) * (Yᵢ - μᵧ) ] / N其中-X和Y分别是随机变量X和Y的取值;-μₓ和μᵧ分别是随机变量X和Y的总体均值;-N是样本个数;-Σ表示对所有样本求和。
样本协方差的计算公式如下:Cov(X, Y) = Σ[ (Xᵢ - X̄) * (Yᵢ - Ȳ) ] / (n - 1)其中-X̄和Ȳ分别是X和Y的样本均值;-n是样本个数;-Σ表示对所有样本求和。
解释:协方差的计算公式可以通过观察上面的公式看出,它是两个变量之间差值的乘积的平均值。
如果协方差为正,表示两个变量呈正相关,当一个变量上升时,另一个变量也上升;如果协方差为负,表示两个变量呈负相关,当一个变量上升时,另一个变量下降;如果协方差为零,则表示两个变量之间不存在线性关系。
2. 相关系数(Correlation coefficient):相关系数是用于度量两个变量之间线性相关程度的一种统计量。
它的值介于-1和1之间。
总体相关系数的计算公式如下:ρ(X, Y) = Cov(X, Y) / (σₓ * σᵧ)其中- Cov(X, Y)是协方差;-σₓ是X的总体标准差;-σᵧ是Y的总体标准差。
样本相关系数的计算公式如下:r(X, Y) = Cov(X, Y) / (sₓ * sᵧ)其中- Cov(X, Y)是协方差;-sₓ是X的样本标准差;-sᵧ是Y的样本标准差。
解释:相关系数是通过协方差来度量两个变量之间的线性关系程度,其值介于-1和1之间。
4.3协方差及相关系数及其性质
(2) ρXY 1的充要条件是存在常数a,b 使 P{Y aX b} 1.
(2)证: 由柯西一许瓦兹不等式中等号成立( ρXY)1 充要条件知 存在常数 a 使 P{Y E(Y ) a(X E(X ))} 1.
即P{Y aX aE(X ) E(Y )} 1. 取b aE(X ) E(Y ),
0, 2aE(
X
)
0.
b
解得
b0
Cov(X ,Y D( X )
),
a0
E(Y
)
E(X
)Cov(X ,Y D( X )
).
将 a0,b0 代入 e E[(Y (a bX ))2]中,得
min e min E[(Y (a bX ))2 ]
a,b
a,b
E[(Y (a0 b0 X ))2]
C1n
C2n
为向量X的协方差矩阵。
Cn1 Cn2 Cnn
例6: 设(X,Y)N(µ1, µ2,σ12,σ22,),求向量(X,Y)'的 均值μ与协方差矩阵。
解: E(X)=μ1,E(Y)=μ2,
D(
X
)
2 1
,
D(Y
)
2 2
,
Cov( X ,Y ) 1 2
所以(X,Y)的均值为μ=(μ1,μ2)
为随机变量 X 与 Y 的相关系数.
若 XY 0, 称 X ,Y 不相关.
无量纲 的量
2. 说明 若随机变量 X 和Y 相互独立
Cov(X ,Y ) E{[X E( X )][Y E(Y )]}
E[X E( X )]E[Y E(Y )] 0.
3. 协方差的计算公式
法1.若 ( X ,Y ) 为离散型,已知pij
协方差及相关系数
=0
ρX X
所以 X 与 X 不相关
( 3 ) 独立性由其定义来判断
对于任意的常数 a > 0 , 事件 ( X < a ) ( X < a ), 且 P ( X < a ) > 0 , P ( X < a ) < 1,因此有 P( X < a, X < a) = P( X < a) P ( X < a)P( X < a) < P( X < a) 所以 P ( X < a , X < a ) ≠ P ( X < a ) P ( X < a ) 故 X 与 X 不独立
Cov ( X , Y ) = E ( XY ) EXEY = pq Cov ( X , Y ) ρ XY = =1 DX DY
例2 设 ( X ,Y ) ~ N ( μ1, σ12,μ2,σ22,ρ), 求 ρXY 解
令 x μ1
Cov ( X ,Y ) = ∫
σ1 y μ2 =t σ2
=s
ξ ,η 为 X , Y的线性组合
所以 ξ ,η 都服从正态分布 N ( 0, + b )σ ) (a
2 2 2
在正态分布中 , 不相关与独立是等价的
所以当 a = b 时, ξ ,η 独立 当 a ≠ b 时, ξ ,η 不独立
( 3) 当ξ ,η 相互独立时 , 即a 2 = b 2 , ξ ,η 都服从
例1 已知 X ,Y 的联合分布为 X Y 1 0 p 0 0 q 1 0 0 < p <1 p+q=1
求 Cov (X ,Y ), ρXY 解 X P 1 p 0 q Y P 1 p 0 q XY P 1 p 0 q
概率论协方差与相关系数
*
*
由此可得 | XY | 1 .
* * D ( X Y ) 2(1 XY ) ,易知 (2) 由上述证明,得
XY 1 的充分必要条件是
例1 已知 X ,Y 的联合分布为
Y
pij X
1 p 0
0 0 q 0 < p <1 p+q=1
1
0
求 Cov (X ,Y ), XY
解
X P 1 0 Y P 1 0 XY P 1 0
p q
p q
p
q
E ( X ) p, E (Y ) p, D( X ) pq, D(Y ) pq,
D( X * Y * ) 0 ,
* * * * E ( X Y ) E ( X ) E ( Y ) 0 及方差的性质知, 再由 上式
等价于
X E ( X ) Y E (Y ) P 0 1 , D(Y ) D( X )
取
则X ,Y 相互独立
0
X ,Y 不相关
例3 设 ( X ,Y ) ~ N ( 1,1,4,4,0.5 ), Z = X + Y , 求 XZ 解 D ( X ) D (Y ) 4,
Cov( X , Y ) XY DX DY 2 Cov( X , Z ) Cov( X , X ) Cov( X , Y ) 6
D( Z ) D( X Y ) D( X ) D(Y ) 2Cov( X , Y ) 12 3 故 XZ 3 / 12 2 .
例4 设 X , Y 服从圆域x2 y2 r 2上的均匀分布,证明
协方差和相关系数
ρ XY
Cov( X ,Y ) D( X ) D(Y )
称为随机变量 X 与 Y 的相关系数 .
3. 协方差的计算公式
(1) Cov( X ,Y ) E ( XY ) E ( X ) E (Y ); ( 2) D( X Y ) D( X ) D(Y ) 2 Cov( X ,Y ).
协方差
2. 定义
( X , Y )是二维随机变量 ,量 E{[ X E ( X )][Y E (Y )]} 称为随机变量X 与 Y 的协方差. 记为 Cov( X , Y ), 或 XY ,即 C ov( X , Y ) E{[ X E ( X )][Y E (Y )]}.
而
1
解:E ( X )
x dx dy 0 2 1 - 1-x + 同理 E (Y ) ypY ( y )dy - yp ( x, y )dxdy 0
1-x 2
xp X ( x) dx
+
-
xp( x, y )dydx
2 2 σ1
, x ,
( y μ2 ) 2
2 2σ 2
2 σ 2
, y .
2 2 E ( X ) μ1 , E (Y ) μ2 , D( X ) σ1 , D(Y ) σ 2 .
而 Cov( X , Y ) ( x μ1 )( y μ2 ) p( x , y ) d x d y
证明 (1 ) Cov( X , Y ) E {[ X E ( X )][ Y E (Y )]}
E[ XY YE ( X ) XE (Y ) E ( X ) E (Y )]
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
E ( XY ) 0 cov(X , Y ) E ( XY ) E ( X ) E (Y )
0.95 0.15 0.1425
例2 设二维随机变量 ( X , Y )的密度函数为
8 xy, 0 x y 1, f ( x, y ) = 其它 0,
性质1 性质2 性质3 性质4
cov( X , aX b) ? aD( X )
例1 设二ቤተ መጻሕፍቲ ባይዱ随机变量 ( X , Y )的联合分布律为: 求 cov( X , Y ).
X
Y -1
0 1 2 0.1 0.3 0.15
0
0.2 0.05 0
2
0 0.1 0.1
解: E( X ) 0.95,
E(Y ) 0.15,
E ( g( X )) g( x ) f ( x )dx
数学期望的性质 性质1 E (c ) c
性质2 E( X c ) E ( X ) c 性质3 E ( kX ) kE( X ) 性质4 E (kX c ) kE( X ) c 性质5 E ( X Y ) E ( X ) E (Y )
cov( X , Y ) E{[ X E ( X )][Y E (Y )]}
若( X , Y )是离散型,则 cov( X , Y )
[ x
i, j
i
E ( X )][ y j E (Y )] pij
若( X , Y )是连续型,则 cov( X , Y )
2
4
这表示 Y与X无线性关系。 X与Y不相关。
但 P{ X 2,Y 1} 0 P{ X 2}P{Y 1} X与Y不 独 立 。 事实上, Y X2
例4 设 ~ [ , ]上的均匀分布, 且 X sin , Y cos ,
判断 X 与Y 是否相关,是否独立.
华软软件学院课件
第16讲
协方差与相关系数
2、相关系数 3、数字特征复习
主要内容:1、协方差
重点:1-3 难点:2
1
一、协方差
对于多维随机变量,期望和方差只反映了各自的 平均值与偏离程度,并没有反映随机变量间的关系.
若X , Y相互独立,则 由方差性质的证明知, E{[ X E ( X )][Y E (Y )]} 0
D ( X ) 9,
cov( X , Y ) 6,
D( Z ) 7,
X Y 又 cov( X , Z ) cov( X , ) 3 2 1 1 cov( X , X ) cov( X , Y ) 3 2 1 1 D( X ) cov( X , Y ) 3 2
例5 已知 X ~ N (1 , 9), Y ~ (0,16) , 且 XY
1 , 2
X Y 设Z , 求 D( Z )及 XZ . 3 2 分析: 已知条件没有告诉 X与 Y 独立,所以求 Z 的方差 必须先求出 X与 Y 的协方差。 解: cov( X ,Y ) D( X )D(Y ) XY 6 X Y D( Z ) D( ) 3 2 1 1 X Y D( X ) D(Y ) 2 cov( , ) 9 4 3 2 1 1 1 1 D( X ) D(Y ) 2 cov( X , Y ) 7 9 4 3 2
XZ
cov( X , Z ) D( X ) D( Z )
6
2 7 3 7 7
6
思考与练习:
求D( X Y )与D( X Y ). cov(X ,Y ) 21,
1. 设( X ,Y )为 二 维 随 机 变 量 , D( X ) 49, D(Y ) 25, XY 0.6
◆ 离散型随机变量 X 的方差
D( X )
i 1
[ xi E ( X )]2 pi
◆ 连续型随机变量 X 的方差
D( X ) [ x E ( X )] f ( x )dx
2
由期望的性质,可得方 差的简便公式 D( X ) E( X 2 ) [ E( X )]2
E ( XY )
xyf ( x, y )dxdy
1
4 dx xy 8 xydy 0 9 x
1
cov(X , Y ) E ( XY ) E ( X ) E (Y )
4 32 9 75
4 225
练习: 设二维随机变量 ( X ,Y )的密度函数为
推论
E( X1 X 2 X n ) E( X1 ) E( X 2 ) E( X n )
方差
定义 随机变量 X 离差的平方的数学 期望称为 X 的方差 , 记作 D( X ) 或 2 . 即 D( X ) E[ X E ( X )]2 .
方 差 的 算 术 平 方 根 D( X ) , 称 为 X 的 均 方 差 或标准差 .
1 E( X ) 2 1 E(Y ) 2
cosd 0,
sind 0 ,
1 E ( XY ) 2
sin cosd 0 ,
E ( XY ) E ( X ) E (Y )
X与Y不相关. 但是 X 2 Y 2 1,所以 X与Y 不独立.
7 E ( X ) E (Y ) , 6
4 E ( XY ) , 3
二、相关系数
协方差是对两个随机变量的协同变化的度量 , 但是其 受度量单位的影响。 例如 , KX与 KY之间的统计关系和 X与Y之间的统计关 2 系应该一样,但协方差却扩大了K 倍。
即 cov(kX , kY ) k 2 cov(X , Y ).
35 ___, 2
6.设X与Y相 互 独 立 , 且 D( X ) 2, D(Y ) 1,
17 则D( 2 X 3Y ) ___
7.设 连 续 型 随 机 变 量 X的 分 布 函 数 为 : x0 0 1 3 3 3 0 3 x dx . 4 F ( x) x 0 x 1, 则E ( X ) ________ 1 x1 8. 设 连 续 型 随 机 变 量 X的 密 度 函 数 为 :
1 ( x y ), 0 x , y 2, 8 f ( x, y ) = 0, 其它
( x 1) , f X ( x) 4 0, 0 x2 其它
求 cov( X , Y ).
1 cov( X , Y ) E ( XY ) E ( X ) E (Y ) 36
反之,若E{[ X E( X )][Y E(Y )]} 0, 则X与Y不独立。
这说明 E{[ X E ( X )][Y E (Y )]} 在一定程度上
反映了X与Y之间的关系。
设(X,Y)为二维随机变量, 若
E{[ X E ( X )][Y E (Y )]}
存在,则称其为随机变量 X和Y 的协方差. 记作 cov(X,Y), 即
3.设X ~ E(1),则E( X e 2 X )
4 ____ 3
1 D(Y ) __ 4 . 4.设X ~ N (0,1), 且Y 2 X 1, 则E(Y ) __,
5. 掷5颗骰子, 则其点数和X的期望E ( X ) 方差D( X )
175 _____ . 12
方差的性质
性质1
D( c ) 0
性质2 D( X c ) D( X ) 性质3 D(cX ) c D( X )
2
性质4
若X与Y相互独立,则 D( X Y ) D( X ) D(Y )
常见分布的期望与方差 分 布 参数
0 p1 n 1,
数学期望
方差
p(1 p ) np (1 p )
4 x(1 x 2 ), f X ( x) 0,
求 cov( X , Y ).
0 x1 其它
1
4 y3 , 0 y 1 fY ( y ) 其它 0,
2
8 E ( X ) xf ( x )dx x 4 x(1 x )dx 0 15 1 4 3 E (Y ) yf ( y )dy y 4 y dy 0 5
D( X ) 9, D(Y ) 16,
cov(X ,Y ) XY D( X ) D(Y ) 2.4
课 后 作业
重点回顾 数学期望(均值)
E ( X ) xk pk
k 1
E ( g( X )) g( xk ) pk
k
E ( X ) x f ( x ) dx
X E( X ) Y E (Y ) * X , Y D( X ) D(Y )
*
为避免量纲的影响,取标准化随机变量
X E( X ) Y E (Y ) * X , Y D( X ) D(Y )
*
则cov(X * ,Y * )不再有量纲的影响。 定 义 设(X,Y)为 二 维 随 机 变 量 , D(X ) 0, D(Y ) 0, 称 cov( X , Y ) * * XY cov( X , Y ) D( X ) D(Y )
[ x E ( X )][ y E (Y )] f ( x, y )dxdy
此外,由期望的性质, 易得
cov( X , Y ) E ( XY ) E ( X ) E (Y )
特别地,当X与Y相互独立时,有
cov(X , Y ) 0.