4.3 协方差与相关系数及矩与协方差矩阵
矩与协方差矩阵
4.1 数学期望 4.2 方差 4.3 协方差与相关系数 4.4 矩与协方差矩阵
§4.3 矩与协方差矩阵
4.4.1 矩
设X和Y(Xk) 为X 的 k 阶原点矩; E{[X-E(X)]k} 为X的 k 阶中心矩。
E(Xk) 为X 的 k 阶原点矩; E{[X-E(X)]k} 为X的 k 阶中心矩。
E(X) 是 X 的一阶原点矩, Var(X) 是 X 的二阶中心矩。
E(XkYm) 为X与Y的 k+m 阶混合原点矩; E{[X-E(X)]k [Y-E(Y)]m} 为X与Y的 k+m 阶混合中心矩。
Cov(X,Y)=E{[X-E(X)] [Y-E(Y)]} 为X与Y的 2阶混合中心矩。
小结
本讲首先介绍二维随机向量 (X,Y) 的分量X与Y 的协方差及相关系数的概念、性质和计算;然后介 绍随机变量的各种矩(k 阶原点矩、 k 阶中心矩、 k+m 阶混合原点矩、k+m 阶混合中心矩),n 维随机 向量的协方差阵的概念、性质和计算;最后简单介 绍了n 元正态分布的概念和三条重要性质。
4.3 协方差与相关系数及矩与协方差矩阵
由f ( x , y ) f X ( x ) fY ( y )可得X与Y不独立.
注意 1、设有随机变量X,Y,下列事实是等价的:
(1) cov( X ,Y ) 0
( 2) X与Y不相关
( 3) E ( XY ) E ( X ) E (Y ) (4) D( X Y ) D( X ) D(Y )
性质6 若X ,Y相互独立, 则cov( X ,Y ) 0;
性质7 若U ,V为随机变量, 且E (U 2 ), E (V 2 )都存在, 则
[ E (UV )]2 E (U 2 ) E (V 2 );
取U X E ( X ),V Y E (Y ), 则有 [cov( X ,Y )]2 D( X ) D(Y ).
定义3 若 cov( X ,Y ) 0或 XY 0,
则称随机变量X与Y不相关.
几点说明:
(1) cov( X ,Y ) E ( XY ) E ( X ) E (Y ), cov( X , X ) D( X ).
( 2)离散型 : cov( X ,Y ) [ xi E ( X )][ y j E (Y )] pij .
定义2
设( X ,Y )是二维随机变量 若 cov( X ,Y ), D( X ), D(Y )都 , cov( X ,Y ) 存在, 且D( X ) 0, D(Y ) 0, 则称 为随 D( X ) D(Y ) 机变量X与Y的相关系数或标准协方 , 记为 XY ,即 差
XY
cov( X ,Y ) . D( X ) D(Y )
ex3.设随机变量X的概率分布密度为 1 x f ( x) e x , 2 (1)求X的数学期望E(X)和方差D(X). (2)求cov(X,|X|),并问X与|X|是否不相关? (3)问X与|X|是否相互独立?为什么? 1 x 解 (1) EX xf ( x )dx x e dx 0, 2 DX E[ X E ( X )]2 E ( X 2 )
大学数学概率篇之随机变量的数字特征——协方差与相关系数概要
解得
Cov( X ,Y ) b0 D( X )
a0 E (Y ) b0 E ( X )
特别地, 当 X与 Y 独立时,有 cov( X ,Y ) 0. 完
二、协方差的性质 1. 协方差的基本性质
(1) cov( X , X ) D( X ); (2) cov( X ,Y ) cov(Y , X ); (3) cov( aX , bY ) ab cov( X ,Y ), 其中 a , b 是 常数; (4) cov(C , X ) 0, C 为任意常数; (5) cov( X1 X 2 ,Y ) cov( X1 ,Y ) cov( X 2 ,Y ); (6) 当 X 与 Y 相互独立, 则 cov( X ,Y ) 0.
X 与 Y 不相关.
例1 设X服从(-1/2, 1/2)内的均匀分布,而 Y=cos X, 不难求得,
Cov(X,Y)=0,
(请课下自行验证)
因而 =0, 即X和Y不相关 .
但Y与X有严格的函数关系,
即X和Y不独立 .
性质3. 若 D( X ) 0, D(Y ) 0, 则
XY 1
i 1 i 1 n n 1 i j n
cov( X , X
i
j
);
② 若 X 1 , X 2 ,, X n 两两独立, 则有
D( X i ) D( X i );
i 1 i 1
n
n
③ 可以证明: 若 X ,Y 的方差存在,则协方差
协方差
证明 (1) 由定理 知 ) 由定理4.1知 [cov( X,Y )] 2 = {E [( X − EX )(Y − EY )]}2 ≤ E [X − EX ]2 ⋅ E [Y − EY ]2 = DX ⋅ DY , 2 , 即 (ρ XY )2 ≤ 1 ,所以 ρ XY ≤ 1 . 因此 cov( X,Y )
独立与不相关都是随机变量之间相互联系程度的一种反映, 独立与不相关都是随机变量之间相互联系程度的一种反映 独立指的是X与 没有任何关系 不相关指的X与 之间没有线 没有任何关系, 独立指的是 与Y没有任何关系,不相关指的 与Y之间没有线 性相关关系. 性相关关系. 事实上, 独立, 一定不相关( 事实上,若X与Y独立,则X与Y一定不相关(这可以利用 与 独立 与 一定不相关 );但反过来 (4-10)和(4-19)进行证明);但反过来,若X与Y不相 - ) - )进行证明);但反过来, 与 不相 却未必独立. 关,则X与Y却未必独立. 与 却未必独立 然而,对于二维正态随机变量 ( X , Y ) 而言,X与Y的独立性 然而, 而言, 与 的独立性 与不相关性却是等价的,我们有如下结果: 与不相关性却是等价的,我们有如下结果: ( X , Y ) ~ N µ1 , µ 2 , σ 12 , σ 22, ρ 则 定理4.3 设 定理 ρ XY = ρ (4—32) )
(
)
显然, 证明 显然,我们有 E ( X ) = µ1 , DX = σ 12 , EY = µ 2 , DY = σ 22 ,而
推论 设 ( X , Y ) ~ N (µ1 , µ 2 , σ 12 , σ 22, ρ ) ,则X与Y相互独立的 与 相互独立的 充要条件是X与 不相关 不相关. 充要条件是 与Y不相关. ( X , Y ) ~ N (µ1 , µ 2 , σ 12 , σ 22, ρ ) ,则X 由定理3.3知 证明 由定理 知, 若 由定理4.3知 与Y相互独立的充要条件是 ρ = 0 ,由定理 知, ρ XY = ρ ,因 相互独立的充要条件是 相互独立的充要条件是X与 不相关 不相关. 此,X与Y相互独立的充要条件是 与Y不相关. 与 相互独立的充要条件是 □ 根据上面的讨论, 根据上面的讨论,二维正态随机变量( X , Y ) 的概率密度中 的参数 ρ 就是X和Y的相关系数,因而二维正态随机变量 ( X , Y ) 就是 和 的相关系数, 的相关系数 的分布就完全可由X和 的数学期望 的数学期望、 的分布就完全可由 和Y的数学期望、方差以及它们的相关系 数所确定. 数所确定. 随机变量除了前面介绍的数学期望、方差、 随机变量除了前面介绍的数学期望、方差、协方差以及它 们的相关系数等数字特征外,还存在许多其它的数字特征,下 们的相关系数等数字特征外,还存在许多其它的数字特征 下 面介绍另外几种常见的数字特征. 面介绍另外几种常见的数字特征. 三、矩的概念
协方差矩阵和相关系数矩阵
协方差矩阵和相关系数矩阵
协方差矩阵和相关系数矩阵是统计学中常用的两个矩阵,用于描述两个或多个随机变量之间的关系。
协方差矩阵衡量了不同随机变量之间的相关性和变异性,而相关系数矩阵则是协方差矩阵的归一化形式。
首先,让我们来谈谈协方差矩阵。
协方差矩阵是一个对称矩阵,它的元素是随机变量之间的协方差。
协方差反映了两个随机变量的共同变动程度。
具体而言,协方差的正负表示了两个变量是否呈现同向或反向的关系,而协方差的数值大小则反映了变量之间变动的幅度。
协方差矩阵由各对随机变量之间的协方差构成,是一个方阵。
与协方差矩阵相关的是相关系数矩阵。
相关系数矩阵是由协方差矩阵标准化得出的,用于消除量纲的影响并提供更直观的信息。
相关系数是将协方差除以各变量的标准差得到的。
相关系数矩阵的元素取值范围在-1到1之间,其中-1表示完全的反向相关,1表示完全的同向相关,而0表示无相关性。
协方差矩阵和相关系数矩阵在统计学和金融学中有广泛的应用。
它们可以帮助我们研究变量之间的关系,了解它们是否存在线性关联以及关联的强度。
通过分析协方差矩阵和相关系数矩阵,我们可以得出一些重要的结论,如哪些变量具有较强的相关性,哪些变量可以用来预测其他变量等等。
总结而言,协方差矩阵和相关系数矩阵是用于描述随机变量之间关系的重要工具。
协方差矩阵衡量了相关性和变异性,而相关系数矩阵进行了标准化以提供更直观的信息。
通过分析这些矩阵,我们可以深入了解变量之间的关联性,并在实际应用中做出更准确的判断和预测。
13讲协方差,相关系数,矩,正态分布
§4.4 n元正态分布的几条重要性质: 元正态分布的几条重要性质: (1). X =(X1, X2, …, Xn) ' 服从 n 元正态分布
对一切不全为 0 的实数 a1, a2, …, an, a1X1+ a2 X2+ …+ an Xn 服从正态分布。 服从正态分布。
(2). 若 X=(X1,X2, …,Xn)'服从 元正态分布, 服从n 服从 元正态分布, Y1,Y2,…,Yk 是 Xj (j=1, 2,…, n)的线性组合 的线性组合, … … 的线性组合 服从k 则(Y1,Y2, …, Yk)'服从 元正态分布。 服从 元正态分布。 这一性质称为正态变量的线性变换不变性。 这一性质称为正态变量的线性变换不变性。
i=1 i=1
n
n
协方差的大小在一定程度上反映了X 协方差的大小在一定程度上反映了 和Y 相互间的关系,但它还受X 相互间的关系,但它还受 和Y 本身度量单位 的影响。 例如: 的影响。 例如: Cov(aX, bY) = ab Cov(X, Y). 为了克服这一缺点, 为了克服这一缺点,对协方差进行标准 化,这就引入了相关系数 。
x2 +y2 ≤ 1 − 1 1
1−y xdx dy =π ∫−1 y ∫− 1−y
2 2
= ∫−10 dy = 0.
1
所以,Cov(X, Y)= E(XY)-E(X) E(Y) = 0 . 所以, 此外, 此外,Var(X) > 0, Var(Y) > 0 . 不相关。 所以, , 所以,ρXY = 0,即 X 与 Y 不相关。 但是, 与 不独立 不独立。 但是,X与Y不独立。
Cov( X,Y) ρ= = 0; Var( X )Var(Y)
43 协方差和相关系数精品PPT课件
4
12
45
XY
1 12 0.968 1 4 12 45
2) E( X ) 0, E( XY ) 0
XY 0
XY
0.968
:有96.8%的线性相似度,即在[0,1]之间,
y=x2与某条直线y=ax+b的图像差别不大。
XY 0 :根本就没有线性相关性,但有其他相关性。
三. 矩
XY
COV ( X ,Y ) 1 D( X )D(Y ) 2
例6 1) X ~ U (0,1),Y X 2 ,求 XY
2)X ~ U (1,1),Y X 2 ,求 XY
解1)
E( X ) 1 , E(Y ) 1 , E( XY ) 1 , D( X ) 1 , D(Y ) 4
2
3
解 DX 3, DY 1,
D(V ) 16D( X ) 9D(Y ) 24Cov( X ,Y ) 33, D(W ) 4D( X ) 16D(Y ) 16Cov( X ,Y ) 44,
Cov(V ,W ) Cov(4X 3Y 1,2X 4Y ) 8D( X ) 16Cov( X ,Y ) 6Cov(Y , X ) 12D(Y ) 22.
)
1 0
x 0
x
2dy
dx
2 3
D(X )
1 0
x 0
x2
2dy
dx
4 9
1 18
x=y D 1
E(Y
)
1 0
x 0
y
2dy
dx
1 3
D(Y )
1 x
0 0
y2
2dy
dx
1 9
1 18
E(XY )
§4.3 协方差、相关系数与矩
第4章
§4.3 协方差、相关系数与矩
第10页
4.3.2 独立性与不相关性
定义4.3.2 当 XY = 0 时,称 X 和 Y不相关. 不相关 独立 但也有例外 例如二维正态分布,独立与不相关等价
“独立” 必然导致 “不相关”, 而“不相关”不一定导致 “独立”
第4章
§4.3 协方差、相关系数与矩
(3)Cov(X1+X2, Y) = Cov(X1,Y) + Cov(X2,Y)
第4章 §4.3 协方差、相关系数与矩 例1 设二维随机变量的联合分布律为 X 0 1 Y 0 q 0 1 0 p 其中p+q=1,求相关系数XY. 解 由(X,Y)的联合分布律,可得X与Y的边缘分布律为
X P 0 q 1 p Y P 0 q
注 (1)若 X与Y独立,则Cov(X, Y)=0 (2)D(X±Y) = D(X) + D(Y)±2Cov(X, Y)
第4章
§4.3 协方差、相关系数与矩
第5页
4. 协方差的性质 (1)Cov(X, Y) = Cov(Y, X) (2)Cov(aX, bY) = abCov(X, Y), a,b 为常数
第4章
§4.3 协方差、相关系数与矩
第7页
例2 设二维(X,Y)随机变量的密度函数为
1 cos( x y ), 0 x , y 0 f ( x, y ) 2 2 2 0, 其它 求 cov( X , Y )
1 2 0 解 因为 E ( X ) x cos( x y)dxdy 0.7854, 2 0 -2 4
E (Y ) / 4,
0 1 2 E ( XY ) xy cos( x y)dxdy 1 0.5708, 2 0 2 2
概率论§4.3 协方差和相关系数
性质4 性质4 设X,Y 为随机变量,则有 , 为随机变量, D(X±Y)=D(X)+D(Y)±2Cov(X,Y) ± ± 性质5 性质5 设X,Y 为任意随机变量,则有 , 为任意随机变量, [Cov(X, Y)]2 ≤ D(X) D(Y) 证明: 证明: [Cov(X, Y)]2 =(E{[ X-E(X)][Y-E(Y)]})2 ≤ E{[X-E(X)]2}·E{[Y-E(Y)]2} = D(X)·D(Y) 柯西柯西许瓦兹 不等式
5
协方差的性质
性质1 协方差的计算与X, 性质1 协方差的计算与 ,Y 的次序无关 Cov(X, Y) = Cov(Y, X) 性质2 性质2 对任意常数 a1,a2,b1,b2 有 Cov(a1X+b1, a2Y+b2) = a1a2Cov(X, Y) 性质3 为随机变量, 性质3 设X1,X2 , Y1,Y2为随机变量,则有 Cov(X1+X2, Y)=Cov(X1, Y)+Cov(X2, Y) Cov(X, Y1+Y2)=Cov(X, Y1)+Cov(X, Y2)
= 4D(X) + D(Y) −4Cov( X,Y )
= 4×1+ 4 − 4×1 = 4
12
Cov(ξ,η) = Cov( X −2Y,2X −Y )
= 2Cov( X, X ) −4Cov(Y, X ) −Cov( X,Y) + 2Cov(Y,Y)
= 2D(X) −5Cov( X,Y ) + 2D(Y)
同理可得
5 E(Y ) = 12
2
15
D(X)=E(X2)−E2(X) − 同理可得
5 7 2 11 = −( ) = 144 12 12
协方差和相关系数矩和协方差矩阵
其中a= -t0,b=t0E(X)+E(Y)为常数.
首页
上页
返回
下页
结束
例4.已知(X,Y)的概率密度,试证X与Y既不相关,也不相互
独立。
f
( x,
y)
1
,
证明:(1) 因为
0,
x2 y2 1 其它
E(X )
证明:(1)考虑实变量t的二次函数
q(t) E{[(X - E(X )) t (Y - E(Y )]2}
E{[ X - E(X )]2}t2 2E{[ X - E(X )] [Y - E(Y )]}t E[Y - E(Y )]2}
D(X ) t 2 2Cov(X ,Y ) t D(Y )
解:X,Y的联合密度f(x,y)及边缘密度 fX(x), fY(y) 如下:
f (x, y)
1
e-
1 2(1-
2
[ )
(
x
-1 12
)2
-2
(
x
-
1 )( y- 1 2
2
)
(
y
-2
2 2
)2
fX (x)
2 1 2 1- 2
1
- ( x-1 )2
e
, 2
2 1
2 1
fY (y)
1
e , -
四、独立 ? 不相关
首页
上页
返回
下页
结束
n则协方差矩阵为上页下页?结束返回首页所以xy的协方差矩阵为2211cexexxfxydxdy???????????????????1022012cos1122rdrrddxdyxyx??????????102023202cos41cos1????????ddrrd2011cos21424d????????411122??cc????????????410041由对称性可知例1
协方差矩阵和相关系数矩阵的关系
协方差矩阵和相关系数矩阵的关系
协方差矩阵和相关系数矩阵在统计学中都有着重要的作用,它们之间存在着联系。
重要的是要理解这种联系,对于数据分析来说有着重要的意义。
一、协方差矩阵
协方差矩阵是衡量两组数据之间变化关系的度量,它提供了两个变量之间的变化情况,在数据分析中起着重要作用。
协方差矩阵是一种表示多元变量之间关联程度的矩阵,其中有N×N元素,N为变量的个数。
协方差矩阵的计算公式为:
cov(X,Y)=∑(xx)(yy)/n
其中,x和y分别是X和Y的样本值,x,y分别是X和Y的平均值,n为样本容量。
协方差矩阵可以用于衡量两组数据之间的变化关系,如果两组数据之间的变化一致,协方差矩阵的值将是正的;如果两组数据之间的变化相反,则协方差矩阵的值将为负的;如果两组数据之间没有任何关系,则协方差矩阵的值将为0。
二、相关系数矩阵
相关系数矩阵是用来研究两个或多个变量之间关系的一种统计
度量,它反映了变量之间的线性关系。
它介于-1和1之间,表示当这两个变量发生变化时,系数值越接近1,说明这两个变量之间的相关性越强;系数值越接近-1,说明这两个变量之间的负相关性越强;
如果系数值为0,说明这两个变量之间毫无关系。
相关系数矩阵的计算公式为:
r=cov(X,Y)/σxσy
其中,cov(X,Y)是协方差,σx,σy分别是X和Y的标准差。
总结
综上所述,协方差矩阵和相关系数矩阵之间有着密切的关系,协方差矩阵衡量的是两个变量之间的相关程度,而相关系数矩阵衡量的是两个变量之间的线性关系。
在数据分析中,理解这种联系,可以帮助我们更好地分析数据,提高分析的准确性。
概率论与数理统计(协方差及相关系数、矩)
实验步骤: 实验步骤: (1) 整理数据如图 所示. 整理数据如图4-5所示 所示.
图4-5 整理数据
(2) 计算边缘概率 计算边缘概率P{X = xi}和P{Y = yj} 和 在单元格G2中输入公式 : 在单元格 中输入公式: = SUM(B2:F2), 并将 中输入公式 , 其复制到单元格区域G3:G6 其复制到单元格区域 在单元格B7中输入公式: 在单元格 中输入公式:=SUM(B2:B6),并将其 中输入公式 , 复制到单元格区域C7:F7 复制到单元格区域 (3) 计算期望 计算期望E(XY) 首先在单元格B9中输入公式: 首先在单元格 中输入公式: 中输入公式 =MMULT(B1:F1,B2:F6), ,
−
π
∫ πcos zdz = 0, ∫ πsin z cos zdz = 0
−
1 E ( XY ) = 2π
π
因而Cov(X,Y) = 0,ρXY = 0. , 因而 , . 不相关, 相关系数ρXY = 0,说明随机变量 与Y不相关, ,说明随机变量X与 不相关 但是, 所以X与 不独立 不独立. 但是,由于 X 2 + Y 2 = 1 ,所以 与Y不独立.
Cov ( X , Y ) = E ( XY ) − E ( X ) E (Y ) = 19 / 400,
所以
ρ XY =
Cov( X , Y ) 19 / 400 133 = = = 0.87 D( X ) D(Y ) 153 / 2800 153
4.3.2 相关系数 下面不加证明地给出相关系数的两条性质: 下面不加证明地给出相关系数的两条性质: (1) |ρXY | ≤ 1; ; 的充要条件是, (2) |ρXY | = 1的充要条件是,存在常数 ,b,使 的充要条件是 存在常数a, P{Y = aX + b} = 1. . 定义4.6 若ρXY = 0,称X与Y不相关.0 < ρXY ≤ 1,称 定义 , 与 不相关. , 不相关 X与Y正相关,– 1 ≤ ρXY < 0,称X与Y负相关. 正相关, 负相关. 与 正相关 , 与 负相关 事实上,相关系数 事实上 相关系数ρXY是X与Y线性关系强弱的一个 与 线性关系强弱的一个 度量,X与 的线性关系程度随着 的线性关系程度随着| 的减小而减弱, 度量 与Y的线性关系程度随着 ρXY|的减小而减弱 的减小而减弱 的线性关系最强, 时 与 的线性关系最强 当|ρXY| = 1时X与Y的线性关系最强, 的不存在线性关系, 当ρXY = 0时,意味 与Y的不存在线性关系,即X 时 意味X与 的不存在线性关系 不相关. 与Y不相关 不相关
随机变量的矩协方差相关系数
2. 协方差、相关系数的定义 协方差、
量 E { [ X − E ( X ) ][Y − E (Y ) ] } 称为随机变量 X 与 Y 的协方差 . 记为 Cov( X , Y ) , 即 C ov( X , Y ) = E { [ X − E ( X )][Y − E (Y )]} .
而
2o 3o
4. 相关系数的性质
(1) ρXY ≤ 1.
( 2) ρXY = 1 的充要条件是 : 存在常数 a , b 使 P {Y = a + bX } = 1.
证明
(1) min e = E[(Y − (a + bX ))2 ]
1. 问题的提出
问 a , b 应如何选择 , 可使 aX + b 最接近 Y ? 接近的程度又应如何来 衡量 ?
设 e = E[(Y − (a + bX ))2 ]
则 e 可用来衡量 a + bX 近似表达 Y 的好坏程度 .
当 e 的值越小, 表示 a + bX 与 Y 的近似程度越好 . 确定 a , b 的值 , 使 e 达到最小.
ρXY =
Cov( X ,Y ) D( X ) ⋅ D(Y )
称为随机变量 X 与 Y 的相关系数 .
3. 说明
(1) X 和 Y 的相关系数又称为标准 协方差 , 它是一个 无量纲的量 .
( 2) 若随机变量 X 和 Y 相互独立 ⇒ Cov( X ,Y ) = E {[ X − E ( X )][Y − E (Y )]}
相关系数 .
解
由 f ( x, y ) =
1 2πσ1σ2 1 − ρ2
− 1 ( x − µ1 )2 ( x − µ1 )( y − µ2 ) ( y − µ2 )2 exp − 2ρ + 2 2 2 σ1σ2 σ2 2(1 − ρ ) σ1
概率论与数理统计电子教案:c4_3 协方差.相关系数与矩
3)C是非负定矩阵;
4)ci2j cii c jj , i, j 1,2,..., n
2020/8/27
4
协方差、相关系数、矩
二. 相关系数
定义:设二维随机变量X,Y的D(X)>0,D(Y)>0
称
XY
covX ,Y DX DY
为随机变量X与Y的相关系数。
注:1)ρXY是一无量纲的量。
a1a2 a1a2
XY
证明
相关系数是衡量两个随机变量之间线性相关程度 的数字特征.
2020/8/27
6
协方差、相关系数、矩
定义:设随机变量X,Y的相关系数存在
1)ρXY=1 称 X,Y正相关. 2)ρXY=-1 称 X,Y负相关. 3)ρXY=0 称 X,Y不相关.
注:ρXY=0仅说明X,Y之间没有线性关系,但可以 有其他非线性关系. 参见书上P116 例4.4.4.
2) XY
E
X
EX DX
Y
E
Y
D Y
E X * Y * cov X * ,Y *
2020/8/27
5
协方差、相关系数、矩
性质:设随机变量X,Y的相关系数ρ存在,则
1) |ρ|1
证明
2) |ρ|=1
X与Y依概率为1线性相关。即
, 0 s .t PY X 1
证明
3)若=a 1X+b1 , = a 2Y+b2 则
PY X 1
证明:" " 必要性 1时 由1)有
D X Y 0 E X Y 0
由 方 差 的 性 质4) 得
P X Y E X Y 1 即
P X Y 0 1
PY -
43协方差与相关系数
16 October 2020
第2章 随机变量及其分布
第13页
例1 已知 X ,Y 的联合分布为
pij X 1 Y
1
p
解0
0
X 01
0 0 < p <1,p + q = 1
0 求 Cov (X ,Y ).
q
Y 01
XY 0 1
P qp
P qp
P qp
E(X ) p, E(Y ) p, Cov(X ,Y )
[注] X 和 Y 的相关系数又称为标准协方差,它是一 个无量纲的量.
在不致引起混淆时,记 XY为 .
16 October 2020
第2章 随机变量及其分布
第21页
相关系数 XY 如何刻画X与Y的线性关系强弱的呢
我们希望用Y 与X的线性函数a+bX作比较!
设 e E[(Y (a bX ))2]
第2章 随机变量及其分布
Байду номын сангаас
第1页
第四章 随机变量的数字特征
§4.1 随机变量的数学期望 §4.2 随机变量的方差 §4.3 协方差与相关系数 §4.4 矩与协方差矩阵
16 October 2020
第2章 随机变量及其分布
第2页
§4.3 协方差与相关系数
➢ 数学期望反映了X 取值的中心. ➢ 方差反映了X 取值的离散程度.
非线性相关
不相关
第2章 随机变量及其分布
第9页
一、协方差的概念及性质
1. 问题的提出
如何描述随机变量之间线性关系的强弱?
16 October 2020
第2章 随机变量及其分布
第10页
2. 定义
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
则称它为X ,Y的k l阶混合原点矩. (4)若E{[ X E ( X )]k [Y E (Y )]l }(k , l 1,2,)存在, 则称它为X ,Y的k l阶混合中心矩.
所以,数学期望、方差、协方差都是矩,是特殊的矩.
• 如果随机变量的概率分布关于期望值是 对称的,则对一切奇数阶中心矩都等于 零。 • 通常用一个无量纲的量 3 / 来度量随 机变量分布的不非对称性,称它为偏态 系数。 • 四阶中心矩可以描述随机变量分布的尖 4 / 4 3来度量分布的 峭程度,通常用 尖峭程度,峰态系数
定义3 若 cov( X ,Y ) 0或 XY 0,
则称随机变量X与Y不相关.
几点说明:
(1) cov( X ,Y ) E ( XY ) E ( X ) E (Y ), cov( X , X ) D( X ).
( 2)离散型 : cov( X ,Y ) [ xi E ( X )][ y j E (Y )] pij .
cov( X ,Y ) E ( XY ) EX EY E ( XY )
x y 1
2 2
xy dxdy 0,
1
从而可知X与Y不相关.
1 x 2 1 1 x 2 dy x 1 而f X ( x ) f ( x , y )dy 0 其它 2 1 x2 y x 1 , 0 o x 其它
c11 c12 将它们排成矩阵的形式: , c21 c22
这个矩阵叫做 X ,Y )的协方差矩阵 ( .
一般地,
设n维随机变量( X1 , X 2 ,, X n )的二阶中心矩存在记为 ,
cij cov( X i , X j ) E{[ X i ( X i )][ X j E ( X j )]} ( i 1,2,, n)
i j
( 3)连续型 : cov( X ,Y ) [ x E ( X )][ y E (Y )] f ( x , y )dxdy.
ex1.设(X,Y)均匀分布于以坐标原点为中心,单位长为 半径的圆的内部,求cov(X,Y),并问X,Y是否不相 关?是否相互独立? 1 2 2 x y 1 解 f ( x , y ) , 0 其它 1 1 EX x dxdy 0, EY y dxdy 0, x 2 y 2 1 x 2 y 2 1
Chapter 4(3)
协方差与相关系数 及矩与协方差矩阵
教学要求:
1. 了解协方差、相关系数的概念与性质,并会计算;
2. 了解矩、协方差矩阵的概念与性质,并会计算.
一. 协方差与相关系数 二. 协方差与相关系数的性 质
三. 矩与协方差矩阵的概念
一、协方差与相关系数
E {[ X E ( X )][Y E (Y )]} E[ XY XE (Y ) YE ( X ) E ( X ) E (Y )] E ( XY ) E ( X ) E (Y ) E (Y ) E ( X ) E ( X ) E (Y ) E ( XY ) E ( X ) E (Y )
定义2
设( X ,Y )是二维随机变量 若 cov( X ,Y ), D( X ), D(Y )都 , cov( X ,Y ) 存在, 且D( X ) 0, D(Y ) 0, 则称 为随 D( X ) D(Y ) 机变量X与Y的相关系数或标准协方 , 记为 XY ,即 差
XY
cov( X ,Y ) . D( X质9
XY 1的充分必要条件是 与Y以概率1线性相关, X
即P{Y aX b} 1, 其中a , b是常数.
ex2.已知X和Y分别服从正态分布 N (1,32 )和N (0,42 ), 1 X Y 且X与Y的相关系数 XY , 设Z 2 3 2 (1)求Z的数学期望E(Z)和方差D(Z);
1 1 1 DX DY XY DX DY 9 4 3
1 1 1 1 9 16 3 4 3. 9 4 3 2 X Y cov X , X cov X , Y ( 2) cov( X , Z ) cov X , 3 3 2 2 1 1 cov( X , X ) cov( X ,Y ) 3 2 1 1 DX XY DX DY 3 2 1 2 1 1 3 3 4 0, 3 2 2 XZ 0.
定义5
设二维随机变量 X ,Y )的四个二阶中心矩存在记为 ( ,
c11 E[ X E ( X )]2 ,
c12 E{[ X E ( X )][Y E (Y )]}, c21 E{[Y E (Y )][ X E ( X )]},
c22 E[Y E (Y )]2 ,
2、X与Y不相关,是指X与Y之间不存在线性关系, 并非它们之间什么关系也没有. 3、独立性与不相关性,在一般情形是不等价的, X与Y独立时必有X与Y不相关,但反过来不一 定成立.
4、当(X,Y)服从二维正态分布时,X与Y独立与X与Y 不相关是等价的 .
二、协方差与相关系数的性质 性质1 cov( X ,Y ) cov(Y , X );
定义1
设( X ,Y )是二维随机变量 若E ( X ), E (Y ), D( X ), D(Y ) , 都存在, 则称E{[ X E ( X )][Y E (Y )]}为随机变量X 与Y的协方差, 记为cov( X ,Y )或 XY ,即
cov( X ,Y ) E{[ X E ( X )][Y E (Y )]}.
P ( X a, X a ) P ( X a ) P ( X a ),
即X与|X|不独立.
三、矩与协方差矩阵的概念 定义4 设X,Y是两个随机变量,
(1)若E ( X k )( k 1,2,)存在, 则称它为X的k阶原点矩,
记为 k E ( X k ).
( 2)若E[ X E ( X )]k ( k 1,2,)存在, 则称它为X的k阶 中心矩, 记为 k E[ X E ( X )]k . ( 3)若E ( X Y )( k , l 1,2,)存在,
故当X、Y相互独立时, 有 E {[ X E ( X )][Y E (Y )]} 0. 这就意味着当 E {[ X E ( X )][Y E (Y )]} 0 时X与Y不相互独立,而存在着一定的联系.
但这种联系不像函数关系那样具有确定的对应关系, 即不能用函数关系来描述,通常称这种联系为相关 性关系。这里用协方差与相关系数来刻划相关性关 系中的线性相关.
ex3.设随机变量X的概率分布密度为 1 x f ( x) e x , 2 (1)求X的数学期望E(X)和方差D(X). (2)求cov(X,|X|),并问X与|X|是否不相关? (3)问X与|X|是否相互独立?为什么? 1 x 解 (1) EX xf ( x )dx x e dx 0, 2 DX E[ X E ( X )]2 E ( X 2 )
1 2 x 1 x e dx 20 x e dx 2, 2 2 (2) cov( X , X ) E ( X X ) EX E X E ( X X ) 2 x
1 x x x f ( x )dx x x e dx 0, 2
c11 c12 c21 c22 c n1 cn 2 c1n c2 n cnn
称矩阵 : (cij )n n
为n维随机变量( X1 , X 2 ,, X n )的协方差矩阵 .
协方差矩阵为实对称矩阵. The end
故X与|X|不相关.
(3)对给定的0 a , ( X a ) ( X a ),
且P ( X a ) 0, P ( X a ) 1,
P ( X a, X a ) P ( X a ). 但P ( X a ) P ( X a ) P ( X a ),
2 1 y2 y 1 同理, fY ( y ) , 0 其它
由f ( x , y ) f X ( x ) fY ( y )可得X与Y不独立.
注意 1、设有随机变量X,Y,下列事实是等价的:
(1) cov( X ,Y ) 0
( 2) X与Y不相关
( 3) E ( XY ) E ( X ) E (Y ) (4) D( X Y ) D( X ) D(Y )
性质2 cov(aX , bY ) ab cov( X ,Y ), a , b为常数;
性质3 cov( X1 X 2 ,Y ) cov( X1 ,Y ) cov( X 2 ,Y ); 性质4 D( X Y ) D( X ) D(Y ) 2 cov( X ,Y ); 性质5 cov( X ,Y ) XY D( X ) D(Y );
性质6 若X ,Y相互独立, 则cov( X ,Y ) 0;
性质7 若U ,V为随机变量, 且E (U 2 ), E (V 2 )都存在, 则
[ E (UV )]2 E (U 2 ) E (V 2 );
取U X E ( X ),V Y E (Y ), 则有 [cov( X ,Y )]2 D( X ) D(Y ).
( 2)求X与Z的相关系数 XZ .
解 (1) EX 1, DX 9; EY 0, DY 16,
1 1 0 1 X Y 1 EZ E EX EY . 2 3 2 3 3 2 3
X Y X Y X Y DZ D D D 2 cov , 3 2 3 2 3 2 1 1 1 DX DY cov( X ,Y ) 9 4 3