13讲协方差,相关系数,矩,正态分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
x2 +y2 ≤ 1 − 1 1
1−y xdx dy =π ∫−1 y ∫− 1−y
2 2
= ∫−10 dy = 0.
1
所以,Cov(X, Y)= E(XY)-E(X) E(Y) = 0 . 所以, 此外, 此外,Var(X) > 0, Var(Y) > 0 . 不相关。 所以, , 所以,ρXY = 0,即 X 与 Y 不相关。 但是, 与 不独立 不独立。 但是,X与Y不独立。
协方差性质 (1). Cov(X, Y) = Cov(Y, X); ; (2). 设 a, b, c, d 是常数,则 是常数, Cov( aX+b, cY+d ) = ac Cov(X, Y) ; (3). Cov(X1+X2, Y)= Cov(X1, Y) + Cov(X2, Y) ; (4). Cov(X, Y) =E(XY)-[E(X)][E(Y)] , 相互独立时, 当 X 和 Y 相互独立时,Cov(X, Y)=0; ; (5). Var(X+Y)=Var(X)+Var(Y)+2Cov(X, Y) .
4.3.2 相关系数 定义2: 设Var(X) > 0, Var(Y) > 0, 则称 定义
Cov(X, Y) Var(X ) Var(Y)
ρXY =
为随机变量X 为随机变量 和Y 的相关系数 。 在不致引起混淆时, 在不致引起混淆时,记 ρXY 为 ρ 。
相关系数性质
(1). | ρ |≤1;
Cov( X,Y) ρ= = 0; Var( X )Var(Y)
并不一定能推出X和 独立。 但ρ=0 并不一定能推出 和 Y 独立。 反例: 反例:
例 1:设 (X,Y) 服从单位 D={ (x, y): x2+y2≤1} : 上的均匀分布,证明: 。 上的均匀分布,证明: ρXY = 0。 证明: 证明
概率论与数理统计 第十三讲
主讲教师: 主讲教师:张冬梅副教授 浙江工业大学理学院
§4.3 协方差与相关系数
对于二维随机向量(X,Y), 除了其分量X 对于二维随机向量 , 除了其分量 的期望与方差之外, 还有一些数字特征, 和Y 的期望与方差之外 还有一些数字特征 用以刻画X与 之间的相关程度 之间的相关程度, 用以刻画 与Y之间的相关程度,其中最主要 的就是协方差和相关系数。 的就是协方差和相关系数。 4.3.1 协方差 定义1: 存在, 定义 :若 E{[ X-E(X)][Y-E(Y)]} 存在, 则称其为X 的协方差,记为Cov(X,Y), 即 则称其为 与Y 的协方差,记为 Cov(X, Y) = E{[ X-E(X)][Y-E(Y) ]}. (1)
Baidu Nhomakorabea
性质(5)可推广到 个随机变量的情形 性质 可推广到n个随机变量的情形: 可推广到 个随机变量的情形:
Var(∑Xi ) = ∑Var(Xi ) + 2∑∑ (Xi , X j ) . Cov
i=1 i=1 i< j
n
n
两两独立, 若 X1, X2, …, Xn 两两独立,则
Var(∑Xi ) = ∑Var(Xi ) .
证:由方差与协方差关系,对任意实数 有 由方差与协方差关系,对任意实数b, 0≤Var(Y-bX)=b2Var(X)-2b Cov(X,Y ) +Var(Y ), 利用韦达定理得到 1-ρ 2≥ 0, 所以 | ρ |≤1。 。
(2). X 和Y 独立时 ρ=0,但其逆不真; 独立时, ,但其逆不真; 独立时, 由于当 X 和 Y 独立时,Cov(X, Y)= 0 . 所以, 所以,
(3). |ρ|=1
存在常数a, 存在常数 b(b≠0), ,
以概率1 使 P{ Y = a+bX } = 1 ,即 X和 Y以概率 和 以概率 线性相关。 线性相关。
前面, 我们已经看到: 前面 我们已经看到: 独立, 不相关;但由X 若X 与Y 独立,则X 与Y 不相关;但由 不相关,不一定能推出X与 独立 独立。 与Y 不相关,不一定能推出 与Y独立。 但对下述情形,独立与不相关是一回事: 但对下述情形,独立与不相关是一回事: 服从二维正态分布, 若(X, Y )服从二维正态分布,则X 与Y 独 服从二维正态分布 立的充分必要条件是X与 不相关 不相关。 立的充分必要条件是 与Y不相关。
(3). 设(X1,X2, …,Xn)服从 元正态分布,则 服从n元正态分布 服从 元正态分布, “X1, X2, …, Xn 相互独立” 等价于 相互独立” “X1,X2, …,Xn两两不相关”。 两两不相关”
设随机变量X和 相互独立 相互独立, 例2: 设随机变量 和Y相互独立,且X~N(1, 2), Y~N(0, 1)。求 Z = 2X-Y+3 的概率密度。 的概率密度。 。 相互独立, 解: 由X~N(1,2), Y~N(0,1),且X与Y相互独立 , 与 相互独立 服从正态分布, 知 Z=2X-Y+3 服从正态分布,且 E(Z) = 2E(X)-E(Y)+3 = 2-0+3=5 , Var(Z) = 4Var(X)+Var(Y) = 8+1 = 9, 故,Z~N(5, 32) .
1/π, (x, y) ∈D, f (x, y) = . 0, (x, y)∉D
E( X ) = =π
x2 + y2 ≤ 1 1 − 1
∫∫ x/π dxdy
∫−1 ∫−
1−y2 1−y2
x dx dy
= ∫ 10dy = 0, −
1
同样, E(Y)=0, 同样,得 E( )=0, E(XY) = ∫∫ (xy/π) dxdy
§4.4 n元正态分布的几条重要性质: 元正态分布的几条重要性质: (1). X =(X1, X2, …, Xn) ' 服从 n 元正态分布
对一切不全为 0 的实数 a1, a2, …, an, a1X1+ a2 X2+ …+ an Xn 服从正态分布。 服从正态分布。
(2). 若 X=(X1,X2, …,Xn)'服从 元正态分布, 服从n 服从 元正态分布, Y1,Y2,…,Yk 是 Xj (j=1, 2,…, n)的线性组合 的线性组合, … … 的线性组合 服从k 则(Y1,Y2, …, Yk)'服从 元正态分布。 服从 元正态分布。 这一性质称为正态变量的线性变换不变性。 这一性质称为正态变量的线性变换不变性。
i=1 i=1
n
n
协方差的大小在一定程度上反映了X 协方差的大小在一定程度上反映了 和Y 相互间的关系,但它还受X 相互间的关系,但它还受 和Y 本身度量单位 的影响。 例如: 的影响。 例如: Cov(aX, bY) = ab Cov(X, Y). 为了克服这一缺点, 为了克服这一缺点,对协方差进行标准 化,这就引入了相关系数 。
§4.3 矩与协方差矩阵
4.3.1 矩 定义1: 是随机变量, 定义 :设X是随机变量 若E(Xk) 存在 是随机变量 (k =1, 2, …), 则称其为 的 k 阶原点矩;若 则称其为X 阶原点矩; E{[X-E(X)]k} 存在 = 1,2, …), 则称其为 存在(k 则称其为X 阶中心矩。 的 k 阶中心矩。 易知: 易知:X 的期望 E(X) 是 X 的一阶原点 方差Var(X) 是 X 的二阶中心矩。 的二阶中心矩。 矩,方差
Z 的概率密度为
1 fZ (z) = e 3 2π
( z−5)2 − 18
, − ∞ < z < ∞.
小结
协方差及相关系数的概念、性质和计算; 协方差及相关系数的概念、性质和计算; 随机变量矩(k 阶原点矩、 阶中心矩); 随机变量矩 阶原点矩、 k 阶中心矩 ; n 元正态分布的概念和三条重要性质。 元正态分布的概念和三条重要性质。
1−y xdx dy =π ∫−1 y ∫− 1−y
2 2
= ∫−10 dy = 0.
1
所以,Cov(X, Y)= E(XY)-E(X) E(Y) = 0 . 所以, 此外, 此外,Var(X) > 0, Var(Y) > 0 . 不相关。 所以, , 所以,ρXY = 0,即 X 与 Y 不相关。 但是, 与 不独立 不独立。 但是,X与Y不独立。
协方差性质 (1). Cov(X, Y) = Cov(Y, X); ; (2). 设 a, b, c, d 是常数,则 是常数, Cov( aX+b, cY+d ) = ac Cov(X, Y) ; (3). Cov(X1+X2, Y)= Cov(X1, Y) + Cov(X2, Y) ; (4). Cov(X, Y) =E(XY)-[E(X)][E(Y)] , 相互独立时, 当 X 和 Y 相互独立时,Cov(X, Y)=0; ; (5). Var(X+Y)=Var(X)+Var(Y)+2Cov(X, Y) .
4.3.2 相关系数 定义2: 设Var(X) > 0, Var(Y) > 0, 则称 定义
Cov(X, Y) Var(X ) Var(Y)
ρXY =
为随机变量X 为随机变量 和Y 的相关系数 。 在不致引起混淆时, 在不致引起混淆时,记 ρXY 为 ρ 。
相关系数性质
(1). | ρ |≤1;
Cov( X,Y) ρ= = 0; Var( X )Var(Y)
并不一定能推出X和 独立。 但ρ=0 并不一定能推出 和 Y 独立。 反例: 反例:
例 1:设 (X,Y) 服从单位 D={ (x, y): x2+y2≤1} : 上的均匀分布,证明: 。 上的均匀分布,证明: ρXY = 0。 证明: 证明
概率论与数理统计 第十三讲
主讲教师: 主讲教师:张冬梅副教授 浙江工业大学理学院
§4.3 协方差与相关系数
对于二维随机向量(X,Y), 除了其分量X 对于二维随机向量 , 除了其分量 的期望与方差之外, 还有一些数字特征, 和Y 的期望与方差之外 还有一些数字特征 用以刻画X与 之间的相关程度 之间的相关程度, 用以刻画 与Y之间的相关程度,其中最主要 的就是协方差和相关系数。 的就是协方差和相关系数。 4.3.1 协方差 定义1: 存在, 定义 :若 E{[ X-E(X)][Y-E(Y)]} 存在, 则称其为X 的协方差,记为Cov(X,Y), 即 则称其为 与Y 的协方差,记为 Cov(X, Y) = E{[ X-E(X)][Y-E(Y) ]}. (1)
Baidu Nhomakorabea
性质(5)可推广到 个随机变量的情形 性质 可推广到n个随机变量的情形: 可推广到 个随机变量的情形:
Var(∑Xi ) = ∑Var(Xi ) + 2∑∑ (Xi , X j ) . Cov
i=1 i=1 i< j
n
n
两两独立, 若 X1, X2, …, Xn 两两独立,则
Var(∑Xi ) = ∑Var(Xi ) .
证:由方差与协方差关系,对任意实数 有 由方差与协方差关系,对任意实数b, 0≤Var(Y-bX)=b2Var(X)-2b Cov(X,Y ) +Var(Y ), 利用韦达定理得到 1-ρ 2≥ 0, 所以 | ρ |≤1。 。
(2). X 和Y 独立时 ρ=0,但其逆不真; 独立时, ,但其逆不真; 独立时, 由于当 X 和 Y 独立时,Cov(X, Y)= 0 . 所以, 所以,
(3). |ρ|=1
存在常数a, 存在常数 b(b≠0), ,
以概率1 使 P{ Y = a+bX } = 1 ,即 X和 Y以概率 和 以概率 线性相关。 线性相关。
前面, 我们已经看到: 前面 我们已经看到: 独立, 不相关;但由X 若X 与Y 独立,则X 与Y 不相关;但由 不相关,不一定能推出X与 独立 独立。 与Y 不相关,不一定能推出 与Y独立。 但对下述情形,独立与不相关是一回事: 但对下述情形,独立与不相关是一回事: 服从二维正态分布, 若(X, Y )服从二维正态分布,则X 与Y 独 服从二维正态分布 立的充分必要条件是X与 不相关 不相关。 立的充分必要条件是 与Y不相关。
(3). 设(X1,X2, …,Xn)服从 元正态分布,则 服从n元正态分布 服从 元正态分布, “X1, X2, …, Xn 相互独立” 等价于 相互独立” “X1,X2, …,Xn两两不相关”。 两两不相关”
设随机变量X和 相互独立 相互独立, 例2: 设随机变量 和Y相互独立,且X~N(1, 2), Y~N(0, 1)。求 Z = 2X-Y+3 的概率密度。 的概率密度。 。 相互独立, 解: 由X~N(1,2), Y~N(0,1),且X与Y相互独立 , 与 相互独立 服从正态分布, 知 Z=2X-Y+3 服从正态分布,且 E(Z) = 2E(X)-E(Y)+3 = 2-0+3=5 , Var(Z) = 4Var(X)+Var(Y) = 8+1 = 9, 故,Z~N(5, 32) .
1/π, (x, y) ∈D, f (x, y) = . 0, (x, y)∉D
E( X ) = =π
x2 + y2 ≤ 1 1 − 1
∫∫ x/π dxdy
∫−1 ∫−
1−y2 1−y2
x dx dy
= ∫ 10dy = 0, −
1
同样, E(Y)=0, 同样,得 E( )=0, E(XY) = ∫∫ (xy/π) dxdy
§4.4 n元正态分布的几条重要性质: 元正态分布的几条重要性质: (1). X =(X1, X2, …, Xn) ' 服从 n 元正态分布
对一切不全为 0 的实数 a1, a2, …, an, a1X1+ a2 X2+ …+ an Xn 服从正态分布。 服从正态分布。
(2). 若 X=(X1,X2, …,Xn)'服从 元正态分布, 服从n 服从 元正态分布, Y1,Y2,…,Yk 是 Xj (j=1, 2,…, n)的线性组合 的线性组合, … … 的线性组合 服从k 则(Y1,Y2, …, Yk)'服从 元正态分布。 服从 元正态分布。 这一性质称为正态变量的线性变换不变性。 这一性质称为正态变量的线性变换不变性。
i=1 i=1
n
n
协方差的大小在一定程度上反映了X 协方差的大小在一定程度上反映了 和Y 相互间的关系,但它还受X 相互间的关系,但它还受 和Y 本身度量单位 的影响。 例如: 的影响。 例如: Cov(aX, bY) = ab Cov(X, Y). 为了克服这一缺点, 为了克服这一缺点,对协方差进行标准 化,这就引入了相关系数 。
§4.3 矩与协方差矩阵
4.3.1 矩 定义1: 是随机变量, 定义 :设X是随机变量 若E(Xk) 存在 是随机变量 (k =1, 2, …), 则称其为 的 k 阶原点矩;若 则称其为X 阶原点矩; E{[X-E(X)]k} 存在 = 1,2, …), 则称其为 存在(k 则称其为X 阶中心矩。 的 k 阶中心矩。 易知: 易知:X 的期望 E(X) 是 X 的一阶原点 方差Var(X) 是 X 的二阶中心矩。 的二阶中心矩。 矩,方差
Z 的概率密度为
1 fZ (z) = e 3 2π
( z−5)2 − 18
, − ∞ < z < ∞.
小结
协方差及相关系数的概念、性质和计算; 协方差及相关系数的概念、性质和计算; 随机变量矩(k 阶原点矩、 阶中心矩); 随机变量矩 阶原点矩、 k 阶中心矩 ; n 元正态分布的概念和三条重要性质。 元正态分布的概念和三条重要性质。