方差与协方差理解
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§2 方差、协方差与相关系数
2.1方差
例1
比较甲乙两人的射击技术,已知两人每次击中环数分布为:
ξ:78901
0601...⎛⎝ ⎫⎭⎪
η:67
891001
02040201.....⎛⎝ ⎫⎭⎪. 问哪一个技术较好?
首先看两人平均击中环数,此时8E E ξη==,从均值来看无法分辩孰优孰劣. 但从直观上看,甲基本上稳定在8环左右,而乙却一会儿击中10环,一会儿击中6环,较不稳定.因此从直观上可以讲甲的射击技术较好.
上例说明:对一随机变量,除考虑它的平均取值外,还要考虑它取值的离散程度.
称ξ-E ξ为随机变量ξ对于均值E ξ的离差(deviation),它是一随机变量. 为了给出一个描述离散程度的数值,考虑用()E E ξξ-,但由于()E E ξξ-=E E ξξ-=0对一切随机变量均
成立,即ξ的离差正负相消,因此用()E E ξξ-是不恰当的. 我们改用(
)2
E E ξξ-描述取
值ξ的离散程度,这就是方差.
定义1 若()2
E E ξξ-存在,
为有限值,就称它是随机变量ξ的方差(variance),记作Var ξ,
Var ξ=(
)2
E E ξξ-
(1)
但Var ξ的量纲与ξ
不同,为了统一量纲,有时用ξ的标准差(standard deviation).
方差是随机变量函数(
)2
E ξξ-的数学期望,由§1的(5)式,即可写出方差的计算公式
Var ξ=2()d ()x E F x ξ
ξ+∞
-∞-⎰=22()(),,
()()d .i i i x E P x x E p x x ξξξξ+∞
-∞⎧-=⎪⎨⎪-⎩∑⎰离散型,连续型 (2)
进一步,注意到
()2
E E ξξ-=()222E E E ξξξξ⎡⎤-+⎣⎦=()22E E ξξ-
即有
Var ξ=
()2
2
E E ξξ-. (3)
许多情况,用(3)式计算方差较方便些. 例1(续) 计算例1中的方差Var ξ与Var η.
解 利用(3)式
2
E ξ=
∑=i
i i x P x
)
(2ξ=72×0.1+82×0.8+92
×0.1=64.2,
Var ξ=
()2
2
E E ξξ-=64.2--82=0.2. 同理, Var η=
()2
2
E E ηη-= 65.2-64 = 1.2 > Var ξ, 所以η取值较ξ分散. 这说明甲的射击技术较好.
例2 试计算泊松分布P(λ)的方差.
解
2
2
1
!
(1)!k
k
k k E k
e
k
e k k λ
λ
λλξ∞
∞
--====-∑∑
1
1(1)
(1)!(1)!k k
k k k e e k k λ
λ
λλ∞
∞
--===-+--∑∑
2
!
!
j
j
j j j
e
e j j λ
λ
λλλ
λ∞
∞
--===+∑∑
2
λλ=+
所以Var ξ=22
λλλλ+-=.
例3 设ξ服从[ a, b ]上的均匀分布U [a, b],求Var ξ.
解
()2
2
22
11
d 3
b
a
E x x a ab b b a ξ==++-⎰,
Var ξ()()2
221132a ab b a b ⎡⎤
=++-+⎢⎥⎣⎦()2
112b a =-.
例4 设ξ服从正态分布(
)2
,N a σ
,求Var ξ.
解 此时用公式(2),由于E a ξ=,
Var
ξ2
()E a ξ=-222
()/2()d x a x a x σ+∞
---∞
=-⎰
2
2
2/2d z z e z
∞
--∞
=
2
22/2
/2
z
z ze
e
dz +∞+∞
---∞
-∞
⎫=-+⎪
⎭⎰
22
2πσ=
=.
可见正态分布中参数2
σ就是它的方差, σ就是标准差.
方差也有若干简单而重要的性质. 先介绍一个不等式.
切贝雪夫(Chebyshev)不等式 若随机变量的方差存在,则对任意给定的正数ε,恒有
()2
Var P E ξξεξε-≥≤. (4)
证 设ξ的分布函数为()F x ,则
()
P E ξξε-≥=
⎰≥-ε
ξ||)(E x x dF 2
2
||()d ()
x E x E F x ξε
ξε
-≥-≤⎰
22
1
()d ()
x E F x ξε+∞
-∞
≤
-⎰
=Var ξ/2
ε.
这就得(4)式.
切贝雪夫不等式无论从证明方法上还是从结论上都有一定意义. 事实上,该式断言ξ落在
(),E ξε-∞-与(),E ξε++∞内的概率小于等于Var ξ/2
ε,或者说,ξ落在区间
(),E E ξεξε-+内的概率大于
1-Var ξ/ε2
,从而只用数学期望和方差就可对上述概率进
行估计.
例如,取 ε
(2
1Var P E ξξξ
-≤≥-≈0.89.
当然这个估计还是比较粗糙的(当ξ~()
2,N a σ时,在第二章曾经指出,
P(|ξ-E
ξ|≤ξ-a |≤3σ)≈0.997 ).
性质1 Var ξ=0的充要条件是P(ξ=c) =1,其中c 是常数.
证 显然条件充分. 反之,如果Var ξ= 0,记E ξ= c, 由切贝雪夫不等式, P(|ξ- E ξ|≥ε)=0 对一切正数ε成立. 从而
()P c ξ=()
10P c ξ=-->
()1lim 11
n P c n ξ→∞
=--≥=.