最新第四章-随机变量的数字特征总结
概率统计 第四章 随机变量的数字特征
i1 j1
E(Z ) E(g(X ,Y ))
g(xi , y j ) pij
i1 j1
(2)设(X,Y)是连续型随机变量,概率密度为f(x,y),则当
g(x, y) f (x, y)dxdy
绝对收敛时,Z的数学期望存在,且
E(Z ) E(g(X ,Y ))
g(x, y) f (x, y)dxdy
此定理说明,在求随机变量X的函数Y=g(X)的期
望时,不必知道Y的分布而只需知道X的分布即可。
定理4.1.2设(X,Y)是二维随机变量,Z=g(X,Y),g(•,•)是 连续函数。
(1)设(X,Y)是离散型随机变量,分布律为
P(X=xi,Y=yj)=pij,i,j=1,2,…
则当 g(xi , y j ) pij 绝对收敛时,Z的数学期望存在,且
解 设Xj为第j组的化验次数,j=1,2,…,10, X为1000人的化验次 数,则Xj的可能取值为1,101,且
Xj
1
101
Pj (99%)100 1-(99%)100
EX j 0.99100 (101)(1 0.99100 )
10
10
E(X ) E( X j ) E(X j )
j 1
第四章 随机变量的数字特征、极限定理
数学期望
几种重要分布的数学期望与方差 矩、协方差和相关系数 分位点、众数与其它数字特征
3.1数学期望
1.数学期望的定义 一、离散型随机变量的数学期望
例3.1 甲、乙两射手进行射击训练,已知在100次射击 中命中环数与次数记录如下:
甲 环数 8 9 10
乙 环数 8 9 10
因此从平均射中的环数看,甲的技术优于乙。
第四章随机变量的数字特征解读
f
(x)
1 π(x2 1)
,
x
求E(X )
解:E(X ) 1
π
x (x2 1) dx
因为广义积分
| x | (x2 1)
dx
不收敛
所以E( X )不存在
二、二维随机变量的数学期望
定义二维随机变量 (X ,Y )数学期望为 E(X ,Y ) (EX , EY )
设二维随机变量 (X ,Y )的联合分布律为
X
x1
pk f (x1)x1
x2
…
xk …
f (x2)x2 … f (xk) xk …
它的数学期望是
lim
0 k
xk
f
(xk
)x k
x f
( x)dx
x f (x)dx
的积分和式
这启发我们引出如下连续型随机变量的数学期望定义:
2、连续型随机变量的数学期望
定义2 设连续型随机变量 X的概率密度为 f (x), 若积分
第四章 随机变量的数字特征
第一节 第二节 第三节 第四节 第五节
数学期望 方差 协方差与相关系数 矩 协方差矩阵 二维正态分布
引言
前面的课程中,我们讨论了随机变量及其分布,如果知道 了随机变量X 的概率分布,那么X 的全部概率特征也就知道了.
p(x)
f (x)
o
x
o
x
但在实际问题中,概率分布一般是较难确定的. 而且在 一些实际应用中,人们并不需要知道随机变量的一切概率 性质,只要知道它的某些数字特征就够了.
例如,评定一批灯泡的质量, 主要应看这批灯泡的平均 寿命和灯泡寿命相对于平均寿命的偏差.平均寿命越长,灯泡 的质量就越好,灯泡寿命相对于平均寿命的偏差越小,灯泡的 质量就越稳定.
概率论第四章总结-精品文档
XY
=
数.
Cov ( X ,Y ) D( X ) D(Y)
称为随机变量X与Y的相关系
2.基本性质
7)| |=1的充要条件是,存在常数 a,b使得 P{Y=a+bX}=1
XY
1)Cov(X,Y)=Cov(Y,X) , Cov(X,X)=D(X).
5)Cov(X1+X2,Y)=Cov(X1,Y)+Cov (X2,Y). 6)| |≤1. *当=0时,称X与Y不 相关.
XY
2)D(X+Y)=D(X)+D(Y)+2Cov(X,Y) 3)Cov(X+Y)=E(XY)-E(X)E(Y).
4)Cov(aX,bY)=abCov(X,Y),a,b是常数.
3.例题 • 设随机变量X ~ N( , ),Y ~ N( , ),且设X,Y相互独立,试求 • Z1=aX+bY和Z2=aX-bY的相关系数(其中a,b是不为零的常数).
The key
解:E[(X-C)2]=E(X2-2CX+C2)=E(X2)-2CE(X)+C2=E(X2) -[E(X)]2+{[E(X)]2-2CE(X)+C2}=D(X)-[E(X)-C]2 ≥ D(X),等 号当且仅当C=E(X)时成立.
三、协方差及相关系数
1.定义
量E{(X-E(X))(Y-E(Y))}称为随机变量X与Y的协方差. 记为Cov(X,Y),即 Cov(X,Y)=E{(X-E(X))(Y-E(Y))}
,
j=1,2,····,说明X的 数学期望不存在. 例2.将n只球(1—n号)随 机的放进n个盒子(1—n号) 中,一个盒子装一只球.若
3j j
随机变量的数字特征
1 2 3 求E(Z)
-1 0 0.1 1
0.4 0.2 0.4
解:方法一:
(1) E(X)=1*0.4+2*0.2+3*0.4=2 E(Y)=-1*0.3+0*0.4+1*0.3=0
方法二:
(1)E(X)=0.2*1+0.1*2+0*0.3+0.1*1+0*2+0.3*3+0.1*1+0.1*2+0.1*3=2
E( X ) xk pk . k 1
E( X ) 0 0.2 0.2 0.2 0.2 0.2 1 (元)
例题:有 5 个相互独立工作的电子装置,它们的寿命Xk (k 1, 2,3,4,5) 服从同一指数分布,其概率密度为
f
(
x
)
1
e
x
/
,
x 0, 0.
0,
x 0,
1) 若将5个装置串联成整机,求整机寿命 N 的数学期望;
若 g(xk )pk 绝对收敛,则有
k 1
E(Y ) E[g( X )] g(xk )pk .
k 1
2). X 是连续型随机变量,概率密度为 f (x),
若 g(x) f (x)dx 绝对收敛,则有
E(Y ) E[g( X )] g(x) f (x)dx
(证明超过范围,略)
说明: 在已知Y是X的连续函数前提下,当我们求
E(Y)时不必知道Y的分布, 只需知道X的分布就可
以了.
Y x42
0
4
例: 设随机变量 X 的分布律为 X -2
0
2
求:E( X ), E( X 2 ), E(3X 2 5). P 0.4 0.3 0.3 解:(1)E(X) 2 0.4 0 0.3 2 0.3 0.2,
第四章随机变量的数字特征
X pk
0 p0
1 p1
2 p2
现射击N次,其中得0分的有 a0 次,得1分的有 a1次, 得2分的有 a2 次, a0 a1 a2 N . 于是,射击N次 的总分为
0 a0 1 a1 2 a2 .
河南理工大学精品课程
概率论与数理统计
从而,每次射击的平均分为 2 0 a0 1 a1 2 a2 ak k . N N k 0 在第五章大数定律中可证明:当N无限增大时, ak pk PX k ,故当N很大时, 频率 接近于概率
(2)
河南理工大学精品课程
pk对 , f( x) 敛 , 其中无穷级数或广义积分均绝 收 分 别为离散型随机变量X的分布律或连续型随机变量X 的概率密度。
概率论与数理统计
定理2 Z=g(X,Y)是随机变量(X,Y)的连续函数, 则Z也是随机变量,且其数学期望为
离散型 g ( xi , y j ) pij , i 1 j 1 (3) E ( Z ) E[ g ( X , Y )] g ( x, y ) f ( x, y )dxdy, 连续型
5 x 1 e x0 5 FN ( x) 1 [1 F ( x)] x0 0
其密度函数为
②并联: M=max{X1, X2, X3, X4, X5}的分布函数为:
x 5 (1 e ) x0 5 FM ( x) [ F ( x)] x0 0
X2 Pk 3X2+5 Pk 0 0.3 5 0.3 4 0.7 17 0.7
于是,
E(X)=(-2)×0.4+0×0.3+2×0.3=-0.2;
河南理工大学精品课程 概率论与数理统计
第四章随机变量的数字特征要点
第四章 随机变量的数字特征要点一、数学期望的定义和性质1、数学期望是反映随机变量取值平均状态的数字特征 离散型: E(X)=i i x p ∑2、数学期望定义连续型:E(X)=⎰+∞∞-dx x xf )(3、数学期望的性质:(1) E(C)=C C 为常数,下同 (2)E(CX)=CE(X) (3)E(X+Y)=E(X)+E(Y)结合(1)(2)(3)可以推广为 E(C 1X 1+C 2X 2+…+C n X n )=C 1E(X 1)+C 2E(X 2)+ …+C n E(X n ) (4)若X,Y 互相独立,则 E(XY)=E(X)E(Y)可以推广为 若X 1,X 2,…,X n 互相独立,则E(X 1X 2,…X n )=E(X 1)E(X 2) …E(X n ) 二、方差的定义和性质1、方差是反映随机变量取值(相对于均值)集中程度的数字特征2、方差的定义和计算D(X)= E[X-E(X)]2 (用于定义,也可用于计算,但计算一般用下式方便) D(X)= E(X 2)- [E(X)]2 (用于计算,只要计算机出E(X)和E(X 2)相减即可) 3、方差的性质(1) D(C)=0 , D(X+C)=D(X) C 为常数,下同(2)D(CX)=C2D(X) (注意:C提到方差号外以后是C的平方)(3)若X与Y互相独立,则D(X±Y)=D(X)+D(Y) (注意独立条件)可以推广到n个互相独立随机变量情况:D(C1X1±C2X2±…±C n X n)=C12D(X1)+C22D(X2)+ …+Cn2D(Xn)三、协方差的定义和性质1、协方差反映的是两个随机变量的关系密切程度的数字特征2、协方差的定义与计算(1)定义式:COV(X,Y)=E[(X-E(X))(Y-E(Y)](2)计算式:COV(X,Y)=E(XY)-E(X)E(Y)3、协方差的性质(1)COV(X,Y)=COV(Y,X)(2)COV(ax,by)=abCOV(X,Y) a,b为常数(3)COV(X1+X2,Y)=COV(X1,Y)+COV(X2,Y)(4)若X,Y互相独立⇒ COV(X,Y)=0 (反过来不成立)4、协方差与方差的关系(1)COV(X,Y)=E(XY)-E(X)E(Y)时YX=COV(X,X)=E(X2)-[E(X)]2=D(X) (2) 一般情况下:D(X+Y)=D(X)+D(Y)+2COV(X,Y)X,Y独立时,由于COV(X,Y)=0⇒D(X+Y)=D(X)+D(Y)四、相关系数的定义和性质1、相关系数也是反映两个随机变量的关系的数字特征2、相关系数的定义: = D(X)>0 D(Y)>03、相关系数的性质:相关系数4、相关系数的意义:相关系数是两个随机变量间线性关系密切程度的度量,越接近1,X与Y的线性关系越密切,时,X与Y存在完全的线性关系;当时,X与Y无线性关系,称X与Y线性无关,或X与Y不相关。
概率论及数理统计:第四章 随机变量的数字特征
E(X k) E(| X |k )
— X 的 k 阶原点矩 — X 的 k 阶绝对原点矩
E(( X E( X ))k ) — X 的 k 阶中心矩
E(( X E( X ))2 ) D( X )
— X 的 方差
E( X kY l )
Ch4-12
— X ,Y 的 k + l 阶混合原点矩
E ( X E( X ))k (Y E(Y ))l
B(n,p)
P()
几何分布
P( X 1) p
P( X 0) 1 p
p
P(X
k)
C
k n
pk (1
p)nk
np
k 0,1, 2, , n
ke
P(X k)
k!
k 0,1, 2,
P( X k ) p(1 p)k1
1
0 p 1 k 0,1, 2,
p
分布 区间(a,b)上的 均匀分布
Ch4-27
例 将 4 个球随机地放入 4 个盒子中,每盒容纳 的球数无限,求空着的盒子数的数学期望.
解一 设 X 为空着的盒子数,则 X 的概率分布为
X0 1
P
4! C41C
1 3
P42
44
44
2
3
C
2 4
(C
2 4
C21C43
)
C41
44
44
E( X ) 81 64
解二 再引入 X i ,i = 1,2,3,4
注:逆命题不成立,即 E (X Y ) = E (X )E (Y ) X,Y 不一定 相互独立, 反例有兴趣见后续
若存在常数 a 使 P(X a) = 1, 则 E (X ) a ;
概率论与数理统计第4章 随机变量的数字特征与极限定理
25
定义4.3 设X是随机变量,若E[X-E(X)]2存 在,则称它为X的方差,记为D(X),即
由定义4.2,随机变量X的方差反映了X的可能取值 与其数学期望的平均偏离程度.若D(X)较小,则X的 取值比较集中,否则,X的取值比较分散.因此,方差 D(X)是刻画X取值离散程度的一个量.
3
定义4.1 设离散型随机变量X的分布律为
4
5
6
7
8
9
4.1.2 几个常用分布的数学期望 1.0—1分布 设随机变量X服从以p为参数的(0—1)分布,则X 的数学期望为
2.二项分布 设随机变量X~B(n,p),则X的数学期望为
10
3.泊松分布 设随机变量X~P(λ)分布,则X的数学期望为
41
Hale Waihona Puke 424.3 协方差、相关系数及矩
4.3.1 协方差 对于二维随机变量(X,Y),除了分量X,Y的数 字特征外,还需要找出能体现各分量之间的联系的数字 特征.
43
44
4.3.2 相关系数 定义4.5 设(X,Y)为二维随机变量,cov (X,Y),D(X),D(X)均存在,且D(X)>0,D(X) >0,称
15
16
17
定理4.2 设(X,Y)是二维随机变量,z=g(x,y) 是一个连续函数. (1)如果(X,Y)为离散型随机变量,其联合分布 律为
18
19
20
4.1.4 数学期望的性质 数学期望有如下常用性质(以下的讨论中,假设所 遇到的数学期望均存在):
概率论与数理统计第4章复习
第四章 随机变量的数字特征一、 随机变量的数学期望1. 离散型随机变量数学期望设离散型随机变量X 的分布律为:,...2,1,}{===k p x X P k k 若级数∑kk k p x 绝对收敛,则称级数∑kk k p x 的和为随机变量X 的数学期望,记为E(X),即∑=kk kp xX E )(。
2. 连续型随机变量数学期望设连续型随机变量X 的概率密度函数为)(X f ,若积分⎰+∞∞-dx x xf )(绝对收敛,则称积分⎰+∞∞-dx x xf )(为随机变量X 的数学期望,记为E(X),即⎰+∞∞-=dx x xf X E )()(.数学期望简称期望或均值,他反映了随机变量所有可能取值的一种平均。
3. 随机变量函数的期望(1) 设X 是随机变量,)(x g y =为实变量x 的函数。
1) 若X 是离散型随机变量,其分布律为:,}{k k p x X P == 1=k ,2,3,...,且级数∑kk k p x g )(绝对收敛,则∑==kk kp xg x g E Y E )()]([)(2) 若X 市连续型随机变量,其密度函数为)(x f ,且积分⎰+∞∞-dx x f x g )()(绝对收敛,则⎰+∞∞-==dx x f x g x g E Y E )()()]([)((2) 设(X ,Y )是二维随机变量,),(y x g z =为实变量x ,y 的二元函数。
1) 若(X ,Y )是离散型随机变量,其分布律为:,),(ij i i p y Y x X P ===,.....2,1,=j i 且∑∑ijij j ip y xg ),(绝对收敛,则∑∑==ijij j ip y xg Y X g E Z E ),()],([)(2) 若(X ,Y )是连续型随机变量,其密度函数为),(y x f ,且⎰⎰+∞∞-+∞∞-dxdy y x f y x g ),(),(绝对收敛,则⎰⎰+∞∞-+∞∞-==dxdy y x f y x g Y X g E Z E ),(),()],([)(。
概率论与数理统计第四版课后学习资料第四章
(4.1)
i,j 1, 2, 3,
则有E(Z) E g(X, Y) g(x i ,y j )p ij , (4.2) (假设级数绝对收敛)
例. 设随机变量(X, Y)的概率密度为 3 , 1 y x.x 1 x 3 2 f(x,y) 2x y 0, 其它, 1 试求 : E(Y),E( ) XY
e
1 x
dx
1 t x
2
0
t 2 e t dt 22 ,
D(X) E(X2 ) -[ E(X)]2 2 .
30 正态分布: 设X~N(, 2 ), 则
解 : E(X)
2
t2 2
1
xe
t2 2
-
(x )2 22
例. 二项分布的均值的计算: 设X~b(n,p),引入r.v.Xi(i=1, 2, …, n), 它们是相互独 立的且都服从0--1分布: P{Xi=1}=p, P{Xi=0}=q, X表 示n次独立重复试验中A发生的次数,Xi表示第i次试 验的结果:Xi=1表示A发生, Xi=0表示A不发生, 所以
解: 计算X1的均值, 由定义有 E(X1) =00+1 0.2+2 0.8=1.8 E(X2)=00.6+1 0.3+2 0.1=0.5
显然,乙的成绩比甲的差.
例2. 有2个相互独立工作的电子装置, 它们的寿命Xk (k 1, 2 )服从同一指数分布, 其概率密度为:
x 1 e , x 0, f(x) θ 0, 0, x 0,
i
n
故 E(X) np D(X) npq.
概率论与数理统计 第4章 随机变量的数字特征
解:
1 (5 0.5x)( 3 x2 x)dx
0
2
4.65(元)
2021/7/22
21
4.1.2 随机变量函数的数学期望
将定理4.1推广到二维随机变量的情形.
定理4.2 设Z是随机变量X,Y的函数Z = g(X,Y), g是连续函数.
(1) 若(X,Y)是二维离散型随机变量,其分布律
为P{X xi ,Y yj } pij, i, j 1,2,, 则有
解:由于 P{ X k} k e ,k = 0,1,2,…,
k!
因而
E( X ) kP{ X k} k k e
k0
k0 k!
k e
k1 (k 1)!
e
k 1
k1 (k 1)!
e k ee k0 k!
2021/7/22
12
4.1.1 数学期望的概念
2. 连续型随机变量的数学期望
2021/7/22
18
4.1.2 随机变量函数的数学期望
定理4.1 设Y为随机变量X的函数:Y = g(X) (g是连续
函数).
(1) 设X是离散型随机变量,其分布律为
P{X xk } pk , k 1,2,
若级数 g( xk ) pk绝对收敛,则 E(Y ) E[g( X )] g( xk ) pk
f ( x) 25( x 4.2), 4 x 4.2,
0,
其 它.
求pH值X的数学期望E(X).
解:
E( X ) xf ( x)dx
4
4.2
x 25( x 3.8)dx x (25)(x 4.2)dx
3.8
4
4
2021/7/22
15
(完整)第四章随机变量的数字特征总结,推荐文档
随机变量的数字特征——总结第四章 随机变量的数字特征㈠ 数学期望 表征随机变量取值的平均水平、“中心”位置或“集中”位置.1、数学期望的定义(1) 定义 离散型和连续型随机变量X 的数学期望定义为{}⎪⎩⎪⎨⎧==⎰∑∞∞- d )( )()( ,,连续型离散型x x xf x X x X kk k P E 其中Σ表示对X 的一切可能值求和.对于离散型变量,若可能值个数无限,则要求级数绝对收敛;对于连续型变量,要求定义中的积分绝对收敛;否则认为数学期望不存在.①常见的离散型随机变量的数学期望1、离散型随机变量的数学期望 设离散型随机变量的概率分布为,若,则称级数为随机变量的数学期望(或称为均值),记为, 即2、两点分布的数学期望 设服从0—1分布,则有,根据定义,的数学期望为. 3、二项分布的数学期望 设服从以为参数的二项分布,,则。
4、泊松分布的数学期望 设随机变量服从参数为的泊松分布,即,从而有。
①常见的连续型随机变量的数学期望1)均匀分布设随机变量ξ服从均匀分布,ξ~U [a ,b ] (a <b ),它的概率密度函数为:随机变量的数字特征——总结= 则=∴ E(ξ)=(a+b)/2.即数学期望位于区间的中点.2)正态分布设随机变量ξ服从正态分布,ξ~N(μ,σ2),它的概率密度函数为:(σ>0,- <μ<+)则令得∴ E(ξ)=μ .3)指数分布设随机变量服从参数为的指数分布,的密度函数为 ,则.(2) 随机变量的函数的数学期望设为连续函数或分段连续函数,而X是任一随机变)(xgy=量,则随机变量的数学期望可以通过随机变量X的概率分布直接来求,而不必先求出的概)(XgY=Y率分布再求其数学期望;对于二元函数,有类似的公式:),(YXgZ=(){}⎪⎩⎪⎨⎧===⎰∑∞∞.;(连续型)离散型-d)()()()(xxfxgxXxgXgY kkkPEE()(){}()()()()⎪⎩⎪⎨⎧====⎰⎰∑∑∞∞-∞∞-.;连续型离散型dd,,,,,yxyxfyxgyYxXyxgYXgZi jjijiPEE设(,)X Y为二维离散型随机变量,其联合概率函数(,),,1,2,,i j ijP X a Y b p i j====如果级数(,)i j ijj ig a b p∑∑绝对收敛,则(,)X Y的函数(,)g X Y的数学期望为随机变量的数字特征——总结[(,)](,)ijijjiE g X Y g a b p =∑∑; 特别地();()i ijj ijiij iE X a p E Y b p==∑∑∑∑.设X 为连续型随机变量,其概率密度为()f x ,如果广义积分 ()()g x f x dx+∞-∞⎰绝对收敛,则X 的函数()g X 的数学期望为[()]()()E g X g x f x dx+∞-∞=⎰.设(,)X Y 为二维连续型随机变量,其联合概率密度为(,)f x y ,如果广义积分(,)(,)g x y f x y dxdy+∞+∞-∞-∞⎰⎰绝对收敛,则(,)X Y 的函数(,)g X Y 的数学期望为[(,)](,)(,)E g x y g x y f x y dxdy+∞+∞-∞-∞=⎰⎰;特别地()(,)E x xf x y dxdy +∞+∞-∞-∞=⎰⎰,()(,)E Y yf x y dxdy+∞+∞-∞-∞=⎰⎰.注:求E(X,Y)是无意义的,比如说二维(身高,胖瘦)的数学期望是无意义的,但是二维随机变量函数Z= E(X,Y)是有意义的,他表示的是函数下的另一个一维意义。
概率论与数理统计第四章随机变量的数字特征
第四章 随机变量的数字特征前面讨论了随机变量的分布函数,我们知道分布函数全面地描述了随机变量的统计特性.但是在实际问题中,一方面由于求分布函数并非易事;另一方面,往往不需要去全面考察随机变量的变化情况而只需知道随机变量的某些特征就够了.例如,在考察一个班级学生的学习成绩时,只要知道这个班级的平均成绩及其分散程度就可以对该班的学习情况作出比较客观的判断了.这样的平均值及表示分散程度的数字虽然不能完整地描述随机变量,但能更突出地描述随机变量在某些方面的重要特征,我们称它们为随机变量的数字特征.本章将介绍随机变量的常用数字特征:数学期望、方差、相关系数和矩.第一节 数学期望1.数学期望的定义粗略地说,数学期望就是随机变量的平均值.在给出数学期望的概念之前,先看一个例子.要评判一个射手的射击水平,需要知道射手平均命中环数.设射手A 在同样条件下进行射击,命中的环数X 是一随机变量,其分布律如下:表4-1由X 的分布律可知,若射手A 共射击N 次,根据频率的稳定性,所以在N 次射击中,大约有0.1×N 次击中10环,0.1×N 次击中9环,0.2×N 次击中8环,0.3×N 次击中7环,0.1×N 次击中6环,0.1×N 次击中5环,0.1×N 次脱靶.于是在N 次射击中,射手A 击中的环数之和约为10×0.1N +9×0.1N +8×0.2N +7×0.3N +6×0.1N +5×0.1N +0×0.1N .平均每次击中的环数约为N1(10×0.1N +9×0.1N +8×0.2N +7×0.3N +6×0.1N +5×0.1N +0×0.1N ) =10×0.1+9×0.1+8×0.2+7×0.3+6×0.1+5×0.1+0×0.1 =6.7(环).由这样一个问题的启发,得到一般随机变量的“平均数”,应是随机变量所有可能取值与其相应的概率乘积之和,也就是以概率为权数的加权平均值,这就是所谓“数学期望的概念”.一般地,有如下定义:定义4.1 设离散型随机变量X 的分布律为P {X =x k }=p k k =1,2,…, 若级数∑∞=1k k kp x绝对收敛,则称级数∑∞=1k k kp x为随机变量X 的数学期望(Mathematical expectation),记为E (X ).即E (X )=∑∞=1k k kp x. (4.1)设连续型随机变量X 的概率密度为f (x ),若积分⎰+∞∞-x x xf d )(绝对收敛,则称积分⎰+∞∞-x x xf d )(的值为随机变量X 的数学期望,记为E (X ).即E (X )=⎰+∞∞-x x xf d )(. (4.2)数学期望简称期望,又称为均值.例4.1 某商店在年末大甩卖中进行有奖销售,摇奖时从摇箱摇出的球的可能颜色为:红、黄、蓝、白、黑五种,其对应的奖金额分别为:10000元、1000元、100元、10元、1元.假定摇箱内装有很多球,其中红、黄、蓝、白、黑的比例分别为:0.01%,0.15%,1.34%,10%,88.5%,求每次摇奖摇出的奖金额X 的数学期望. 解每次摇奖摇出的奖金额X 是一个随机变量,易知它的分布律为因此,E (X )=10000×0.0001+1000×0.0015+100×0.0134+10×0.1+1×0.885=5.725. 可见,平均起来每次摇奖的奖金额不足6元.这个值对商店作计划预算时是很重要的.例4.2 按规定,某车站每天8点至9点,9点至10点都有一辆客车到站,但到站的时刻是随机的,且两者到站的时间相互独立.其分布律为一旅客8点20分到车站,求他候车时间的数学期望.解 设旅客候车时间为X 分钟,易知X 的分布律为表4-4在上表中p k 的求法如下,例如P {X =70}=P (AB )=P (A )P (B )=1/6×3/6=3/36,其中A 为事件“第一班车在8:10到站”,B 为事件“第二班车在9:30到站”,于是候车时间的数学期望为E (X )=10×3/6+30×2/6+50×1/36+70×3/36+90×2/36=27.22(分钟).例4.3 有5个相互独立工作的电子装置,它们的寿命X k (k =1,2,3,4,5)服从同一指数分布,其概率密度为f (x )=⎪⎩⎪⎨⎧≤>-.00,0,1/x ,x x θθe(1) 若将这5个电子装置串联起来组成整机,求整机寿命N 的数学期望;(2) 若将这5个电子装置并联组成整机,求整机寿命M 的数学期望.解 X k (k =1,2,3,4,5)的分布函数为F (x )=⎩⎨⎧≤>--.0,0,0,1/x x x θe(1) 串联的情况由于当5个电子装置中有一个损坏时,整机就停止工作,所以这时整机寿命为N =min{X 1,X 2,X 3,X 4,X 5}.由于X 1,X 2,X 3,X 4,X 5是相互独立的,于是i=min{X 1,X 2,X 3,X 4,X 5}的分布函数为F N (x )=P {N ≤x }=1-P {N >x }=1-P {X 1>x ,X 2>x ,X 3>x ,X 4>x ,X 5>x }=1-P {X 1>x }·P {X 2>x }·P {X 3>x }·P {X 4>x }·P {X 5>x }=1-[1-)(1x F X ][1- )(2x F X ][1-)(3x F X ][1-)(4x F X ][1-)(5x F X ] =1-[1-F (x )]5=⎪⎩⎪⎨⎧≤>--.0,0,0,15x x xθe 因此N 的概率密度为f N (x )=⎪⎩⎪⎨⎧≤>-.0,0,0,55x x xθθe则N 的数学期望为E (N )=55)(5θθθ==-∞+∞-∞+∞-⎰⎰x xx x xf xN d ed(2) 并联的情况由于当且仅当5个电子装置都损坏时,整机才停止工作,所以这时整机寿命为M =max{X 1,X 2,X 3,X 4,X 5}.由于X 1,X 2,X 3,X 4,X 5相互独立,类似可得M 的分布函数为F M (x )=[F (x )]5=⎪⎩⎪⎨⎧≤>--.0,0,0,)1(5x x x θe因而M 的概率密度为f M (x )=⎪⎩⎪⎨⎧≤>---.0,0,0,]1[54x x x x θθθe e于是M 的数学期望为E (M )=.60137)1(5)(0max θθθ=-=-∞+∞-∞+⎰⎰x xx x xf xd e d 这说明:5个电子装置并联联接工作的平均寿命要大于串联联接工作的平均寿命.例4.4 设随机变量X 服从柯西(Cauchy )分布,其概率密度为f (x )=)1(12x +π,-x <x <+∞, 试证E (X )不存在.证 由于,)1(1)(2⎰⎰+∞∞-+∞∞-∞=+=x x xx x f x d πd 故E (X )不存在.2.随机变量函数的数学期望在实际问题与理论研究中,我们经常需要求随机变量函数的数学期望.这时,我们可以通过下面的定理来实现.定理4.1 设Y 是随机变量X 的函数Y =g (X )(g 是连续函数). (1) X 是离散型随机变量,它的分布律为P (X =x k )=p k ,k =1,2,…,若kk kpx g ∑∞=1)(绝对收敛,则有E (Y )=E [g (X )]=kk kpx g ∑∞=1)(. (4.3)(2) X 是连续型随机变量,它的概率密度为f (x ),若⎰+∞∞-x x f x g d )()(绝对收敛,则有E (Y )=E [g (X )]=⎰+∞∞-x x f x g d )()(. (4.4)定理4.4的重要意义在于当我们求E (Y )时,不必知道Y 的分布而只需知道X 的分布就可以了.当然,我们也可以由已知的X 的分布,先求出其函数g (X )的分布,再根据数学期望的定义去求E [g (X )],然而,求Y =g (X )的分布是不容易的,所以一般不采用后一种方法.定理4.1的证明超出了本书的范围,这里不证.上述定理还可以推广到二个或二个以上随机变量的函数情形. 例如,设Z 是随机变量X ,Y 的函数,Z =g (X ,Y )(g 是连续函数),那么Z 也是一个随机变量,当(X ,Y )是二维离散型随机变量,其分布律为P {X =x i ,Y =y j }=p ij (i ,j =1,2,…)时,若∑∑ijijiipy x g ),(绝对收敛,则有E (Z )=E [g (X ,Y )]=∑∑ijijiipy x g ),(. (4.5)当(X ,Y )是二维连续型随机变量,其概率密度为f (x ,y )时,若⎰⎰+∞∞-+∞∞-yx y x f y z g d d ),(),(绝对收敛,则有E (Z )=E [g (X ,Y )]=⎰⎰+∞∞-+∞∞-y x y x f y z g d d ),(),(. (4.6)特别地有E (X )=⎰⎰+∞∞-+∞∞-y x y x xf d d ),(=⎰+∞∞-.)(x x xf X dE (Y )=⎰⎰+∞∞-+∞∞-y x y x yf d d ),(=⎰+∞∞-.)(y y yf Y d例4.5 设随机变量X 的分布律为表4-5求E (X ),E (-2x +1).解 由(4.5)式得E (X 2)=(-1)2×18+02×14+22×38+32×14=318, E (-2X +1)=[-2×(-1)+1]×18+[-2×0+1]×14+[-2×2+1]×38+[-2×3+1]×14= -74.例4.6 对球的直径作近似测量,设其值均匀分布在区间[a ,b ]内,求球体积的数学期望.解 设随机变量X 表示球的直径,Y 表示球的体积,依题意,X 的概率密度为f (x )=⎪⎩⎪⎨⎧≤≤-.,0,,1其他b x a a b球体积Y =361X π,由(4.6)式得 E (Y )=x ab xX E b a d ππ-=⎰161)61(33 =).)((24)(6223b a b a x x a b ba++=-⎰πd π例4.7 设国际市场每年对我国某种出口商品的需求量X (吨)服从区间[2000,4000]上的均匀分布.若售出这种商品1吨,可挣得外汇3万元,但如果销售不出而囤积于仓库,则每吨需保管费1万元.问应预备多少吨这种商品,才能使国家的收益最大? 解设预备这种商品y 吨(2000≤y ≤4000),则收益(万元)为g (X )=⎩⎨⎧<--≥.),(3,,3y X X y X y X y则 E [g (X )]=⎰⎰-⋅=+∞∞-40002000200040001)()()(x x g x x f x g d d =[]⎰⎰+--40002000320001)(320001y y x y x x y x d d =)1047000(1000162⨯-+-y y . 当y =3500吨时,上式达到最大值.所以预备3500吨此种商品能使国家的收益最大,最大收益为8250万元.例4.8 设二维随机变量(X ,Y )在区域A 上服从均匀分布,其中A 为x 轴,y 轴及直线x +2y=1所围成的三角区域,求E (X ),E (Y ),E (XY ). 解 由于(X ,Y )在A 内服从均匀分布,所以其概率密度f (x ,y )=⎪⎩⎪⎨⎧⎩⎨⎧∉∈=∉∈.),(,0,),(,1,),(,0,),(,1A y x A y x A y x A y x A 的面积 E (X )=12(1)1(,)d d d d d d ;3x Axf x y x y x x y x x y +∞+∞--∞-∞===⎰⎰⎰⎰⎰⎰E (Y )=2122(,)d d d d d d ;3y Ayf x y x y y x y y y x +∞+∞--∞-∞===⎰⎰⎰⎰⎰⎰E (XY )=;61)1(2),()1(201021⎰⎰⎰⎰⎰+∞∞-+∞∞--=-==x x x x y y x x y x y x xyf d d d d d3.数学期望的性质下面讨论数学期望的几条重要性质.定理4.2 设随机变量X ,Y 的数学期望E (X ),E (Y )存在. 1°E (c )=c ,其中c 是常数; 2°E (cX )=cE (X );3°E (X +Y )=E (X )+E (Y ); 4°若X ,Y 是相互独立的,则有E (XY )=E (X )E (Y ).证 就连续型的情况我们来证明性质3°、4°,离散型情况和其他性质的证明留给读者. 3°设二维随机变量(X ,Y )的概率密度为f (x ,y ),其边缘概率密度为f X (x ),f Y (y ),则E (X +Y )=⎰⎰+∞∞-+∞∞-+y x y x f y x d d ),()(=⎰⎰⎰⎰+∞∞-+∞∞-+∞∞-+∞∞-+y x y x yf y x y x xf d d d d ),(),(=)()()()(Y E X E y y yf x x xf Y X +=+⎰⎰+∞∞-+∞∞-d d .4°又若X 和Y 相互独立,此时f (x ,y )=f X (x )f Y (y ),故E (XY )=⎰⎰⎰⎰+∞∞-+∞∞-+∞∞-+∞∞-=y x y f x xyf y x y x xyf Y X d d d d )()(),(=).()()()(Y E X E y y yf x x xf Y X =⋅⎰⎰+∞∞-+∞∞-d d性质3°可推广到任意有限个随机变量之和的情形;性质4°可推广到任意有限个相互独立的随机变量之积的情形.例4.9 设一电路中电流I (安)与电阻R (欧)是两个相互独立的随机变量,其概率密度分别为g (i )=⎩⎨⎧≤≤.,0,10,2其他i i h (r )=⎪⎩⎪⎨⎧≤≤.,0,30,92其他r r试求电压V =IR 的均值.解 E (V )=E (IR )=E (I )E (R )=2392)()(303102=⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡⎰⎰⎰⎰∞+∞-∞+∞-r r i i r r rh i i ig d d d d (伏). 例4.10 设对某一目标进行射击,命中n 次才能彻底摧毁该目标,假定各次射击是独立的,并且每次射击命中的概率为p ,试求彻底摧毁这一目标平均消耗的炮弹数.解 设X 为n 次击中目标所消耗的炮弹数,X k 表示第k -1次击中后至k 次击中目标之间所消耗的炮弹数,这样,X k 可取值1,2,3,…,其分布律见表4-6.其中q =1-p ,X 1为第一次击中目标所消耗的炮弹数,则n 次击中目标所消耗的炮弹数为X =X 1+X 2+…+X n .由性质3°可得E (X )=E (X 1)+E (X 2)+…+E (X n )=nE (X 1). 又E (X 1)=,111pkpqk k =∑∞=- 故 E (X )=pn . 4.常用分布的数学期望 (1) 两点分布 设X 的分布律为 E (X )=0×(1-p )+1×p =p .(2) 二项分布设X 服从二项分布,其分布律为P {X =k }=kn k k n p p --)1(C , (k =0,1,2,…,n),(0<p <1). 则X 的数学期望为E (X )=∑∑==----=-nk nk k n k kn kknp p k n k n kp p k 0)1()!(!!)1(C=[]∑=----------nk k n k p p k n k n np0)]1()1[(1)1(!)1()1()!1()!1(, 令k -1=t ,则E (X )=[]∑-=------1])1[()1(!)1(!)!1(n t t n tp p t n t n np=np [p +(1-p )]n -1=np .若利用数学期望的性质,将二项分布表示为n 个相互独立的0-1分布的和,计算过程将简单得多.事实上,若设X 表示在n 次独立重复试验中事件A 发生的次数,X i (i =1,2,…,n )表示A 在第i 次试验中出现的次数,则有X =1nii X=∑.所以E (X i )=p ,i =1,2,…,n .由定理4.2的性质3°有E (X )=∑∑===⎪⎭⎫ ⎝⎛ni i n i i X E X E 11)( =np .(3) 泊松分布设X 服从泊松分布,其分布律为P {X =k }=λλ-e !k k, (k =0,1,2,…),(λ>0).则X 的数学期望为E (X )=∑∑∞=--∞=--=11)!1(!k k k kk k k λλλλλee,令k -1=t ,则有E (X )=.!0λλλλλλλ=⋅=-∞=-∑e e ek tt .(4) 均匀分布设X 服从[a ,b ]上的均匀分布,其概率密度函数为f (x )=⎪⎩⎪⎨⎧≤≤-.,0,,1其他b x a a b则X 的数学期望为E (X )=.2)(ba x ab x x x xf ba +=-=⎰⎰+∞∞-d d . (5) 指数分布设X 服从指数分布,其分布密度为f (x )=⎩⎨⎧<≥-.0,0,0,x x x λλe则X 的数学期望为E (X )=1()d e d x xf x x x x λλλ+∞+∞--∞-∞==⎰⎰.(6) 正态分布设X ~N (μ,σ2),其分布密度为f (x )=222)(21σμσ--x e π,则X 的数学期望为E (X )=2()2()d ed ,x xf x x x x μσ--+∞+∞-∞-∞=⎰⎰令σμ-x =t ,则E (X )=⎰∞+∞--+t t t d e π22)(21σμ注意到t t d eπ⎰∞+∞--222μ=μ,t σt t d e π⎰∞+∞--2221=0, 故有E (X )=μ.第二节 方 差1.方差的定义数学期望描述了随机变量取值的“平均”.有时仅知道这个平均值还不够.例如,有A ,B 两名射手,他们每次射击命中的环数分别为X ,Y ,已知X ,Y 的分布律为:由于E (X )=E (Y )=9(环),可见从均值的角度是分不出谁的射击技术更高,故还需考虑其他的因素.通常的想法是:在射击的平均环数相等的条件下进一步衡量谁的射击技术更稳定些.也就是看谁命中的环数比较集中于平均值的附近,通常人们会采用命中的环数X 与它的平均值E (X )之间的离差|X -E (X )|的均值E [|X -E (X )|]来度量,E [|X -E (X )|]愈小,表明X 的值愈集中于E (X )的附近,即技术稳定;E [|X -E (X )|]愈大,表明X 的值很分散,技术不稳定.但由于E [|X -E (X )|]带有绝对值,运算不便,故通常采用X 与E (X )的离差|X -E (X )|的平方平均值E [X -E (X )]2来度量随机变量X 取值的分散程度.此例中,由于E [X -E (X )]2=0.2×(8-9)2+0.6×(9-9)2+0.2×(10-9)2=0.4, E [Y -E (Y )]2=0.1×(8-9)2+0.8×(9-9)2+0.1×(10-9)2=0.2.由此可见B 的技术更稳定些.定义4.2 设X 是一个随机变量,若E [X -E (X )]2存在,则称E [X -E (X )]2为X的方差(Variance ),记为D (X ),即D (X )=E [X -E (X )]2. (4.7)称)(X D 为随机变量X 的标准差(Standard deviation )或均方差(Mean square deviation),记为σ(X ).根据定义可知,随机变量X 的方差反映了随机变量的取值与其数学期望的偏离程度.若X 取值比较集中,则D (X )较小,反之,若X 取值比较分散,则D (X )较大. 由于方差是随机变量X 的函数g (X )=[X -E (X )]2的数学期望.若离散型随机变量X 的分布律为P {X =x k }=p k ,k =1,2,…,则D (X )=k k kp X E x∑∞=-12)]([. (4.8)若连续型随机变量X 的概率密度为f (x ),则D (X )=⎰+∞∞--.)()]([2x x f X E x d (4.9)由此可见,方差D (X )是一个常数,它由随机变量的分布惟一确定.根据数学期望的性质可得:D (X )=E [X -E (X )]2=E [X 2-2X ·E (X )+[E (X )]2]=E (X 2)-2E (X )·E (X )+[E (X )]2=E (X 2)-[E (X )]2.于是得到常用计算方差的简便公式D (X )=E (X 2)-[E (X )]2. (4.10)例4.11 设有甲,乙两种棉花,从中各抽取等量的样品进行检验,结果如下表:表4-10且评定它们的质量.解 由于E (X )=28×0.1+29×0.15+30×0.5+31×0.15+32×0.1=30, E (Y )=28×0.13+29×0.17+30×0.4+31×0.17+32×0.13=30,故得D (X )=(28-30)2×0.1+(29-30)2×0.15+(30-30)2×0.5+(31-30)2×0.15+(32-30)2×0.1=4×0.1+1×0.15+0×0.5+1×0.15+4×0.1=1.1, D (Y )=(28-30)2×0.13+(29-30)2×0.17+(30-30)2×0.4+(31-30)2×0.17+(32-30)2×0.13 =4×0.13+1×0.17+0×0.4+1×0.17+4×0.13=1.38.因D (X )<D (Y ),所以甲种棉花纤维长度的方差小些,说明其纤维比较均匀,故甲种棉花质量较好.例4.12 设随机变量X 的概率密度为f (x )=⎪⎩⎪⎨⎧<≤-<≤-+.,0,10,1,01,1其他x x x x求D (X ).解 E (X )=⎰⎰-++-11)1()1(x x x x x x d d =0,E (X 2)=⎰⎰-++-12012)1()1(x x x x x x d d =1/6,于是 D (X )=E (X 2)-[E (X )]2=1/6.2.方差的性质方差有下面几条重要的性质.设随机变量X 与Y 的方差存在,则 1°设c 为常数,则D (c )=0;2°设c 为常数,则D (cX )=c 2D (X );3°D (X ±Y )=D (X )+D (Y )±2E [(X -E (X ))(Y -E (Y ))]; 4°若X ,Y 相互独立,则D (X ±Y )=D (X )+D (Y ); 5°对任意的常数c ≠E (X ),有D (X )<E [(X -c )2]. 证 仅证性质4°,5°.4°D (X ±Y )=E [(X ±Y )-E (X ±Y )]2=E [(X -E (X ))±(Y -E (Y ))]2=E [X -E (X )]2±2E [(X -E (X ))(Y -E (Y ))]+E [Y -E (Y )]2 =D (X )+D (Y )±2E [(X -E (X ))(Y -E (Y ))].当X 与Y 相互独立时,X -E (X )与Y -E (Y )也相互独立,由数学期望的性质有E [(X -E (X ))(Y -E (Y ))]=E (X -E (X ))E (Y -E (Y ))=0.因此有D (X ±Y )=D (X )+D (Y ).性质4°可以推广到任意有限多个相互独立的随机变量之和的情况.5°对任意常数c ,有E [(X -c )2]=E [(X -E (X )+E (X )-c )2]=E [(X -E (X ))2]+2(E (X )-c )·E [X -E (X )]+(E (X )-c )2=D (X )+(E (X )-c )2.故对任意常数c ≠EX ,有DX <E [(X -c )2].例4.13 设随机变量X 的数学期望为E (X ),方差D (X )=σ2(σ>0),令Y =σ)(X E X -,求E (Y ),D (Y ).解 E (Y )=[],0)()(1)]([1)(=-=-=⎥⎦⎤⎢⎣⎡-X E X E X E X E X E X E σσσ D (Y )=.1)(1)]([1)(2222===-=⎥⎦⎤⎢⎣⎡-σσσσσX D X E X D X E X D 常称Y 为X 的标准化随机变量.例4.14 设X 1,X 2,…,X n 相互独立,且服从同一(0-1)分布,分布律为P {X i =0}=1-p ,P {X i =1}=p , i =1,2,…,n .证明 X =X 1+X 2+…+X n 服从参数为n ,p 的二项分布,并求E (X )和D (X ).解 X 所有可能取值为0,1,…,n ,由独立性知X 以特定的方式(例如前k 个取1,后n -k 个取0)取k (0≤k ≤n )的概率为p k (1-p )n -k,而X 取k 的两两互不相容的方式共有k nC 种,故P {X =k }=k n C p k (1-p )n -k, k =0,1,2,…,n ,即X 服从参数为n ,p 的二项分布.由于E (X i )=0×(1-p )+1×p =p ,D (X i )=(0-p )2×(1-p )+(1-p )2×p =p (1-p ), i =1,2,…,n ,故有E (X )=.)(11np X E X E ni i n i i ==⎪⎭⎫ ⎝⎛∑∑==由于X 1,X 2,…,X n 相互独立,得D (X )= ).1()(11p np X D X D ni i n i i -==⎪⎭⎫ ⎝⎛∑∑==3.常用分布的方差 (1) (0-1)分布设X 服从参数为p 的0-1分布,其分布律为(2) 二项分布设X 服从参数为n ,p 的二项分布,由例4.14知,D (X )=np (1-p ). (3) 泊松分布设X 服从参数为λ的泊松分布,由上一节知E (X )=λ,又E (X 2)=E [X (X -1)+X ]=E [X (X -1)]+E (X )=∑∑∞=--∞=-+-=+-2220)!2(!)1(k k k kk k k k λλλλλλλee=λ2e -λ·e λ+λ=λ2+λ,从而有D (X )=E (X 2)-[E (X )]2=λ2+λ -λ2=λ.(4) 均匀分布设X 服从[a ,b ]上的均匀分布,由上一节知E (X )=2ba +,又 E (X 2)=3222b ab a x a b x ba ++=-⎰d , 所以D (X )=E (X 2)-[E (X )]2=12)()(41)(312222a b b a b ab a -=+-++.(5) 指数分布设X 服从参数为λ的指数分布,由上一节知.E (X )=1/λ,又E (X 2)=222λλλ=⎰-bax x x d e ,所以D (X )=E (X 2)-[E (X )]2=.112222λλλ=⎪⎭⎫⎝⎛-(6) 正态分布 设X ~N (μ,σ2),由上一节知E (X )=μ,从而D (X )=[]⎰⎰∞+∞--∞+∞--=--d e πd x x x x f X E x x 222)(2221)()()(σμσμ令σμ-x =t 则D (X )=)(22222222222⎰⎰∞+∞--∞+∞--∞+∞--+-=t t t t t t t d eeπd eπσσ=)20(22ππ+σ =σ2.由此可知:正态分布的概率密度中的两个参数μ和σ分别是该分布的数学期望和均方差.因而正态分布完全可由它的数学期望和方差所确定.再者,由上一章第五节例3.17知道,若X i ~N (μi ,σi 2),i =1,2,…,n ,且它们相互独立,则它们的线性组合c 1X 1+c 2X 2+…+c n X n (c 1,c 2,…,c n 是不全为零的常数)仍然服从正态分布.于是由数学期望和方差的性质知道:c 1X 1+c 2X 2+…+c n X n ~⎪⎭⎫⎝⎛∑∑==n i ni i i i i c c N 1122,σμ.这是一个重要的结果.例4.15 设活塞的直径(以cm 计)X ~N (22.40,0.032),气缸的直径Y ~N (22.50,0.042),X ,Y 相互独立,任取一只活塞,任取一只气缸,求活塞能装入气缸的概率. 解按题意需求P {X <Y }=P {X -Y <0}. 令Z =X -Y ,则E (Z )=E (X )-E (Y )=22.40-22.50=-0.10,D (Z )=D (X )+D (Y )=0.032+0.042=0.052,即Z ~N (-0.10,0.052), 故有P {X <Y }=P {Z <0}=⎪⎭⎫⎝⎛Φ=⎭⎬⎫⎩⎨⎧--<--05.010.005.0)10.0(005.0)10.0(Z P =Φ(2)=0.9772.第三节 协方差与相关系数对于二维随机变量(X ,Y ),数学期望E (X ),E (Y )只反映了X 和Y 各自的平均值,而D (X ),D (Y )反映的是X 和Y 各自偏离平均值的程度,它们都没有反映X 与Y 之间的关系.在实际问题中,每对随机变量往往相互影响、相互联系.例如,人的年龄与身高;某种产品的产量与价格等.随机变量的这种相互联系称为相关关系,它们也是一类重要的数字特征,本节讨论有关这方面的数字特征.定义4.3 设(X ,Y )为二维随机变量,称E {[X -E (X )][Y -E (Y )]}为随机变量X ,Y 的协方差(Covariance ),记为Cov (X ,Y ),即Cov (X ,Y )=E {[X -E (X )][Y -E (Y )]}. (4.11) 而)()(),cov(Y D X D Y X 称为随机变量X ,Y 的相关系数(Correlation coefficient)或标准协方差(Standard covariance),记为ρXY ,即ρXY =)()(),cov(Y D X D Y X . (4.12)特别地,Cov(X ,X )=E {[X -E (X )][X -E (X )]}=D (X ), Cov(Y ,Y )=E {[Y -E (Y )][Y -E (Y )]}=D (Y ).故方差D (X ),D (Y )是协方差的特例.由上述定义及方差的性质可得D (X ±Y )=D (X )+D (Y )±2Cov(X ,Y ).由协方差的定义及数学期望的性质可得下列实用计算公式Cov (X ,Y )=E (XY )-E (X )E (Y ). (4.13)若(X ,Y )为二维离散型随机变量,其联合分布律为P {X =x i ,Y =y j }=p ij ,i ,j =1,2,…,则有Cov (X ,Y )=[][]∑∑--ijijiipY E y X E x )()(. (4.14)若(X ,Y )为二维连续型随机变量,其概率密度为f (x ,y ),则有Cov (X ,Y )=[][]⎰⎰+∞∞-+∞∞---y x y x f Y E y X E x d d ),()()(. (4.15)例4.16 设(X ,Y )的分布律为表4-120<p <1,求Cov(X ,Y )和ρXY .解 易知X 的分布律为P {X =1}=p ,P {X =0}=1-p ,故 E (X )=p , D (X )=p (1-p ).同理E (Y )=p ,D (Y )=p (1-p ),因此Cov(X ,Y )=E (XY )-E (X )·E (Y )=p -p 2=p (1-p ), 而ρXY =1)1()1()1(),cov(=-⋅--=⋅p p p p p p DY DX Y X例4.17 设(X ,Y )的概率密度为f (x ,y )=⎩⎨⎧<<<<+.,0,10,10,其他y x y x求Cov (X ,Y ).解 由于f X (x )=⎪⎩⎪⎨⎧<<+,,0,10,21其他x x f Y (y )=⎪⎩⎪⎨⎧<<+.,0,10,21其他y y E (X )=127)21(10=+⎰x x x d ,E (Y )=127)21(10=+⎰y y y d ,E (XY )=31)(10102101021010=+=+⎰⎰⎰⎰⎰⎰y x xy y x y x y x y x xy d d d d d d因此 Cov (X ,Y )=E (XY )-E (X )E (Y )=144112712731-=⨯-.协方差具有下列性质:1°若X 与Y 相互独立,则Cov (X ,Y )=0; 2°Cov (X ,Y )=Cov (Y ,X ); 3°Cov (aX ,bY )=ab Cov (X ,Y );4°Cov (X 1+X 2,Y )=Cov (X 1,Y )+Cov (X 2,Y ). 证 仅证性质4°,其余留给读者.Cov(X 1+X 2,Y ) =E [(X 1+X 2)Y ]-E (X 1+X 2)E (Y )=E (X 1Y )+E (X 2Y )-E (X 1)E (Y )-E (X 2)E (Y ) =[E (X 1Y )-E (X 1)E (Y )]+[E (X 2Y )-E (X 2)E (Y )] =Cov (X 1,Y )+Cov (X 2,Y ).下面给出相关系数ρXY 的几条重要性质,并说明ρXY 的含义.定理4.3 设D (X )>0,D (Y )>0,ρXY 为(X ,Y )的相关系数,则 1°如果X ,Y 相互独立,则ρXY =0; 2°|ρXY |≤1;3°|ρXY |=1的充要条件是存在常数a ,b 使P {Y =aX +b }=1(a ≠0). 证 由协方差的性质1°及相关系数的定义可知1°成立. 2°对任意实数t ,有D (Y -tX )=E [(Y -tX )-E (Y -tX )]2=E [(Y -E (Y ))-t (X -E (X ))]2 =E [Y -E (Y )]2-2tE [Y -E (Y )][X -E (X )]+t 2E [X -E (X )]2 =t 2D (X )-2t Cov (X ,Y )+D (Y )=[])(),cov()()(),cov()(22X D Y X Y D X D Y X t X D -+⎥⎦⎤⎢⎣⎡-. 令t =)(),cov(X D Y X =b ,于是D (Y -bX )=[][]).1)(()()(),cov(1)()(),cov()(222XY Y D Y D X D Y X Y D X D Y X Y D ρ-=⎥⎦⎤⎢⎣⎡-=-由于方差不能为负,所以1-2XY ρ≥0,从而|ρXY |≤1.性质3°的证明较复杂,从略.当ρXY =0时,称X 与Y 不相关,由性质1°可知,当X 与Y 相互独立时,ρXY =0,即X 与Y 不相关.反之不一定成立,即X 与Y 不相关,X 与Y 却不一定相互独立.例4.18 设X 服从[0,2π]上均匀分布,Y =cos X ,Z =cos(X +a ),这里a 是常数.求ρYZ .解 E (Y )=⎰⋅πd π2021cos x x =0, E (Z )= ⎰+πd π20)cos(21x a x =0, D (Y )=E {[Y -E (Y )]2}=21cos 21202=⎰πd πx x , D (Z )=E {[Z -E (Z )]2}=21)(cos 21202=+⎰πd πx a x , Cov(Y ,Z )=E {[Y -E (Y )][Z -E (Z )]}= a x a x x cos 21)cos(cos 2120=+∙⎰πd π, 因此 ρYZ =.cos 2121cos 21)()(),cov(a a Z D Y D Z Y =⋅=⋅ ① 当a =0时,ρYZ =1,Y =Z ,存在线性关系;② 当a=π时,ρYZ =-1,Y =-Z ,存在线性关系; ③ 当a =2π或23π时,ρYZ =0,这时Y 与Z 不相关,但这时却有Y 2+Z 2=1,因此,Y 与Z不独立.这个例子说明:当两个随机变量不相关时,它们并不一定相互独立,它们之间还可能存在其他的函数关系.定理4.3 告诉我们,相关系数ρXY 描述了随机变量X ,Y 的线性相关程度,|ρXY |愈接近1,则X 与Y 之间愈接近线性关系.当|ρXY |=1时,X 与Y 之间依概率1线性相关.不过,下例表明当(X ,Y )是二维正态随机变量时,X 和Y 不相关与X 和Y 相互独立是等价的.例4.19 设(X ,Y )服从二维正态分布,它的概率密度为f (x ,y )=⨯-221121ρσσπ⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⎥⎦⎤⎢⎣⎡-+------2222212121212)())((2)()1(21exp σμσσμμρσμρy y x x 求Cov (X ,Y )和ρXY .解 可以计算得(X ,Y )的边缘概率密度为f X (x )=21212)(121σμσ--x e π,-∞<x <+∞,f Y (y )=22222)(221σμσ--x e π,-∞<y <+∞,故E (X )=μ1,E (Y )=μ2, D (X )=σ12,D (Y )=σ22.而Cov (X ,Y )=⨯-=--⎰⎰+∞∞-+∞∞-22121121),()()(ρσπσμμy x y x f y x d dy x y x x y x d d ee-2112222121)1(212)(21)()(⎥⎦⎤⎢⎣⎡------∞+∞-∞+∞---⎰⎰σμρσμρσμμμ令t =⎪⎪⎭⎫ ⎝⎛----1122211σμρσμρx y ,u =11σμ-x ,则 Cov (X ,Y )=⎰⎰∞+∞-∞+∞---+-u t u tu t u d d e π2222122122)1(21σρσρσσ =⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫⎝⎛⎰⎰∞+∞--∞+∞--t e u u t u d d eπ22221222ρσσ +⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛-⎰⎰∞+∞--∞+∞--t t u u t u d e d eπ222212221ρσσ =.2222121σρσσρσ=⋅πππ于是ρXY=ρ.这说明二维正态随机变量(X ,Y )的概率密度中的参数ρ就是X 和Y 的相关系数,从而二维正态随机变量的分布完全可由X ,Y 的各自的数学期望、方差以及它们的相关系数所确定.由上一章讨论可知,若(X ,Y )服从二维正态分布,那么X 和Y 相互独立的充要条件是ρ=0,即X 与Y 不相关.因此,对于二维正态随机变量(X ,Y )来说,X 和Y 不相关与X 和Y 相互独立是等价的.第四节 矩、协方差矩阵数学期望、方差、协方差是随机变量最常用的数字特征,它们都是特殊的矩(Moment ).矩是更广泛的数字特征.定义4.4 设X 和Y 是随机变量,若E (X k ),k =1,2,…存在,称它为X 的k 阶原点矩,简称k 阶矩.若 E [X -E (X )]k , k =1,2,… 存在,称它为X 的k 阶中心矩.若 E (X k Y l ), k ,l =1,2,… 存在,称它为X 和Y 的k +l 阶混合矩.若 E {[X -E (X )]k [Y -E (Y )]l } 存在,称它为X 和Y 的k +l 阶混合中心矩.显然,X 的数学期望E (X )是X 的一阶原点矩,方差D (X )是X 的二阶中心矩,协方差Cov (X ,Y )是X 和Y 的1+1阶混合中心矩.当X 为离散型随机变量,其分布律为P {X =x i }=p i ,则E (X k)=∑∞=1i i kip x,E [X -E (X )]k=1[()]kii i x E X p ∞=-∑.当X 为连续型随机变量,其概率密度为f (x ),则E (X k )=⎰+∞∞-x x f x k d )(,E [X -E (X )]k =⎰+∞∞--x x f X E x k d )()]([.下面介绍n 维随机变量的协方差矩阵.设n 维随机变量(X 1,X 2,…,X n )的1+1阶混合中心矩σij =Cov (X i ,X j )=E {[X i -E (X i )][X j -E (X j )]}, i ,j =1,2,…,n都存在,则称矩阵Σ=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡nn n n n n σσσσσσσσσ 212222111211 为n 维随机变量(X 1,X 2,…,X n )的协方差矩阵. 由于σij =σji (i ,j =1,2,…,n ),因此Σ是一个对称矩阵. 协方差矩阵给出了n 维随机变量的全部方差及协方差,因此在研究n 维随机变量的统计规律时,协方差矩阵是很重要的.利用协方差矩阵还可以引入n 维正态分布的概率密度. 首先用协方差矩阵重写二维正态随机变量(X 1,X 2)的概率密度. f (x 1,x 2)=221121ρσσ-π×.)())((2)()1(21exp 22222212211212112⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⎥⎦⎤⎢⎣⎡-+------σμσσμμρσμρx x x x 令X =⎪⎪⎭⎫⎝⎛21x x ,μ=⎪⎪⎭⎫⎝⎛21μμ,(X 1,X 2)的协方差矩阵为 Σ=.2121212122211211⎪⎪⎭⎫⎝⎛=⎪⎪⎭⎫ ⎝⎛σσρσσρσσσσσσ 它的行列式|Σ|=σ12σ22(1-ρ2),逆阵Σ-1=.121212122⎪⎪⎭⎫⎝⎛--σσρσσρσσ∑ 由于 (X -μ)T Σ-1(X -μ)=.),(12211212121222211⎪⎪⎭⎫⎝⎛--⎪⎪⎭⎫ ⎝⎛----μμσσρσσρσσμμx x x x ∑ =,)())((2)(11222221221112112⎥⎦⎤⎢⎣⎡-+-----σμσσμμρσμρx x x x , 因此(X 1,X 2)的概率密度可写成f (x 1,x 2)=.)()(21exp 211⎭⎬⎫⎩⎨⎧----μ∑μ∑X X T π上式容易推广到n 维的情形.设(X 1,X 2,…,X n )是n 维随机变量,令X =⎪⎪⎪⎪⎪⎭⎫ ⎝⎛n x x x 21, μ=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛)()()(2121n n X E X E X E μμμ,定义n 维正态随机变量(X 1,X 2,…,X n )的概率密度为f (x 1,x 2,…,x n)=111()().2(2T X X πμμ-⎧⎫--∑-⎨⎬⎩⎭其中Σ是(X 1,X 2,…,X n )的协方差矩阵.n 维正态随机变量具有以下几条重要性质: 1°n 维随机变量(X 1,X 2,…,X n )服从n 维正态分布的充要条件是X 1,X 2,…,X n的任意的线性组合l 1X 1+l 2X 2+…+l n X n服从一维正态分布.(其中l 1,l 2,…,l n 不全为零).2°若(X 1,X 2,…,X n )服从n 维正态分布,设Y 1,Y 2,…,Y k 是X 1,X 2,…,X n 的线性函数,则(Y 1,Y 2,…,Y k )服从k 维正态分布.3°设(X 1,X 2,…,X n )服从n 维正态分布,则X 1,X 2,…,X n 相互独立的充要条件是X 1,X 2,…,X n 两两不相关.小结随机变量的数字特征是由随机变量的分布确定的,能描述随机变量某一个方面的特征的常数.最重要的数字特征是数学期望和方差.数学期望E(X)描述随机变量X取值的平均大小,方差D(X)=E{[X-E(X)]2}描述随机变量X与它自己的数学期望E(X)的偏离程度.数学期望和方差虽不能像分布函数、分布律、概率密度一样完整地描述随机变量,但它们能描述随机变量的重要方面或人们最关心方面的特征,它们在应用和理论上都非常重要.要掌握随机变量的函数Y=g(X)的数学期望E(Y)=E[g(X)]的计算公式(4.3)和(4.4).这两个公式的意义在于当我们求E(Y)时,不必先求出Y=g(X)的分布律或概率密度,而只需利用X的分布律或概率密度就可以了,这样做的好处是明显的.我们常利用公式D(X)=E(X2)-[E(X)]2来计算方差D(X),请注意这里E(X2)和[E(X)]2的区别.要掌握数学期望和方差的性质,提请读者注意的是:(1)当X1,X2独立或X1,X2不相关时,才有E(X1X2)=E(X1)·E(X2);(2)设c为常数,则有D(cX)=c2D(X);(3)D(X1±X2)=D(X1)+D(X2)±2Cov(X1,X2),当X1,X2独立或不相关时才有D(X1+X2)=D(X1)+D(X2).例如:若X1,X2独立,则有D(2X1-3X2)=4D(X1)+9D(X2).相关系数ρXY有时也称为线性相关系数,它是一个可以用来描述随机变量(X,Y)的两个分量X,Y之间的线性关系紧密程度的数字特征.当|ρXY|较小时X,Y的线性相关的程度较差;当ρXY=0时称X,Y不相关.不相关是指X,Y之间不存在线性关系,X,Y不相关,它们还可能存在除线性关系之外的关系(参见第3节例4.18),又由于X,Y相互独立是指X,Y的一般关系而言的,因此有以下的结论:X,Y相互独立则X,Y一定不相关;反之,若X,Y不相关则X,Y不一定相互独立.特别,对于二维正态变量(X,Y,),X和Y不相关与X和Y相互独立是等价的.而二元正态变量的相关系数ρXY就是参数ρ.于是,用“ρ=0”是否成立来检验X,Y是否相互独立是很方便的.重要术语及主题数学期望随机变量函数的数学期望数学期望的性质方差标准差方差的性质协方差相关系数相关系数的性质X,Y不相关矩协方差矩阵习 题 四求E (X ),E (X ),E (2X +3).2.已知100个产品中有10个次品,求任意取出的5个产品中的次品数的数学期望、方差. 1234.袋中有N 只球,其中的白球数X 为一随机变量,已知E (X )=n ,问从袋中任取1球为白球的概率是多少?5.设随机变量X 的概率密度为f (x )=⎪⎩⎪⎨⎧≤≤-<≤.,0,21,2,10,其他x x x x求E (X ),D (X ).6.设随机变量X ,Y ,Z 相互独立,且E (X )=5,E (Y )=11,E (Z )=8,求下列随机变量的数学期望.(1) U =2X +3Y +1; (2) V =YZ -4X .7.设随机变量X ,Y 相互独立,且E (X )=E (Y )=3,D (X )=12,D (Y )=16,求E (3X -2Y ),D (2X -3Y ).8.设随机变量(X ,Y )的概率密度为f (x ,y )=⎩⎨⎧<<<<.,0,0,10,其他x y x k试确定常数k ,并求E (XY ).9.设X ,Y 是相互独立的随机变量,其概率密度分别为f X (x )=⎩⎨⎧≤≤;,0,10,2其他x x f Y (y )=⎩⎨⎧>--.,0,0,)5(其他y y e 求E (XY ).10.设随机变量X ,Y 的概率密度分别为f X (x )=⎩⎨⎧≤>-;0,0,0,22x x x e f Y (y )=⎩⎨⎧≤>-.0,0,0,44y y y e 求(1) E (X +Y );(2) E (2X -3Y 2). 11.设随机变量X 的概率密度为f (x )=⎪⎩⎪⎨⎧<≥-.0,0,0,22x x cx xke求(1) 系数c ;(2) E (X );(3) D (X ).12.袋中有12个零件,其中9个合格品,3个废品.安装机器时,从袋中一个一个地取出(取出后不放回),设在取出合格品之前已取出的废品数为随机变量X ,求E (X )和D (X ). 13.一工厂生产某种设备的寿命X (以年计)服从指数分布,概率密度为f (x )=⎪⎩⎪⎨⎧≤>-.0,0,0,414x x xe为确保消费者的利益,工厂规定出售的设备若在一年内损坏可以调换.若售出一台设备,工厂获利100元,而调换一台则损失200元,试求工厂出售一台设备赢利的数学期望.14.设X 1,X 2,…,X n 是相互独立的随机变量,且有E (X i )=μ,D (X i )=σ2,i =1,2,…,n ,记∑==n i i S X n X 12,1,S 2=∑=--n i i X X n 12)(11. (1) 验证)(X E =μ,)(X D =n2σ;(2) 验证S 2=)(11122∑=--ni i X n X n ;(3) 验证E (S 2)=σ2.15.对随机变量X 和Y ,已知D (X )=2,D (Y )=3,Cov(X ,Y )=-1, 计算:Cov (3X -2Y +1,X +4Y -3).16.设二维随机变量(X ,Y )的概率密度为f (x ,y )=⎪⎩⎪⎨⎧≤+.,0,1122其他y x ,π试验证X 和Y 是不相关的,但X 和Y 不是相互独立的.验证X 和Y 是不相关的,但X 和Y 不是相互独立的. 18.设二维随机变量(X ,Y )在以(0,0),(0,1),(1,0)为顶点的三角形区域上服从均匀分布,求Cov (X ,Y ),ρXY . 19.设(X ,Y )的概率密度为f (x ,y )=⎪⎩⎪⎨⎧≤≤≤≤+.0,20,20),sin(21其他,y x y x ππ求协方差Cov (X ,Y )和相关系数ρXY .20.已知二维随机变量(X ,Y )的协方差矩阵为⎥⎦⎤⎢⎣⎡4111,试求Z 1=X -2Y 和Z 2=2X -Y 的相关系数.21.对于两个随机变量V ,W ,若E (V 2),E (W 2)存在,证明:[E (VW )]2≤E (V 2)E (W 2).这一不等式称为柯西许瓦兹(Couchy -Schwarz )不等式.22.假设一设备开机后无故障工作的时间X 服从参数λ=1/5的指数分布.设备定时开机,出现故障时自动关机,而在无故障的情况下工作2小时便关机.试求该设备每次开机无故障工作的时间Y 的分布函数F (y ). (2002研考)23.已知甲、乙两箱中装有同种产品,其中甲箱中装有3件合格品和3件次品,乙箱中仅装有3件合格品.从甲箱中任取3件产品放乙箱后,求:(1)乙箱中次品件数Z 的数学期望;(2)从乙箱中任取一件产品是次品的概率. (2003研考) 24.假设由自动线加工的某种零件的内径X (毫米)服从正态分布N (μ,1),内径小于10或大于12为不合格品,其余为合格品.销售每件合格品获利,销售每件不合格品亏损,已知销售利润T (单位:元)与销售零件的内径X 有如下关系T =⎪⎩⎪⎨⎧>-≤≤<-.12,5,1210,20,10,1X X X 若若若 问:平均直径μ取何值时,销售一个零件的平均利润最大? (1994研考)25.设随机变量X 的概率密度为f (x )=⎪⎩⎪⎨⎧≤≤.,0,0,2cos 21其他πx x 对X 独立地重复观察4次,用Y 表示观察值大于π/3的次数,求Y 2的数学期望.(2002研考)26.两台同样的自动记录仪,每台无故障工作的时间T i (i =1,2)服从参数为5的指数分布,首先开动其中一台,当其发生故障时停用而另一台自动开启.试求两台记录仪无故障工作的总时间T =T 1+T 2的概率密度f T (t ),数学期望E (T )及方差D (T ). (1997研考) 27.设两个随机变量X ,Y 相互独立,且都服从均值为0,方差为1/2的正态分布,求随机变量|X -Y |的方差. (1998研考) 28.某流水生产线上每个产品不合格的概率为p (0<p <1),各产品合格与否相互独立,当出现一个不合格产品时,即停机检修.设开机后第一次停机时已生产了的产品个数为X ,求E (X )和D (X ). (2000研考) 29.设随机变量X 和Y 的联合分布在点(0,1),(1,0)及(1,1)为顶点的三角形区域上服从均匀分布.(如图),试求随机变量U =X +Y 的方差. (2001研考) 30.设随机变量U 在区间[-2,2]上服从均匀分布,随机变量X =⎩⎨⎧->-≤-,U ,U 1,11,1若若 Y =⎩⎨⎧>≤-.1,11,1U ,U 若若试求(1)X 和Y 的联合概率分布;(2)D (X +Y ). (2002研考) 31.设随机变量X 的概率密度为f (x )=x-e21,(-∞<x <+∞)(1) 求E (X )及D (X );(2) 求Cov(X ,|X |),并问X 与|X |是否不相关?(3) 问X 与|X |是否相互独立,为什么? (1993研考) 32.已知随机变量X 和Y 分别服从正态分布N (1,32)和N (0,42),且X 与Y 的相关系数ρXY =-1/2,设Z =23YX +. (1) 求Z 的数学期望E (Z )和方差D (Z ); (2) 求X 与Z 的相关系数ρXZ ;(3) 问X 与Z 是否相互独立,为什么? (1994研考)33.将一枚硬币重复掷n 次,以X 和Y 表示正面向上和反面向上的次数.试求X 和Y 的相关系数ρXY . (2001研考)试求X 和Y 的相关系数ρ. (2002研考) 35.对于任意两事件A 和B ,0<P (A )<1,0<P (B )<1,则称 ρ=())()()()()()(B P A P B P A P B P A P AB P ⋅-为事件A 和B 的相关系数.试证:(1) 事件A 和B 独立的充分必要条件是ρ=0;(2) |ρ|≤1. (2003研考) 36. 设随机变量X 的概率密度为f X (x )=⎪⎪⎪⎩⎪⎪⎪⎨⎧<≤<<-.,0,20,41,01,21其他x x令Y =X 2,F (x ,y )为二维随机变量(X ,Y )的分布函数,求:(1) Y 的概率密度f Y (y ); (2) Cov(X ,Y );(3) F (-1/2,4). (2006研考)。
概率论与数理统计(经管类)复习要点 第4章 随机变量的数字特征
第四章 随机变量的数字特征1. 把刻画随机变量某些方面特征的数值称为随机变量的数字特征,如期望、方差、协方差、相关系数等。
2. 随机变量的期望反映了随机变量取值的集中位置。
离散型随机变量的期望设离散型随机变量X 的分布律为P {X =x k }=p k ,k=1,2,…若级数∑ix i p i 绝对收敛(即级数∑i丨x i 丨p i 收敛),则定义X 的数学期望(简称均值或期望)为E (X )=∑ix i p i注:当X 的可能取值为有限多个x 1,x 2,…,x n 时,E (X )=∑=ni 1x i p i 当X 的可能取值为可列多个x 1,x 2,…,x n ,…时,E (X )=∑∞=1i x i p i三种重要离散型随机变量的数学期望:3. 离散型随机变量函数的数学期望 设离散型随机变量X 的分布律为P {X =x k }=p k ,k=1,2,…令Y =g (X ),若级数∑∞=1k g (x k )p k 绝对收敛,则随机变量Y 的数学期望为E (Y )= E[g (X )] =∑∞=1k g (x k )p k4. 连续型随机变量的期望三种重要连续型随机变量的数学期望:5. 连续型随机变量函数的数学期望2017.4单解:6. 二维随机变量的期望二维随机变量函数的期望7. 期望的性质(1)常数的期望等于这个常数,即E (C )=C ,其中C 为常数证明 常数C 作为随机变量,它只可能取一个值C ,即P {X =C }=1,所以E (C )=C ⋅1=C(2)常数与随机变量X 乘积的期望等于该常数与随机变量X 的期望的乘积,即E (C X )=C ⋅E (X ) (3)随机变量和的期望等于随机变量期望之和,即E (X +Y )= E (X )+ E (Y ) 推广:E (C 1X +C 2Y )= C 1E (X )+ C 2E (Y ),其中C 1,C 2为常数 一般地,设X 1,X 2,…,X n ,为n 个随机变量,则有E (∑=ni iX 1)=∑=ni iX E 1)(E (∑=ni ii X C 1)=∑=ni iiX E C 1)( 其中C i(i=1,2,…)为常数(4)两个相互独立的随机变量乘积的期望等于期望的乘积,即若X ,Y 是相互独立的随机变量,则E (XY )= E (X )E (Y )由数学归纳法可证得:当X1,X2,…,X n相互独立时有E(X1,X2,…,X n)= E(X1)E(X2)…E(X n)2018.4单解:指数分布的期望值为 1,故E(X)= E(Y)=21,所以E(X Y)= E(X)E(Y)=412018.4计解:(1)平均收益率E(X)=1%×0.1+2%×0.2+3%×0.1+4%×0.3+5%×0.2+6%×0.1=3.6%(2)预期利润10×3.6%=0.36万元2017.10单解:E(-3X +2)=-3 E(X)+2=-3×51+2=572017.4填解:E(X+Y)= E(X)+ E(Y)=20×0.1+2=48. 方差反映了随机变量偏离中心——期望的平均偏离程度。
随机变量的数字特征
随机变量的数字特征
随机变量的数字特征包括均值、方差、标准差、偏度和峰度等。
其中,均值是衡量随机变量中心位置的指标,是所有取值的平均数;方差是随机变量离均值的距离平方的平均数;标准差是方差的算术平方根,也是随机变量离均值距离的度量,具有与随机变量相同的量纲;偏度是随机变量概率分布的偏斜程度,为其分布的非对称程度的度量;峰度则是随机变量概率分布的尖锐程度,衡量随机变量的概率分布在平均值附近的峰值高低。
可以通过计算公式来求解以上数字特征,例如均值的计算公式为所有取值的总和除以取值的数量;方差的计算公式为将每个取值与均值的差值平方后的总和除
以取值的数量;标准差的计算公式则是方差的算术平方根;偏度的计算公式为三阶中心矩与标准差的比值;峰度的计算公式为四阶中心矩与标准差的四次幂的比值。
了解随机变量的数字特征有助于描绘随机变量的特征与规律,进而分析和预测其行为。
同时,对于特定应用领域,也需要针对性地选择数字特征进行分析,以
更好地满足应用的需求。
概率统计第四章 随机变量的数字特征
第四章随机变量的数字特征知道了随机变量的概率分布也就知道了它的全部统计特性.然而,在许多实际问题中,随机变量的概率分布往往不易求得,也有不少实际问题并不需要我们知道随机变量的全部统计特性,而只需要知道它的某些主要统计特征.举例:学生成绩.首先要知道平均成绩,其次又要注意各个学生的成绩与平均成绩的偏离程度. 平均成绩越高,偏离程度越小,学生学习成绩就越好。
我们把表示随机变量某些特征的数值称为随机变量的数字特征,它们反映了随机变量的某些本质属性.许多重要的分布往往由这些数字特征唯一确定.本章主要介绍数学期望、方差、相关系数和矩.第一节数学期望一数学期望的定义1. 引例设有十个数字1,1,2,2,2,3,3,3,3,4 以表示平均值,则有又可以写成。
显然,这里的实际上是数字1,2,3,4在这十个数字中所占的份额,我们可以称之为这四个数字的“权重”,所以上式又可称为是1,2,3,4这四个数字的加权平均数。
再换一个角度,设想这是十张写有数字的卡片,随机从中取出一张,观察到的数值为,则它是一个随机变量,它的可能取值为1,2,3,4,而它的分布律为:因此,实质上就是随机变量的取值的平均数。
受此问题的启发,引出如下数学期望的定义.2.数学期望(Mathematical expectation)或均值(Mean的定义1)[定义] 设是离散型随机变量,其概率函数为如果级数绝对收敛,则定义的数学期望为;2)[定义] 设为连续型随机变量,其概率密度为,如果广义积分绝对可积,则定义的数学期望为.【注1】数学期望即随机变量的平均取值,它是所有可能取值以概率为权重的加“权”平均.考察随机变量的平均取值.【注2】连续型随机变量的数学期望和离散型随机变量的数学期望的实质是相同的:相当于;相当于;相当于.【注3】物理解释:数学期望——重心.设有总质量为的个质点构成的质点系,记点在轴上的坐标为,质量为,求该质点系的重心坐标.解:记质点系的重心坐标为,于是,这里是在点处的质量占总质量的比重,因此是以为权的加“权”平均.例1甲、乙两人作射击比赛,命中环数分别为,它们的分布律分别为问:哪一个射手的本领较好?解(环)(环)显然,,因此甲比乙的本领要好些.例2 设随机变量X的密度函数为:,求.解:. 二随机变量函数的数学期望1.[定义] 设为离散型随机变量,其概率函数,为连续函数,且级数绝对收敛,则的函数的数学期望为2.[定义] 设为连续型随机变量,其概率密度为,如果广义积分绝对收敛,则的函数的数学期望为:.例3.设离散型随机变量X的分布律如下,求:.X 0 1 2P 3/10 6/10 1/10解:.例4.设风速X是一个随机变量,在[0,]上服从均匀分布,而飞机的两机翼受到的压力Y与风速X的平方成正比,即,,求:.解:X的密度函数为,而,所以.三数学期望的性质1. (其中c为常数;2. (其中c为常数;3. ;4. 如果X与Y相互独立,则.例4. 若X的数学期望E(X)存在,求:解:第二节方差与标准差一方差(Variance)与标准差(Standard deviation的概念1.方差与标准差的定义[定义] 设是随机变量,若存在,则称为的方差,记为或,即.随机变量的标准差定义为方差的算术平方根,记为.从定义中可清楚地看出:方差实际上是随机变量X 的函数的数学期望,于是当为离散型随机变量,其方差为;当为连续型随机变量,其方差为.【注1】方差描述的是随机变量取值的波动程度,或随机变量偏离均值的程度.2.计算方差的简便公式:利用数学期望的性质,可以得到:.因此,方差的计算常常用简便公式:例1 设,求:解:=0;;所以:.二方差的性质1. (c是常数;2. (c是常数;3. (c是常数;4. 如果与独立,则这个结论可以推广到有限个相互独立的随机变量的情况:设相互独立,则有.例2.设两个相互独立的随机变量与,它们的方差分别为4和2,求解:.例3. 随机变量X有,且已知求解:由∴,故:. 三常用分布的数学期望与方差分布名称数学期望方差0-1 分布p p(1p二项分布np n p (1p泊松分布π(均匀分布指数分布Exp(正态分布N(, 2 2例4. 设随机变量X在区间上服从均匀分布,求解:,;;∴.例5. 设随机变量X服从参数为的二项分布,求解:由二项分布的定义可知:随机变量X表示重贝努里试验中事件A发生的次数,且在每次试验中A发生的概率为.现在引进随机变量,表示在第次试验中A发生;表示在第次试验中A不发生,则.由于各次试验的独立性,且,可得:,,,所以:;.【注2】当直接求某个随机变量的数学期望或方差有困难或计算麻烦时,一个较为有效的处理技巧是把它分解成若干容易求数学期望或方差的随机变量的和,从而可以方便地求出该随机变量的数学期望或方差。
第4章(随机变量的数字特征与极限定理)4.4-4.5
e =E{[Y-(a+bX)]2 } =E(Y2)+b2E(X2)+a2- 2bE(XY)+2abE(X) - 2aE(Y) 这样求出的最佳逼近为
∂e = 2a + 2bE( X) − 2E(Y) = 0L(X)=a0+b0X ∂a ∂e = 2bE( X2 ) − 2E( XY) + 2aE( X) = 0 ∂b
的概率分布为: Y 的概率分布为 P{Y = −1} = 0.55, P{Y = 0} = 0.25, P{Y = 2} = 0.2,
例1 已知离散型随机向量 ( X,Y ) 的概率分布如右表, 的概率分布如右表, 求 cov( X,Y ). 解 于是有
Y X 0 1 2
−1 0.1 0.3 0.15
Cov( X ,Y ) ρ= =0 D( X )D(Y )
并不一定能推出X和 独立. 但由 ρ = 0 并不一定能推出 和Y 独立
服从(-1/2, 1/2)内的均匀分布 而 内的均匀分布,而 例1 设X服从 服从 内的均匀分布 Y=cos X, 不难求得, 不难求得, Cov(X,Y)=0, , 和 不相关 因而 ρ =0,即X和Y不相关 . , 但Y与X有严格的函数关系, X和Y不独立 . 有严格的函数关系, 与 有严格的函数关系 即 和 不独立
−∞ 0
x f X ( x)dx = ∫ x2 ⋅ 4x(1 − x2 )dx ∫−∞
2 0+∞1 Nhomakorabea于是
E(X)= 8/ 15, E(Y )= 4/ 5, E(XY ) = 4/ 9,
从而 cov( X,Y ) = E( XY ) − E( X)E(Y ) = 4/ 225, 又 E( X 2 ) = 1/ 3,
第四章随机变量的数字特征
首先将二维正态随机变量的概率密度改写成另一种形式 二维正态随机变量(X1,X2)的概率密度为
( x1 1 ) 2 ( x1 1 )( x 2 2 ) ( x 2 2 ) 2 2 2 2 2 ( 1 2 ) 1 2 1 2 1
协方差 Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}=E(XY)-E(X)E(Y) 相关系数 XY
Cov( X , Y ) D( X ) D(Y )
相关系数的性质
1° |XY|£1
XY仅说明X和Y的线性相关性,因此X,Y不相关,不一定独立
对于二维正态随机变量X,Y则存在特例:=0 ÛX和Y相互独立 矩、协方差矩阵 l阶中心矩 E{[X-E(X)]l} l阶原点矩 E(Xl) l+m阶混合原点矩 E(XlYm)
第四章 随机变量的数字特征
§4.1 数学期望 §4.2 方差 §4.3 协方差及相关系数
§4.4 矩、协方差矩阵
1/21
§4.4 矩、协方差矩阵
本节引入随机变量的另外几个数字特征
定义:X和Y是随机变量 1°若E(Xk)存在,k=1,2,…,称它为X的k阶原点矩,简称k阶矩 当k=1时即为数学期望E(X),它是X的一阶原点矩 2°若E{[X-E(X)]k}存在,k=1,2,…,称它为X的k阶中心矩
Cov(X1,X2)
Cov(X2,X1) D(X2)
将它们排成矩阵的形式, c11 c12 这个矩阵称为随机变量 (X1,X2)的协方差矩阵 c c 21 22 3/21
§4.4 矩、协方差矩阵
设 n 维随机变量( X 1 , X 2 ,, X n ) 的二阶混合中心矩
概率知识点总结汇总
(6)条件分布
离散型
在已知X=xi的条件下,Y取值的条件分布为
在已知Y=yj的条件下,X取值的条件分布为
连续型
在已知Y=y的条件下,X的条件分布密度为
;
在已知X=x的条件下,Y的条件分布密度为
(7)独立性
一般型
F(X,Y)=FX(x)FY(y)
离散型
有零不独立
连续型
f(x,y)=fX(x)fY(y)
(4)分布函数
设为随机变量,是任意实数,则函数
称为随机变量X的分布函数,本质上是一个累积函数。
可以得到X落入区间的概率。分布函数表示随机变量落入区间(– ∞,x]内的概率。
分布函数具有如下性质:
1°;
2°是单调不减的函数,即时,有;
3°,;
4°,即是右连续的;
5°。
对于离散型随机变量,;
对于连续型随机变量,。
分布满足可加性:设
则
t分布
设X,Y是两个相互独立的随机变量,且
可以证明函数
的概率密度为
我们称随机变量T服从自由度为n的t分布,记为T~t(n)。
F分布
设,且X与Y独立,可以证明的概率密度函数为
我们称随机变量F服从第一个自由度为n1,第二个自由度为n2的F分布,记为F~f(n1, n2).
第四章随机变量的数字特征
(1)联合分布
离散型
如果二维随机向量(X,Y)的所有可能取值为至多可列个有序对(x,y),则称为离散型随机量。
设=(X,Y)的所有可能取值为,且事件{ = }的概率为pij,,称
为=(X,Y)的分布律或称为X和Y的联合分布律。联合分布有时也用下面的概率分布表来表示:
Y
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章 随机变量的数字特征㈠ 数学期望 表征随机变量取值的平均水平、“中心”位置或“集中”位置. 1、数学期望的定义(1) 定义 离散型和连续型随机变量X 的数学期望定义为{}⎪⎩⎪⎨⎧==⎰∑∞∞- d )( )()( ,,连续型离散型x x xf x X x X kk k P E其中Σ表示对X 的一切可能值求和.对于离散型变量,若可能值个数无限,则要求级数绝对收敛;对于连续型变量,要求定义中的积分绝对收敛;否则认为数学期望不存在. ①常见的离散型随机变量的数学期望1、离散型随机变量的数学期望设离散型随机变量的概率分布为,若,则称级数为随机变量的数学期望(或称为均值),记为, 即2、两点分布的数学期望设服从0—1分布,则有,根据定义,的数学期望为.3、二项分布的数学期望设服从以为参数的二项分布,,则。
4、泊松分布的数学期望设随机变量服从参数为的泊松分布,即,从而有。
①常见的连续型随机变量的数学期望1)均匀分布设随机变量ξ服从均匀分布,ξ~U [a ,b ] (a <b ),它的概率密度函数为:= 则=∴ E (ξ)=(a+b )/2. 即数学期望位于区间的中点.2)正态分布设随机变量ξ服从正态分布,ξ~N(μ,σ2),它的概率密度函数为:(σ>0,- <μ<+ )则令得∴ E(ξ)=μ .3)指数分布设随机变量服从参数为的指数分布,的密度函数为,则.(2) 随机变量的函数的数学期望设)(xgy=为连续函数或分段连续函数,而X是任一随机变量,则随机变量)(XgY=的数学期望可以通过随机变量X的概率分布直接来求,而不必先求出Y的概率分布再求其数学期望;对于二元函数),(YXgZ=,有类似的公式:(){}⎪⎩⎪⎨⎧===⎰∑∞∞.;(连续型)离散型-d)()()()(xxfxgxXxgXgY kkkPEE()(){}()()()()⎪⎩⎪⎨⎧====⎰⎰∑∑∞∞-∞∞-.;连续型离散型dd,,,,,yxyxfyxgyYxXyxgYXgZi jjijiPEE设(,)X Y为二维离散型随机变量,其联合概率函数(,),,1,2,,i j ijP X a Y b p i j====如果级数(,)i j ijj ig a b p∑∑绝对收敛,则(,)X Y的函数(,)g X Y的数学期望为[(,)](,)i j ijj iE g X Y g a b p=∑∑;特别地();()i ij j iji i j iE X a p E Y b p==∑∑∑∑.设X为连续型随机变量,其概率密度为()f x,如果广义积分()()g x f x dx+∞-∞⎰绝对收敛,则X的函数()g X的数学期望为[()]()()E g X g x f x dx+∞-∞=⎰.设(,)X Y 为二维连续型随机变量,其联合概率密度为(,)f x y ,如果广义积分(,)(,)g x y f x y dxdy+∞+∞-∞-∞⎰⎰绝对收敛,则(,)X Y 的函数(,)g X Y 的数学期望为[(,)](,)(,)E g x y g x y f x y dxdy+∞+∞-∞-∞=⎰⎰; 特别地()(,)E x xf x y dxdy +∞+∞-∞-∞=⎰⎰,()(,)E Y yf x y dxdy+∞+∞-∞-∞=⎰⎰.注:求E(X,Y)是无意义的,比如说二维(身高,胖瘦)的数学期望是无意义的,但是二维随机变量函数Z= E(X,Y)是有意义的,他表示的是函数下的另一个一维意义。
2、数学期望的性质(1) 对于任意常数c ,有c c =E . 例E[E(X)]=E(X) (2) 对于任意常数λ,有X XE E λλ=.例:E(aX+b)=aE(X)+b(3) 对于任意m X X X ,,,21 ,有()m m X X X X X X E E E E +++=+++ 2121. (4) 如果m X X X ,,,21 相互独立,则()m m X X X X X X E E E E2121=.(注:相互独立有后面的结论成立,但这是单向性的,即不能有结论推出独立) ㈡ 方差和标准差 表征随机变量取值分散或集中程度的数字特征. 1、方差的定义 称222)()(X X X X X E E E E D -=-=为随机变量X 的方差,称XD =σ为随机变量X 的标准差.随机变量X 的方差有如下计算公式:(){}()⎪⎪⎩⎪⎪⎨⎧-=-=⎰∑∞∞-.;连续型离散型 )( d )( )( 22x x f X x x X X x X kk k E P E D (4.3) 2、常见分布的方差(1)两点分布设ξ~(0-1),其概率分布为: P (ξ=1)=p , P (ξ=0)=1-p =q (0<p <1) E (ξ)=p , E (ξ2)=12×p +02×(1-p )=p ∴ D (ξ)=E (ξ2)-(E (ξ))2=p -p 2=p (1-p ) (2)二项分布设ξ~B (n ,p ), 其概率分布为:(k =0, 1, 2,…,n ) (0<p <1) E (ξ)=np,(此处运用组合数公式)==,(运用二项分布的数学期望公式知 )E (ξ2)=np (n -1)p +np ,∴ D (ξ)=E (ξ2)-(E (ξ))2=np (1-p ). (3)均匀分布设ξ~U [a , b ] ( a < b ),它的概率密度函数为:E (ξ)=(a +b )/2 ,.∴ D (ξ)=E (ξ2)-(E (ξ))2=(b -a )2/12. (4)正态分布设ξ~N (μ, σ2),它的概率密度函数为:(σ>0,-∞<μ<+∞) E (ξ)=μ(令t =(x -μ)/σ)=σ2 ∴ D (ξ)=σ2.(5)指数分布2、方差的性质 (1)0≥X D ,并且0=X D 当且仅当X (以概率1)为常数;(2) 对于任意实数λ,有XXD D 2λλ=;(方差对随机变量前面的常数具有平方作用)(3) 若m X X X ,,,21 两两独立或两两不相关,则()m m X X X X X X D D D D +++=+++ 2121.(4)D(X)≥0,D(X)=0的充要条件是P {X=E (X )}=1或者P{X=C}=1. (5)设X 是一个随机变量,c 是常数,则D(X+c)=D(X).例:D (kξ+c )= k 2D (ξ); ㈢ 切比雪夫不等式我们知道方差)(X D 是用来描述随机变量X 的取值在其数学期望)(X E 附近的离散程度的,因此,对任意的正数ε,事件ε≥-)(X E X 发生的概率应该与)(X D 有关,而这种关系用数学形式表示出来,就是下面我们要学习的切比雪夫不等式。
定理1 设随机变量X 的数学期望)(X E 与方差)(X D 存在 ,则对于任意正数ε,不等式 2)(])([ εεX D X E X P ≤≥- (1) 或 2)(1])([ εεX D X E X P -≥<- (2)都成立。
不等式(1)和(2)称为切比雪夫不等式。
切比雪夫不等式给出了在随机变量X 的分布未知的情况下,只利用X 的数学期望和方差即可对X 的概率分布进行估值的方法,这就是切比雪夫不等式的重要性所在。
例1 已知正常男性成人血液中,每毫升含白细胞数的平均值是7300,均方差是700,利用切比雪夫不等式估计每毫升血液含白细胞数在9400~5200之间的概率。
解 设X 表示每毫升血液中含白细胞个数,则700)()(,7300)(===X D X X E σ而}2100|7300{|1}2100|7300{|}94005200{≥--=≤-=≤≤X P X P X P又912100700}2100|7300{|22=≤≥-X P 所以98}94005200{≥≤≤X P ㈢ 协方差和相关系数考虑二维随机向量),(Y X ,其数字特征包括每个变量的数学期望和方差,以及X 和Y 的联合数字特征——协方差和相关系数.1、协方差和相关系数的定义(1) 协方差 随机变量X 和Y 的协方差定义为Y X XY Y Y X X Y X E E E E E E -=--=))((),cov(,其中{}()()()⎪⎪⎩⎪⎪⎨⎧===⎰⎰∑∑∞∞-∞∞-.;连续型离散型 d d , , y x y x xyf y Y x X y x XY i jj i j i P E (2) 相关系数 随机变量X 和Y 的相关系数定义为()yx Y X XY Y X Y X σσρE E E D D -==,cov .2、协方差的性质 设随机变量X 和Y 的方差存在,则它们的协方差也存在. (1) 若X 和Y 独立,则0),cov(=Y X ;对于任意常数c ,有0),cov(=c X .(2)),cov(),cov(X Y Y X =.(3) 对于任意实数a 和b ,有),cov(),cov(Y X ab bY aX =.(4) 对于任意随机变量Z Y X ,,,有.,),cov(),cov(),cov( ),cov(),cov(),cov(Z X Y X Z Y X Z Y Z X Z Y X +=++=+(5) 对于任意X 和Y ,有()Y X Y X D D ≤,cov .(等号成立,且当仅当存在常数啊,a ,b 使P{Y=a+bX}=1成立)(6) 对于任意X 和Y ,有),cov(2)(Y X Y X Y X±+=±D D D .3、相关系数的性质 相关系数的如下三条基本性质,决定了它的重要应用.设ρ——X 和Y 的相关系数,,,,,222121Y X Y X D D E E ====σσμμ(1)11≤≤-ρ.(2) 若X 和Y 相互独立,则ρ=0;但是,当ρ=0时X 和Y 却未必独立. (3)1=ρ的充分必要条件是X 和Y (以概率1)互为线性函数.(4)对随机变量x ,y ,下列事件等价: ①cov (X,Y )=0;②X 和Y 不相关;③E(XY)=E(X)E(Y);④D(X+Y)=D(X)+D(Y)三条性质说明,随着变量X 和Y 之间的关系由相互独立到互为线性函数,它们的相关系数的绝对值ρ从0增加到1,说明相关系数可以做两个变量统计相依程度的度量.4、随机变量的相关性 假设随机变量X 和Y 的相关系数ρ存在.若ρ= 0,则称X 和Y 不相关,否则称X 和Y 相关.(1) 若两个随机变量独立,则它们一定不相关,而反之未必;(2) 若X 和Y 的联合分布是二维正态分布,则它们“不相关”与“独立”等价.㈣ 矩 在力学和物理学中用矩描绘质量的分布.概率统计中用矩描绘概率分布.常用的矩有两大类:原点矩和中心矩.数学期望是一阶原点矩,而方差是二阶中心矩.1、原点矩 对任意实数0≥k ,称kk X E =α为随机变量X的k 阶原点矩,简称k 阶矩.XE 1=α.原点矩的计算公式为:{}⎪⎪⎩⎪⎪⎨⎧===⎰∑∞∞-.;连续型离散型 d )( )()( x x f x x X x X ki i k i kk P E α 一阶原点矩是数学期望()E X ; 2、中心矩 称()kkX X E E -=μ为随机变量X的k 阶中心矩.二阶中心矩是方差D(X);3.混合中心矩随机变量(,)X Y 的(,)k l 阶混合原点矩定义为()klE X Y ;随机变量(,)X Y 的(,)k l 阶混合中心矩定义为[(())(())]k lE X E X Y E Y --.(1,1)阶混合中心矩为协方差cov(,)X Y . (四)常用分布的数字特征9.1当X 服从二项分布(,)B n p 时, (),()(1)E X np D X np p ==-. 9.2 当X 服从泊松分布()p λ时, (),()E X D X λλ==,9.3 当X 服从区间(,)a b 上均匀分布时,2()(),()212a b b a E X D X +-==9.4 当X 服从参数为λ的指数分布时,211(),()E X D X λλ== 9.5 当X 服从正态分布2(,)N μσ时, 2(),()E X D X μσ==.9.6 当(,)X Y 服从二维正态分布221212(,,,,)N μμσσρ时, 211(),()E X D X μσ==;222(),()E Y D Y μσ==;12cov(,),XY X Y ρσσρρ==三、典型例题及其分析例4.2.1 一台设备由三大部件构成,在设备运转中各部件需要调整的概率相应为0.10,0.20和0.30,假设各部件的状态相互独立,以X 表示同时需要调整的部件数,试求X 的数学期望EX 和方差DX .【思路】 关键是求出X 的分布律,然后用定义计算EX .【解】 引入事件:{} i=1,2,3.i A i =第个部件需要调整根据题设,三部件需要调整的概率分别为()()()1230.10,0.20,0.30.P A P A P A ===由题设部件的状态相互独立,于是有 ()()()()()1231230 0.90.80.70.504.P X P A A A P A P A P A ====⨯⨯=()()12312312310.10.80.70.90.20.70.90.80.3 0.398P X P A A A A A A A A A ==⋃⋃=⨯⨯+⨯⨯+⨯⨯=()()12312312320.10.20.70.10.80.30.90.20.3 0.092;P X P A A A A A A A A A ==⋃⋃=⨯⨯+⨯⨯+⨯⨯=于是的分布律为从而00.50410.39820.09230.0060.6,i i iEX x p ==⨯+⨯+⨯+⨯=∑22222200.50410.39820.09230.0060.820.i i iEX x p ==⨯+⨯+⨯+⨯=∑故()2220.8200.60.46.DX EX EX =-=-=【解毕】【技巧】 本题的关键是引入事件i A ,将X的分布律求出,因此,可以发现求期望和方差的难点转到了求X的分布.同时,方差的计算一般均通过公式()22DXEX EX =-来进行.例4.2.3 设X 是一随机变量,其概率密度为()1, 10,1, 01,0, x x f x x x +-≤≤⎧⎪=-<≤⎨⎪⎩其他.求DX .(1995年考研题) 【解】()()()()()()()011011222221110..11211 6EX xfx dx x x dx x x dx EXx fx dx x x dx x x dx x x dx+∞-∞-+∞-∞-==++-===++-=-=⎰⎰⎰⎰⎰⎰⎰于是()221.6DX EX EX =-= 【解毕】【技巧】 在计算数学期望和方差时,应首先检验一下()f x 的奇偶性,这样可利用对称区间上奇偶函数的积分公式简化求解,比如本题中,()f x 为偶函数,故()0.EX xf x dx +∞-∞==⎰同样DX 的计算也可直接简化.例4.2.4 已知连续型随机变量X 的密度函数为()221, -<x<+.xx f x -+-=∞∞求EX与DX . (1987年考研题)【思路】 一种求法是直接利用数学期望与方差的定义来求.另一种方法是利用正态分布的形式及其参数的含义. 【解】 (方法1)直接法.由数学期望与方差的定义知()()()()()()222211111 1.x x x x EX xf x dx xedx edx x edx edx +∞+∞+∞+∞-------∞+∞--===-==⎰⎰⎰⎰⎰()()()()()22222212111.2x t t DX E X EX x f x dx x dxt ee dt +∞+∞---∞-∞+∞+∞---∞-∞=-=-=-==⎰⎰⎰⎰(方法2) 利用正态分布定义.由于期望为μ,方差为2σ()()222.x x μσ---∞<<+∞所以把()f x 变形为()()221212x fx π--⨯=易知,()fx 为11,2N ⎛⎫ ⎪⎝⎭的概率密度,因此有11,.2EX DX == 【技巧】 解决本题的关键是要善于识别常用分布的密度函数,不然的话,直接计算将会带来较大的工作量.反过来,用正态分布的特性也可以来求积分2kxe dx +∞--∞⎰等.(2)若干计算公式的应用主要包括随机变量函数的数学期望公式,数学期望与方差的性质公式的应用.例4.2.5 设X 表示10次独立重复射击中命中目标的次数,每次射中目标的概率为0.4,求2EX . (1995年考研题) 【解】 由题意知()~10,0.4X B 于是100.44,EX =⨯=()100.410.4 2.4.DX =⨯⨯-=由()22DXEX EX =-可推知()2222.4418.4.EXDX EX =+=+=【寓意】 本题考查了两个内容,一是由题意归结出随机变量X 的分布;二是灵活应用方差计算公式,如果直接求解,那么()1010221000.410.4kk k K EXk C -==-∑的计算是繁琐的.例4.2.6 设X 服从参数1λ=的指数分布,求()2X E X e -+.(1992年考研题)【解】 由题设知,X 的密度函数为(), 0,0, 0.x e x f x x -⎧>=⎨≤⎩ 且1EX =,又因为()22201,3Xxx xEeef x dx e e dx +∞+∞-----∞===⎰⎰ 从而()22141.33X X E X e EX Ee --+=+=+= 【解毕】【寓意】 本题的目的是考查常见分布的分布密度(或分布律)以及它们的数字特征,同时也考查了随机变量函数的数学期望的求法.例4.2.7 设二维随机变量(),X Y 在区域(){},:01,G x y x y x =<<<内服从均匀分布,求随机变量21Z X =+的方差.DZ【解】 由方差的性质得知()214DZ D X DX =+=又由于X 的边缘密度为()()1, 01,0, .2, 010, xX xdy x f x f x y dy x x +∞--∞⎧<<⎪==⎨⎪⎩<<⎧=⎨⎩⎰⎰其他其他.于是()112200222212, 2,32121.2318EX x xdx EX x xdx DX EX EX ====⎛⎫=-=-= ⎪⎝⎭⎰⎰ 因此 ,1244.189DZ DX ==⨯=【解毕】 【技巧】 尽管本题给出的是二维随机变量,但在求X 的期望于方差时,可以从X 的边缘密度函数出发,而不必从X 与Y 的联合密度函数开始.在一般情形下,采用边缘密度函数较为方便.例4.2.8 设随机变量X 和Y 独立,且X 服从均值为1的正态分布,而Y 服从标准正态分布,试求随机变量23ZX Y =-+的概率密度函数.(1989年考研题)【思路】 此题看上去好像与数字特征无多大联系,但由于X 和Y 相互独立且都服从正态分布,所以Z 作为,X Y的线性组合也服从正态分布.故只需求EZ 和DZ ,则Z 的概率密度函数就唯一确定了. 【解】 由题设知,()()~1,2,~0,1X N Y N .从而由期望和方差的性质得2235,29.EZ EX EY DZ DX DY =-+==+=又因Z 是,X Y 的线性函数,且,X Y 是相互独立的正态随机变量,故Z 也为正态随机变量,又因正态分布完全由其期望和方差确定,故知()~5,9ZN ,于是,Z 的概率密度为()()2529, .z Zf z z --⨯=-∞<<+∞ 【解毕】【寓意】 本题主要考查二点内容,一是独立正态分布的线性组合仍为正态分布;其二是正态分布完全由其期望和方差决定.例4.2.9 假设随机变量Y 服从参数为1λ=的指数分布,随机变量0, ,1, .kY k X Y k ≤⎧=⎨>⎩若若()1,2k =(1) 求1X 和2X 的联合概率分布;(2) 求()12EX X +.【解】 显然,Y 的分布函数为 ()1, 0,0, 0.ye y F y y -⎧->=⎨≤⎩10, 11 1.Y X Y ≤⎧=⎨>⎩若,,若 20, 212.Y X Y ≤⎧=⎨>⎩若,,若(1)()12X X +有四个可能取值:()()()()0,0,0,1,1,0,1,1,且()()()()()()()()()()()()()()121121212120,01,21 11,0,11,20,1,01,212 21,1,11,22 P X X P Y Y P Y F e P X X P Y Y P X X P Y Y P Y F F e e P X X P Y Y P Y --===≤≤=≤==-===≤>====>≤=<≤=-=-===>>=>()2 12.F e -=-= 于是得到1X 和2X 的联合分布律为(3) 显然,12,X X 的分布律分别为1X 0 1 2X 0 1P11e -- 1e - P 21e -- 2e -因此 1212,.EX e EX e --==故()121212.E X X EX EX e e --+=+=+ 【解毕】【技巧】 本题中若不要求求X 与Y 的联合分布律,也可直接求出()12E X X +,这是因为()()()1111011.EX P Y P Y P Y e -=⨯>+⨯≤=>=而 222,EX PY e -=>= 因此()121212.E X X EX EX e e --+=+=+不仅如此,我们还能求12,X X 其他函数的期望.例如求()12E X X ,此时,由于121, 2,0 .Y X X >⎧=⎨⎩若,其他故()()()()21212022.E X X P Y P Y P Y e -=⨯>+⨯≤=>=例4.2.10 设随机变量(),X Y 服从二维正态分布,其密度函数为()()22121,2x y f x y e π-+=求随机变量Z=的期望和方差.【思路】 利用随机变量函数的期望的求法进行计算.【解】由于Z=,故()222,1 .2x y EZ Ef x y dxdy dxdy π+∞-∞-∞+∞+--∞-∞===⎰⎰⎰⎰令cos ,sin .x r y r θθ=⎧⎨=⎩,则22222222000211222 |r r r r EZ d rer re e dr edr πθπππ+∞+∞---+∞+∞-⎡⎤==-+⎢⎥⎢⎥⎣⎦==⎰⎰⎰⎰而()()()2222222222222212122 2.xy r r EZ E X Y xy edxdyd rerdr redrππθπ++∞+∞--∞-∞+∞+∞--=+=+===⎰⎰⎰⎰⎰故 ()222.2DZ EZ EZ π=-=-【解毕】【技巧】 本题也可先求出Z 的密度函数,再来求Z 的期望与方差,但由于求Z 的密度本身就是一繁琐的工作,因此我们借助随机变量函数的期望公式来求解,再此公式中并不需要知道Z 的分布,而只需直接计算一个二重积分即可.因此,对随机变量函数的期望计算问题,除非它是一线性函数,或者(),X Y 为离散型随机变量,一般我们往往不直接去求这个函数的分布,而直接按随机变量函数的期望计算公式来求解. 例 4.3.4 已知随机变量X 与Y 分别服从正态分布()21,3N 和()20,4N ,且X与Y 的相关系数12XYρ=-,设,32X YZ =+求:(1)Z 的数学期望EZ 和方差DZ ; (2)X 与Z 的相关系数XZ ρ;(2) (3) 问X 与Z 是否相互独立?为什么?(1994年考研题)【解】 (1)由数学期望的运算性质有111.32323X Y EZ E EX EY ⎛⎫=+=+= ⎪⎝⎭由()()2,DX Y DX DY Cov X Y +=++有()2211112,32323211112,3232111 943 142 3.XY X Y DZ D D X D Y Cov X Y DX DY Cov X Y DX DY DX DYρ⎛⎫⎛⎫⎛⎫⎛⎫=+=++ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭=++⨯⨯=++=+-= (2)因为()()()2,,3211,,321132111 3340,322XY X Y Cov X Z Cov X Cov X X Cov X Y DX DX DYρ⎛⎫=+ ⎪⎝⎭=+=+⎛⎫=⨯+⨯-⨯⨯= ⎪⎝⎭所以,0.XZ Cov X Z DZρ==(3)因,X Y 均为正态,故,X Y的线性组合Z 也是正态随机变量,由于二正态分布的独立性与相关性是等价的,所以由0XZρ=知,X 与Z 相互独立. 【解毕】【寓意】 本题考查的主要有两点,一是关于协方差,有性质()()()()(),,,,,C o v a Xb Yc Ud V a c C o v X U a d C o v X V b c C o v Y U b d C o v Y V ++=+++另一点为:对于二正态变量X 与Y ,X 与Y 相互独立等价于0.XY ρ=综例4.4.3 设随机变量X 的概率密度为(), 02,, 24,0, .ax x f x cx b x <<⎧⎪=+≤≤⎨⎪⎩其他已知()32,13.4EXP X =<<=求:(1)常数,,;a b c (2)XEe . 【思路】 要确定三个常数,,,a b c 需三个条件,题设中已有两个条件,另一条件为()1,f x dx +∞-∞=⎰而X Ee 只需利用随机变量函数的期望计算公式即可.【解】 (1)由概率密度的性质知,有()()2421262.f x dx axdx cx b dx a c b +∞-∞==++=++⎰⎰⎰又因为()()24022356 6,83EX xf x dx x axdx x cx b dx a c b +∞-∞===++=++⎰⎰⎰而 ()()()323112313435.22P X f x dx axdx cx b dxa cb =<<==++=++⎰⎰⎰ 解方程 2621,85662,33353.224a cb ac b a c b ⎧⎪++=⎪⎪++=⎨⎪⎪++=⎪⎩ 得111,4,4a b c ===- (2)()24242144111.424Xxxx x x Eee f x dx edx e dxe e +∞-∞⎛⎫==+- ⎪⎝⎭=-+⎰⎰⎰ 【解毕】。