随机变量的数字特征
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
E (X + Y ) = E (X ) + E (Y )
n n E ai X i C ai E ( X i ) C i1 i1
当X ,Y 独立时,E (X Y ) = E (X )E (Y ) .
若存在数 a 使 P(X a) = 1, 则 E (X ) a ; 若存在数 b 使 P(X b) = 1, 则 E (X ) b.
解 只须计算方案(2)所需化验次数的期望. 为简单计, 不妨设 n 是 k 的倍数,共分成 n / k 组. 设第 i 组需化验的次数为X i, 则
Xi P 1 k+1
k
1 p
k
1 1 p
k
E ( X i ) 1 p (k 1)[1 1 p ]
公司期望总收益为
E ( X i ) E ( X i ) 100000 20a .
i 1 i 1
1000
1000
若公司每笔赔偿3000元, 能使公司期望 总获益40000元.
应用2
验血方案的选择
为普查某种疾病, n 个人需验血. 验血方 案有如下两种: (1) 分别化验每个人的血, 共需化验 n 次; (2) 分组化验, k 个人的血混在一起化验, 若 结果为阴性, 则只需化验一次; 若为阳性, 则 对 k 个人的血逐个化验, 找出有病者, 此时 k 个人的血需化验 k + 1 次. 设每人血液化验呈阳性的概率为 p, 且 每人化验结果是相互独立的.试说明选择哪 一方案较经济.
2 4 1 2 3 4
3
1 C4 4 4
1 1 4! C4C3 P42 P 4 4 4 4 81 E( X ) 64
解二 再引入 X i ,i = 1,2,3,4
1, 第i盒空, Xi 其它, 0,
X X1 X 2 X 3 X 4
Xi
1
3 4
4
0
k
(k 1) k 1 p
k
n k E ( X ) E ( X i ) (k 1) k 1 p k i 1
k
n
1 k n 1 (1 p) k (1 p) k 1 0, 若 则E (X ) < n k
(0 p 1)k r , r 1, r 1
P( X k ) p(1 p) k 1 , (0 p 1) k 0,1,2,
r p
几何分布
1 p
分布
概率密度
期望
1 , a x b, a b 区间(a,b)上的 f ( x) b a 均匀分布 2 0, 其它 x e , x 0, 1 f ( x) E() 其它 0,
2
2
1 2
e
t2 2
dt 2
t 2
e
t2 2
dt
2
t
2
2
e
t2 2
dt
由分部积分法有 因而
2
2
t
2
2
2
e
t2 2
dt 1
E( X )
(2) E (e ) e f ( x)dx 2 e
P( X k )
期望
p
np
e
k
k! k 0,1,2,
分布
超几何分布
概率分布
k n C N CM k P( X k ) Cln
期望
nN l
k 0,1,2, n, n N
lM N
负二项分布
1 P( X k ) Ckr1 p r (1 p) k r
例如,
n 1000 , p 0.001, k 10 ,
1 10 E ( X ) 1000 1 0.999 110 1000 . 10
当 (1 p) 1 / k 时, 选择方案(2) 较经济.
k
应用3 市场上对某种产品每年需求量为 X 吨 ,X ~ U [ 2000,4000 ], 每出售一吨可赚 3万元 ,售不出去,则每吨需仓库保管费1 万元,问应该生产这中商品多少吨, 才能 使平均利润最大?
注
性质 4 的逆命题不成立,即
若E (X Y ) = E (X )E (Y ),X ,Y 不一定独立
证 性质5
设 X 连续,d.f. 为 f (x), 分布函数为 F(x), 则
P( X a) 1 P( X a)
1 F (a) 1
F (a) 0
F ( x) 0,
f ( x) 0,
N(,
2)
1 f ( x) e 2
( x )2 2 2
分布
伽玛分布
概率密度
1 x x e , x 0, f ( x) ( ) 0, x0
期望
威布尔分布
x x 1 ( ) exp[ ( ) ], x 0 f ( x) 0, 0 0, x
y X, yX
E (Y ) g ( x) f X ( x)dx
4000 1 1 2000 (4 x y ) dx y 3 y dx 2000 2000 1 2 6 (2 y 14000 y 8 10 ) 2000 y
解 设Xi 表示公司从第 i 个投保者身上所得 的收益, i =1~1000 . 则 Xi ~ 100 100 a 0.98 0.02
由题设 E ( X i ) 100 0.98 (100 a) 0.02
100 0.02a 0 100 a 5000
公司每笔赔偿小于5000元, 能使公司获益.
注意 不是所有的 r.v.都有数学期望
例如:柯西(Cauchy)分布的密度函数为
1 f ( x) , 2 (1 x )
x
| x| 但 | x | f ( x)dx dx 发散 (1 x 2 )
它的数学期望不存在!
随机变量函数 Y = g(X ) 的数学期望 设离散 r.v. X 的概率分布为
P( X xi ) pi , i 1,2,
若无穷级数
g ( xi ) pi 绝对收敛,则
i 1
E (Y ) g ( xi ) pi
设连续 r.v. 的 d.f. 为f (x) 若广义积分 g ( x) f ( x)dx 绝对收敛, 则
i 1
E (Y ) g ( x) f ( x)1)k
np
特例 若Y ~ B ( 1 , p ), 则 E(Y) p
例3
X ~ N ( , 2 ), 求 E ( X ) .
( x )2 2 2
1 解 E ( X ) x e 2
令 x u
试问哪一个选手射击本领较好?
甲:8×0.3N+9×0.1N+10×0.6N=9.3N
乙:8×0.2N+9×0.5N+10×0.3N=9.1N
数学期望的定义
设 X 为离散 r.v. 其分布为
P( X xk ) pk ,
若无穷级数
k 1,2,
绝对收敛, 则称
xk p k
k 1
其和为 X 的数学期望 记作 E( X ), 即
E ( X ) xk p k
k 1
定义
设连续 r.v. X 的 d.f. 为 若广义积分 xf ( x)dx 绝对收敛, 则称此积分为 X 的数学期望 记作 E( X ), 即
E ( X ) xf ( x)dx
f (x)
数学期望的本质 —— 加权平均 它是一个数不再是 r.v.
3 1 4
4 4
P
3 E( X i ) 4
4
3 81 E( X ) 4 4 64
应用1 据统计65岁的人在10年内正常死亡 的概率为0. 98, 因事故死亡概率为0.02.保险 公司开办老人事故死亡保险, 参加者需交纳 保险费100元.若10 年内因事故死亡公司赔偿 a 元, 应如何定 a , 才能使公司可期望获益; 若有1000人投保, 公司期望总获益多少?
例 5 设随机变量 X 服从正态分布 N (, 2 ) ,求 (1) E ( X 2 ) ;(2)
E (e X ) .
( x )2 2 2
解: 令 则
(1)
x
E ( X 2 ) x 2 f ( x)dx
x2 2
e
dx ,
t
,
E( X )
例2
X ~ B ( n , p ), 求 E( X ) .
n k 0
解 E ( X ) kCnk p k (1 p) nk
(n 1)! k 1 ( n 1)( k 1) np p (1 p) k 1 ( k 1)!( n k )!
n
np C p (1 p)
x 1 p
k 1 x1 p 1 1 p 2 (1 x) x1 p p
常见 r.v. 的数学期望(P85)
分布
参数为p 的 0-1分布 B(n,p) P()
概率分布
P( X 1) p P( X 0) 1 p
P( X k ) Cnk p k (1 p) nk k 0,1,2,, n
X x
e
x
( x )2 2 2
dx ,
令 t, 则 E(e ) e
X
x
t
1 2
e
t2 2
dt e
2 2
1 2
e
t2 2
dt e
2 2
.
数学期望的性质
E (C ) = C 常数
E (aX ) = a E (X )
dx
u2 2
1 (u ) e du 2 例4 设 X ~ 参数为 p 的几何分布,求E ( X ).
解 E ( X ) kp(1 p) k 1 p kx k 1
k 1
'
xk p k 1
第四章
随机变量的数字特征
分布函数能完整地描述 r.v.的统计特
性, 但实际应用中并不都需要知道分布函 数,而只需知道 r.v.的某些特征. 例如: 判断棉花质量时, 既看纤维的平均长度 又要看 纤维长度与平均长度的偏离程度 平均长度越长,偏离程度越小, 质量就越好;
考察一射手的水平, 既要看他的平均 环数是否高, 还要看他弹着点的范围是否 小, 即数据的波动是否小. 由上面例子看到,与 r.v. 有关的某 些数值,虽不能完整地描述 r.v.但能清 晰地描述 r.v.在某些方面的重要特征 , 这些数字特征在理论和实践上都具有重 要意义.
随机变量某一方面的概率特性 都可用数字来描写
本 章 r.v.的平均取值 —— 数学期望 内 r.v.取值平均偏离均值的情况 容 —— 方差
第一节 数学期望
例1. 有甲、乙两个射击选手,他们的射击技术由下表给出: 甲射手:
环数
p
8
0.3
9
0.1
10
0.6
乙射手:
环数
p
8
0.2
9
0.5
10
0.3
解
1 , 2000 x 4000, f X ( x) 2000 0, 其它
设每年生产 y 吨的利润为 Y
显然,2000 < y < 4000
3 y, Y g( X ) 3 X ( y X ) 1, y x, 3 y, g ( x) 4 x y , y x
故
xa
xa
E ( X ) a xf ( x)dx a af ( x)dx
a
例6 将 4 个不同色的球随机放入 4 个盒子 中, 每盒容纳球数无限, 求空盒子数的 数学期望. 解一 设 X 为空盒子数, 则 X 的概率分布为
X 0 1
2 4
2
C (C C C ) 4 4
n n E ai X i C ai E ( X i ) C i1 i1
当X ,Y 独立时,E (X Y ) = E (X )E (Y ) .
若存在数 a 使 P(X a) = 1, 则 E (X ) a ; 若存在数 b 使 P(X b) = 1, 则 E (X ) b.
解 只须计算方案(2)所需化验次数的期望. 为简单计, 不妨设 n 是 k 的倍数,共分成 n / k 组. 设第 i 组需化验的次数为X i, 则
Xi P 1 k+1
k
1 p
k
1 1 p
k
E ( X i ) 1 p (k 1)[1 1 p ]
公司期望总收益为
E ( X i ) E ( X i ) 100000 20a .
i 1 i 1
1000
1000
若公司每笔赔偿3000元, 能使公司期望 总获益40000元.
应用2
验血方案的选择
为普查某种疾病, n 个人需验血. 验血方 案有如下两种: (1) 分别化验每个人的血, 共需化验 n 次; (2) 分组化验, k 个人的血混在一起化验, 若 结果为阴性, 则只需化验一次; 若为阳性, 则 对 k 个人的血逐个化验, 找出有病者, 此时 k 个人的血需化验 k + 1 次. 设每人血液化验呈阳性的概率为 p, 且 每人化验结果是相互独立的.试说明选择哪 一方案较经济.
2 4 1 2 3 4
3
1 C4 4 4
1 1 4! C4C3 P42 P 4 4 4 4 81 E( X ) 64
解二 再引入 X i ,i = 1,2,3,4
1, 第i盒空, Xi 其它, 0,
X X1 X 2 X 3 X 4
Xi
1
3 4
4
0
k
(k 1) k 1 p
k
n k E ( X ) E ( X i ) (k 1) k 1 p k i 1
k
n
1 k n 1 (1 p) k (1 p) k 1 0, 若 则E (X ) < n k
(0 p 1)k r , r 1, r 1
P( X k ) p(1 p) k 1 , (0 p 1) k 0,1,2,
r p
几何分布
1 p
分布
概率密度
期望
1 , a x b, a b 区间(a,b)上的 f ( x) b a 均匀分布 2 0, 其它 x e , x 0, 1 f ( x) E() 其它 0,
2
2
1 2
e
t2 2
dt 2
t 2
e
t2 2
dt
2
t
2
2
e
t2 2
dt
由分部积分法有 因而
2
2
t
2
2
2
e
t2 2
dt 1
E( X )
(2) E (e ) e f ( x)dx 2 e
P( X k )
期望
p
np
e
k
k! k 0,1,2,
分布
超几何分布
概率分布
k n C N CM k P( X k ) Cln
期望
nN l
k 0,1,2, n, n N
lM N
负二项分布
1 P( X k ) Ckr1 p r (1 p) k r
例如,
n 1000 , p 0.001, k 10 ,
1 10 E ( X ) 1000 1 0.999 110 1000 . 10
当 (1 p) 1 / k 时, 选择方案(2) 较经济.
k
应用3 市场上对某种产品每年需求量为 X 吨 ,X ~ U [ 2000,4000 ], 每出售一吨可赚 3万元 ,售不出去,则每吨需仓库保管费1 万元,问应该生产这中商品多少吨, 才能 使平均利润最大?
注
性质 4 的逆命题不成立,即
若E (X Y ) = E (X )E (Y ),X ,Y 不一定独立
证 性质5
设 X 连续,d.f. 为 f (x), 分布函数为 F(x), 则
P( X a) 1 P( X a)
1 F (a) 1
F (a) 0
F ( x) 0,
f ( x) 0,
N(,
2)
1 f ( x) e 2
( x )2 2 2
分布
伽玛分布
概率密度
1 x x e , x 0, f ( x) ( ) 0, x0
期望
威布尔分布
x x 1 ( ) exp[ ( ) ], x 0 f ( x) 0, 0 0, x
y X, yX
E (Y ) g ( x) f X ( x)dx
4000 1 1 2000 (4 x y ) dx y 3 y dx 2000 2000 1 2 6 (2 y 14000 y 8 10 ) 2000 y
解 设Xi 表示公司从第 i 个投保者身上所得 的收益, i =1~1000 . 则 Xi ~ 100 100 a 0.98 0.02
由题设 E ( X i ) 100 0.98 (100 a) 0.02
100 0.02a 0 100 a 5000
公司每笔赔偿小于5000元, 能使公司获益.
注意 不是所有的 r.v.都有数学期望
例如:柯西(Cauchy)分布的密度函数为
1 f ( x) , 2 (1 x )
x
| x| 但 | x | f ( x)dx dx 发散 (1 x 2 )
它的数学期望不存在!
随机变量函数 Y = g(X ) 的数学期望 设离散 r.v. X 的概率分布为
P( X xi ) pi , i 1,2,
若无穷级数
g ( xi ) pi 绝对收敛,则
i 1
E (Y ) g ( xi ) pi
设连续 r.v. 的 d.f. 为f (x) 若广义积分 g ( x) f ( x)dx 绝对收敛, 则
i 1
E (Y ) g ( x) f ( x)1)k
np
特例 若Y ~ B ( 1 , p ), 则 E(Y) p
例3
X ~ N ( , 2 ), 求 E ( X ) .
( x )2 2 2
1 解 E ( X ) x e 2
令 x u
试问哪一个选手射击本领较好?
甲:8×0.3N+9×0.1N+10×0.6N=9.3N
乙:8×0.2N+9×0.5N+10×0.3N=9.1N
数学期望的定义
设 X 为离散 r.v. 其分布为
P( X xk ) pk ,
若无穷级数
k 1,2,
绝对收敛, 则称
xk p k
k 1
其和为 X 的数学期望 记作 E( X ), 即
E ( X ) xk p k
k 1
定义
设连续 r.v. X 的 d.f. 为 若广义积分 xf ( x)dx 绝对收敛, 则称此积分为 X 的数学期望 记作 E( X ), 即
E ( X ) xf ( x)dx
f (x)
数学期望的本质 —— 加权平均 它是一个数不再是 r.v.
3 1 4
4 4
P
3 E( X i ) 4
4
3 81 E( X ) 4 4 64
应用1 据统计65岁的人在10年内正常死亡 的概率为0. 98, 因事故死亡概率为0.02.保险 公司开办老人事故死亡保险, 参加者需交纳 保险费100元.若10 年内因事故死亡公司赔偿 a 元, 应如何定 a , 才能使公司可期望获益; 若有1000人投保, 公司期望总获益多少?
例 5 设随机变量 X 服从正态分布 N (, 2 ) ,求 (1) E ( X 2 ) ;(2)
E (e X ) .
( x )2 2 2
解: 令 则
(1)
x
E ( X 2 ) x 2 f ( x)dx
x2 2
e
dx ,
t
,
E( X )
例2
X ~ B ( n , p ), 求 E( X ) .
n k 0
解 E ( X ) kCnk p k (1 p) nk
(n 1)! k 1 ( n 1)( k 1) np p (1 p) k 1 ( k 1)!( n k )!
n
np C p (1 p)
x 1 p
k 1 x1 p 1 1 p 2 (1 x) x1 p p
常见 r.v. 的数学期望(P85)
分布
参数为p 的 0-1分布 B(n,p) P()
概率分布
P( X 1) p P( X 0) 1 p
P( X k ) Cnk p k (1 p) nk k 0,1,2,, n
X x
e
x
( x )2 2 2
dx ,
令 t, 则 E(e ) e
X
x
t
1 2
e
t2 2
dt e
2 2
1 2
e
t2 2
dt e
2 2
.
数学期望的性质
E (C ) = C 常数
E (aX ) = a E (X )
dx
u2 2
1 (u ) e du 2 例4 设 X ~ 参数为 p 的几何分布,求E ( X ).
解 E ( X ) kp(1 p) k 1 p kx k 1
k 1
'
xk p k 1
第四章
随机变量的数字特征
分布函数能完整地描述 r.v.的统计特
性, 但实际应用中并不都需要知道分布函 数,而只需知道 r.v.的某些特征. 例如: 判断棉花质量时, 既看纤维的平均长度 又要看 纤维长度与平均长度的偏离程度 平均长度越长,偏离程度越小, 质量就越好;
考察一射手的水平, 既要看他的平均 环数是否高, 还要看他弹着点的范围是否 小, 即数据的波动是否小. 由上面例子看到,与 r.v. 有关的某 些数值,虽不能完整地描述 r.v.但能清 晰地描述 r.v.在某些方面的重要特征 , 这些数字特征在理论和实践上都具有重 要意义.
随机变量某一方面的概率特性 都可用数字来描写
本 章 r.v.的平均取值 —— 数学期望 内 r.v.取值平均偏离均值的情况 容 —— 方差
第一节 数学期望
例1. 有甲、乙两个射击选手,他们的射击技术由下表给出: 甲射手:
环数
p
8
0.3
9
0.1
10
0.6
乙射手:
环数
p
8
0.2
9
0.5
10
0.3
解
1 , 2000 x 4000, f X ( x) 2000 0, 其它
设每年生产 y 吨的利润为 Y
显然,2000 < y < 4000
3 y, Y g( X ) 3 X ( y X ) 1, y x, 3 y, g ( x) 4 x y , y x
故
xa
xa
E ( X ) a xf ( x)dx a af ( x)dx
a
例6 将 4 个不同色的球随机放入 4 个盒子 中, 每盒容纳球数无限, 求空盒子数的 数学期望. 解一 设 X 为空盒子数, 则 X 的概率分布为
X 0 1
2 4
2
C (C C C ) 4 4