第四章随机解释变量问题
高中数学第4章概率与统计4.2随机变量4.2.4第1课时离散型随机变量的均值b选择性
![高中数学第4章概率与统计4.2随机变量4.2.4第1课时离散型随机变量的均值b选择性](https://img.taocdn.com/s3/m/c20d99c8a32d7375a517802f.png)
7
个,从中任取
2
个球,
提 素
知
养
合 作
已知取到白球个数的数学期望值为67,则口袋中白球的个数为(
探
究
A.3
B.4
释
疑 难
C.5
D.2
)课
时 分 层 作 业
·
返 首 页
第十四页,共五十五页。
·
情
课
境
堂
导
小
学
结
·
探 新
(2)(一题两空)某运动员投篮命中率为 p=0.6,则
提 素
知
养
①投篮 1 次时命中次数 X 的数学期望为________;
探
课 时
究
释 疑
可知 X~B300,13,∴E(X)=300×13=100.]
分 层 作 业
难
·
返 首 页
第十九页,共五十五页。
·
情
离散(lísàn)型随机变量均值的性质
课
境
堂
导
小
学
结
·
探 新
【例 2】 已知随机变量 X 的分布列为
提 素
知
养
X -2 -1 0 1 2
合
作 探 究
P
1 4
1 3
1 5
提 素
知
养
奇数”的对立事件的概率;(2)先求出 ξ 的取值及每个取值的概率,
合
作
课
探 然后求其分布列和均值.
时
究
分
层
释
作
疑
业
难
·
返 首 页
第二十七页,共五十五页。
情
[解] 只考虑甲、乙两单位的相对位置,故可用组合计算基本事 课
计量经济学第四章
![计量经济学第四章](https://img.taocdn.com/s3/m/d1873a60a6c30c2259019ef9.png)
Ⅰ、联立方程模型的提出
联立方程计量经济学模型是相对于单方程 计量经济学模型而言的,它以经济系统为 研究对象;以揭示经济系统中各部分、各 因素间的数量关系和系统的数量特征为目 标;用于经济系统的预测、分析和评价。 使计量经济学模型的重要组成部分。
3
计量经济学
一、联立方程计量经济学模型问题
单方程计量经济学模型,只能描述经济变 量间的单向因果关系。但经济现象是错综 复杂的,许多经济变量间存在着交错的双 向或多项因果关系,因此需要建立多个单 方程组成的多方程模型,即联立方程模型。 其中每个方程都描述变量间的一个因果关 系。
0 Ct - b1Yt It - b0 - b2Yt-1 - 0 Gt u2t
- Ct Yt - It - 0- 0 Yt-1 - Gt 0
16
计量经济学
C t - a 1 Y t 0 I t - a 0 - 0 Y t -1 - 0 G t u 1t 0 C t - b 1 Y t I t - b 0 - b 2 Y t -1 - 0 G t u 2t - C t Y t - I t - 0 - 0 Y t-1 - G t 0 矩阵形式: BY X N
Ⅲ、联立方程计量经济学模型的识别
联立方程模型的识别性,主要指联立方程模型 中包含的各种影响和关系,是否可以明确辨别 或惟一确定。联立方程模型的识别性,实际上 与结构参数和简化参数之间存在明确的一一对 应关系有关,因此对联立方程模型的分析有重 要影响。
27
计量经济学
同上
联立方程模型的识别问题的本质:由于联立 方程模型中有许多个方程,内生变量的水平 是由多个方程的共同作用所决定的,因此能 否根据观测到的变量数据推测出生成它们的 各方面经济关系,很值得疑问。
第四章 随机变量的数字特征试题答案
![第四章 随机变量的数字特征试题答案](https://img.taocdn.com/s3/m/bd2d2cbb6529647d2728525d.png)
第四章随机变量的数字特征试题答案一、 选择(每小题2分)1、设随机变量X 服从参数为2的泊松分布,则下列结论中正确的是(D ) A.E (X )=0.5,D (X )=0.5?B.E (X )=0.5,D (X )=0.25 C.E (X )=2,D (X )=4?D.E (X )=2,D (X )=22Y X -=,则34) A C 5A 6、)1=(C ) A .34?B .37C .323?D .326 7、设随机变量X 服从参数为3的泊松分布,)31,8(~B Y ,X 与Y 相互独立,则)43(--Y X D =(C )A .-13?B .15C .19?D .238、已知1)(=X D ,25)(=Y D ,XY ρ=0.4,则)(Y X D -=(B )A .6?B .22C .30?D .469、设)31,10(~B X,则)(X E =(C )A .31?B .1C .310?D .1010、设)3,1(~2N X ,则下列选项中,不成立的是(B )A.E (X )=1?B.D (X )=3?C.P (X=1)=0?D.P (X<1)=0.511A .C .12、XY ρ=(D 13x =(B)A .14、(C ) A.-15、为(A .C .21)(,41)(==X D X E ?D .41)(,21)(==X D X E 16、设二维随机变量(X ,Y )的分布律为则)(XY E =(B )A .91-?B .0 C .91?D .3117、已知随机变量X 服从参数为2的泊松分布,则随机变量X 的方差为(D ) A18,0.5),则A 19,则X A 20, 则21(B A C 22、设n X X X ,,,21 是来自总体),(2σμN 的样本,对任意的ε>0,样本均值X 所满足的切比雪夫不等式为(B ) A .{}22εσεμn n X P ≥<-?B .{}221εσεμn X P -≥<-C .{}221εσεμn X P -≤≥-?D .{}22εσεμn n X P ≤≥-23、设随机变量X 的μ=)(X E ,2)(σ=X D ,用切比雪夫不等式估计{}≥<-σ3)(X E X P (C )A .91?B .31C .98?D .124、设随机变量X 服从参数为0.5的指数分布,用切比雪夫不等式估计{}≤≥-32X P (C )A25A 1234且5x =710 67、设随机变量X 服从参数为3的指数分布,则)12(+X D =948、设二维随机变量);,;,(~),(222121ρσσμμN Y X ,且X 与Y 相互独立,则ρ=0 9、设随机变量序列 ,,,,21n X X X 独立同分布,且μ=)(i X E ,0)(2>=σi X D ,,2,1=i ,则对任意实数x ,⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧>-∑=∞→x n n X P n i i n σμ1lim =)(1x Φ- 10、设随机变量X 具有分布51}{==k XP ,5,4,3,2,1=k ,则)(X E =3 11、设随机变量X 在区间(0,1)上服从均匀分布,Y=3X -2,则E?(?Y?)=-0.5 121314、3=,则cov(X 1516大于1724}=0.6826 附:18、-0.5,19的期望E?(Y)=4,D?(Y?)=9,又E?(XY?)=10,则X ,Y 的相关系数XY ρ=31 20、设随机变量X 服从二项分布31,3(B ,则)(2X E =35 三、计算:每小题5分1、某柜台做顾客调查,设每小时到达柜台的顾客数X 服从泊松分布,则)(~λP X ,若已知}2{}1{===X P XP ,且该柜台销售情况Y (千元),满足2212+=X Y。
第二版 工程数学-概率统计简明教程-第四章随机变量及其分布
![第二版 工程数学-概率统计简明教程-第四章随机变量及其分布](https://img.taocdn.com/s3/m/a6dc812c2b160b4e767fcfe1.png)
P( X
1)
27 64
27 64
27 32
.
30
例7 已知一批螺丝钉的次品率为0.01,且每个螺丝 钉是相互独立的,现将这批螺丝钉没10个宝成一包 出售,并保证若每包发现多于一个次品则课退款。 问卖出的某包螺丝钉被退回的概率多大?
解 设X表示每包中的次品数,则X~B(10,0.01)
退回 ↔ 次品多于一个 ↔ X>1
取球结果为:红或者白,是定性的描述。可这样量化: 用X表示抽得的结果, 则X只有两种结果, 每一种结果分别对应一个数,如 X=1表示取到红球, X=0表示取到白球
特点:试验结果数量化了,试验结果与数建立了
一个对应关系
随机变量的定义
随机变量
设随机试验的样本空间为Ω ,如果对于每一个 样本点w∈Ω ,均有唯一的实数X(w)与之对应, 称X(w)为样本空间Ω 上的随机变量。
则X服从0-1分布,其分布律为:
X
0
1
P
7
3
10
10
二项分布
在n重伯努利试验中,若以X表示事件A发生的次数, 则X可能的取值为0,1,2,3,…,n.
随机变量X的分布律为
P X k Cnk pk (1 p)nk
k 0,1, 2..., n; 其中0< p <1, 则称X服从参数为 n, p 的二 项分布(也称Bernoulli 分布),记为
k 0
15 15 15 15 15
即 10 5c 1 15
c 1
例5 袋中有5个球,分别编号1,2,3,4,5.从中同时取出3个
球,以X表示取出的球的最小号码,求X的分布律与分布函数. 解 由于X表示取出的3个球中的最小号码, 因此X的所有可
海南大学《概率论与数理统计》课件 第四章 随机变量及其分布
![海南大学《概率论与数理统计》课件 第四章 随机变量及其分布](https://img.taocdn.com/s3/m/08e51d8af424ccbff121dd36a32d7375a517c678.png)
X 3 取出的n个产品中至多有3个次品;
X 3 取出的n个产品中有超过3个的次品.
8
关于随机变量的补充说明
• 引入随机变量之后, 可以更方便地表示事件。 • 随机变量的确定不仅与样本空间有关, 也与试验
的研究目的有关。 • 随机变量满足函数的单值对应关系。 • 随机变量不仅有取值的不同, 取到这些值的概率
②正则性: p( xi ) 1 . i 1
这两条性质也是随机变量分布列的充要条件。
由概率的意义和随机变量的完备性容易证明。
25
二、离散型随机变量的分布函数
由分布列可以写出其分布函数 F ( x) P( xi ) xi x
它的图形是有限(或无穷)级数的阶梯函数〔右连续 〕
F(x)
1
0
x
26
27
X的分布列为
X1 2 3 P 0.6 0.3 0.1
X的分布函数为
0, x 1; 0.6, 1 x 2; F ( x) 0.9, 2 x 3; 1 , x 3.
注意:由分布列求分布函数是概率累加的过程.
并且,总有: 当x xmin时,F ( x) 0; 当x xmax时,F ( x) 1.
解 (1) 根据分布函数的性质可知
F() 1, F() 0
依题意可得
18
F() A π B 1 2
F() A π B 0 2
联立上面两个方程可以解得 A 1,B 1 2π
(2) 随机变量 X 落在(-1,1)内的概率可以表示为
P{1 X 1} F (1 0) F (1)
P{a X b} F(b 0) F(a 0);
P{a X b} F(b 0) F(a).
概率论与数理统计第四章随机变量的数字特征习题解答
![概率论与数理统计第四章随机变量的数字特征习题解答](https://img.taocdn.com/s3/m/17c46ac8d4bbfd0a79563c1ec5da50e2524dd15f.png)
习题4-11、设随机变量X 服从参数为p 的01-分布,求()E X 。
解:据题意知,X 的分布律为根据期望的定义,得()0(1)1E X p p p =⋅-+⋅=。
2、袋中有n 张卡片,记有号码1,2,,n 。
现从中有放回地抽出k 张卡片,求号码之和X 的数学期望。
解:设i X 表示第i 次取到的卡片的号码(1,2,,i k =),则12k X X X X =+++。
因为是有放回地抽出卡片,所以i X 之间相互独立。
所以第i 次抽到号码为m 的卡片的概率为1{},(1,2,,;1,2,,)i P X m m n i k n====,即i X 的分布律为1{},(1,2,,)i P X m m n n===, 所以11()(12)2i n E X n n+=+++=, 所以,1(1)()()2k k n E X E X X +=++=。
注:求复杂随机变量期望时可先引入若干个简单的随机变量,再根据期望的性质即可。
3、某产品的次品率为0.1,检验员每天检验4次。
每次随机地抽取10件产品进行检验,如果发现其中的次品数多于1,就去调整设备,以X 表示一天中调整设备的次数,试求()E X 。
(设诸产品是否是次品是相互独立的。
)解:令Y 表示一次抽检的10件产品的次品数,据题意知,~(10,0.1)Y b ,00101191010{1}1{0}{1}10.10.90.10.90.2639p P Y P Y P Y C C =>=-=-==--=,因此,~(4,0.2639)X b ,从而()40.2639 1.0556E X np ==⋅=。
注:此题必须先求出一天中调整设备的概率。
即p 值。
4、据统计,一位60岁的健康(一般体检未发生病症)者,在5年内仍然活着或自杀身亡的概率为p (01p <<,p 为已知),在五年内非自杀身亡的概率为1p -。
保险公司开办5年人寿保险,条件是参保者需缴纳人寿保费a 元(a 已知),若5年内非自杀死亡,保险公司赔偿b 元(b a >)。
概率论与数理统计第4章 随机变量的数字特征与极限定理
![概率论与数理统计第4章 随机变量的数字特征与极限定理](https://img.taocdn.com/s3/m/b20cd54cad02de80d4d84067.png)
25
定义4.3 设X是随机变量,若E[X-E(X)]2存 在,则称它为X的方差,记为D(X),即
由定义4.2,随机变量X的方差反映了X的可能取值 与其数学期望的平均偏离程度.若D(X)较小,则X的 取值比较集中,否则,X的取值比较分散.因此,方差 D(X)是刻画X取值离散程度的一个量.
3
定义4.1 设离散型随机变量X的分布律为
4
5
6
7
8
9
4.1.2 几个常用分布的数学期望 1.0—1分布 设随机变量X服从以p为参数的(0—1)分布,则X 的数学期望为
2.二项分布 设随机变量X~B(n,p),则X的数学期望为
10
3.泊松分布 设随机变量X~P(λ)分布,则X的数学期望为
41
Hale Waihona Puke 424.3 协方差、相关系数及矩
4.3.1 协方差 对于二维随机变量(X,Y),除了分量X,Y的数 字特征外,还需要找出能体现各分量之间的联系的数字 特征.
43
44
4.3.2 相关系数 定义4.5 设(X,Y)为二维随机变量,cov (X,Y),D(X),D(X)均存在,且D(X)>0,D(X) >0,称
15
16
17
定理4.2 设(X,Y)是二维随机变量,z=g(x,y) 是一个连续函数. (1)如果(X,Y)为离散型随机变量,其联合分布 律为
18
19
20
4.1.4 数学期望的性质 数学期望有如下常用性质(以下的讨论中,假设所 遇到的数学期望均存在):
第四章随机变量的数字特征习题
![第四章随机变量的数字特征习题](https://img.taocdn.com/s3/m/3fa57411a32d7375a41780a9.png)
第四章 随机变量的数字特征一、填空题:1. 设随机变量ζ~B(n,p) ,且5.0=ζE ,45.0=ζD ,则n= , p= 。
2. 设随机变量ξ表示10次独立重复射击中命中目标的次数,且每次射击命中目标的概率为0.4,则)(2ξE = 。
3. 已知随机变量ξ的概率密度为1221)(-+-=x xe x πϕ(+∞<<∞-x ),则=)(ξE ,=)(ξD 。
4. 设随机变量ξ),(~b a U ,且2)(=ξE ,31)(=ξD ,则=a ,=b 。
5. 设随机变量ζ,有10=ζE ,25=ζD ,已知 0)(=+b a E ζ ,1)(=+b a D ζ 则 a= , b= , 或 a= , b= 。
6. 已知离散型随机变量ζ服从参数为2的普哇松分布,则随机变量23-=ζη的数学期望=ηE 。
7. 设随机变量1ξ]6,0[~U ,2ξ)2,0(~2N ,且1ξ与2ξ相互独立,则=-)2(21ξξD 。
8. 设随机变量n ζζζ,,,21 独立,并且服从同一分布。
数学期望为a , 方差为2σ,令 i ni n ζζ∑==11 ,则 =ζE ,=ζD 。
9. 已知随机变量ζ与η的方差分别为49=ζD , 64=ηD , 相关系数8.0=ζηρ,则=+)(ηζD ,=-)(ηζD 。
10. 若随机变量ζ的方差为004.0)(=ξD ,利用切比雪夫不等式知{}≥<-2.0ξξE P 。
二、选择题:1. 设随机变量ζ的函数为b a +=ζη,(a , b 为常数),且ζE ,ζD 均存在,则必有( )。
A. ζηaE E =B. ζηaD D =C. b aE E +=ζηD. b aD D +=ζη2. 设随机变量ζ的方差ζD 存在,则=+)(b a D ζ( )(a , b 为常数)。
A. b aD +ζB. ζD a 2C. b D a +ζ2D. ζD a3. 如果随机变量ζ~),(2σμN ,且3=ζE ,1=ζD ,则=≤<-)11(ζP ( ).A. 1)1(2-ΦB.)4()2(Φ-ΦC.)2()4(-Φ--ΦD.)2()4(Φ-Φ4. 若随机变量ζ服从指数分布,且25.0=ζD ,则ζ的数学期望=ζE ( ).A.21 B. 2 C. 41D. 4 5. 设随机变量ζ的分布函数为⎪⎩⎪⎨⎧>≤≤<=1,110,,0)(3x x x x x F ,则=)(ξE ( ). A.dx x ⎰+∞4B.dx x ⎰123 C. ⎰⎰+∞+114xdx dx xD.dx x ⎰+∞236. 设随机变量ζ的期望ζE 为一非负值,且2)12(2=-ζE ,21)12(=-ζD ,则=ζE ( )。
概率论与数理统计 第4章 随机变量的数字特征
![概率论与数理统计 第4章 随机变量的数字特征](https://img.taocdn.com/s3/m/413f10220508763230121271.png)
解:
1 (5 0.5x)( 3 x2 x)dx
0
2
4.65(元)
2021/7/22
21
4.1.2 随机变量函数的数学期望
将定理4.1推广到二维随机变量的情形.
定理4.2 设Z是随机变量X,Y的函数Z = g(X,Y), g是连续函数.
(1) 若(X,Y)是二维离散型随机变量,其分布律
为P{X xi ,Y yj } pij, i, j 1,2,, 则有
解:由于 P{ X k} k e ,k = 0,1,2,…,
k!
因而
E( X ) kP{ X k} k k e
k0
k0 k!
k e
k1 (k 1)!
e
k 1
k1 (k 1)!
e k ee k0 k!
2021/7/22
12
4.1.1 数学期望的概念
2. 连续型随机变量的数学期望
2021/7/22
18
4.1.2 随机变量函数的数学期望
定理4.1 设Y为随机变量X的函数:Y = g(X) (g是连续
函数).
(1) 设X是离散型随机变量,其分布律为
P{X xk } pk , k 1,2,
若级数 g( xk ) pk绝对收敛,则 E(Y ) E[g( X )] g( xk ) pk
f ( x) 25( x 4.2), 4 x 4.2,
0,
其 它.
求pH值X的数学期望E(X).
解:
E( X ) xf ( x)dx
4
4.2
x 25( x 3.8)dx x (25)(x 4.2)dx
3.8
4
4
2021/7/22
15
(完整)第四章随机变量的数字特征总结,推荐文档
![(完整)第四章随机变量的数字特征总结,推荐文档](https://img.taocdn.com/s3/m/16bf1064240c844768eaee97.png)
随机变量的数字特征——总结第四章 随机变量的数字特征㈠ 数学期望 表征随机变量取值的平均水平、“中心”位置或“集中”位置.1、数学期望的定义(1) 定义 离散型和连续型随机变量X 的数学期望定义为{}⎪⎩⎪⎨⎧==⎰∑∞∞- d )( )()( ,,连续型离散型x x xf x X x X kk k P E 其中Σ表示对X 的一切可能值求和.对于离散型变量,若可能值个数无限,则要求级数绝对收敛;对于连续型变量,要求定义中的积分绝对收敛;否则认为数学期望不存在.①常见的离散型随机变量的数学期望1、离散型随机变量的数学期望 设离散型随机变量的概率分布为,若,则称级数为随机变量的数学期望(或称为均值),记为, 即2、两点分布的数学期望 设服从0—1分布,则有,根据定义,的数学期望为. 3、二项分布的数学期望 设服从以为参数的二项分布,,则。
4、泊松分布的数学期望 设随机变量服从参数为的泊松分布,即,从而有。
①常见的连续型随机变量的数学期望1)均匀分布设随机变量ξ服从均匀分布,ξ~U [a ,b ] (a <b ),它的概率密度函数为:随机变量的数字特征——总结= 则=∴ E(ξ)=(a+b)/2.即数学期望位于区间的中点.2)正态分布设随机变量ξ服从正态分布,ξ~N(μ,σ2),它的概率密度函数为:(σ>0,- <μ<+)则令得∴ E(ξ)=μ .3)指数分布设随机变量服从参数为的指数分布,的密度函数为 ,则.(2) 随机变量的函数的数学期望设为连续函数或分段连续函数,而X是任一随机变)(xgy=量,则随机变量的数学期望可以通过随机变量X的概率分布直接来求,而不必先求出的概)(XgY=Y率分布再求其数学期望;对于二元函数,有类似的公式:),(YXgZ=(){}⎪⎩⎪⎨⎧===⎰∑∞∞.;(连续型)离散型-d)()()()(xxfxgxXxgXgY kkkPEE()(){}()()()()⎪⎩⎪⎨⎧====⎰⎰∑∑∞∞-∞∞-.;连续型离散型dd,,,,,yxyxfyxgyYxXyxgYXgZi jjijiPEE设(,)X Y为二维离散型随机变量,其联合概率函数(,),,1,2,,i j ijP X a Y b p i j====如果级数(,)i j ijj ig a b p∑∑绝对收敛,则(,)X Y的函数(,)g X Y的数学期望为随机变量的数字特征——总结[(,)](,)ijijjiE g X Y g a b p =∑∑; 特别地();()i ijj ijiij iE X a p E Y b p==∑∑∑∑.设X 为连续型随机变量,其概率密度为()f x ,如果广义积分 ()()g x f x dx+∞-∞⎰绝对收敛,则X 的函数()g X 的数学期望为[()]()()E g X g x f x dx+∞-∞=⎰.设(,)X Y 为二维连续型随机变量,其联合概率密度为(,)f x y ,如果广义积分(,)(,)g x y f x y dxdy+∞+∞-∞-∞⎰⎰绝对收敛,则(,)X Y 的函数(,)g X Y 的数学期望为[(,)](,)(,)E g x y g x y f x y dxdy+∞+∞-∞-∞=⎰⎰;特别地()(,)E x xf x y dxdy +∞+∞-∞-∞=⎰⎰,()(,)E Y yf x y dxdy+∞+∞-∞-∞=⎰⎰.注:求E(X,Y)是无意义的,比如说二维(身高,胖瘦)的数学期望是无意义的,但是二维随机变量函数Z= E(X,Y)是有意义的,他表示的是函数下的另一个一维意义。
概率论与数理统计+第四章+随机变量的数字特征+练习题
![概率论与数理统计+第四章+随机变量的数字特征+练习题](https://img.taocdn.com/s3/m/fef3b7800b1c59eef9c7b4c7.png)
滨州学院《概率论与数理统计》(公共课)练习题第四章 随机变量的数字特征一、填空题1.已知随机变量X 的分布函数为:()⎪⎪⎩⎪⎪⎨⎧≥<≤<≤--=. 若 ,若,若,<若 1 , 1 10 , 0.7501 , 25.01 , 0 x x x x x F 则⎪⎭⎫ ⎝⎛+21X X D = . 2.设随机变量X 分布函数为()x F ,则随机变量⎪⎩⎪⎨⎧<-=>=01,,0 ,0,0,1 X X X Y 若若若的数学期望=EY .3.设随机变量X 服从参数为0.5的泊松分布,则随机变量)1(1X Y +=的数学期望EY = .4.假设无线电测距仪无系统误差,其测量的随机误差服从正态分布.已知随机测量的绝对误差以概率0.95不大于20米,则随机测量误差的标准差σ= .5.设随机变量X 和Y 独立同正态分布()21,0N ,则||Y X D -= .6.100次独立重复试验成功次数的标准差的最大值等于 .7.有若干瓶超过保质期的饮料,假设其中变质的期望瓶数为18瓶,标准差为4瓶.则变质饮料的瓶数X 的概率分布是 .8.假设随机变量X 和Y 的方差都等于1,X 和Y 的相关系数为0.25,则随机变量Y X U +=和Y X V 2-=的协方差为 .9.三名队员投篮的命中率分别为0.45、0.5和0.4,且相互独立,现在让每人各投一次,则三人总进球次数的期望是 .10.设随机变量X 服从参数为λ的指数分布,则}{DX X P >= .11.设随机变量X 在区间[-1,2]上服从均匀分布;随机变量 ⎪⎩⎪⎨⎧<-=>=.01,00,01X X X Y 若若若 则方差=DY .12. 随机变量X ,Y 的联合概率分布为则2X 和2Y 的协方差),(22Y X Cov = .13.设随机变量)1(,,,21>n X X X n 独立同分布,且其方差为.02>σ 令∑==ni i X n Y 11,则Cov(),1Y X = .二、选择题1.对于任意随机变量X 和Y ,如果)()(Y X D Y X D -=+,则( ).(A) X 和Y 独立; (B) X 和Y 不独立;(C) )()()(Y D X D XY D =; (D) )()()(Y E X E XY E =.2.设X 在区间[-1,1]上均匀分布,则X U arcsin 和X V arccos =的相关系数等于( ).(A) 1-; (B) 0; (C) 0.5; (D) 1.3.假设试验E 以概率p 成功,以概率p q -=1失败,分别以X 和Y 表示在n 次独立地重复试验中成功和失败的次数,则X 和Y 的相关系数ρ等于( ).(A)1-; (B) 0; (C) 1/2; (D) 1.4.设随机变量X 的方差存在,且记μ=EX ,则对任意常数C ,必有( ).(A )222)(C EX C X E -=-; (B )22)()(μ-=-X E C X E ;(C )22)()(μ-<-X E C X E ; (D )22)()(μ-≥-X E C X E5.设随机变量X 的概率密度为⎩⎨⎧<<+=其他010)(x bx a x f ,又X 的期望53=EX ,则X 的标准差为( ).(A )15011 ; (B )150121; (C )1511 ; (D )3013. 6.设随机变量X 和Y 的方差存在且为正,则DY DX Y X D +=+)(是X 和Y ( ).(A )不相关的充分条件,但不是必要条件 ;(B )独立的必要条件,但不是充分条件;(C )不相关的充要条件 ;(D )独立的充要条件 .7.设二维随机变量(X ,Y )服从二维正态分布,则随机变量Y X Y X -=+=ηξ与不相关的充要条件为( ).(A )EY EX =; (B )2222)()(EY EY EX EX-=-; (C )22EY EX =; (D )2222)()(EY EY EX EX +=+.8.将一枚硬币重复掷n 次,以X ,Y 分别表示正面向上和反面向上的次数,则X ,Y 的相关系数等于( ).(A )1-; (B )0; (C )1/2; (D )1.三、解答题1.自动生产线加工的零件的内径X (mm)服从正态分布)1,(μN ,内径小于10或大于12mm的为不合格品,其余为合格品.每件产品的成本为10元,内径小于10mm 的可再加工成合格品,尚需费用5元.全部合格品在市场上销售,每件合格品售价20元.问零件的平均内径μ取何值时,销售一个零件的平均销售利润最大?2.假设某季节性商品,适时地售出1kg 可以获利s 元,季后销售每千克净亏损t 元.假设一家商店在季节内该商品的销售量X (kg )是一随机变量,并且在区间),(b a 内均匀分布.问季初应安排多少这种商品,可以使期望销售利润最大?3.独立地重复进行某项试验,直到成功为止,每次试验成功的概率为p .假设前5次试验每次的试验费用为10元,从第6次起每次的试验费用为5元.试求这项试验的总费用的期望值a .4.假设n 个信封内分别装有发给n 个人的通知,但信封上各收信人的地址是随机填写的.以X 表示收到自己通知的人数,求X 的数学期望和方差.5.求}1|,min{|X E ,假设随机变量X 服从柯西分布,其概率密度为()()∞<<∞-+=x x x f 11)(2π. 6.假设一种电器设备的使用寿命X (单位:小时)是一随机变量,服从参数为λ=0.01的指数分布.使用这种电器每小时的费用为C 1=3元,当电器工作正常时每小时可获利润C 2=10元.此设备由一名工人操作,每小时报酬为C 3=4元,并且按约定操作时间为h 小时支付报酬.问约定操作时间h 为多少时,能使期望利润最大?7.一微波线路有两个中间站,其中任何一个出现故障都要引起线路故障.假设两个中间站无故障的时间都服从指数分布,平均无故障工作的时间相应为1和0.5(千小时),试求线路无故障工作时间X 的数学期望.8.设随机变量X ,Y 相互独立,并且都服从正态分布),(2σμN ,求随机变量},min{Y X Z =的数学期望.9.假设随机向量),(Y X 在以点)1,1(),0,1(),1,0(为顶点的三角形区域上服从均匀分布.试求随机变量Y X Z +=的方差.10.假设随机变量X ,Y 的数学期望都等于1,方差都等于2, 其相关系数为0.25,求随机变量Y X U 2+=和Y X V 2-=的相关系数ρ.11.假设随机变量1021,,,X X X 独立同分布,且方差存在.求随机变量 651X X X U +++= 和 1065X X X V +++=的相关系数ρ.12.对于任意二随机事件A 和B ,设随机变量⎩⎨⎧-=,不出现若出现若 ,1, ,1A A X ⎩⎨⎧-=;不出现若出现若 , 1 , ,1B B Y 试证明“随机变量X ,Y 不相关” 当且仅当“事件A 和B 独立”.13.现有10张奖券,其中8张为2元,2张为5元,今某人从中随机无放回地抽取3张,则此人得奖的金额的数学期望为多少.14.某产品的次品率为0.1,检验员每天检验4次,每次随机地取10件产品进行检验,如发现其中的次品数多于1个,就去调整设备. 假设各产品是否为次品是相互独立的,以X 表示一天中调整设备的次数,试求)(X E 和)(X D .15.有3只球, 4只盒子, 盒子的编号为1,2,3,4. 将球逐个独立地, 随机地放入4只盒子中去,以X 表示其中至少有一只球的最小号码(例如X =3表示第1号,第2号盒子是空的,第3号盒子至少有一个球), 试求)(X E 和)(X D .16.某射手每次射击的命中率为)10(<<p p , 他有6发子弹, 准备对一目标进行射击, 一旦打中或子弹打完, 他就立即转移, 求他在转移前平均射击的次数.17.设随机变量X 的概率密度函数为⎩⎨⎧<<=其他0102)(x x x f 试求)2|(|DX EX X P ≥-18.设随机变量X 的分布律为 ,3,2,1,32)(===n n X P n ,试求X Y )1(1-+=的数学期望与方差. 19.设随机变量X ,Y 相互独立,且X 服从[0,2]上的均匀分布,)1,1(~N Y ,求)(XY D20.设随机变量X 的分布列为若随机变量32,X Z X Y ==,(1)试求),(Z Y Cov ,并问Y ,Z 是否相关;(2)求二维随机变量(Y ,Z )的联合分布列;(3)试问Y ,Z 是否独立?为什么?21.已知二维随机变量(Y X ,)的概率密度为 ⎩⎨⎧<<++=其它01,0)1(),(y x xy y C y x f (1)试确定常数C ;(2)试问Y X ,是否相互独立?为什么?(3)试问Y X ,是否不相关?为什么?如果相关的话,其相关系数是多少.22.已知二维随机变量(Y X ,)的概率密度为⎩⎨⎧<≤<=其它01012),(2x y y y x f 试求:(1)2)(Y X E -(2)Y X ,的协方差.23.设n X X X ,,,21 为取自总体X 的一个样本,且2,σμ==DX EX 存在,X 为样本均值,试证明X X i -与X X j -的相关系数为n j i j i n ,,2,1,,,11 =≠--=ρ 24.设随机变量X 服从参数为0>λ(λ待定)的指数分布,)(x F 为其分布函数,若已知21)31(=F ,试确定最小值2)(min C X E C -是多少? 25.随机的向半圆)0(202>-<<a x ax y 抛掷一个点, 点落在任何一个区域的概率与该区域的面积成正比, 设原点与该点的连线与x 轴正向的夹角为θ, 试求θ的数学期望与方差.26.假设一电路由3个同种电子元件,其工作状况相互独立,无故障工作时都服从参数为0>λ的指数分布,当3个元件都无故障工作时,电路正常工作,否则整个电路不能正常工作,试求电路正常工作时间T 的概率分布、数学期望与方差.27.编号为n ,,2,1 的n 张卡片中随机地抽取1张,如果抽出的卡片的号码为k ,则第2张卡片从编号为k ,,2,1 的k 张卡片中抽取.记X 为抽出的第2张卡片的号码,试证:43+=n EX . 28.设随机变量Z Y X ,,相互独立,且X 服从[0,6]上的均匀分布,Y 服从正态分布2(0,2)N , Z 服从参数为31的指数分布,试求2)(Z XY E -和)32(Z Y X D -+. 29.设Y X ,是相互独立,分别服从参数为0>λ和0>μ的指数分布,令⎩⎨⎧>≤=YX Y X Z 2,02,1. 求Z 的分布函数和方差. 30.设随机变量X 的概率密度函数为⎪⎩⎪⎨⎧≤≤=其他002cos 21)(πx x x f ,对X 独立地重复观察4次,用Y 表示观察值大于3π的次数,求2Y 的数学期望. 31.游客乘电梯从底层到电视塔顶层观光,电梯于每个整点的第5分钟、25分钟和55分钟从底层起行,假设一游客在早八点的第X 分钟到达底层候梯处,且X 在[0,60]上服从均匀分布,求该游客等候时间的数学期望.32.设n X X X ,,,21 i .i .d ),(~2σμN ,求)||(1∑=-n k k X XE ,其中∑==n k k n X X 1133.供电公司每月可以供应某工厂的电力服从[10,30](单位:万度)上均匀分布,而该工厂每月实际生产所需要的电力服从[10,20]上的均匀分布.如果工厂能从供电公司得到足够的电力,则每一万度电可创造30万元的利润,若工厂从供电公司得不到足够的电力,则不足部分由工厂通过其它途径自行解决,此时,每一万度电只能产生10万元的利润.问该工厂每月的平均利润为多大?34.对于任意二事件A B 与,0101<<<<P A P B (),(),))(1)(())(1)(()()()(B P B P A P A P B P A P AB P ---=ρ称为事件A B 与的相关系数.(1)证明事件A B 与独立的充分必要条件是其相关系数等于0;(2)利用随机变量相关系数的基本性质,证明1||≤ρ.35.设随机变量X 的具有连续的密度函数为)(x f ,令||)(a X E a h -=,试证明:当a 满足21)(=≤a X P 时(此时称a 为X 的中位数),)(a h 达到最小.。
高中数学第四章概率与统计4.2随机变量4.2.3二项分布与超几何分布课件新人教B版选择性
![高中数学第四章概率与统计4.2随机变量4.2.3二项分布与超几何分布课件新人教B版选择性](https://img.taocdn.com/s3/m/b3acdc407ed5360cba1aa8114431b90d6c85896e.png)
则甲获胜的概率为(
2 2
2 2 2 1 1
A.(3) +3 (3) (3)
2 2
2 2 2
B.(3) +3 (3)
2 2
1 2 2 1 1
C.( ) +2 ( ) ( )
3
3 3
2 2
1 2 1 1 1
D.(3) +2 (3) (3)
)
答案 C
解析 事件“甲获胜”包含“甲三局赢两局”和“前两局甲赢”,若甲三局赢两局,
物品中随机取出n件(n≤N),则这n件中所含甲类物品数X是一个离散型随
机变量,X能取不小于t且不大于s的所有自然数,其中s是M与n中的较小者,t
在n不大于乙类物品件数(即n≤N-M)时取0,否则t取n减乙类物品件数之差
(即t=n-(N-M)),而且
k n -k
M
N -M
P(X=k)= n
N
,k=t,t+1,…,s,这里的X称为服从参数
P(X≤1)等于(
3
A.4
5
B.7
4
C.5
7
D.8
)
答案 B
C35
解析 根据题意,P(X≤1)=P(X=0)+P(X=1)=
C38
+
C25 C13
C38
=
10
30
+
56
56
=
5
.故选
7
B.
重难探究•能力素养全提升
探究点一 n次独立重复试验概率的求法
【例1】现有4个人去参加某娱乐活动,该活动有甲、乙两个游戏可供参加
2
率为3.
设“这 4 个人中恰有 i 人去参加甲游戏”为事件 Ai(i=0,1,2,3,4).
第4章(随机变量的数字特征与极限定理)4.4-4.5
![第4章(随机变量的数字特征与极限定理)4.4-4.5](https://img.taocdn.com/s3/m/daea7d781711cc7931b716f8.png)
e =E{[Y-(a+bX)]2 } =E(Y2)+b2E(X2)+a2- 2bE(XY)+2abE(X) - 2aE(Y) 这样求出的最佳逼近为
∂e = 2a + 2bE( X) − 2E(Y) = 0L(X)=a0+b0X ∂a ∂e = 2bE( X2 ) − 2E( XY) + 2aE( X) = 0 ∂b
的概率分布为: Y 的概率分布为 P{Y = −1} = 0.55, P{Y = 0} = 0.25, P{Y = 2} = 0.2,
例1 已知离散型随机向量 ( X,Y ) 的概率分布如右表, 的概率分布如右表, 求 cov( X,Y ). 解 于是有
Y X 0 1 2
−1 0.1 0.3 0.15
Cov( X ,Y ) ρ= =0 D( X )D(Y )
并不一定能推出X和 独立. 但由 ρ = 0 并不一定能推出 和Y 独立
服从(-1/2, 1/2)内的均匀分布 而 内的均匀分布,而 例1 设X服从 服从 内的均匀分布 Y=cos X, 不难求得, 不难求得, Cov(X,Y)=0, , 和 不相关 因而 ρ =0,即X和Y不相关 . , 但Y与X有严格的函数关系, X和Y不独立 . 有严格的函数关系, 与 有严格的函数关系 即 和 不独立
−∞ 0
x f X ( x)dx = ∫ x2 ⋅ 4x(1 − x2 )dx ∫−∞
2 0+∞1 Nhomakorabea于是
E(X)= 8/ 15, E(Y )= 4/ 5, E(XY ) = 4/ 9,
从而 cov( X,Y ) = E( XY ) − E( X)E(Y ) = 4/ 225, 又 E( X 2 ) = 1/ 3,
概率论与数理统计第四章随机变量的数字特征
![概率论与数理统计第四章随机变量的数字特征](https://img.taocdn.com/s3/m/cab229faff00bed5b8f31d4c.png)
第四章 随机变量的数字特征前面讨论了随机变量的分布函数,我们知道分布函数全面地描绘了随机变量的统计特性.但是在实际问题中,一方面由于求分布函数并非易事;另一方面,往往不需要去全面考察随机变量的变化情况而只需知道随机变量的某些特征就够了.例如,在考察一个班级学生的学习成绩时,只要知道这个班级的平均成绩及其分散程度就可以对该班的学习情况作出比较客观的判断了.这样的平均值及表示分散程度的数字虽然不能完好地描绘随机变量,但能更突出地描绘随机变量在某些方面的重要特征,我们称它们为随机变量的数字特征.本章将介绍随机变量的常用数字特征:数学期望、方差、相关系数和矩.第一节 数学期望1.数学期望的定义粗略地说,数学期望就是随机变量的平均值.在给出数学期望的概念之前,先看一个例子.要评判一个射手的射击程度,需要知道射手平均命中环数.设射手A 在同样条件下进展射击,命中的环数X 是一随机变量,其分布律如下:表4-1由X 的分布律可知,假设射手A 共射击N 次,根据频率的稳定性,所以在N 次射击中,大约有0.1×N 次击中10环,0.1×N 次击中9环,0.2×N 次击中8环,0.3×N 次击中7环,0.1×N 次击中6环,0.1×N 次击中5环,0.1×N 次脱靶.于是在N 次射击中,射手A 击中的环数之和约为10×0.1N +9×0.1N +8×0.2N +7×0.3N +6×0.1N +5×0.1N +0×0.1N .平均每次击中的环数约为N1〔10×0.1N +9×0.1N +8×0.2N +7×0.3N +6×0.1N +5×0.1N +0×0.1N 〕 =10×0.1+9×0.1+8×0.2+7×0.3+6×0.1+5×0.1+0×0.1 =6.7〔环〕.由这样一个问题的启发,得到一般随机变量的“平均数〞,应是随机变量所有可能取值与其相应的概率乘积之和,也就是以概率为权数的加权平均值,这就是所谓“数学期望的概念〞.一般地,有如下定义:定义4.1 设离散型随机变量X 的分布律为P {X =x k }=p k k =1,2,…, 假设级数∑∞=1k k kp x绝对收敛,那么称级数∑∞=1k k kp x为随机变量X 的数学期望〔Mathematical expectation 〕,记为E 〔X 〕.即E 〔X 〕=∑∞=1k k kp x. 〔4.1〕设连续型随机变量X 的概率密度为f 〔x 〕,假设积分⎰+∞∞-x x xf d )(绝对收敛,那么称积分⎰+∞∞-x x xf d )(的值为随机变量X 的数学期望,记为E 〔X 〕.即E 〔X 〕=⎰+∞∞-x x xf d )(. 〔4.2〕数学期望简称期望,又称为均值.例4.1 某商店在年末大甩卖中进展有奖销售,摇奖时从摇箱摇出的球的可能颜色为:红、黄、蓝、白、黑五种,其对应的奖金额分别为:10000元、1000元、100元、10元、1元.假定摇箱内装有很多球,其中红、黄、蓝、白、黑的比例分别为:0.01%,0.15%,1.34%,10%,88.5%,求每次摇奖摇出的奖金额X 的数学期望. 解每次摇奖摇出的奖金额X 是一个随机变量,易知它的分布律为因此,E 〔X 〕=10000×0.0001+1000×0.0015+100×0.0134+10×0.1+1×0.885=5.725. 可见,平均起来每次摇奖的奖金额缺乏6元.这个值对商店作方案预算时是很重要的.例4.2 按规定,某车站每天8点至9点,9点至10点都有一辆客车到站,但到站的时刻是随机的,且两者到站的时间互相独立.其分布律为一旅客8点20分到车站,求他候车时间的数学期望.解 设旅客候车时间为X 分钟,易知X 的分布律为表4-4在上表中p k 的求法如下,例如P {X =70}=P 〔AB 〕=P 〔A 〕P 〔B 〕=1/6×3/6=3/36,其中A 为事件“第一班车在8:10到站〞,B 为事件“第二班车在9:30到站〞,于是候车时间的数学期望为E 〔X 〕=10×3/6+30×2/6+50×1/36+70×3/36+90×2/36=27.22〔分钟〕.例4.3 有5个互相独立工作的电子装置,它们的寿命X k 〔k =1,2,3,4,5〕服从同一指数分布,其概率密度为f 〔x 〕=⎪⎩⎪⎨⎧≤>-.00,0,1/x ,x x θθe〔1〕 假设将这5个电子装置串联起来组成整机,求整机寿命N 的数学期望;〔2〕 假设将这5个电子装置并联组成整机,求整机寿命M 的数学期望.解 X k 〔k =1,2,3,4,5〕的分布函数为F 〔x 〕=⎩⎨⎧≤>--.0,0,0,1/x x x θe〔1〕 串联的情况由于当5个电子装置中有一个损坏时,整机就停顿工作,所以这时整机寿命为N =min{X 1,X 2,X 3,X 4,X 5}.由于X 1,X 2,X 3,X 4,X 5是互相独立的,于是i=min{X 1,X 2,X 3,X 4,X 5}的分布函数为F N 〔x 〕=P {N ≤x }=1-P {N >x }=1-P {X 1>x ,X 2>x ,X 3>x ,X 4>x ,X 5>x }=1-P {X 1>x }·P {X 2>x }·P {X 3>x }·P {X 4>x }·P {X 5>x }=1-[1-)(1x F X ][1- )(2x F X ][1-)(3x F X ][1-)(4x F X ][1-)(5x F X ] =1-[1-F 〔x 〕]5=⎪⎩⎪⎨⎧≤>--.0,0,0,15x x xθe 因此N 的概率密度为f N 〔x 〕=⎪⎩⎪⎨⎧≤>-.0,0,0,55x x xθθe那么N 的数学期望为E 〔N 〕=55)(5θθθ==-∞+∞-∞+∞-⎰⎰x xx x xf xN d ed〔2〕 并联的情况由于当且仅当5个电子装置都损坏时,整机才停顿工作,所以这时整机寿命为M =max{X 1,X 2,X 3,X 4,X 5}.由于X 1,X 2,X 3,X 4,X 5互相独立,类似可得M 的分布函数为F M 〔x 〕=[F 〔x 〕]5=⎪⎩⎪⎨⎧≤>--.0,0,0,)1(5x x x θe因此M 的概率密度为f M 〔x 〕=⎪⎩⎪⎨⎧≤>---.0,0,0,]1[54x x x x θθθe e于是M 的数学期望为E 〔M 〕=.60137)1(5)(0max θθθ=-=-∞+∞-∞+⎰⎰x xx x xf xd e d 这说明:5个电子装置并联联接工作的平均寿命要大于串联联接工作的平均寿命.例4.4 设随机变量X 服从柯西〔Cauchy 〕分布,其概率密度为f 〔x 〕=)1(12x +π,-x <x <+∞, 试证E 〔X 〕不存在.证 由于,)1(1)(2⎰⎰+∞∞-+∞∞-∞=+=x x xx x f x d πd 故E 〔X 〕不存在.2.随机变量函数的数学期望在实际问题与理论研究中,我们经常需要求随机变量函数的数学期望.这时,我们可以通过下面的定理来实现.定理4.1 设Y 是随机变量X 的函数Y =g 〔X 〕〔g 是连续函数〕. 〔1〕 X 是离散型随机变量,它的分布律为P 〔X =x k 〕=p k ,k =1,2,…,假设kk kpx g ∑∞=1)(绝对收敛,那么有E 〔Y 〕=E [g 〔X 〕]=kk kpx g ∑∞=1)(. 〔4.3〕〔2〕 X 是连续型随机变量,它的概率密度为f 〔x 〕,假设⎰+∞∞-x x f x g d )()(绝对收敛,那么有E 〔Y 〕=E [g 〔X 〕]=⎰+∞∞-x x f x g d )()(. 〔4.4〕定理4.4的重要意义在于当我们求E 〔Y 〕时,不必知道Y 的分布而只需知道X 的分布就可以了.当然,我们也可以由的X 的分布,先求出其函数g 〔X 〕的分布,再根据数学期望的定义去求E [g 〔X 〕],然而,求Y =g 〔X 〕的分布是不容易的,所以一般不采用后一种方法.定理4.1的证明超出了本书的范围,这里不证.上述定理还可以推广到二个或二个以上随机变量的函数情形. 例如,设Z 是随机变量X ,Y 的函数,Z =g 〔X ,Y 〕〔g 是连续函数〕,那么Z 也是一个随机变量,当〔X ,Y 〕是二维离散型随机变量,其分布律为P {X =x i ,Y =y j }=p ij 〔i ,j =1,2,…〕时,假设∑∑ijijiipy x g ),(绝对收敛,那么有E 〔Z 〕=E [g 〔X ,Y 〕]=∑∑ijijiipy x g ),(. 〔4.5〕当〔X ,Y 〕是二维连续型随机变量,其概率密度为f 〔x ,y 〕时,假设⎰⎰+∞∞-+∞∞-yx y x f y z g d d ),(),(绝对收敛,那么有E 〔Z 〕=E [g 〔X ,Y 〕]=⎰⎰+∞∞-+∞∞-y x y x f y z g d d ),(),(. 〔4.6〕特别地有E 〔X 〕=⎰⎰+∞∞-+∞∞-y x y x xf d d ),(=⎰+∞∞-.)(x x xf X dE 〔Y 〕=⎰⎰+∞∞-+∞∞-y x y x yf d d ),(=⎰+∞∞-.)(y y yf Y d例4.5 设随机变量X 的分布律为表4-5求E 〔X 〕,E 〔-2x +1〕.解 由〔4.5〕式得E 〔X 2〕=〔-1〕2×18+02×14+22×38+32×14=318, E 〔-2X +1〕=[-2×〔-1〕+1]×18+[-2×0+1]×14+[-2×2+1]×38+[-2×3+1]×14= -74. 例4.6 对球的直径作近似测量,设其值均匀分布在区间[a ,b ]内,求球体积的数学期望.解 设随机变量X 表示球的直径,Y 表示球的体积,依题意,X 的概率密度为f 〔x 〕=⎪⎩⎪⎨⎧≤≤-.,0,,1其他b x a a b球体积Y =361X π,由〔4.6〕式得 E 〔Y 〕=x a b x X E ba d ππ-=⎰161)61(33=).)((24)(6223b a b a x x a b ba++=-⎰πd π例4.7 设国际市场每年对我国某种出口商品的需求量X 〔吨〕服从区间[2000,4000]上的均匀分布.假设售出这种商品1吨,可挣得外汇3万元,但假设销售不出而囤积于仓库,那么每吨需保管费1万元.问应预备多少吨这种商品,才能使国家的收益最大? 解设预备这种商品y 吨〔2000≤y ≤4000〕,那么收益〔万元〕为g 〔X 〕=⎩⎨⎧<--≥.),(3,,3y X X y X y X y那么 E [g 〔X 〕]=⎰⎰-⋅=+∞∞-40002000200040001)()()(x x g x x f x g d d=[]⎰⎰+--40002000320001)(320001y y x y x x y x d d =)1047000(1000162⨯-+-y y . 当y =3500吨时,上式到达最大值.所以预备3500吨此种商品能使国家的收益最大,最大收益为8250万元.例4.8 设二维随机变量〔X ,Y 〕在区域A 上服从均匀分布,其中A 为x 轴,y 轴及直线x +2y=1所围成的三角区域,求E 〔X 〕,E 〔Y 〕,E 〔XY 〕. 解 由于〔X ,Y 〕在A 内服从均匀分布,所以其概率密度f 〔x ,y 〕=⎪⎩⎪⎨⎧⎩⎨⎧∉∈=∉∈.),(,0,),(,1,),(,0,),(,1A y x A y x A y x A y x A 的面积 E 〔X 〕=12(1)001(,)d d d d d d ;3x Axf x y x y x x y x x y +∞+∞--∞-∞===⎰⎰⎰⎰⎰⎰E 〔Y 〕=2122(,)d d d d d d ;3y Ayf x y x y y x y y y x +∞+∞--∞-∞===⎰⎰⎰⎰⎰⎰E 〔XY 〕=;61)1(2),()1(2010210⎰⎰⎰⎰⎰+∞∞-+∞∞--=-==x x x x y y x x y x y x xyf d d d d d3.数学期望的性质下面讨论数学期望的几条重要性质.定理4.2 设随机变量X ,Y 的数学期望E 〔X 〕,E 〔Y 〕存在. 1°E 〔c 〕=c ,其中c 是常数; 2°E 〔cX 〕=cE 〔X 〕;3°E 〔X +Y 〕=E 〔X 〕+E 〔Y 〕;4°假设X ,Y 是互相独立的,那么有E 〔XY 〕=E 〔X 〕E 〔Y 〕.证 就连续型的情况我们来证明性质3°、4°,离散型情况和其他性质的证明留给读者. 3°设二维随机变量〔X ,Y 〕的概率密度为f 〔x ,y 〕,其边缘概率密度为f X 〔x 〕,f Y 〔y 〕,那么E 〔X +Y 〕=⎰⎰+∞∞-+∞∞-+y x y x f y x d d ),()(=⎰⎰⎰⎰+∞∞-+∞∞-+∞∞-+∞∞-+y x y x yf y x y x xf d d d d ),(),(=)()()()(Y E X E y y yf x x xf Y X +=+⎰⎰+∞∞-+∞∞-d d .4°又假设X 和Y 互相独立,此时f 〔x ,y 〕=f X 〔x 〕f Y 〔y 〕,故E 〔XY 〕=⎰⎰⎰⎰+∞∞-+∞∞-+∞∞-+∞∞-=y x y f x xyf y x y x xyf Y X d d d d )()(),(=).()()()(Y E X E y y yf x x xf Y X =⋅⎰⎰+∞∞-+∞∞-d d性质3°可推广到任意有限个随机变量之和的情形;性质4°可推广到任意有限个互相独立的随机变量之积的情形.例4.9 设一电路中电流I 〔安〕与电阻R 〔欧〕是两个互相独立的随机变量,其概率密度分别为g 〔i 〕=⎩⎨⎧≤≤.,0,10,2其他i i h 〔r 〕=⎪⎩⎪⎨⎧≤≤.,0,30,92其他r r试求电压V =IR 的均值.解 E 〔V 〕=E 〔IR 〕=E 〔I 〕E 〔R 〕=2392)()(303102=⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡⎰⎰⎰⎰∞+∞-∞+∞-r r i i r r rh i i ig d d d d 〔伏〕. 例4.10 设对某一目的进展射击,命中n 次才能彻底摧毁该目的,假定各次射击是独立的,并且每次射击命中的概率为p ,试求彻底摧毁这一目的平均消耗的炮弹数.解 设X 为n 次击中目的所消耗的炮弹数,X k 表示第k -1次击中后至k 次击中目的之间所消耗的炮弹数,这样,X k 可取值1,2,3,…,其分布律见表4-6.表4-61X =X 1+X 2+…+X n .由性质3°可得E 〔X 〕=E 〔X 1〕+E 〔X 2〕+…+E 〔X n 〕=nE 〔X 1〕. 又 E〔X 1〕=,111pkpq k k =∑∞=- 故 E 〔X 〕=pn . 4.常用分布的数学期望 〔1〕 两点分布 那么X 的数学期望为E 〔X 〕=0×〔1-p 〕+1×p =p .〔2〕 二项分布设X 服从二项分布,其分布律为P {X =k }=kn k k n p p --)1(C , 〔k =0,1,2,…,n 〕,〔0<p <1〕.那么X 的数学期望为E 〔X 〕=∑∑==----=-nk nk k n k kn kknp p k n k n kp p k 0)1()!(!!)1(C=[]∑=----------nk k n k p pk n k n np)]1()1[(1)1(!)1()1()!1()!1(,令k -1=t ,那么E 〔X 〕=[]∑-=------10])1[()1(!)1(!)!1(n t t n t p p t n t n np=np [p +〔1-p 〕]n -1=np .假设利用数学期望的性质,将二项分布表示为n 个互相独立的0-1分布的和,计算过程将简单得多.事实上,假设设X 表示在n 次独立重复试验中事件A 发生的次数,X i 〔i =1,2,…,n 〕表示A 在第i 次试验中出现的次数,那么有X =1nii X=∑.显然,这里X所以E 〔X i 〕=p ,i =1,2,…,n .由定理4.2的性质3°有E 〔X 〕=∑∑===⎪⎭⎫ ⎝⎛ni i n i i X E X E 11)( =np .〔3〕 泊松分布设X 服从泊松分布,其分布律为P {X =k }=λλ-e !k k, 〔k =0,1,2,…〕,〔λ>0〕.那么X 的数学期望为E 〔X 〕=∑∑∞=--∞=--=11)!1(!k k k kk k k λλλλλee,令k -1=t ,那么有E 〔X 〕=.!0λλλλλλλ=⋅=-∞=-∑e e ek tt .〔4〕 均匀分布设X 服从[a ,b ]上的均匀分布,其概率密度函数为f 〔x 〕=⎪⎩⎪⎨⎧≤≤-.,0,,1其他b x a a b那么X 的数学期望为E 〔X 〕=.2)(ba x ab x x x xf ba +=-=⎰⎰+∞∞-d d . 〔5〕 指数分布设X 服从指数分布,其分布密度为f 〔x 〕=⎩⎨⎧<≥-.0,0,0,x x x λλe那么X 的数学期望为E 〔X 〕=1()d e d x xf x x x x λλλ+∞+∞--∞-∞==⎰⎰.〔6〕 正态分布设X ~N 〔μ,σ2〕,其分布密度为f 〔x 〕=222)(21σμσ--x e π,那么X 的数学期望为E 〔X 〕=22()2()d ed ,x xf x x x x μσ--+∞+∞-∞-∞=⎰令σμ-x =t ,那么E 〔X 〕=⎰∞+∞--+t t t d e π22)(21σμ 注意到t t d eπ⎰∞+∞--222μ=μ,t σt t d e π⎰∞+∞--2221=0,故有E 〔X 〕=μ.第二节 方 差1.方差的定义数学期望描绘了随机变量取值的“平均〞.有时仅知道这个平均值还不够.例如,有A ,B 两名射手,他们每次射击命中的环数分别为X ,Y ,X ,Y 的分布律为:由于E 〔X 〕=E 〔Y 〕=9〔环〕,可见从均值的角度是分不出谁的射击技术更高,故还需考虑其他的因素.通常的想法是:在射击的平均环数相等的条件下进一步衡量谁的射击技术更稳定些.也就是看谁命中的环数比较集中于平均值的附近,通常人们会采用命中的环数X 与它的平均值E 〔X 〕之间的离差|X -E 〔X 〕|的均值E [|X -E 〔X 〕|]来度量,E [|X -E 〔X 〕|]愈小,说明X 的值愈集中于E 〔X 〕的附近,即技术稳定;E [|X -E 〔X 〕|]愈大,说明X 的值很分散,技术不稳定.但由于E [|X -E 〔X 〕|]带有绝对值,运算不便,故通常采用X 与E 〔X 〕的离差|X -E 〔X 〕|的平方平均值E [X -E 〔X 〕]2来度量随机变量X 取值的分散程度.此例中,由于E [X -E 〔X 〕]2=0.2×〔8-9〕2+0.6×〔9-9〕2+0.2×〔10-9〕2=0.4, E [Y -E 〔Y 〕]2=0.1×〔8-9〕2+0.8×〔9-9〕2+0.1×〔10-9〕2=0.2.由此可见B 的技术更稳定些.定义4.2 设X 是一个随机变量,假设E [X -E 〔X 〕]2存在,那么称E [X -E 〔X 〕]2为X 的方差〔Variance 〕,记为D 〔X 〕,即D 〔X 〕=E [X -E 〔X 〕]2. 〔4.7〕 称)(X D 为随机变量X 的标准差〔Standard deviation 〕或均方差〔Mean square deviation 〕,记为σ〔X 〕.根据定义可知,随机变量X 的方差反映了随机变量的取值与其数学期望的偏离程度.假设X 取值比较集中,那么D 〔X 〕较小,反之,假设X 取值比较分散,那么D 〔X 〕较大. 由于方差是随机变量X 的函数g 〔X 〕=[X -E 〔X 〕]2的数学期望.假设离散型随机变量X 的分布律为P {X =x k }=p k ,k =1,2,…,那么D 〔X 〕=k k kp X E x∑∞=-12)]([. 〔4.8〕假设连续型随机变量X 的概率密度为f 〔x 〕,那么D 〔X 〕=⎰+∞∞--.)()]([2x x f X E x d 〔4.9〕由此可见,方差D 〔X 〕是一个常数,它由随机变量的分布惟一确定.根据数学期望的性质可得:D 〔X 〕=E [X -E 〔X 〕]2=E [X 2-2X ·E 〔X 〕+[E 〔X 〕]2]=E 〔X 2〕-2E 〔X 〕·E 〔X 〕+[E 〔X 〕]2=E 〔X 2〕-[E 〔X 〕]2.于是得到常用计算方差的简便公式D 〔X 〕=E 〔X 2〕-[E 〔X 〕]2. 〔4.10〕例4.11 设有甲,乙两种棉花,从中各抽取等量的样品进展检验,结果如下表:其中X ,Y 分别表示甲,乙两种棉花的纤维的长度〔单位:毫米〕,求D 〔X 〕与D 〔Y 〕,且评定它们的质量.解 由于E 〔X 〕=28×0.1+29×0.15+30×0.5+31×0.15+32×0.1=30, E 〔Y 〕=28×0.13+29×0.17+30×0.4+31×0.17+32×0.13=30,故得D 〔X 〕=〔28-30〕2×0.1+〔29-30〕2×0.15+〔30-30〕2×0.5+〔31-30〕2×0.15+〔32-30〕2×0.1=4×0.1+1×0.15+0×0.5+1×0.15+4×0.1=1.1,D 〔Y 〕=〔28-30〕2×0.13+〔29-30〕2×0.17+〔30-30〕2×0.4+〔31-30〕2×0.17+〔32-30〕2×0.13=4×0.13+1×0.17+0×0.4+1×0.17+4×0.13=1.38.因D 〔X 〕<D 〔Y 〕,所以甲种棉花纤维长度的方差小些,说明其纤维比较均匀,故甲种棉花质量较好.例4.12 设随机变量X 的概率密度为f 〔x 〕=⎪⎩⎪⎨⎧<≤-<≤-+.,0,10,1,01,1其他x x x x求D 〔X 〕.解 E 〔X 〕=⎰⎰-++-11)1()1(x x x x x x d d =0,E 〔X 2〕=⎰⎰-++-12012)1()1(x x x x x x d d =1/6,于是 D 〔X 〕=E 〔X 2〕-[E 〔X 〕]2=1/6.2.方差的性质方差有下面几条重要的性质.设随机变量X 与Y 的方差存在,那么 1°设c 为常数,那么D 〔c 〕=0;2°设c 为常数,那么D 〔cX 〕=c 2D 〔X 〕; 3°D 〔X ±Y 〕=D 〔X 〕+D 〔Y 〕±2E [〔X -E 〔X 〕〕〔Y -E 〔Y 〕〕]; 4°假设X ,Y 互相独立,那么D 〔X ±Y 〕=D 〔X 〕+D 〔Y 〕; 5°对任意的常数c ≠E 〔X 〕,有D 〔X 〕<E [〔X -c 〕2]. 证 仅证性质4°,5°. 4°D 〔X ±Y 〕=E [〔X ±Y 〕-E 〔X ±Y 〕]2=E [〔X -E 〔X 〕〕±〔Y -E 〔Y 〕〕]2=E [X -E 〔X 〕]2±2E [〔X -E 〔X 〕〕〔Y -E 〔Y 〕〕]+E [Y -E 〔Y 〕]2 =D 〔X 〕+D 〔Y 〕±2E [〔X -E 〔X 〕〕〔Y -E 〔Y 〕〕].当X 与Y 互相独立时,X -E 〔X 〕与Y -E 〔Y 〕也互相独立,由数学期望的性质有E [〔X -E 〔X 〕〕〔Y -E 〔Y 〕〕]=E 〔X -E 〔X 〕〕E 〔Y -E 〔Y 〕〕=0.因此有D 〔X ±Y 〕=D 〔X 〕+D 〔Y 〕.性质4°可以推广到任意有限多个互相独立的随机变量之和的情况.5°对任意常数c ,有E [〔X -c 〕2]=E [〔X -E 〔X 〕+E 〔X 〕-c 〕2]=E [〔X -E 〔X 〕〕2]+2〔E 〔X 〕-c 〕·E [X -E 〔X 〕]+〔E 〔X 〕-c 〕2=D 〔X 〕+〔E 〔X 〕-c 〕2.故对任意常数c ≠EX ,有DX <E [〔X -c 〕2].例4.13 设随机变量X 的数学期望为E 〔X 〕,方差D 〔X 〕=σ2〔σ>0〕,令Y =σ)(X E X -,求E 〔Y 〕,D 〔Y 〕.解 E 〔Y 〕=[],0)()(1)]([1)(=-=-=⎥⎦⎤⎢⎣⎡-X E X E X E X E X E X E σσσ D 〔Y 〕=.1)(1)]([1)(2222===-=⎥⎦⎤⎢⎣⎡-σσσσσX D X E X D X E X D 常称Y 为X 的标准化随机变量.例4.14 设X 1,X 2,…,X n 互相独立,且服从同一〔0-1〕分布,分布律为P {X i =0}=1-p ,P {X i =1}=p , i =1,2,…,n .证明 X =X 1+X 2+…+X n 服从参数为n ,p 的二项分布,并求E 〔X 〕和D 〔X 〕.解 X 所有可能取值为0,1,…,n ,由独立性知X 以特定的方式〔例如前k 个取1,后n -k 个取0〕取k 〔0≤k ≤n 〕的概率为p k 〔1-p 〕n -k,而X 取k 的两两互不相容的方式共有knC 种,故P {X =k }=kn C p k 〔1-p 〕n -k , k =0,1,2,…,n ,即X 服从参数为n ,p 的二项分布. 由于E 〔X i 〕=0×〔1-p 〕+1×p =p ,D 〔X i 〕=〔0-p 〕2×〔1-p 〕+〔1-p 〕2×p =p 〔1-p 〕, i =1,2,…,n ,故有E 〔X 〕=.)(11np X E X E ni i n i i ==⎪⎭⎫ ⎝⎛∑∑==由于X 1,X 2,…,X n 互相独立,得D 〔X 〕= ).1()(11p np X D X D ni i n i i -==⎪⎭⎫ ⎝⎛∑∑==3.常用分布的方差 〔1〕 〔0-1〕分布设X 服从参数为p 的0-1分布,其分布律为由例4.14知,D 〔X 〕=p 〔1-p 〕. 〔2〕 二项分布设X 服从参数为n ,p 的二项分布,由例4.14知,D 〔X 〕=np 〔1-p 〕. 〔3〕 泊松分布设X 服从参数为λ的泊松分布,由上一节知E 〔X 〕=λ,又E 〔X 2〕=E [X 〔X -1〕+X ]=E [X 〔X -1〕]+E 〔X 〕=∑∑∞=--∞=-+-=+-2220)!2(!)1(k k k kk k k k λλλλλλλee=λ2e -λ·e λ+λ=λ2+λ,从而有D 〔X 〕=E 〔X 2〕-[E 〔X 〕]2=λ2+λ -λ2=λ.〔4〕 均匀分布设X 服从[a ,b ]上的均匀分布,由上一节知E 〔X 〕=2ba +,又 E 〔X 2〕=3222b ab a x a b x ba ++=-⎰d , 所以D 〔X 〕=E 〔X 2〕-[E 〔X 〕]2=12)()(41)(312222a b b a b ab a -=+-++.〔5〕 指数分布设X 服从参数为λ的指数分布,由上一节知.E 〔X 〕=1/λ,又E 〔X 2〕=222λλλ=⎰-bax x x d e ,所以D 〔X 〕=E 〔X 2〕-[E 〔X 〕]2=.112222λλλ=⎪⎭⎫⎝⎛-〔6〕 正态分布 设X ~N 〔μ,σ2〕,由上一节知E 〔X 〕=μ,从而D 〔X 〕=[]⎰⎰∞+∞--∞+∞--=--d e πd x x x x f X E x x 222)(2221)()()(σμσμ令σμ-x =t 那么D 〔X 〕=)(22222222222⎰⎰∞+∞--∞+∞--∞+∞--+-=t t t t t t t d eeπd eπσσ=)20(22ππ+σ =σ2.由此可知:正态分布的概率密度中的两个参数μ和σ分别是该分布的数学期望和均方差.因此正态分布完全可由它的数学期望和方差所确定.再者,由上一章第五节例3.17知道,假设X i ~N 〔μi ,σi 2〕,i =1,2,…,n ,且它们互相独立,那么它们的线性组合c 1X 1+c 2X 2+…+c n X n 〔c 1,c 2,…,c n 是不全为零的常数〕仍然服从正态分布.于是由数学期望和方差的性质知道:c 1X 1+c 2X 2+…+c n X n ~⎪⎭⎫⎝⎛∑∑==n i ni i i i i c c N 1122,σμ.这是一个重要的结果.例4.15 设活塞的直径〔以cm 计〕X ~N 〔22.40,0.032〕,气缸的直径Y ~N 〔22.50,0.042〕,X ,Y 互相独立,任取一只活塞,任取一只气缸,求活塞能装入气缸的概率. 解按题意需求P {X <Y }=P {X -Y <0}. 令Z =X -Y ,那么E 〔Z 〕=E 〔X 〕-E 〔Y 〕=22.40-22.50=-0.10, D 〔Z 〕=D 〔X 〕+D 〔Y 〕=0.032+0.042=0.052,即Z ~N 〔-0.10,0.052〕, 故有P {X <Y }=P {Z <0}=⎪⎭⎫⎝⎛Φ=⎭⎬⎫⎩⎨⎧--<--05.010.005.0)10.0(005.0)10.0(Z P =Φ〔2〕=0.9772.第三节 协方差与相关系数对于二维随机变量〔X ,Y 〕,数学期望E 〔X 〕,E 〔Y 〕只反映了X 和Y 各自的平均值,而D 〔X 〕,D 〔Y 〕反映的是X 和Y 各自偏离平均值的程度,它们都没有反映X 与Y 之间的关系.在实际问题中,每对随机变量往往互相影响、互相联络.例如,人的年龄与身高;某种产品的产量与价格等.随机变量的这种互相联络称为相关关系,它们也是一类重要的数字特征,本节讨论有关这方面的数字特征.定义4.3 设〔X ,Y 〕为二维随机变量,称E {[X -E 〔X 〕][Y -E 〔Y 〕]}为随机变量X ,Y 的协方差〔Covariance 〕,记为Cov 〔X ,Y 〕,即Cov 〔X ,Y 〕=E {[X -E 〔X 〕][Y -E 〔Y 〕]}. 〔4.11〕 而)()(),cov(Y D X D Y X 称为随机变量X ,Y 的相关系数〔Correlation coefficient 〕或标准协方差〔Standard covariance 〕,记为ρXY ,即ρXY =)()(),cov(Y D X D Y X . 〔4.12〕特别地,Cov 〔X ,X 〕=E {[X -E 〔X 〕][X -E 〔X 〕]}=D 〔X 〕, Cov 〔Y ,Y 〕=E {[Y -E 〔Y 〕][Y -E 〔Y 〕]}=D 〔Y 〕.故方差D 〔X 〕,D 〔Y 〕是协方差的特例.由上述定义及方差的性质可得D 〔X ±Y 〕=D 〔X 〕+D 〔Y 〕±2Cov 〔X ,Y 〕.由协方差的定义及数学期望的性质可得以下实用计算公式Cov 〔X ,Y 〕=E 〔XY 〕-E 〔X 〕E 〔Y 〕. 〔4.13〕假设〔X ,Y 〕为二维离散型随机变量,其结合分布律为P {X =x i ,Y =y j }=p ij ,i ,j =1,2,…,那么有Cov 〔X ,Y 〕=[][]∑∑--ijijiipY E y X E x )()(. 〔4.14〕假设〔X ,Y 〕为二维连续型随机变量,其概率密度为f 〔x ,y 〕,那么有Cov 〔X ,Y 〕=[][]⎰⎰+∞∞-+∞∞---y x y x f Y E y X E x d d ),()()(. 〔4.15〕例4.16 设〔X ,Y 〕的分布律为表4-120<p <1,求Cov 〔X ,Y 〕和XY .解 易知X 的分布律为P {X =1}=p ,P {X =0}=1-p ,故 E 〔X 〕=p , D 〔X 〕=p 〔1-p 〕.同理E 〔Y 〕=p ,D 〔Y 〕=p 〔1-p 〕,因此Cov 〔X ,Y 〕=E 〔XY 〕-E 〔X 〕·E 〔Y 〕=p -p 2=p 〔1-p 〕, 而ρXY =1)1()1()1(),cov(=-⋅--=⋅p p p p p p DY DX Y X例4.17 设〔X ,Y 〕的概率密度为f 〔x ,y 〕=⎩⎨⎧<<<<+.,0,10,10,其他y x y x求Cov 〔X ,Y 〕.解 由于f X 〔x 〕=⎪⎩⎪⎨⎧<<+,,0,10,21其他x x f Y 〔y 〕=⎪⎩⎪⎨⎧<<+.,0,10,21其他y y E 〔X 〕=127)21(10=+⎰x x x d ,E 〔Y 〕=127)21(10=+⎰y y y d ,E 〔XY 〕=31)(10102101021010=+=+⎰⎰⎰⎰⎰⎰y x xy y x y x y x y x xy d d d d d d因此 Cov 〔X ,Y 〕=E 〔XY 〕-E 〔X 〕E 〔Y 〕=144112712731-=⨯-. 协方差具有以下性质:1°假设X 与Y 互相独立,那么Cov 〔X ,Y 〕=0; 2°Cov 〔X ,Y 〕=Cov 〔Y ,X 〕; 3°Cov 〔aX ,bY 〕=ab Cov 〔X ,Y 〕;4°Cov 〔X 1+X 2,Y 〕=Cov 〔X 1,Y 〕+Cov 〔X 2,Y 〕. 证 仅证性质4°,其余留给读者.Cov 〔X 1+X 2,Y 〕 =E [〔X 1+X 2〕Y ]-E 〔X 1+X 2〕E 〔Y 〕=E 〔X 1Y 〕+E 〔X 2Y 〕-E 〔X 1〕E 〔Y 〕-E 〔X 2〕E 〔Y 〕 =[E 〔X 1Y 〕-E 〔X 1〕E 〔Y 〕]+[E 〔X 2Y 〕-E 〔X 2〕E 〔Y 〕] =Cov 〔X 1,Y 〕+Cov 〔X 2,Y 〕.下面给出相关系数ρXY 的几条重要性质,并说明ρXY 的含义.定理4.3 设D 〔X 〕>0,D 〔Y 〕>0,ρXY 为〔X ,Y 〕的相关系数,那么 1°假设X ,Y 互相独立,那么ρXY =0; 2°|ρXY |≤1;3°|ρXY |=1的充要条件是存在常数a ,b 使P {Y =aX +b }=1〔a ≠0〕. 证 由协方差的性质1°及相关系数的定义可知1°成立. 2°对任意实数t ,有D 〔Y -tX 〕=E [〔Y -tX 〕-E 〔Y -tX 〕]2=E [〔Y -E 〔Y 〕〕-t 〔X -E 〔X 〕〕]2 =E [Y -E 〔Y 〕]2-2tE [Y -E 〔Y 〕][X -E 〔X 〕]+t 2E [X -E〔X 〕]2=t 2D 〔X 〕-2t Cov 〔X ,Y 〕+D 〔Y 〕=[])(),cov()()(),cov()(22X D Y X Y D X D Y X t X D -+⎥⎦⎤⎢⎣⎡-. 令t =)(),cov(X D Y X =b ,于是D 〔Y -bX 〕=[][]).1)(()()(),cov(1)()(),cov()(222XY Y D Y D X D Y X Y D X D Y X Y D ρ-=⎥⎦⎤⎢⎣⎡-=-由于方差不能为负,所以1-2XY ρ≥0,从而|ρXY |≤1.性质3°的证明较复杂,从略.当ρXY =0时,称X 与Y 不相关,由性质1°可知,当X 与Y 互相独立时,ρXY =0,即X 与Y 不相关.反之不一定成立,即X 与Y 不相关,X 与Y 却不一定互相独立.例4.18 设X 服从[0,2π]上均匀分布,Y =cos X ,Z =cos 〔X +a 〕,这里a 是常数.求ρYZ .解 E 〔Y 〕=⎰⋅πd π2021cos x x =0, E 〔Z 〕= ⎰+πd π20)cos(21x a x =0, D 〔Y 〕=E {[Y -E 〔Y 〕]2}=21cos 21202=⎰πd πx x , D 〔Z 〕=E {[Z -E 〔Z 〕]2}=21)(cos 21202=+⎰πd πx a x , Cov 〔Y ,Z 〕=E {[Y -E 〔Y 〕][Z -E 〔Z 〕]}= a x a x x cos 21)cos(cos 2120=+•⎰πd π, 因此 ρYZ =.cos 2121cos 21)()(),cov(a a Z D Y D Z Y =⋅=⋅ ① 当a =0时,ρYZ =1,Y =Z ,存在线性关系;② 当a=π时,ρYZ =-1,Y =-Z ,存在线性关系; ③ 当a =2π或23π时,ρYZ =0,这时Y 与Z 不相关,但这时却有Y 2+Z 2=1,因此,Y 与Z不独立.这个例子说明:当两个随机变量不相关时,它们并不一定互相独立,它们之间还可能存在其他的函数关系.定理4.3 告诉我们,相关系数ρXY 描绘了随机变量X ,Y 的线性相关程度,|ρXY |愈接近1,那么X 与Y 之间愈接近线性关系.当|ρXY |=1时,X 与Y 之间依概率1线性相关.不过,下例说明当〔X ,Y 〕是二维正态随机变量时,X 和Y 不相关与X 和Y 互相独立是等价的.例4.19 设〔X ,Y 〕服从二维正态分布,它的概率密度为f 〔x ,y 〕=⨯-221121ρσσπ⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⎥⎦⎤⎢⎣⎡-+------2222212121212)())((2)()1(21exp σμσσμμρσμρy y x x 求Cov 〔X ,Y 〕和ρXY .解 可以计算得〔X ,Y 〕的边缘概率密度为f X 〔x 〕=21212)(121σμσ--x e π,-∞<x <+∞,f Y 〔y 〕=22222)(221σμσ--x e π,-∞<y <+∞,故E 〔X 〕=μ1,E 〔Y 〕=μ2, D 〔X 〕=σ12,D 〔Y 〕=σ22. 而Cov 〔X ,Y 〕=⨯-=--⎰⎰+∞∞-+∞∞-22121121),()()(ρσπσμμy x y x f y x d dy x y x x y x d d ee-2112222121)1(212)(21)()(⎥⎦⎤⎢⎣⎡------∞+∞-∞+∞---⎰⎰σμρσμρσμμμ令t =⎪⎪⎭⎫⎝⎛----1122211σμρσμρx y ,u =11σμ-x ,那么 Cov 〔X ,Y 〕=⎰⎰∞+∞-∞+∞---+-u t u tu t u d d e π2222122122)1(21σρσρσσ =⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛⎰⎰∞+∞--∞+∞--t e u u t u d d e π22221222ρσσ +⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫⎝⎛-⎰⎰∞+∞--∞+∞--t t u u t u d e d eπ222212221ρσσ =.2222121σρσσρσ=⋅πππ于是ρXY=ρ.这说明二维正态随机变量〔X ,Y 〕的概率密度中的参数ρ就是X 和Y 的相关系数,从而二维正态随机变量的分布完全可由X ,Y 的各自的数学期望、方差以及它们的相关系数所确定.由上一章讨论可知,假设〔X ,Y 〕服从二维正态分布,那么X 和Y 互相独立的充要条件是ρ=0,即X 与Y 不相关.因此,对于二维正态随机变量〔X ,Y 〕来说,X 和Y 不相关与X 和Y 互相独立是等价的.第四节 矩、协方差矩阵数学期望、方差、协方差是随机变量最常用的数字特征,它们都是特殊的矩〔Moment 〕.矩是更广泛的数字特征.定义4.4 设X 和Y 是随机变量,假设E 〔X k 〕,k =1,2,…存在,称它为X 的k 阶原点矩,简称k 阶矩.假设 E [X -E 〔X 〕]k , k =1,2,… 存在,称它为X 的k 阶中心矩.假设 E 〔X k Y l 〕, k ,l =1,2,… 存在,称它为X 和Y 的k +l 阶混合矩.假设 E {[X -E 〔X 〕]k [Y -E 〔Y 〕]l } 存在,称它为X 和Y 的k +l 阶混合中心矩.显然,X 的数学期望E 〔X 〕是X 的一阶原点矩,方差D 〔X 〕是X 的二阶中心矩,协方差Cov 〔X ,Y 〕是X 和Y 的1+1阶混合中心矩.当X 为离散型随机变量,其分布律为P {X =x i }=p i ,那么E 〔X k〕=∑∞=1i i kip x,E [X -E 〔X 〕]k=1[()]kii i x E X p ∞=-∑.当X 为连续型随机变量,其概率密度为f 〔x 〕,那么E 〔X k 〕=⎰+∞∞-x x f x k d )(,E [X -E 〔X 〕]k =⎰+∞∞--x x f X E x k d )()]([.下面介绍n 维随机变量的协方差矩阵.设n 维随机变量〔X 1,X 2,…,X n 〕的1+1阶混合中心矩σij =Cov 〔X i ,X j 〕=E {[X i -E 〔X i 〕][X j -E 〔X j 〕]}, i ,j =1,2,…,n都存在,那么称矩阵Σ=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡nn n n n n σσσσσσσσσ 212222111211 为n 维随机变量〔X 1,X 2,…,X n 〕的协方差矩阵. 由于σij =σji 〔i ,j =1,2,…,n 〕,因此Σ是一个对称矩阵. 协方差矩阵给出了n 维随机变量的全部方差及协方差,因此在研究n 维随机变量的统计规律时,协方差矩阵是很重要的.利用协方差矩阵还可以引入n 维正态分布的概率密度. 首先用协方差矩阵重写二维正态随机变量〔X 1,X 2〕的概率密度. f 〔x 1,x 2〕=221121ρσσ-π×.)())((2)()1(21exp 22222212211212112⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⎥⎦⎤⎢⎣⎡-+------σμσσμμρσμρx x x x 令X =⎪⎪⎭⎫⎝⎛21x x ,μ=⎪⎪⎭⎫⎝⎛21μμ,〔X 1,X 2〕的协方差矩阵为 Σ=.2121212122211211⎪⎪⎭⎫⎝⎛=⎪⎪⎭⎫ ⎝⎛σσρσσρσσσσσσ 它的行列式|Σ|=σ12σ22〔1-ρ2〕,逆阵Σ-1=.121212122⎪⎪⎭⎫⎝⎛--σσρσσρσσ∑ 由于 〔X -μ〕T Σ-1〔X -μ〕= .),(12211212121222211⎪⎪⎭⎫⎝⎛--⎪⎪⎭⎫ ⎝⎛----μμσσρσσρσσμμx x x x ∑ =,)())((2)(1122222212211212112⎥⎦⎤⎢⎣⎡-+-----σμσσμμρσμρx x x x , 因此〔X 1,X 2〕的概率密度可写成f 〔x 1,x 2〕=.)()(21exp 211⎭⎬⎫⎩⎨⎧----μ∑μ∑X X T π上式容易推广到n 维的情形.设〔X 1,X 2,…,X n 〕是n 维随机变量,令X =⎪⎪⎪⎪⎪⎭⎫ ⎝⎛n x x x 21, μ=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛)()()(2121n n X E X E X E μμμ, 定义n 维正态随机变量〔X 1,X 2,…,X n 〕的概率密度为f 〔x 1,x 2,…,x n 〕=111exp ()().2(2T nX X πμμ-⎧⎫--∑-⎨⎬⎩⎭其中Σ是〔X 1,X 2,…,X n 〕的协方差矩阵.n 维正态随机变量具有以下几条重要性质: 1°n 维随机变量〔X 1,X 2,…,X n 〕服从n 维正态分布的充要条件是X 1,X 2,…,X n的任意的线性组合l 1X 1+l 2X 2+…+l n X n服从一维正态分布.〔其中l 1,l 2,…,l n 不全为零〕.2°假设〔X 1,X 2,…,X n 〕服从n 维正态分布,设Y 1,Y 2,…,Y k 是X 1,X 2,…,X n 的线性函数,那么〔Y 1,Y 2,…,Y k 〕服从k 维正态分布.3°设〔X 1,X 2,…,X n 〕服从n 维正态分布,那么X 1,X 2,…,X n 互相独立的充要条件是X 1,X 2,…,X n 两两不相关.小结随机变量的数字特征是由随机变量的分布确定的,能描绘随机变量某一个方面的特征的常数.最重要的数字特征是数学期望和方差.数学期望E〔X〕描绘随机变量X取值的平均大小,方差D〔X〕=E{[X-E〔X〕]2}描绘随机变量X与它自己的数学期望E〔X〕的偏离程度.数学期望和方差虽不能像分布函数、分布律、概率密度一样完好地描绘随机变量,但它们能描绘随机变量的重要方面或人们最关心方面的特征,它们在应用和理论上都非常重要.要掌握随机变量的函数Y=g〔X〕的数学期望E〔Y〕=E[g〔X〕]的计算公式〔4.3〕和〔4.4〕.这两个公式的意义在于当我们求E〔Y〕时,不必先求出Y=g〔X〕的分布律或概率密度,而只需利用X的分布律或概率密度就可以了,这样做的好处是明显的.我们常利用公式D〔X〕=E〔X2〕-[E〔X〕]2来计算方差D〔X〕,请注意这里E〔X2〕和[E〔X〕]2的区别.要掌握数学期望和方差的性质,提请读者注意的是:〔1〕当X1,X2独立或X1,X2不相关时,才有E〔X1X2〕=E〔X1〕·E〔X2〕;〔2〕设c为常数,那么有D〔cX〕=c2D〔X〕;〔3〕D〔X1±X2〕=D〔X1〕+D〔X2〕±2Cov〔X1,X2〕,当X1,X2独立或不相关时才有D〔X1+X2〕=D〔X1〕+D〔X2〕.例如:假设X1,X2独立,那么有D〔2X1-3X2〕=4D〔X1〕+9D〔X2〕.相关系数ρXY有时也称为线性相关系数,它是一个可以用来描绘随机变量〔X,Y〕的两个分量X,Y之间的线性关系严密程度的数字特征.当|ρXY|较小时X,Y的线性相关的程度较差;当ρXY=0时称X,Y不相关.不相关是指X,Y之间不存在线性关系,X,Y不相关,它们还可能存在除线性关系之外的关系〔参见第3节例4.18〕,又由于X,Y互相独立是指X,Y的一般关系而言的,因此有以下的结论:X,Y互相独立那么X,Y一定不相关;反之,假设X,Y不相关那么X,Y不一定互相独立.特别,对于二维正态变量〔X,Y,〕,X和Y不相关与X和Y互相独立是等价的.而二元正态变量的相关系数ρXY就是参数ρ.于是,用“ρ=0〞是否成立来检验X,Y是否互相独立是很方便的.重要术语及主题数学期望随机变量函数的数学期望数学期望的性质方差标准差方差的性质协方差相关系数相关系数的性质X,Y不相关矩协方差矩阵分布名称分布律或概率密度期望方差参数范围两点分布P{X=1}=p, P{X=0}=q p pq 0<p<1q=1-p二项分布X~B〔n,p〕P{X=k}=knkknqpC〔k=0,1,2,…,n〕np npq 0<p<1q=1-pn为自然数习 题 四求E 〔X 〕,E 〔X 〕,E 〔2X +3〕.2.100个产品中有10个次品,求任意取出的5个产品中的次品数的数学期望、方差. 1234.袋中有N 只球,其中的白球数X 为一随机变量,E 〔X 〕=n ,问从袋中任取1球为白球的概率是多少?5.设随机变量X 的概率密度为f 〔x 〕=⎪⎩⎪⎨⎧≤≤-<≤.,0,21,2,10,其他x x x x求E 〔X 〕,D 〔X 〕.6.设随机变量X ,Y ,Z 互相独立,且E 〔X 〕=5,E 〔Y 〕=11,E 〔Z 〕=8,求以下随机变量的数学期望.〔1〕 U =2X +3Y +1; 〔2〕 V =YZ -4X .7.设随机变量X ,Y 互相独立,且E 〔X 〕=E 〔Y 〕=3,D 〔X 〕=12,D 〔Y 〕=16,求E 〔3X -2Y 〕,D 〔2X -3Y 〕.8.设随机变量〔X ,Y 〕的概率密度为f 〔x ,y 〕=⎩⎨⎧<<<<.,0,0,10,其他x y x k试确定常数k ,并求E 〔XY 〕.9.设X ,Y 是互相独立的随机变量,其概率密度分别为f X 〔x 〕=⎩⎨⎧≤≤;,0,10,2其他x x f Y 〔y 〕=⎩⎨⎧>--.,0,0,)5(其他y y e 求E 〔XY 〕.10.设随机变量X ,Y 的概率密度分别为f X 〔x 〕=⎩⎨⎧≤>-;0,0,0,22x x x e f Y 〔y 〕=⎩⎨⎧≤>-.0,0,0,44y y y e 求〔1〕 E 〔X +Y 〕;〔2〕 E 〔2X -3Y 2〕.11.设随机变量X 的概率密度为f 〔x 〕=⎪⎩⎪⎨⎧<≥-.0,0,0,22x x cx xke求〔1〕 系数c ;〔2〕 E 〔X 〕;〔3〕 D 〔X 〕.12.袋中有12个零件,其中9个合格品,3个废品.安装机器时,从袋中一个一个地取出〔取出后不放回〕,设在取出合格品之前已取出的废品数为随机变量X ,求E 〔X 〕和D 〔X 〕. 13.一工厂消费某种设备的寿命X 〔以年计〕服从指数分布,概率密度为f 〔x 〕=⎪⎩⎪⎨⎧≤>-.0,0,0,414x x xe为确保消费者的利益,工厂规定出售的设备假设在一年内损坏可以调换.假设售出一台设备,工厂获利100元,而调换一台那么损失200元,试求工厂出售一台设备赢利的数学期望. 14.设X 1,X 2,…,X n 是互相独立的随机变量,且有E 〔X i 〕=μ,D 〔X i 〕=σ2,i =1,2,…,n ,记∑==n i i S X n X 12,1,S 2=∑=--ni i X X n 12)(11. 〔1〕 验证)(X E =μ,)(X D =n2σ;〔2〕 验证S 2=)(11122∑=--ni i X n X n ; 〔3〕 验证E 〔S 2〕=σ2.15.对随机变量X 和Y ,D 〔X 〕=2,D 〔Y 〕=3,Cov 〔X ,Y 〕=-1, 计算:Cov 〔3X -2Y +1,X +4Y -3〕.16.设二维随机变量〔X ,Y 〕的概率密度为f 〔x ,y 〕=⎪⎩⎪⎨⎧≤+.,0,1122其他y x ,π试验证X 和Y 是不相关的,但X 和Y 不是互相独立的.验证X 和Y 是不相关的,但X 和Y 不是互相独立的. 18.设二维随机变量〔X ,Y 〕在以〔0,0〕,〔0,1〕,〔1,0〕为顶点的三角形区域上服从均匀分布,求Cov 〔X ,Y 〕,ρXY . 19.设〔X ,Y 〕的概率密度为f 〔x ,y 〕=⎪⎩⎪⎨⎧≤≤≤≤+.0,20,20),sin(21其他,y x y x ππ求协方差Cov 〔X ,Y 〕和相关系数ρXY . 20.二维随机变量〔X ,Y 〕的协方差矩阵为⎥⎦⎤⎢⎣⎡4111,试求Z 1=X -2Y 和Z 2=2X -Y 的相关系数. 21.对于两个随机变量V ,W ,假设E 〔V 2〕,E 〔W 2〕存在,证明:[E 〔VW 〕]2≤E 〔V 2〕E 〔W 2〕.这一不等式称为柯西许瓦兹〔Couchy -Schwarz 〕不等式.22.假设一设备开机后无故障工作的时间X 服从参数λ=1/5的指数分布.设备定时开机,出现故障时自动关机,而在无故障的情况下工作2小时便关机.试求该设备每次开机无故障工作的时间Y 的分布函数F 〔y 〕. 〔2002研考〕 23.甲、乙两箱中装有同种产品,其中甲箱中装有3件合格品和3件次品,乙箱中仅装有3件合格品.从甲箱中任取3件产品放乙箱后,求:〔1〕乙箱中次品件数Z 的数学期望;〔2〕从乙箱中任取一件产品是次品的概率. 〔2003研考〕 24.假设由自动线加工的某种零件的内径X 〔毫米〕服从正态分布N 〔μ,1〕,内径小于10或大于12为不合格品,其余为合格品.销售每件合格品获利,销售每件不合格品亏损,销售利润T 〔单位:元〕与销售零件的内径X 有如下关系T =⎪⎩⎪⎨⎧>-≤≤<-.12,5,1210,20,10,1X X X 若若若 问:平均直径μ取何值时,销售一个零件的平均利润最大? 〔1994研考〕25.设随机变量X 的概率密度为f 〔x 〕=⎪⎩⎪⎨⎧≤≤.,0,0,2cos 21其他πx x对X 独立地重复观察4次,用Y 表示观察值大于π/3的次数,求Y 2的数学期望.〔2002研考〕26.两台同样的自动记录仪,每台无故障工作的时间T i 〔i =1,2〕服从参数为5的指数分布,首先开动其中一台,当其发生故障时停用而另一台自动开启.试求两台记录仪无故障工作的总时间T =T 1+T 2的概率密度f T 〔t 〕,数学期望E 〔T 〕及方差D 〔T 〕. 〔1997研考〕 27.设两个随机变量X ,Y 互相独立,且都服从均值为0,方差为1/2的正态分布,求随机变量|X -Y |的方差. 〔1998研考〕 28.某流水消费线上每个产品不合格的概率为p 〔0<p <1〕,各产品合格与否互相独立,当出现一个不合格产品时,即停机检修.设开机后第一次停机时已消费了的产品个数为X ,求E 〔X 〕和D 〔X 〕. 〔2000研考〕 29.设随机变量X 和Y 的结合分布在点〔0,1〕,〔1,0〕及〔1,1〕为顶点的三角形区域上服从均匀分布.〔如图〕,试求随机变量U =X +Y 的方差. 〔2001研考〕 30.设随机变量U 在区间[-2,2]上服从均匀分布,随机变量X =⎩⎨⎧->-≤-,U ,U 1,11,1若若 Y =⎩⎨⎧>≤-.1,11,1U ,U 若若试求〔1〕X 和Y 的结合概率分布;〔2〕D 〔X +Y 〕. 〔2002研考〕 31.设随机变量X 的概率密度为f 〔x 〕=x-e 21,〔-∞<x <+∞〕 〔1〕 求E 〔X 〕及D 〔X 〕;〔2〕 求Cov 〔X ,|X |〕,并问X 与|X |是否不相关?〔3〕 问X 与|X |是否互相独立,为什么? 〔1993研考〕 32.随机变量X 和Y 分别服从正态分布N 〔1,32〕和N 〔0,42〕,且X 与Y 的相关系数ρXY =-1/2,设Z =23YX +. 〔1〕 求Z 的数学期望E 〔Z 〕和方差D 〔Z 〕; 〔2〕 求X 与Z 的相关系数ρXZ ;〔3〕 问X 与Z 是否互相独立,为什么? 〔1994研考〕33.将一枚硬币重复掷n 次,以X 和Y 表示正面向上和反面向上的次数.试求X 和Y 的相关系数ρXY . 〔2001研考〕 Y X -1 0 10 10.07 0.18 0.15 0.08 0.32 0.20试求X 和Y 的相关系数. 〔2002研考〕 35.对于任意两事件A 和B ,0<P 〔A 〕<1,0<P 〔B 〕<1,那么称。
第四章-随机变量的数字特征PPT课件
![第四章-随机变量的数字特征PPT课件](https://img.taocdn.com/s3/m/fb1295e364ce0508763231126edb6f1aff0071ee.png)
k 1
k 1
变量X的数学期望,记为E(X),即
EX xk pk k1
§4.1 数学期望
关于定义的几点说明 (1) E(X)是一个实数,而非变量,它是一种加权平均,与
一般的算术平均值不同 , 它从本质上体现了随机变量 X 取可能值的真正的平均值, 也称均值.
(2) 级数的绝对收敛性保证了级数的和不随级数各 项次序的改变而改变 , 之所以这样要求是因为数学期望 是反映随机变量X 取可能值的平均值,它不应随可能值的 排列次序而改变.
❖ 例3:设 X(),求 E (X)。
解 : X 的 分 布 律 为 : P ( X k ) k e k 0 , 1 , 0 k ! X的 数 学 期 望 为 :
E(X) k ke
k0 k!
e
k1
k1
(k 1)!
ee
即E(X)
§4.1 数学期望
三、连续型随机变量的数学期望
设连续型随机变量X 的概率密度为f ( x), 若积分
§4.2 方差
(2) 利用公式计算
D (X ) E (X 2 ) [E (X )2 .] 证明 D (X ) E {X [ E (X )2 } ]
E { X 2 2 X ( X ) E [ E ( X )2 } ] E ( X 2 ) 2 E ( X ) E ( X ) [ E ( X )2] E (X 2)[E (X )2] E (X2)E 2(X).
§4.1 数学期望
❖ 例2:某车站每天8:00—9:00,9:00—10:00都恰有一 辆客车到站,但到站的时刻是随机的,且两者到站的时间 相互独立。其规律为
8:10 8:30 8:50
到站时刻
9:10 9:30 9:50
第四章 随机解释变量问题
![第四章 随机解释变量问题](https://img.taocdn.com/s3/m/8f5ebfb9a26925c52dc5bfa3.png)
(4-3)
(4-4)
3.随机解释变量与随机干扰项同期相关
即
Cov( X1i , i ) E(x1ii ) 0
(4-5)
i j
二、随机解释变量问题产生的原因
随机解释变量问题主要表现 —— 于用滞后被解释变量作为模型的解释变量的情况。
但是,并不是所有包含滞后被解释变量的模型都带来“随机解释变量问题”
工具变量的选取 工具变量的应用 工具变量法估计量的性质
一、工具变量的选取
工具变量——在模型估计过程中被作为工具使用的变量,
用以替代与随机干扰项相关的随机解释量。
例4-1:
耐用品存量调整模型。著名的“耐用品存量调整模型”可表示为
Qt 0 1Yt 2Qt1 t t 1, 2, ,T (4-6) 该模型表示,耐用品的存量 Qt 由前一个时期的存量 Qt1 和当期收入 Yt
共同决定。这是一个滞后被解释变量作为解释变量的模型。但是,如果模型不
存在随机干扰项的序列相关性,那么随机解释变量 Qt1只与 t1 相关,与 t
与
t
t
相关,因此
E
(kt
t
)
0
,于是
E(ˆ1) 1
(4-15)
即参数OLS估计量是有偏的。但是由(4-14)可看出 ˆ1 是 1 的一致估计。
3.如果 X与 同期相关,得到的参数估计量有偏且非一致。
这时Cov(Xt,μt)=E(xtμt)≠0,由(4-12)、(4-14)容易看出 参数OLS估计量有偏且非一致。
1
所以参数OLS估计量 ˆ0 , ˆ1 仍然是无偏一致估计量
(4-12) (4-13) (4-14)
分三种不同情况:
2.如果X与 同期不相关而异期相关,得到的参数OLS估计量有偏,但却
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章 随机解释变量问题1. 随机解释变量的来源有哪些?答:随机解释变量的来源有:经济变量的不可控,使得解释变量观测值具有随机性;由于随机干扰项中包括了模型略去的解释变量,而略去的解释变量与模型中的解释变量往往是相关的;模型中含有被解释变量的滞后项,而被解释变量本身就是随机的。
2.随机解释变量有几种情形? 分情形说明随机解释变量对最小二乘估计的影响与后果? 答:随机解释变量有三种情形,不同情形下最小二乘估计的影响和后果也不同。
(1)解释变量是随机的,但与随机干扰项不相关;这时采用OLS 估计得到的参数估计量仍为无偏估计量;(2)解释变量与随机干扰项同期无关、不同期相关;这时OLS 估计得到的参数估计量是有偏但一致的估计量;(3)解释变量与随机干扰项同期相关;这时OLS 估计得到的参数估计量是有偏且非一致的估计量。
3. 选择作为工具变量的变量必须满足那些条件?答:选择作为工具变量的变量需满足以下三个条件:(1)与所替代的随机解释变量高度相关;(2)与随机干扰项不相关;(3)与模型中其他解释变量不相关,以避免出现多重共线性。
4.对模型Y t =β0+β1X 1t +β2 X 2t +β3 Y t-1+μt假设Y t-1与μt 相关。
为了消除该相关性,采用工具变量法:先求Y t 关于X 1t 与 X 2t 回归,得到Y tˆ,再做如下回归: Y t =β0+β1X 1t +β2 X 2t +β3Y t ˆ1-+μt 试问:这一方法能否消除原模型中Y t-1与μt 的相关性? 为什么?解答:能消除。
在基本假设下,X 1t ,X 2t 与μt 应是不相关的,由此知,由X 1t 与X 2t 估计出的Y tˆ应与μt 不相关。
5.对于一元回归模型Y t =β0+β1X t *+μt假设解释变量X t *的实测值X t 与之有偏误:X t = X t *+e t , 其中e t 是具有零均值、无序列相关,且与X t *及μt 不相关的随机变量。
试问:(1) 能否将X t = X t *+e t 代入原模型,使之变换成Y t =β0+β1X t +νt 后进行估计? 其中,νt为变换后模型的随机干扰项。
(2) 进一步假设μt 与e t 之间,以及它们与X t *之间无异期相关,那么E(X t-1νt )=0成立吗?X t 与X t-1相关吗?(3) 由(2)的结论,你能寻找什么样的工具变量对变换后的模型进行估计? 解答:(1)不能。
因为变换后的模型为Y t =β0+β1X t +(μt -β1e t ) 显然,由于e t 与X t 同期相关,则说明变换后的模型中的随机干扰项νt =μt -β1e t 与X t 同 期相关。
(2) E(X t-1νt )=E[(X t-1*+e t-1)( μt -β1e t)]= E(X t-1*μt)-β1E(X t-1*e t)+E(e t-1μt) -β1E(e t-1e t)=0多数经济变量的时间序列,除非它们是以一阶差分的形式或变化率的形式出现,往往具有较强的相关性,因此,当X t与X t-1直接表示经济规模或水平的经济变量时,它们之间很可能相关;如果变量是一阶差分的形式或以变化率的形态出现,则它们间的相关性就会降低,但仍有一定程度的相关性。
(3) 由(2)的结论知,E(X t-1νt)=0,即X t-1与变换后的模型的随机干扰项不相关,而且X t 与X t-1有较强的相关性,因此,可用X t-1作为X t的工具变量对变换后的模型进行估计。
6.一个对某地区大学生就业增长影响的简单模型可描述如下:gEMP t=β0+β1gMINI t+β2gPOP t+β3gGDP1t+β4gGDP t+μt式中,EMP为新就业的大学生人数,MINI为该地区最低限度工资,POP为新毕业的大学生人数,GDP1为该地区国内生产总值,GDP为该国国内生产总值;g表示年增长率。
(1) 如果该地区政府以多多少少不易观测的却对新毕业大学生就业有影响的因素作为基础来选择最低限度工资,则OLS估计将会存在什么问题?(2) 令MIN为该国的最低限度工资,它与随机扰动项相关吗?(3) 按照法律,各地区最低限度工资不得低于国家最低工资,哪么gMIN能成为gMINI 的工具变量吗?解答:(1) 由于地方政府通常是根据过去的经验、当前的经济状况以及期望的经济发展前景来定制地区最低限度工资水平,但模型中并不包含这些因素,而是被归结到了模型的随机干扰项中,因此gMINI与μ不仅异期相关,而且很可能是同期相关的,这将引起OLS 估计量的偏误,甚至当样本容量增大时也不具有一致性。
(2) 全国最低限度工资的制定主要根据全国整体的情况而定,因此gMINI基本与上述模型的随机扰动项无关。
(3) 由于地方政府在制定本地区最低工资水平时往往会考虑全国最低工资水乎要求,因此gMINI与gMIN具有较强的相关性。
结合(2)知gMIN可以作为gMINI的工具变量使用。
第五章 多重共线性1.什么是多重共线性? 产生多重共线性的经济背景是什么?答:对于多元回归模型:01122 12i i i k ki i Y X X X i n ββββμ=+++++=,,,如果某两个或多个解释变量之间出现了相关性,则称为多重共线性。
产生多重共线性的经济背景是,经济变量在时间上有共同变化的趋势和经济变量之间较强的相关性。
另外,当模型中包含解释变量与其滞后解释变量时,由于解释变量本身前后期相关,也会产生多重共线性。
2.多重共线性的危害是什么? 为什么会造成这些危害?答:当存在完全的多重共线性时,模型的参数将无法估计,因为参数估计量(X'X)-1X'Y 中的(X'X)-1将不存在;当多重共线性程度很高时,(X'X)-1的分母将变得很小,因此参数估计量的方差σ2(X'X)-1将变大,相应的t 统计量值变小,显著性检验也失去意义,模型预测失去意义;另外,解释变量的参数不再反映各自与被解释变量之间的关系,而是反映它们对解释变量的共同影响,因而参数失去了应有的经济含义。
3.检验多重共线性的方法思路是什么? 有哪些克服方法?答:检验多重共线性的思路是通过各种方法来检验解释变量之间是否存在显著的相关关系。
多重共线性的克服方法有很多,主要可以由以下几种:利用逐步回归法排除引起共线性的变量、差分法、减少参数估计量的方差、利用先验信息改变参数的约束形式、增加样本容量等。
4.在研究生产函数时,得到以下两种结果:1n Yˆt =-5.04 + 0.8871nK t + 0.8931nL t (A) S.E.= (1.40) (0.087) (0.137) R 2=0.878 n=211n Yˆt =-8.57 + 0.0272t + 0.4601nK t + 1.2851nL t (B) S.E.= (2.99) (0.020) (0.333) (0.324) R 2=0.889 n=21其中,Y=产量,K=资本,L=劳动,t=时间,n=样本容量。
请回答:(1) 验证模型(A)中所有的系数在统计上都是显著的(5%);(2) 验证模型(B)中t 和lnK 的系数在统计上不显著(5%);(3) 可能什么原因造成了(B)中lnK 的系数不显著;(4) 如果t 与lnK 的相关系数为0.98,你将如何判断并能得出什么结论?解答: (1) 模型(A)中三个系数对应的t 统计量分别为:40.104.5-=-3.6 087.0887.0=10.195 137.0893.0=6.5182 查t 分布临界值表得t 0.025(18)=2.101,模型(A)中三个系数t 统计量的绝对值均大于临界值2.101,因此所有的回归系数在统计上都是显著的。
(2) 模型(B)中t 和lnK 的系数对应的t 统计量分别为:0204.00272.0=1.3333 324.0460.0=1.4193 查t 分布临界值表得t 0.025(17)=2.11,模型(B)中t 和lnK 的系数对应的t 统计量绝对值均小于临界值2.11,因此回归系数在统计上不显著。
(3) 造成模型(B)中lnK 系数不显著的原因是由于新变量t 的引入,t 与lnK 之间可能存在严重的多重共线性。
(4) t 与lnK 的相关系数为0.98,表明两者相关程度很高,模型(2)存在严重的多重共线性。
5.某地区供水部门利用最近15年的用水年度数据得出如下估计模型:Wˆ=-326.9 + 0.305HO + 0.363PO – 0.005RE – 17.87PR – 1.123RA (-1.7) (0.9) (1.4) (-0.6) (-1.2) (-0.8)R 2=0.939 F=38.9其中,W(Water)—用水总量(百万立方米),HO(House)—住户总数(千户),PO(Population)—总人口(千人),RE(Revenue)—人均收人(元),PR(price)—价格(元/100立方米),RA(rain)—降雨量(毫米)。
(1) 根据经济理论和直觉,预计回归系数的符号是什么(不包括常量)? 为什么? 观察符号与你的直觉相符吗?(2) 在10%的显著性水平下,请进行变量的t 检验与方程的F 检验。
t 检验与F 检验结果有相矛盾的现象吗?(3) 你认为估计值是①有偏的;②无效的或③不一致的吗? 详细阐述理由。
解答: (1) 在其他变量不变的情况下,一城市的人口越多或房屋数量越多,则对用水的需求越高。
所以可期望HO 和PO 的符号为正;收入较高的个人可能用水较多,因此RE 的预期符号为正,但它可能是不显著的;如果水价上涨,则用户会节约用水,所以可预期PR 的系数为负;如果降雨量较大,则草地和其他花园或耕地的用水需求就会下降,所以可以期望RA 的系数符号为负。
从估计的模型看,除了RE 之外,所有符号都与预期相符。
(2) t 统计量检验单个变量的显著性,F 统计量检验回归方程总体线性显著与否,是联合检验。
这里t 检验的自由度为15-5-1=9,在10%的显著性水平下的临界值为1.833。
可见,所有参数估计值的t 值的绝对值都小于该值,所以即使在10%的显著水平下这些变量也不是显著的。
这里,F 统计值的分子自由度为5,分母自由度为9。
10%显著性水平下F 分布的临界值为2.61。
显然计算的F 值大于该临界值,表明回归系数是联合显著的。
t 检验与F 检验结果相矛盾可能是由于多重共线性造成的。
HO 、PO 、RE 都是高度相关的,这将使它们的t 值降低且表现为不显著。
PR 和RA 不显著另有原因。
根据经验,如果一个变量的值在样本期间没有很大的变化,则它对被解释变量的影响就不能很好地被度量。