随机变量的统计特性共29页文档
生物统计课件:第2章 随机变量及其数字特征
分布函数的定义
设X是一个随机变量,x是任意实数,则 函数
F ( x) = P{ X ≤ x}
称为X的分布函数(distribution function).
F ( x ) = P{ X ≤ x}
= ∑ pk xi ≤ x
例
X
~
0 1
1 2 1 1
3 6 2
0,
1
,
F(
x)
=
3
1
2
,
1,
x<0 0≤ x <1
伯努利概型
试验结果具有对立性的n重独 立重复试验称为n重伯努利试验,简 称伯努利试验。
伯努利试验的特点:
• 对立性 • 独立重复性
例:一次试验结果为“成功”、“失败”; 如果作两次试验呢? … … 如果作n次试验呢?
在一次Bernoulli试验中,
P (成功) = π, P (失败)= 1-π
二重Bernoulli试验,
二项分布的最可能值
n
Pk
∑ (a + b)n = Cnk akbn−k
k =0
..
0
..n
n=13, p=0.5
常见离散型随机变量(2)
定义:若随机变量X的概率函数为
P{X = k}=λke-λ k!
(λ > 0) k = 0 ,1 2,L
则称X服从参数为λ的泊松分布
(Poisson distribution),记作
P{x1 <X ≤ x2}=P{X ≤x2)−P{X ≤x1} =F(x2)−F(x1)
例
X的取值
0 12
相应概率P 0.16 0.48 0.36
0,
F(x)
概率论及数理统计随机变量的数字特征
X0 1 2 3 P 0.3 0.3 0.2 0.2
下面我们用计算机 进行模拟试验.
1 101 32 0 23 0
输入试验次数(即天数)n,计算机对小张的生产 情况进行模拟,统计他不出废品,出一件、二 件、三件废品的天数n0,n1,n2,n3 , 并计算
M (n )0n 01n 12n 23n 3 nn n n
k阶绝对中E(心 |X矩 E(X)|k)
其中 k 是正整数.
例1.设X的分布列为 X
0
1
1
1
P
24
求E1 1 X
解:
23
11 88
E( 1 )1 1 1 1 1 1 1 1 1X 210 411 812 813 67 96
例2. 设公共汽车起点站在每小时的10分,30分, 50分发车,一位不知发车时间的乘客,每 小时内到达车站的时间是随机的,求该乘客 在车站等车的数学期望。
30
60 50
60
10
设(X, Y)是二维随机变量, Z=g( X, Y ),则
EZE[g(X,Y)]
i1
g(xi, yj)pij,
j1
(X,Y)离散型
g(x, y)f(x, y)dxd,y(X,Y)连续型
当( X, Y )是离散型时:分布列为 P ( X x i Y y j) p ij i , j 1 , 2 ,
X~B(n,p),则X表示n重贝努里试验中的“成功” 次数.
若设
Xi
1 0
如第i次试验成功i=1,2,…,n
如第i次试验失败
则 X= X1+X2+…+Xn 因为 P(Xi =1)= p, P(Xi =0)= 1-p
E(Xi)= 1p0(1p)= p n
第02章 随机变量及其统计特征.
P( X k ) p q
k
1k
,
k 0,1
(2-18)
这是 (0-1)分布。
(2) 泊松(Poisson)分布 泊松定理 设随机变量Xn(n = 1,2,…) 服从二项式分布,其分布规律为
P( X n k ) C p (1 pn )
k n k n n k
k 0,1,...,n
随机变量就是在试验的结果中能取得 不同数值的量。 按照随机变量可能取得的值,可分为两 种基本类型:离散随机变量及连续随机 变量。离散随机变量仅可能取得有限或 可列无限个数值。连续随机变量可以取 得某一区间内的任何数值。
1. 离散随机变量的概率分布 设离散随机变量X所有可能取的值为 xk(k = 1,2,…), X取各个可能值的 概率,即事件{X = xk}的概率为
一般地,设是个相互独立的事件,则有
P( A1 A2 ...An ) P( A1 ) P( A2 )...P( An )
(2-11)
4. 全概率公式 设试验E的样本空间为S,A为E的 事件, B1,B2,…,Bn为S的一个划分, 且P(Bi)>0 (i = 1,2,…,n),则
P( A) P( A / B1 ) P( B1 ) P( A / B2 ) P( B2 )
泊松定理指明了当n∞时,以n,p(np =) 为参数的二项式分布趋于以 λ 为参数的泊松 函数
设 X 是一个随机变量, x 是任意
实数,函数
F ( x) P( X x)
(2-20)
称为 X 的概率分布函数。它完整地描述
了随机变量的概率特征.
概率分布函数F(X)具有以下的基 本性质:
(a) F(X) 是一个不减函数
随机变量的统计特性
xi pi
i 1
方差: D( X ) E{[ X E( X )]2}
协方差:cov( X ,Y ) E{[ X E( X )][Y E(Y )]} KXY
相关系数: rXY
cov(X ,Y ) D( X )D(Y )
课后作业:1.8、1.9、1.10
随机变量是定义在样本空间S上的单值函数
二、随机变量的分类
连续型随机变量
离散型随机变量
离散型随机变量是指它的取值为有限个或者可列无穷个
离散型随机变量的概率分布:
概率分布列: P(X xk ) pk (k 1, 2,...., n)
X
x
x
... x
1
2
n
p
pp... p Nhomakorabeak
1
2
n
离散随机变量概率分布
随机试验 满足下列三个条件的试验称为随机试验,记为E :
(1)在相同条件下可重复进行; (2)试验的结果不止一个,所有可能的结果能事先明确; (3)每次试验前不能确定会出现哪一个结果。
例:投掷硬币
样本空间 随机试验E的所有可能结果组成的集合称为E的样
本空间,记为S。
随机事件 试验E的样本空间S的子集为E的随机事件,简称为事件。
基本事件 由一个样本点组成的单点集称为基本事件。
频数和频率 在相同条件下的n 次重复试验中,事件A发生的次
数
nA
的频率。
称为事件A的频数n,A 比值 n
称为事件A发生
概率 事件发生的可能性大小的度量 P( A) lim nA n n
一、随机变量的定义
X
X
(e)
0 1
eT eH
定义:设随机试验E的样本空间为S={e},如果对于每一个eS, 有一个实数X(e)与之对应,这样就得到一个定义在S上的单值 函数X(e),称X(e)为随机变量,简记为X。
概率论与数理统计随机变量的数字特征
第四章随机变量的数字特征前面讨论了随机变量的分布函数, 从中知道随机变量的分布函数能完整地描述随机变量的统计规律性.但在许多实际问题中, 人们并不需要去全面考察随机变量的变化情况, 而只要知道它的某些数字特征即可.例如, 在评价某地区粮食产量的水平时, 通常只要知道该地区粮食的平均产量;又如, 在评价一批棉花的质量时, 既要注意纤维的平均长度, 又要注意纤维长度与平均长度之间的偏离程度, 平均长度较大, 偏离程度小, 则质量就较好. 等等实际上, 描述随机变量的平均值和偏离程度的某些数字特征在理论和实践上都具有重要的意义, 它们能更直接、更简洁更清晰和更实用地反映出随机变量的本质.本章将要讨论的随机变量的常用数字特征包括: 数学期望、方差、相关系数、矩.第一节数学期望内容分布图示★引言★离散型随机变量的数学期望★例1 ★例2 ★例3★连续型随机变量的数学期望★例4★例5 ★例6 ★例7★随机变量函数的数学期望★例8★例9 ★例10 ★例11★数学期望的性质★例12 ★例13 ★例14★内容小结★课堂练习★习题4-1 ★返回内容要点:一、离散型随机变量的数学期望平均值是日常生活中最常用的一个数字特征, 它对评判事物、作出决策等具有重要作用.定义设X是离散型随机变量的概率分布为,2,1,}{===ipxXP ii如果∑∞=1iiipx绝对收敛, 则定义X的数学期望(又称均值)为.)(1∑∞==iiipxXE二、连续型随机变量的数学期望定义设X是连续型随机变量, 其密度函数为)(xf,如果⎰∞∞-dxx xf) (绝对收敛, 定义X 的数学期望为 .)()(⎰∞∞-=dx x xf X E三、 随机变量函数的数学期望设X 是一随机变量, )(x g 为一实函数,则)(X g Y =也是一随机变量, 理论上, 虽然可通过X 的分布求出)(X g 的分布, 再按定义求出)(X g 的数学期望)]([X g E . 但这种求法一般比较复杂. 下面不加证明地引入有关计算随机变量函数的数学期望的定理.定理1 设X 是一个随机变量, )(X g Y =,且)(Y E 存在, 则(1) 若X 为离散型随机变量, 其概率分布为,2,1,}{===i p x X P i i则Y 的数学期望为.)()]([)(1∑∞===i i i p x g X g E Y E(2) 若X 为连续型随机变量, 其概率密度为)(x f , 则Y 的数学期望为.)()()]([)(⎰∞∞-==dx x f x g X g E Y E注: (i)定理的重要性在于:求)]([X g E 时, 不必知道)(X g 的分布, 只需知道X 的分布即可. 这给求随机变量函数的数学期望带来很大方便;(ii) 上述定理可推广到二维以上的情形, 即有定理2 设),(Y X 是二维随机向量, ),(Y X g Z =,且)(Z E 存在, 则 (1)若),(Y X 为离散型随机向量, 其概率分布为),2,1,(},{ ====j i p y Y x X P ij j i则Z 的数学期望为,),()],([)(11∑∑∞=∞===j i ij j i p y x g Y X g E Z E(2) 若),(Y X 为连续型随机向量, 其概率密度为),(y x f 则Z 的数学期望为.),(),()],([)(⎰⎰∞∞-∞∞-==dx y x f y x g Y X g E Z E四、数学期望的性质1. 设C 是常数, 则;)(C C E =2.若k 是常数,则);()(X kE kX E =3. );()()(2121X E X E X X E +=+4. 设Y X ,独立, 则)()()(Y E X E XY E =;注: (i) 由)()()(Y E X E XY E =不一定能推出Y X ,独立,例如,在例10中,已计算得 49)()()(==Y E X E XY E , 但 81}0{},431{,0}0,1{=======Y P X P Y X P ,显然}0{}1{}0,1{=⋅=≠==Y P X P Y X P 故X 与Y 不独立(ii) 这个性质可推广到有限个随机变量之和的情形.例题选讲:离散型随机变量的数学期望例1 (讲义例1) 甲, 乙两人进行打靶, 所得分数分别记为21,X X , 它们的分布律分别为,8.02.002101i p X1.03.06.02102ip X试评定他们的成绩的好坏.例2 (讲义例2) 某种产品的每件表面上的疵点数服从参数8.0=λ的泊松分布, 若规定疵点数不超过1个为一等品, 价值10元; 疵点数大于1个不多于4个为二等品, 价值8元; 疵点数超过4个为废品. 求:(1) 产品的废品率; (2) 产品价值的平均值.例3 按规定,某车站每天8:00~9:00和9:00~10:00之间都恰有一辆客车到站, 但到站的时刻是随机的, 且两者到站的时间相互独立. 其规律为一旅客8:20连续型随机变量的数学期望例4 (讲义例3) 已知随机变量X 的分布函数 ⎪⎩⎪⎨⎧>≤<≤=4,140,4/0,0)(x x x x x F , 求).(X E例5 (讲义例4) 某商店对某种家用电器的销售采用先使用后付款的方式. 记使用寿命为X (以年计), 规定:.3000,3;2500,32;2000,21;1500,1元一台付款元一台付款元一台付款元一台付款>≤<≤≤X X X X设寿命X 服从指数分布, 概率密度为()⎪⎩⎪⎨⎧≤>=-.0,00,10110/x x e x f x试求该商店一台电器收费Y 的数学期望.例6 (讲义例5) 设随机变量,127)(),(~=X E x f X 且 ⎩⎨⎧≤≤+=其它,010,)(x b ax x f求a 与b 的值, 并求分布函数)(x F .例7 有2个相互独立工作的电子装置, 它们的寿命)2,1(=k X k 服从统一指数分布,其概率密度为⎪⎩⎪⎨⎧≤>=-0,00,1)(/x x e x f x θθ,.0>θ若将这2个电子装置串联联接组成整机, 求整机寿命(以小时计)N 的数学期望.随机变量函数的数学期望例8 (讲义例6) 设),(Y X 的联合概率分布为:求).(),(),(XY E Y E X E例9 (讲义例7) 设随机变量X 在],0[π上服从均匀分布, 求)(),(sin 2X E X E 及.)]([2X E X E -例10 (讲义例8) 设随机变量),(Y X 的概率密度⎪⎩⎪⎨⎧><<=.,0,1,1,23),(23其它x x y x yx y x f 求数学期望.1),(⎪⎭⎫⎝⎛XY E Y E例11 (讲义例9) 设某商店经营一种商品, 每周的进货量X 和顾客对该种商品的需求量Y 是两个相互独立的随机变量, 均服从[10,20]上的均匀分布. 此商店每售出一个单位的商品可获利1000元, 若需求量超过进货量, 可从其他商店调剂供应, 此时售出的每单位商品仅获利500元. 求此商店经销这种商品每周获利的期望.例12 设)(),(2X E X E 均存在,证明222)]([)()]([X E X E X E X E -=-. 例13 (二项分布的数学期望)若),,(~p n b X 求).(X E 数学期望的性质例14 (讲义例10) 一民航送各车载有20位旅客自机场开出, 旅客有10个车站可以下车. 如到达一个车站没有旅客下车就不停车. 以X 表示停车的次数, 求E (X ) (设每位旅客在各个车站下车是等可能的, 并设各旅客是否下车相互独立).课堂练习1. 设甲、乙两人玩必分胜负的赌博游戏, 假定游戏的规则不公正, 以致两人获胜的概率不等,甲为p , 乙为q ,,q p >1=+q p . 为了补偿乙的不利地位, 另行规定两人下的赌注不相等, 甲为a , 乙为b , b a >. 现在的问题是: a 究竟应比b 大多少, 才能做到公正?2. 某种新药在400名病人中进行临床试验有一半人服用,一班人未服,经过5天后,有210人痊愈,其中190人是服了新药的.试用概率统计方法说明新药的疗效.3. 把数字n ,,2,1 任意地排成一列, 如果数字k 恰好出现在第k 个位置上, 则称为一个巧合, 求巧合个数的数学期望.第二节 方差随机变量的数学期望是对随机变量取值水平的综合评价, 而随机变量取值的稳定性是判断随机现象性质的另一个十分重要的指标.内容分布图示★ 引言 ★ 方差的定义★ 方差的计算 ★ 例1 ★ 例2★ 例3 ★ 例4 ★ 例5 ★ 例6★ 例7★ 方差的性质 ★ 例8 ★ 例9 ★ 例10★ 补充说明 ★ 例11 ★ 例12 ★ 条件期望与条件方差简介★ 例13★ 内容小结 ★ 课堂练习 ★ 习题4-2 ★ 返回内容要点:一、 方差的定义定义1 设X 是一个随机变量, 若2)]([(X E X E -存在,则称它为X 的方差, 记为.)]([)(2X E X E X D -=方差的算术平方根)(X D 称为标准差或均方差, 它与X 具有相同的度量单位, 在实际应用中经常使用.方差刻划了随机变量X 的取值与数学期望的偏离程度,它的大小可以衡量随机变量取值的稳定性.从方差的定义易见:(1)若X 的取值比较集中,则方差较小; (2)若X 的取值比较分散,则方差较大;(3)若方差0)(=X D , 则随机变量X 以概率1取常数值,此时X 也就不是随机变量了.二、 方差的计算若X 是离散型随机变量,且其概率分布为,2,1,}{===i p x X P i i则 ;)]([)(12∑∞=-=i i i p X E x X D若X 是连续型随机变量,且其概率密度为),(x f 则.)()]([)(2⎰∞∞--=dx x f X E x X D i利用数学期望的性质, 易得计算方差的一个简化公式:22)]([)()(X E X E X D -=.三、方差的性质1. 设C 常数, 则0)(=C D ;2. 若X 是随机变量, 若C 是常数, 则);()(2X D C CX D =3. 设Y X ,是两个随机向量,则)));())((((2)()()(Y E Y X E X E Y D X D Y X D --±+=± 特别地, 若Y X ,相互独立, 则).()()(Y D X D Y X D +=±注: 对n 维情形, 有: 若n X X X ,,,21 相互独立, 则.)(,)(12111∑∑∑∑=====⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡n i i i n i i i n i i n i i X D C X C D X D X D四、 条件数学期望和条件方差简介由于随机变量之间存在相互联系, 一个随机变量的取值可能会对另一随机变量的分布产生影响, 这种影响会在数字特征上得到反映. 下面要讨论的是:在某个随机变量取某值的条件下,求另一个与之相关的随机变量的数字特征. 作为简介,这里我们直接给出它们的定义.1. 设),(Y X 是离散型随机向量, 其概率分布为),,2,1,,2,1(},{ =====j i p y Y x X P ijj i定义2 (i) 称}|{)|(i j jj i x X y Y P y x X Y E ====∑(绝对收敛)为在 i x X =条件下Y 的条件数学期望.类似地,称 }|{)|(j i ii i y Y x X P x y Y X E ====∑(绝对收敛)为在 i y Y =条件下X 的条件数学期望;(ii) 称}|{)]|([)|(2i j ji j i x X y Y P x X Y E y x X Y D ===-==∑(绝对收敛)为在 i x X =条件下Y 的条件方差.类似地,称}|{)]|([)|(2j i ij i i y Y x X P y Y X E x y Y X D ===-==∑(绝对收敛)为在j y Y =条件下X 的条件方差.2.设),(Y X 是连续型随机向量, )|(|x y f X Y 是在x X =条件下的概率密度,)|(|y x f Y X 是在y Y =条件下X 的概率密度.定义3 (i) 称 ⎰+∞∞-==dy x y yf x X Y E X Y )|(]|[|(绝对收敛)为在 x X =条件下Y 的条件数学期望;类似地,称⎰+∞∞-==dx y x xf y Y X E Y X )|(]|[|(绝对收敛)为在 y Y =条件下X 的条件数学期望;(ii) 称dy x y f x X Y E y x X Y D X Y )|()]|([)|(|2⎰+∞∞-=-==(绝对收敛)为在x X =条件下Y 的条件方差;类似地,称dx y x f y Y X E x y Y X D Y X )|()]|([)|(|2⎰+∞∞-=-==(绝对收敛)为在y Y =条件下X 的条件方差.例题选讲:方差的计算例 1 (讲义例1) 设随机变量X 具有数学期望,)(μ=X E 方差.0)(2≠=σX D 记,*σμ-=X X 则;0])([1)(1)(*=-=-=μσμσX E X E X E.1])[(1])[()]([)()(222222*2**==-=-=-=σσμσσμX E X E X E XE X D即σμ-=X X *的数学期望为0, 方差为1. *X 称为X 的标准化变量.例2 (讲义例2) 设随机变量X 具有)10(-分布, 其分布律为,}1{,1}0{p X P p X P ==-==求),(X E ).(X D例3 (讲义例3) 设),(~λP X 求),(X E ).(X D 例4 (讲义例4) 设),,(~b a U X 求),(X E ).(X D例5 (讲义例5) 设随机变量X 服从指数分布, 其概率密度为⎪⎩⎪⎨⎧≤>=-.0,0,0,1)(/x x e x f x θθ其中,0>θ 求).(),(X D X E例6 (讲义例6) 设随机变量X 服从几何分布, 概率函数n k p p k X P k ,,2,1,)1(}{1 =-==-其中10<<p , 求)(),(X D X E .例7 (讲义例7) 设随机变量Y X ,的联合点分布在以点(0,1), (1,0), (1,1)为顶点的三角形区域上服从均匀分布, 试求随机变量Y X Z +=的期望与方差.方差的性质例8 (讲义例8) 设,,)()(2R x x X E x f ∈-= 证明当)(X E x =时, )(x f 达到最小值. 注:本例子说明了数学期望)(X E 是随机变量X 取值的集中位置, 反映了X 的平均值. 例9 (讲义例9) 设),(~p n b X , 求).(),(X D X E 例10 (讲义例10) 设),,(~2σμN X 求).(),(X D X E例11 (讲义例11) 设活塞的直径(以cm 计),40.22(~N X )03.02,气缸的直径,50.22(~N Y ),04.02 Y X ,相互独立, 任取一只活塞, 任取一只气缸, 求活塞能装入气缸的概率.例12 设随机变量X 和Y 相互独立, 试证).()]([)()]([)()()(22X D Y E Y D X E Y D X D XY D ++=条件数学期望和条件方差简介例 13 (讲义例12) 设),,,,(~),(222121ρσσμμN Y X ,求),|(x X Y E = )|(x X Y D =.课堂练习1. 设随机变量X 的密度函数为⎪⎩⎪⎨⎧≤≤-<≤=.,021,210,)(其它x x x x x f 求).(X E2. 设随机变量X 的概率分布律为4/112/16/16/13/1212/101i p X -试求1+-=X Y 及2X Z =的期望与方差.第三节 协方差及相关系数对多维随机变量, 随机变量的数学期望和方差只反映了各自的平均值与偏离程度,并没能反映随机变量之间的关系. 本节将要讨论的协方差是反映随机变量之间依赖关系的一个数字特征.内容分布图示★ 引言★ 协方差的定义★ 协方差的性质★ 例1 ★ 例2★ 相关系数的定义 ★ 相关系数的性质★ 例3 ★ 例4 ★ 例5 ★ 例6★ 矩的概念 ★ 协方差矩阵 ★ n 维正态分布的概率密度★ n 维正态分布的几个重要性质 ★ 例7★ 内容小结 ★ 课堂练习 ★ 习题4-3 ★ 返回内容要点:一、 协方差的定义定义 设),(Y X 为二维随机向量,若)]}()][({[Y E Y X E X E --存在, 则称其为随机变量X 和Y 的协方差, 记为),(Y XC o v ,即 )]}.()][({[),cov(Y E Y X E X E Y X --=按定义, 若),(Y X 为离散型随机向量,其概率分布为),2,1,(},{ ====j i p y Y x X P ijj i则 ∑--=ji j i Y E y X E x E Y X ,)]}.()][({[),cov(若),(Y X 为连续型随机向量, 其概率分布为),,(y x f 则⎰⎰+∞∞-+∞∞---=dxdy y x f Y E y X E x E Y X ),()]}()][({[),cov(.此外, 利用数学期望的性质, 易将协方差的计算化简.).()()()()()()()()()()]}()][({[),cov(Y E X E XY E Y E X E X E Y E Y E X E XY E Y E Y X E X E Y X -=+--=--=特别地, 当X 与Y 独立时, 有 .0),cov(=Y X二、协方差的性质1. 协方差的基本性质 );(),cov()1(X D X X = );,cov(),cov()2(X Y Y X =),cov(),cov()3(Y X ab bY aX =,其中b a ,是常数; C X C ,0),cov()4(=为任意常数;).,cov(),cov(),cov()5(2121Y X Y X Y X X +=+(6) 若X 与Y 相互独立时,则.0),cov(=Y X2. 随机变量和的方差与协方差的关系),,cov(2)()()(Y X Y D X D Y X D ++=+ 特别地, 若X 与Y 相互独立时, 则)()()(Y D X D Y X D +=+.三、相关系数的定义与性质定义 设),(Y X 为二维随机变量,,0)(,0)(>>Y D X D 称)()(),(Y D X D Y X Cov XY =ρ为随机变量X 和Y 的相关系数.有时也记XY ρ为ρ. 特别地,当0=XY ρ时,称X 与Y 不相关. 相关系数的性质1. ;1||≤XY ρ2. 若X 和Y 相互独立, 则0=XY ρ.3. 若0,0>>DY DX ,则1||=XY ρ当且仅当存在常数).0(,≠a b a 使1}{=+=b aX Y P , 而且当0>a 时, 1=XY ρ;当0<a 时, 1-=XY ρ.注: 相关系数XY ρ刻画了随机变量Y 与X 之间的“线性相关”程度. ||XY ρ的值越接近1, Y 与X 的线性相关程度越高; ||XY ρ的值越近于0, Y 与Y 的线性相关程度越弱.当1||=XY ρ时, Y 与X 的变化可完全由X 的线性函数给出. 当0=XY ρ时, Y 与X 之间不是线性关系.4. 设,)]([2b aX Y E e +-=称为用b aX +来近似Y 的均方误差,则有下列结论. 设,0)(,0)(>>Y D X D 则)()(,)(),cov(000X E a Y E b X D Y X a -==使均方误差达到最小.注: 我们可用均方误差e 来衡量以b aX +近似表示Y 的好坏程度, e 值越小表示b aX +与Y 的近似程度越好.且知最佳的线性近似为.0b X a +而其余均方误差)1)((2XY Y D e ρ-=. 从这个侧面也能说明. ||XY ρ越接近1, e 越小.反之, ||XY ρ越近于0, e 就越大.Y 与X 的线性相关性越小.四、矩的概念定义 设X 和Y 为随机变量, l k ,为正整数, 称)(k X E 为k 阶原点矩(简称k 阶矩阵); ))](([k X E X E - 为k 阶中心矩; )|(|k X E 为k 阶绝对原点矩; )|)((|k X E X E - 为k 阶绝对中心矩; )(l k Y X E 为X 和Y 的l k +阶混合矩;})]([)]({[l k Y E Y X E X E -- 为X 和Y 的l k +阶混合中心矩;注: 由定义可见:(1) X 的数学期望)(X E 是X 的一阶原点矩; (2) X 的方差)(X D 是X 的二阶中心矩;(3)协方差),(Y X Cov 是X 和Y 的二阶混合中心矩.五、协方差矩阵将二维随机变量),(21X X 的四个二阶中心矩)]}.()][({[)]},()][({[},)]({[},)]({[1122212211122222221111X E X X E X E c X E X X E X E c X E X E c X E X E c --=--=-=-=排成矩阵的形式: ⎪⎪⎭⎫⎝⎛22211211c c c c (对称矩阵),称此矩阵为),(21X X 的协方差矩阵. 类似定义n 维随机变量),,,(21n X X X 的协方差矩阵.若n j i X E X X E X E X X Cov c j j i i j i ij ,,2,1,)]}()][({[),( =--==都存在, 则称⎪⎪⎪⎪⎪⎭⎫⎝⎛=nn n n n n c c cc c cc c c C212222111211 为),,,(21n X X X 的协方差矩阵.六、n 维正态分布的概率密度七、n 维正态分布的几个重要性质例题选讲:协方差的性质例1 (讲义例1) 已知离散型随机向量),(Y X 的概率分布为求),cov(Y X .例2 (讲义例2) 设连续型随机变量),(Y X 的密度函数为⎩⎨⎧≤≤≤=其它,010,8),(y x xy y x f求),cov(Y X 和)(Y X D +.相关系数的性质例3 (易知,0)(=X E 于是XY 不相关. 这表示Y X ,不存在线性关系. 但},1{}2{0}1,2{=-=≠==-=Y P X P Y X P 知Y X ,不是相互独立的. 事实上, X 和Y 具有关系: ,2X Y =Y 的值完全可由X 的值所确定.例4 (讲义例4) 设θ服从],[ππ-上的均匀分布, ,sin θ=X θcos =Y 判断X 与Y 是否不相关, 是否独立.例5 (讲义例5) 已知)3,1(~2N X , ),4,0(~2N Y 且X 与Y 的相关系数 .21-=XY ρ 设,23YX Z -=求)(Z D 及.XZ ρ 例6 (讲义例6) 设),(Y X 服从二维正态分布, 它的概率密度为,)())((2)()1(21exp 121),(2222212121212221⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⎥⎥⎦⎤⎢⎢⎣⎡-+-------=σμσσμμρσμρρσπσy y x x y x f 求X 和Y 的相关系数XY ρ.注:在上一章中我们已经得到:若),(Y X 服从二维正态分布, 那么X 和Y 相互独立的充要条件为0=ρ. 现在知道ρ即为X 与Y 的相关系数, 故有下列结论:“若),(Y X 服从二维正态分布,则X 与Y 相互独, 立当且仅当X 与Y 不相关”.n 维正态分布的几个重要性质例7 (讲义例7) 设随机变量X 和Y 相互独立且),.2,1(~N X )1,0(~N Y ,试求32+-=Y X Z 的概率密度.课堂练习1. 对不同品牌的某种机械的两项重要指标评分, 设21,X X 为其所得分数(百分制). 已知,9.68)(1=X E 8.72)(2=X E ; ,81)(1=X D ;49)(2=X D .36),cov(21=X X现以服从正态分布的综合分21167169X X Y +=来决定各参评品牌的名次 .(1) 试求Y 的分布; (2) 如果对综合分85≥Y 的品牌颁奖, 试计算获奖者的百分比.第四节 大数定理与中心极限定理概率论与数理统计是研究随机现象统计规律性的学科. 而随机现象的规律性在相同的条件下进行大量重复试验时会呈现某种稳定性. 例如, 大量的抛掷硬币的随机试验中, 正面出现频率; 在大量文字资料中, 字母使用频率; 工厂大量生产某种产品过程中, 产品的废品率等. 一般地, 要从随机现象中去寻求事件内在的必然规律, 就要研究大量随机现象的问题.在生产实践中, 人们还认识到大量试验数据、测量数据的算术平均值也具有稳定性. 这种稳定性就是我们将要讨论的大数定律的客观背景. 在这一节中,我们将介绍有关随机变量序列的最基本的两类极限定理----大数定理和中心极限定理.内容分布图示★大数定理的引入 ★依概率收敛 ★切比雪夫不等式 ★例1 ★例2★切比雪夫大数定理 ★例3★泊努力大数定理★辛钦大数定理 ★例4★例5大数定理★中心极限定理的引入 ★林德伯格—勒维定理★棣莫佛—拉普拉斯定理 ★例6 ★例7 ★例8 ★例9★例10 ★例11 ★用频率估计概率的误差 ★例12 ★李维普诺夫定理★高尔顿钉板试验中心极限定理★内容小结 ★课堂练习 ★习题4-4★返回内容要点:一、依概率收敛与微积分学中的收敛性的概念类似, 在概率论中, 我们要考虑随机变量序列的收敛性. 定义1 设 ,,,,21n X X X 是一个随机变量序列, a 为一个常数,若对于任意给定的正数ε,有 ,1}|{|lim =<-∞→εa X P n n 则称序列 ,,,,21n X X X 依概率收敛于a , 记为).(∞→−→−n a X Pn定理1 设,,b Y a X Pn P n −→−−→−又设函数),(y x g 在点),(b a 连续, 则),(),(b a g Y X g Pn n −→−.二、切比雪夫不等式定理2设随机变量X 有期望μ=)(X E 和方差2)(σ=X D ,则对于任给0>ε, 有22}|{|εσεμ≤≥-X P .上述不等式称切比雪夫不等式.注:(i) 由切比雪夫不等式可以看出,若2σ越小, 则事件}|)({|ε<-X E X的概率越大, 即, 随机变量X 集中在期望附近的可能性越大. 由此可见方差刻划了随机变量取值的离散程度.(ii) 当方差已知时,切比雪夫不等式给出了X 与它的期望的偏差不小于ε的概率的估计式.如取,3σε= 则有.111.09}3|)({|22≈≤≥-σσσX E X P故对任给的分布,只要期望和方差2σ存在, 则随机变量X 取值偏离)(X E 超过σ3的概率小于0.111.三、大数定理1.切比雪夫大数定律定理3 (切比雪夫大数定律)设 ,,,,21n X X X 是两两不相关的随机变量序列,它们数学期望和方差均存在, 且方差有共同的上界, 即,,2,1,)( =≤i K X D i 则对任意0>ε, 有1)(11lim 11=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<-∑∑==∞→εn i i n i i n X E n X n P 注: 定理表明: 当n 很大时,随机变量序列}{n X 的算术平均值∑=ni i X n 11依概率收敛于其数学期望∑=ni i X E n 1)(1.2.伯努利大数定理定理4 (伯努利大数定律)设A n 是n 重伯努利试验中事件A 发生的次数, p 是事件A 在每次试验中发生的概率, 则对任意的0>ε, 有1lim =⎭⎬⎫⎩⎨⎧<-→∞εp n n P A n 或 0l i m =⎭⎬⎫⎩⎨⎧≥-→∞εp n n P A n . 注:(i) 伯努利大数定律是定理1的推论的一种特例, 它表明: 当重复试验次数n 充分大时, 事件A 发生的频率nn A依概率收敛于事件A 发生的概率p .定理以严格的数学形式表达了频率的稳定性. 在实际应用中, 当试验次数很大时,便可以用事件发生的频率来近似代替事件的概率.(ii) 如果事件A 的概率很小,则由伯努利大数定律知事件A 发生的频率也是很小的,或者说事件A 很少发生. 即“概率很小的随机事件在个别试验中几乎不会发生”,这一原理称为小概率原理,它的实际应用很广泛. 但应注意到,小概率事件与不可能事件是有区别的. 在多次试验中,小概率事件也可能发生.3.辛钦大数定理定理5 (辛钦大数定律) 设随机变量 ,,,,21n X X X 相互独立, 服从同一分布,且具有数学期望,,2,1,)( ==i X E i μ 则对任意0>ε, 有11lim 1=⎭⎬⎫⎩⎨⎧<-∑=∞→εμn i i n X n P . 注: (i) 定理不要求随机变量的方差存在;(ii) 伯努利大数定律是辛钦大数定律的特殊情况;(iii) 辛钦大数定律为寻找随机变量的期望值提供了一条实际可行的途径. 例如, 要估计某地区的平均亩产量, 可收割某些有代表性的地块, 如n 块,计算其平均亩产量, 则当n 较大时,可用它作为整个地区平均亩产量的一个估计. 此类做法在实际应用中具有重要意义.四、中心极限定理在实际问题中, 许多随机现象是由大量相互独立的随机因素综合影响所形成, 其中每一个因素在总的影响中所起的作用是微小的. 这类随机变量一般都服从或近似服从正态分布. 以一门大炮的射程为例, 影响大炮的射程的随机因素包括: 大炮炮身结构的制造导致的误差, 炮弹及炮弹内炸药在质量上的误差, 瞄准时的误差, 受风速、风向的干扰而造成的误差等. 其中每一种误差造成的影响在总的影响中所起的作用是微小的, 并且可以看成是相互独立的, 人们关心的是这众多误差因素对大炮射程所造成的总影响. 因此需要讨论大量独立随机变量和的问题.中心极限定理回答了大量独立随机变量和的近似分布问题, 其结论表明: 当一个量受许多随机因素(主导因素除外) 的共同影响而随机取值, 则它的分布就近似服从正态分布.1.林德伯格—勒维定理定理6 (林德伯格—勒维) 设 ,,,,21n X X X 是独立同分布的随机变量序列, 且,,,2,1,)(,)(2n i X D X E i i ===σμ则 ⎰∑∞--=∞→=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧≤-x t n i i n dt e x n n X P 2/1221lim πσμ 注: 定理6表明: 当n 充分大时, n 个具有期望和方差的独立同分布的随机变量之和近似服从正态分布. 虽然在一般情况下, 我们很难求出n X X X +++ 21的分布的确切形式,但当n 很大时, 可求出其近似分布. 由定理结论有.1),/,(~)1,0(~/1)1,0(~1211∑∑∑====⇒-⇒-n i i ni i ni i X n X n N X N nX n N n n X σμσμσμ近似近似故定理又可表述为: 均值为μ, 方差的02>σ的独立同分布的随机变量 ,,,,21n X X X 的算术平均值X , 当n 充分大时近似地服从均值为μ,方差为n /2σ的正态分布. 这一结果是数理统计中大样本统计推断的理论基础.2. 棣莫佛—拉普拉斯定理在第二章中,作为二项分布的正态近似,我们曾经介绍了棣莫佛—拉普拉斯定理,这里再次给出,并利用上述中心极限定理证明之.定理7(棣莫佛—拉普拉斯定理)设随机变量n Y 服从参数p n ,)10(<<p 的二项分布, 则对任意x , 有)(21)1(lim 22x dt e x p np np Y P x tn n Φ==⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤--⎰∞--∞→π注: 易见,棣莫佛—拉普拉斯定理就是林德伯格—勒维定理的一个特殊情况.3.用频率估计概率的误差设n μ为n 重贝努里试验中事件A 发生的频率, p 为每次试验中事件A 发生的概率,,1p q -=由棣莫佛—拉普拉斯定理,有⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<-<-=⎭⎬⎫⎩⎨⎧<-pq n npqnp pq nP p n P n n εμεεμ .12-⎪⎪⎭⎫ ⎝⎛Φ=⎪⎪⎭⎫ ⎝⎛-Φ-⎪⎪⎭⎫ ⎝⎛Φ≈pq n pq n pq n εεε这个关系式可用解决用频率估计概率的计算问题:4. 李雅普诺夫定理定理8(李雅普诺夫定理) 设随机变量 ,,,,21n X X X 相互独立, 它们具有数学期望和方差: ,2,1,0)(,)(2=>==i X D X E kk k k σμ,记.122∑==nk k nB σ 若存在正数δ, 使得当∞→n 时,,0}|{|1122→-∑=++nk k knXE Bδδμ则随机变量之和∑=n k k X 1的标准化变量:nnk kn k kn k k n k k nk k n B X X D X E X Z ∑∑∑∑∑=====-=⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛-=11111μ的分布函数)(x F n 对于任意x , 满足).(21lim )(lim 2/112x dt e x B X P x F x t n n k k n k k n n n Φ==⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤-=⎰∑∑∞--==∞→∞→πμ注:定理8表明, 在定理的条件下, 随机变量.11nnk kn k kn B X Z ∑∑==-=μ当n 很大时,近似地服从正态分布)1,0(N . 由此, 当n 很大时,∑∑==+=nk k n n nk k Z B X 11μ近似地服从正态分布⎪⎪⎭⎫ ⎝⎛∑=21,n n k k B N μ.这就是说,无论各个随机变量),2,1( =k X k 服从什么分布,只要满足定理的条件,那么它们的和∑=nk k X 1当n 很大时,就近似地服从正态分布.这就是为什么正态随机变量在概率论中占有重要地位的一个基本原因.在很多问题中,所考虑的随机变量可以表示成很多个独立的随机变量之和,例如,在任一指定时刻,一个城市的耗电量是大量用户耗电量的总和;一个物理实验的测量误差是由许多观察不到的、可加的微小误差所合成的,它们往往近似地服从正态分布.例题选讲:切比雪夫不等式例1 (讲义例1) 已知正常男性成人血液中, 每一毫升白细胞数平均是7300, 均方差是700. 利用切比雪夫不等式估计每毫升白细胞数在5200~9400之间的概率.例2 (讲义例2) 在每次试验中, 事件A 发生的概率为0.75, 利用切比雪夫不等式求: 事件A 出现的频率在0.74~0.76之间的概率至少为0.90? 切比雪夫大数定律例3 (讲义例3) 设}{k X 为相互独立的随机变量序列, 且,212112120212212++--k kk kk k pX ,2,1=k 试证}{k X 服从大数定律.辛钦大数定理例4 (讲义例4) 设}{k X 为相互独立且同分布的随机变量序列, 并且k X 的概率分布为),,2,1(2}2{ln 2 ===--i X P ii i k试证}{k X 服从大数定律.中心极限定理例5 在一个罐子中,装有10个编号为0-9的同样的球,从罐中放回地抽取若干次,每次抽一个,并记下号码. 设⎩⎨⎧=否则次取到号码第,00,1k X k , n k ,2,1=问对序列}{k X 能否应用大数定律?例6 (讲义例5) 一盒同型号螺丝钉共有100个,已知该型号的螺丝钉的重量是一个随机变量,期望值是100g 标准差是10g, 一盒螺丝钉的重量超过10.2kg 的概率.例7 (讲义例6)一船舶在某海区航行,已知每遭受一次波浪的冲击,纵摇角大于 3的概率为,3/1=p 若船舶遭受了90000次波浪冲击,问其中有29500~30500次纵摇角度大于 3的概率是多少?例8 对于一个学校而言, 来参加家长会的家长人数是一个随机变量, 设一个学生无家长, 1名家长, 2名家长来参加会议的概率分别0.05, 0.8, 0.15. 若学校共有400名学生, 设各学生参加会议的家长数相互独立, 且服从同一分布.(1)求参加会议的家长数X 超过450的概率;(2)求有1名家长来参加会议的学生数不多于340的概率.例9 (讲义例7)(供电问题)某车间有200台车床, 在生产期间由于需要检修、调换刀具、变换位置及调换工作等常需停车. 设开工率为0.6,并设每台车床的工作是独立的, 且在开工时需电力1千瓦. 问应供应多少瓦电力就能以99.9%的概率保证该车间不会因供电不足而影响生产?例10 设有1000人独立行动, 每个人能够按时进入掩蔽体的概率为0.9. 以95%概率估计, 在一次行动中:(1)至少有多少人能进入掩蔽体; (2)至多有多少人能进入掩蔽体.例11 (讲义例8) 设一大批产品中一级品率为10%, 现从中任取500件.(1) 分别用切比雪夫不等式估计和中心极限定理计算: 这500件中一级品的比例与10%之差的绝对值小于2%的概率;(2) 至少应取多少件才能使一级品的比例与10%之差的绝对值小于2%的把握大于95%?用频率估计概率的误差例12 (讲义例9 现从某厂生产的一批同型号电子元件中抽取395件, 由于次品率未知,需要通过次品的相对频率来估计, 这时估计的可靠性大于95%. (1)求绝对误差ε;(2)如果样品中有十分之一是次品, 应对p 怎样估计?李雅普诺夫定理例13 (讲义例10高尔顿钉板试验如图4-4-2是高尔顿钉板, 常常在赌博游戏中见到, 庄家常常在两边放置值钱的东西来吸引顾客, 现在可用中心极限定理来揭穿这个赌博中的奥秘.设n 为钉子的排数, 记随机变量。
概率论随机变量的特征
Y X2 0
149
P(Y yi ) 0.25 0.40 0.25 0.10
EY 00.25 10.40 40.25 90.10 2.30
10
2020年10月21日3时50分
山东建筑大学理学院信息与计算科学教研室
概率论与数理统计
随机变量的数字特 征
EX Y
x
y
f
x,
y dxdy
xf x, ydxdy yf x, ydxdy =EX+ EY
推论: E n Xi n EXi .
i1 i1
16
2020年10月21日3时50分
山东建筑大学理学院信息与计算科学教研室
概率论与数理统计
随机变量的数字特
征
定理 若X、Y 独立,则有: EXY EX EY
频率
12 5 40 40 40
66 40 40
该班的平均成绩为:
85
85 40 40
421
421 40 40 40
351 50 2 68 5 72 6 75 6 80 8 85 5 90 4 96 2 1001
35
1
50
2
68
5
72
6
75
6
40
80
8
85
5
90
4
96
X1
1234
pX1 xi 0.4 0.3 0.2 0.1
EX1 1 0.4 2 0.3 3 0.2 4 0.1 2
5
2020年10月21日3时50分
山东建筑大学理学院信息与计算科学教研室
概率论与数理统计
(2)设随机变量 X 2 是取球次数,则
经管类概率论与数理统计第四章随机变量的数字特征
随机变量的概率分布完整地描述了随机变量统计规律,但是在实际问题中求得随机变量的概率分布并不容易,而且对某些问题来说,只需知道它的某些特征,我们把刻画随机变量某些方面特征的数值称为随机变量的数字特征。
本章主要研究随机变量的期望、方差、协方差、相关系数等数字特征。
4.1 随机变量的期望4.1.1 离散型随机变量的期望引例10人参加考试,1人得100分,6人得80分,3人得60分,求10人考度的平均分。
【答疑编号:10040101针对该题提问】解:平均分为:从本例看:平均分并不等于60、80、100的平均值80。
这是由于60分出现的机会多于100分,上面方法出现了60分出现的频率多。
100分的频率小,能正确计算平均值。
定义若X的分布律为P(X=x i)=p i,i=1,2…当级数绝对收敛时(即收敛)就说是离散型随机变量X的期望。
记作EX,即说明:(1)若X取值为有限个x1,x2,…,x n则(2)若X取值为可列无限多个x1,x2,…,x n…则这时才要求无穷级数绝对收敛。
很明显,X的期望EX体现随机变量X取值的平均概念,所以EX也叫X的均值。
【例4-1】设随机变量X的分布律为求E(X)解E(X)=(-1)×0.3+0×0.2+1×0.5=0.2【例4-2】甲乙两人进行打靶,所得分数分别记为X,Y,它们的分布律分别为试比较他们成绩的好坏。
【答疑编号:10040102针对该题提问】 解 我们分别计算X 和Y 的数学期望: EX=0×0+1×0.2+2×0.8=1.8(分)。
EY=0×0.1+1×0.8+2×0.1=1(分)。
这意味着,如果进行多次射击,甲所得分数的平均值接近于1.8分,而乙得分的平均值接近1分。
很明显乙的成绩远不如甲。
4.1.2 下面介绍几种重要离散型随机变量的数学期望。
1.两点分布随机变量X 的分布律为其中<p <1,有 EX=0×(1-p )+1×p=p 。
概率论与数理统计课件:随机变量的数字特征
首页 返回 退出
例7 (正态分布的数学期望)设 X ~ N( μ, σ 2 ), 求E(X).
解:
E(X) =
+
-
xf ( x )dx =
+
-
1
x
e
2πσ
( x - μ )2
2σ 2
dx
x-μ
, 则
令 t=
σ
E(X) =
+
-
t2
2
t2
+ 2
-
1
μ
( μ + t σ)
+
若级数 | g( xk ) | pk < + , 则 Y = g( X ) 的数学期望为
k =1
+
E(Y ) = E(g( X )) = g( xk ) pk
k =1
随机变量的数字特征
首页 返回 退出
定理4.2 (连续型随机变量函数的数学期望) 设连续型随
机变量X的概率密度函数为f(x),若
随机变量的数字特征
第一节 随机变量的数学期望
第二节 方差
第三节 协方差和相关系数
第四节 R实验
随机变量的数字特征
首页 返回 退出
第一节 随机变量的数学期望
一、离散型随机变量数学期望
二、连续型随机变量数学期望
二、随机变量函数的数学期望
三、数学期望的性质
随机变量的数字特征
首页 返回 退出2
§4.1随机变量的数学期望
P{X = xi } = pi , i = 1,2,
如果
+
| x
i
.
| pi < +
第3章 随机变量的数值特征
j 1 i 1
设 X , Y 的联合密度为 f ( x, y ), 若
| g ( x, y) | f ( x, y)dxdy ,E(Y ) E[ g ( X )] g ( x) f ( x)dx
方差的算术平方根 D( X )称为X 的标准差或均方差 记为 ( X ),它与X 具有相同的量纲。
由于它与X具有相同的度量单位,在实 际问题中经常使用.
D(X)=E[X-E(X)]2 方差刻划了随机变量的取值对于其数学 期望的离散程度 . 若X的取值比较集中,则方差较小;
若X的取值比较分散,则方差较大 .
E (Y ) E[ g ( X )] g ( xk ) pk
k 1
P{X xi , Y y j } pij , i, j 1, 2, 若 | g ( xi , y j ) | pij , 则
i 1 j 1
E (Z ) E[ g ( X , Y )]
E{[ X E ( X )]2 }
来度量随机变量X与其均值E(X)的偏离程度. 这个数字特征就是我们这一讲要介绍的 方差
方差的引入和定义
设X是一个随机变量,若E[(X-E(X)]2存在,
P70
称E[(X-E(X)]2 为 X 的方差. 记为D(X)或Var(X),即
D(X)=Var(X)=E[X-E(X)]2
下面我们将向大家介绍随机变量另一个 重要的数字特征: 方差
方差 方差的引入和定义
计算方差的一个简化公式
方差的性质
方差的引入和定义 例 某零件的真实长度为a,现用甲、乙 两台仪器各测量10次,将测量结果X用坐标 上的点表示:
[理学]概率论与数理统计第04章随机变量的数字特征第1讲
又设飞机机翼受到的正压力W是V的函数, W=kV2(k>0, 常数), 求W的数学期望. 解 由(1.4)式有
E (W ) kv f (v) d v
2
a
0
1 1 2 kv d v ka . a 3
2
24
例9 设随机变量(X,Y)的概率密度
1 3 y x, x 1. 3 2, x f ( x, y ) 2 x y 其它. 0, 1 求数学期望E (Y ), E . XY
3 1 3 3 ln x 3 dx . 2 4 2 x 1 2 1 x x 3 1 1 E f ( x, y ) d y d x d x 1 4 3 d y 1 xy XY x 2x y 3 . 5
12
例4 某商店对某种家用电器的销售采用先使 用后付款的方式, 记使用寿命为X(以年计), 规 定: X1, 一台付款1500元; 1<X2, 一台付款2000元; 2<X3, 一台付款2500元; X>3, 一台付款3000元. 设寿命X服从指数分布, 概率密度为 1 x /10 e , x 0 f ( x) 10 x 0. 0, 试求该商店一台收费Y的数学期望.
5
例1 甲乙二人打靶, 所得分数分别记为X1,X2, 它们的分布律分别为
X1 pk 0 0 1 2
X2
0
1
2
0.2 0.8
pk 0.6 0.3 0.1
试评定他们成绩的好坏. 解 计算X1,X2的数学期望为 E(X1)=00+10.2+20.8=1.8(分) E(X2)=00.6+10.3+20.1=0.5(分) 很明显乙的成绩远不如甲的成绩.
概率论与数理统计随机变量的数字特征课件
03
通过数值模拟方法可以直观地 展示随机变量的分布情况,帮 助理解概率论与数理统计中的 概念和理论。
06
总结与展望
主要内容回顾
随机变量的概念与分类
常见随机变量的性质与 分布
01
02
03
随机变量的数字特征: 均值、方差、协方差等
04
大数定律和中心极限定 理的应用
存在的问题与不足之处
学生对概念的理解不够深入 ,容易混淆不同概念之间的
掷骰子
假设掷一个六面体的骰子,每个数字出现的概率为1/6。通过数值模拟方法计算在掷n次骰子时,每个 数字出现的次数。
结果解释与讨论
01
对于投掷硬币的实例,当n逐 渐增大时,正面和反面出现的 次数逐渐接近,符合理论上的 期望值。
02
对于掷骰子的实例,当n逐渐 增大时,每个数字出现的次数 也逐渐接近理论上的期望值。
相关系数
相关系数是协方差与两个随机变量方差的比值, 用于衡量两个随机变量的线性相关程度。
意义
协方差和相关系数可以反映两个随机变量之间的 线性相关程度,正值表示正相关,负值表示负相 关,值为0表示无关。
03
随机变量的矩与特征
矩的定义
01
矩:对于实随机变量X,其k阶原点矩定义为E[X^k]
,k为非负整数。
概率论与数理统计随机变量 的数字特征课件
目 录
• 随机变量的基本概念 • 随机变量的期望值与方差 • 随机变量的矩与特征 • 随机变量的函数与变换 • 随机变量的数值模拟与实例分析 • 总结与展望
01
随机变量的基本概念
随机变量的定义
定义
设E是随机试验,S是样本空 间,对于E的每一个样本点e ,都有唯一的实数X(e)与之对 应,则称X(e)为随机变量。
概率统计:随机变量
下面求 X 的分布函数 F(x) P(X x).
当 x 0时, P(X x) P() 0.
当0 x 1时, P(X x) P(X 0) 1/ 6.
当1 x 2时, P(X x) P{(X 0) (X 1)}
P(X 0) P(X 1) 1/ 6 1/ 3 1/ 2
42
43
• 二点分布的其他例: • 赌博中输与赢 • 抽签的中与不中 • 设备的好与坏 • 民意测验中赞成与反对 • 因为可以用 X=1 来表示“赢”,“中”,“好”,“赞
成”等 • 用 X=0 来表示“输”,“不中”,坏”,“不赞成”等 • 二点分布亦称为伯努利(Bernoulli)分布 • 结果服从二点分布的试验称为伯努利(Bernoulli)
4.P{ () a} P{ () a} P{ () a} 1 F(a). 5.P{a () b} P{ () b} P{() a} F(b) F(a).
分布函数(7)
• 不少读者会混淆分布和分布函数两个不同 的概念。
• 这里再强调一下,随机变量的分布函数仅 仅是用来表示的分布的几个数学工具中的 一个。
随机变量
在随机试验中,有些试验结果本身与数值有关(本 身就是一个数).
例如,掷一颗骰子面上出现的点数; 每天进入地铁站的人数; 昆虫的产卵数; 六月份广州的最高温度;
在有些试验中,试验结果看来与数值无关,但我 们可以引进一个变量来表示它的各种结果.也就是说, 把试验结果数值化.
随机变量
例 1.1 投掷一个骰子一次,出现 1 点得 0 分,出现 2 点或 3
具体地, 如果随机试验E只有两个结果: A和A, 其中,P(A)=p, P(A)=q, (p+q=1,p>0,q>0), 则称E 为伯努利试验.
随机变量概念及其概率分布和特征
随着n无限增大,二项分布趋近于正态分布
p=0.3
p=0.5
p=0.7
二项分布图示
【例3-11】
某单位有4辆汽车,假设每辆车在一年中至 多只发生一次损失且损失的概率为0.1。试求 在一年内该单位:(1)没有汽车发生损失 的概率;(2)有1辆汽车发生损失的概率; (3)发生损失的汽车不超过2辆的概率。
95%的灯管寿命在均值左右392(即658~1442)小时
3 σ 原则
|X-μ| > 3σ 的概率很小,因此可认为正 态随机变量的取值几乎全部集中在[ μ3σ,μ+ 3σ ]区间内
广泛应用:
产品质量控制
判断异常情况 ……
68.27%
95.45%
99.73%
x -3σ -2σ -σ +σ +2σ +3σ
X 落在子区间 [c,d ] 内的 概率与该子区间的长度成正 比,与具体位置无关
P(c≤X≤d)
f(x)
ac d b x
2. 正态分布
X~N (μ、σ 2 ),其概率密度为:
(x)2
f(x)
1
e
22
2
-∞< x <∞
正态分布的均值和标准差 均值 E(X) =μ
方差 D(X)=σ 2
2. 正态曲线
(a)使用寿命在500小时以下的灯管占多大比 例?
(b)使用寿命在850~1450小时的灯管占多 大比例?
(c)以均值为中心,95%的灯管的使用寿命 在什么范围内?
解
X=使用寿命,X~N (1050,2002 )
P (X 5)0 = P 0 {Z 50 100 5 2 .7 0 }5 200
第三章 随机变量的数字特征
第三章 随机变量(向量)的数字特征
§3.1 随机变量的数学期望 §3.2 随机变量的方差 §3.3 协方差与相关系数
为了完整的描述随机变量的统计特性,自然应该知道 其分布函数,因为随机变量的分布函数可以反映随机变量 取值的规律。但是在实际问题中,一方面随机变量的分布 或分布函数并不都是容易求得的,另一方面,往往也不需 要知道随机变量的详尽的概率分布,而仅需要知道其某些
四、随机变量函数的数学期望 1. 一元随机变量函数的情况 设Y g( X )是随机变量 X的函数, (1)离散型
如果随机变量X 的概率函数为 P{ X xk } pk k 1, 2, 则有E (Y ) E[ g ( X )] g ( xk ) pk
k 1
(2)连续型
x2
1 n
Pk
n
… xi … 1 n
… xn … 1 n
E ( X ) x1 1 x2 1 ... xn 1 1 xi n n n n
i 1
2.两点分布 由数学期望的定义
E( X ) p
X pi
0
1
q
p
3. 二项分布 若随机变量 X ~ B(n, p) ,其概率函数为
xR
( x )2 2 2
1 E ( X ) xf ( x)dx xe 2 t2 (x ) 1 令t ( t )e 2 dt 2 t2 1 e 2 dt 2
dx
解:由上面的公式
1 1 2 E (W ) kv f (v)dv kv dv ka a 3 0
2 2 a
例3.6 设X与Y相互独立,它们的概率密度函数分别为
概率论与数理统计讲义第三章随机变量的数字特征
概率论与数理统计讲义第三章随机变量的数字特征第三章随机变量的数字特征【授课对象】理工类本科二年级【授课时数】4学时【授课方法】课堂讲授与提问相结合【基本要求】1、理解数学期望、方差的概念,并掌握它们的性质。
2、会计算随机变量函数的数学期望。
3、了解协方差、相关系数的概念。
【本章重点】对数学期望、方差、相关系数等数字特征概念的理解与计算。
【本章难点】对不相关与相互独立间关系的理解。
【授课内容及学时分配】§3.0 前言从上一章我们可以看出,分布函数(或密度函数、分布列)给出了随机变量的一种最完全的描述。
因此,原则上讲,全面认识和分析随机现象就应当求出随机变量的分布,但是对许多实际问题来讲,要想精确地求出其分布是很困难的。
其实,通过对现实问题的分析,人们发现对某些随机现象的认识并不要求了解它的确切分布,而只要求掌握他们的某些重要特征,这些特征往往更能集中地反映随机现象的特点。
例如要评价两个不同厂家生产的灯泡的质量,人们最关心的是谁家的灯泡使用的平均寿命更长些,而不需要知道其寿命的完全分布,同时还要考虑其寿命与平均寿命的偏离程度等,这些数据反映了它在某些方面的重要特征。
我们把刻划随机变量(或其分布)某些特征的确定的数值称为随机变量的数字特征。
本章主要介绍反应随机变量取值的集中位置、分散程度以及随机变量之间的线性相依程度的数字特征——数学期望、方差与相关系数(矩)。
§3.1 随机变量的数学期望一、离散型随机变量的数学期望引例:甲、乙二人进行射击比赛,以、分别表示他们命中的环数,其分布列分别为~~试问谁的技术好些?解:这个问题的答案并不是一眼看得出的。
这说明了分布列虽然完整地描述了离散型随机变量的概率特征,但是却不够“集中”地反映出它的变化情况,因此我们有必要找出一些量来更集中、更概括地描述随机变量,这些量多是某种平均值。
若在上述问题中,使两个射手各射N枪,则他们打中靶的总环数大约是:甲 8N+90.1N+100.6N=9.3N乙 80.2N+90.5N+100.3N=9.1N平均起来甲每枪射中9.3环,乙每枪射中9.1环,因此可以认为甲射手的本领要好些。
[考研数学]概率论和数理统计第四章 随机变量的数字特征课件全面版
为随机变量X的数学期望,简称期望,记为E(X),即
E(X) xk pk
k1
设 连 续 型 随 X具机 有变 概量 率 f(x), 密 度
若xf(x)d绝 x 对 收 ,则敛 称 积 x分 f(x)d为 xX的
数
学
期
望E(, X), 记即 E为 (X)
xf(x)dx
上一页 下一页 返回
E(X)是一个实数,形式上是X的可能值的加权 平均数,实质上它体现了X取值的真正平均。又称 E(X)为X的平均值,简称均值。它完全由X的分布 所决定,又称为分布的均值.
上一页 下一页 返回
例1: 某种产品即将投放市场,根据市场调查估计每件 产品有60%的把握按定价售出,20%的把握打折售出 及20%的可能性低价甩出。上述三种情况下每件产品 的利润分别为5元,2元和-4元。问厂家对每件产品可 期望获利多少?
解: 设X表示一件产品的利润(单位:元),X的分布
率为
X 5 2 -4
E (X ) k e ee 2 -4
k ! (k 1 )! 随机变量函数的数学期k 望 :0
k 1
k 0
设n维随机变量(X1,X2,···Xn) 的1+1阶混合中心矩
6第元四,E 章还(是随X 有机利变2可量)图的的 数。字E 特征[X(X1)X]E[X(X1)]E(X)
例7: 设圆的直径X~U(a,b),求圆的面积的期望。
P X k 2 -4
第四节 矩、协方差矩阵 随机变量数学期望的性质:
k !
k0 ,1 ,2 , ,0
若(X,Y)为二维离散型随机变量,其联合分布律为
设n维随机变量(X1,X2,·· ·Xn) 的1+1阶k 混合 中心矩
概率统计第四章 随机变量的数字特征
第四章随机变量的数字特征知道了随机变量的概率分布也就知道了它的全部统计特性.然而,在许多实际问题中,随机变量的概率分布往往不易求得,也有不少实际问题并不需要我们知道随机变量的全部统计特性,而只需要知道它的某些主要统计特征.举例:学生成绩.首先要知道平均成绩,其次又要注意各个学生的成绩与平均成绩的偏离程度. 平均成绩越高,偏离程度越小,学生学习成绩就越好。
我们把表示随机变量某些特征的数值称为随机变量的数字特征,它们反映了随机变量的某些本质属性.许多重要的分布往往由这些数字特征唯一确定.本章主要介绍数学期望、方差、相关系数和矩.第一节数学期望一数学期望的定义1. 引例设有十个数字1,1,2,2,2,3,3,3,3,4 以表示平均值,则有又可以写成。
显然,这里的实际上是数字1,2,3,4在这十个数字中所占的份额,我们可以称之为这四个数字的“权重”,所以上式又可称为是1,2,3,4这四个数字的加权平均数。
再换一个角度,设想这是十张写有数字的卡片,随机从中取出一张,观察到的数值为,则它是一个随机变量,它的可能取值为1,2,3,4,而它的分布律为:因此,实质上就是随机变量的取值的平均数。
受此问题的启发,引出如下数学期望的定义.2.数学期望(Mathematical expectation)或均值(Mean的定义1)[定义] 设是离散型随机变量,其概率函数为如果级数绝对收敛,则定义的数学期望为;2)[定义] 设为连续型随机变量,其概率密度为,如果广义积分绝对可积,则定义的数学期望为.【注1】数学期望即随机变量的平均取值,它是所有可能取值以概率为权重的加“权”平均.考察随机变量的平均取值.【注2】连续型随机变量的数学期望和离散型随机变量的数学期望的实质是相同的:相当于;相当于;相当于.【注3】物理解释:数学期望——重心.设有总质量为的个质点构成的质点系,记点在轴上的坐标为,质量为,求该质点系的重心坐标.解:记质点系的重心坐标为,于是,这里是在点处的质量占总质量的比重,因此是以为权的加“权”平均.例1甲、乙两人作射击比赛,命中环数分别为,它们的分布律分别为问:哪一个射手的本领较好?解(环)(环)显然,,因此甲比乙的本领要好些.例2 设随机变量X的密度函数为:,求.解:. 二随机变量函数的数学期望1.[定义] 设为离散型随机变量,其概率函数,为连续函数,且级数绝对收敛,则的函数的数学期望为2.[定义] 设为连续型随机变量,其概率密度为,如果广义积分绝对收敛,则的函数的数学期望为:.例3.设离散型随机变量X的分布律如下,求:.X 0 1 2P 3/10 6/10 1/10解:.例4.设风速X是一个随机变量,在[0,]上服从均匀分布,而飞机的两机翼受到的压力Y与风速X的平方成正比,即,,求:.解:X的密度函数为,而,所以.三数学期望的性质1. (其中c为常数;2. (其中c为常数;3. ;4. 如果X与Y相互独立,则.例4. 若X的数学期望E(X)存在,求:解:第二节方差与标准差一方差(Variance)与标准差(Standard deviation的概念1.方差与标准差的定义[定义] 设是随机变量,若存在,则称为的方差,记为或,即.随机变量的标准差定义为方差的算术平方根,记为.从定义中可清楚地看出:方差实际上是随机变量X 的函数的数学期望,于是当为离散型随机变量,其方差为;当为连续型随机变量,其方差为.【注1】方差描述的是随机变量取值的波动程度,或随机变量偏离均值的程度.2.计算方差的简便公式:利用数学期望的性质,可以得到:.因此,方差的计算常常用简便公式:例1 设,求:解:=0;;所以:.二方差的性质1. (c是常数;2. (c是常数;3. (c是常数;4. 如果与独立,则这个结论可以推广到有限个相互独立的随机变量的情况:设相互独立,则有.例2.设两个相互独立的随机变量与,它们的方差分别为4和2,求解:.例3. 随机变量X有,且已知求解:由∴,故:. 三常用分布的数学期望与方差分布名称数学期望方差0-1 分布p p(1p二项分布np n p (1p泊松分布π(均匀分布指数分布Exp(正态分布N(, 2 2例4. 设随机变量X在区间上服从均匀分布,求解:,;;∴.例5. 设随机变量X服从参数为的二项分布,求解:由二项分布的定义可知:随机变量X表示重贝努里试验中事件A发生的次数,且在每次试验中A发生的概率为.现在引进随机变量,表示在第次试验中A发生;表示在第次试验中A不发生,则.由于各次试验的独立性,且,可得:,,,所以:;.【注2】当直接求某个随机变量的数学期望或方差有困难或计算麻烦时,一个较为有效的处理技巧是把它分解成若干容易求数学期望或方差的随机变量的和,从而可以方便地求出该随机变量的数学期望或方差。
概率论与数理统计第四章随机变量的数字特征
第四章 随机变量的数字特征前面讨论了随机变量的分布函数,我们知道分布函数全面地描绘了随机变量的统计特性.但是在实际问题中,一方面由于求分布函数并非易事;另一方面,往往不需要去全面考察随机变量的变化情况而只需知道随机变量的某些特征就够了.例如,在考察一个班级学生的学习成绩时,只要知道这个班级的平均成绩及其分散程度就可以对该班的学习情况作出比较客观的判断了.这样的平均值及表示分散程度的数字虽然不能完好地描绘随机变量,但能更突出地描绘随机变量在某些方面的重要特征,我们称它们为随机变量的数字特征.本章将介绍随机变量的常用数字特征:数学期望、方差、相关系数和矩.第一节 数学期望1.数学期望的定义粗略地说,数学期望就是随机变量的平均值.在给出数学期望的概念之前,先看一个例子.要评判一个射手的射击程度,需要知道射手平均命中环数.设射手A 在同样条件下进展射击,命中的环数X 是一随机变量,其分布律如下:表4-1由X 的分布律可知,假设射手A 共射击N 次,根据频率的稳定性,所以在N 次射击中,大约有0.1×N 次击中10环,0.1×N 次击中9环,0.2×N 次击中8环,0.3×N 次击中7环,0.1×N 次击中6环,0.1×N 次击中5环,0.1×N 次脱靶.于是在N 次射击中,射手A 击中的环数之和约为10×0.1N +9×0.1N +8×0.2N +7×0.3N +6×0.1N +5×0.1N +0×0.1N .平均每次击中的环数约为N1〔10×0.1N +9×0.1N +8×0.2N +7×0.3N +6×0.1N +5×0.1N +0×0.1N 〕 =10×0.1+9×0.1+8×0.2+7×0.3+6×0.1+5×0.1+0×0.1 =6.7〔环〕.由这样一个问题的启发,得到一般随机变量的“平均数〞,应是随机变量所有可能取值与其相应的概率乘积之和,也就是以概率为权数的加权平均值,这就是所谓“数学期望的概念〞.一般地,有如下定义:定义4.1 设离散型随机变量X 的分布律为P {X =x k }=p k k =1,2,…, 假设级数∑∞=1k k kp x绝对收敛,那么称级数∑∞=1k k kp x为随机变量X 的数学期望〔Mathematical expectation 〕,记为E 〔X 〕.即E 〔X 〕=∑∞=1k k kp x. 〔4.1〕设连续型随机变量X 的概率密度为f 〔x 〕,假设积分⎰+∞∞-x x xf d )(绝对收敛,那么称积分⎰+∞∞-x x xf d )(的值为随机变量X 的数学期望,记为E 〔X 〕.即E 〔X 〕=⎰+∞∞-x x xf d )(. 〔4.2〕数学期望简称期望,又称为均值.例4.1 某商店在年末大甩卖中进展有奖销售,摇奖时从摇箱摇出的球的可能颜色为:红、黄、蓝、白、黑五种,其对应的奖金额分别为:10000元、1000元、100元、10元、1元.假定摇箱内装有很多球,其中红、黄、蓝、白、黑的比例分别为:0.01%,0.15%,1.34%,10%,88.5%,求每次摇奖摇出的奖金额X 的数学期望. 解每次摇奖摇出的奖金额X 是一个随机变量,易知它的分布律为因此,E 〔X 〕=10000×0.0001+1000×0.0015+100×0.0134+10×0.1+1×0.885=5.725. 可见,平均起来每次摇奖的奖金额缺乏6元.这个值对商店作方案预算时是很重要的.例4.2 按规定,某车站每天8点至9点,9点至10点都有一辆客车到站,但到站的时刻是随机的,且两者到站的时间互相独立.其分布律为一旅客8点20分到车站,求他候车时间的数学期望.解 设旅客候车时间为X 分钟,易知X 的分布律为表4-4在上表中p k 的求法如下,例如P {X =70}=P 〔AB 〕=P 〔A 〕P 〔B 〕=1/6×3/6=3/36,其中A 为事件“第一班车在8:10到站〞,B 为事件“第二班车在9:30到站〞,于是候车时间的数学期望为E 〔X 〕=10×3/6+30×2/6+50×1/36+70×3/36+90×2/36=27.22〔分钟〕.例4.3 有5个互相独立工作的电子装置,它们的寿命X k 〔k =1,2,3,4,5〕服从同一指数分布,其概率密度为f 〔x 〕=⎪⎩⎪⎨⎧≤>-.00,0,1/x ,x x θθe〔1〕 假设将这5个电子装置串联起来组成整机,求整机寿命N 的数学期望;〔2〕 假设将这5个电子装置并联组成整机,求整机寿命M 的数学期望.解 X k 〔k =1,2,3,4,5〕的分布函数为F 〔x 〕=⎩⎨⎧≤>--.0,0,0,1/x x x θe〔1〕 串联的情况由于当5个电子装置中有一个损坏时,整机就停顿工作,所以这时整机寿命为N =min{X 1,X 2,X 3,X 4,X 5}.由于X 1,X 2,X 3,X 4,X 5是互相独立的,于是i=min{X 1,X 2,X 3,X 4,X 5}的分布函数为F N 〔x 〕=P {N ≤x }=1-P {N >x }=1-P {X 1>x ,X 2>x ,X 3>x ,X 4>x ,X 5>x }=1-P {X 1>x }·P {X 2>x }·P {X 3>x }·P {X 4>x }·P {X 5>x }=1-[1-)(1x F X ][1- )(2x F X ][1-)(3x F X ][1-)(4x F X ][1-)(5x F X ] =1-[1-F 〔x 〕]5=⎪⎩⎪⎨⎧≤>--.0,0,0,15x x xθe 因此N 的概率密度为f N 〔x 〕=⎪⎩⎪⎨⎧≤>-.0,0,0,55x x xθθe那么N 的数学期望为E 〔N 〕=55)(5θθθ==-∞+∞-∞+∞-⎰⎰x xx x xf xN d ed〔2〕 并联的情况由于当且仅当5个电子装置都损坏时,整机才停顿工作,所以这时整机寿命为M =max{X 1,X 2,X 3,X 4,X 5}.由于X 1,X 2,X 3,X 4,X 5互相独立,类似可得M 的分布函数为F M 〔x 〕=[F 〔x 〕]5=⎪⎩⎪⎨⎧≤>--.0,0,0,)1(5x x x θe因此M 的概率密度为f M 〔x 〕=⎪⎩⎪⎨⎧≤>---.0,0,0,]1[54x x x x θθθe e于是M 的数学期望为E 〔M 〕=.60137)1(5)(0max θθθ=-=-∞+∞-∞+⎰⎰x xx x xf xd e d 这说明:5个电子装置并联联接工作的平均寿命要大于串联联接工作的平均寿命.例4.4 设随机变量X 服从柯西〔Cauchy 〕分布,其概率密度为f 〔x 〕=)1(12x +π,-x <x <+∞, 试证E 〔X 〕不存在.证 由于,)1(1)(2⎰⎰+∞∞-+∞∞-∞=+=x x xx x f x d πd 故E 〔X 〕不存在.2.随机变量函数的数学期望在实际问题与理论研究中,我们经常需要求随机变量函数的数学期望.这时,我们可以通过下面的定理来实现.定理4.1 设Y 是随机变量X 的函数Y =g 〔X 〕〔g 是连续函数〕. 〔1〕 X 是离散型随机变量,它的分布律为P 〔X =x k 〕=p k ,k =1,2,…,假设kk kpx g ∑∞=1)(绝对收敛,那么有E 〔Y 〕=E [g 〔X 〕]=kk kpx g ∑∞=1)(. 〔4.3〕〔2〕 X 是连续型随机变量,它的概率密度为f 〔x 〕,假设⎰+∞∞-x x f x g d )()(绝对收敛,那么有E 〔Y 〕=E [g 〔X 〕]=⎰+∞∞-x x f x g d )()(. 〔4.4〕定理4.4的重要意义在于当我们求E 〔Y 〕时,不必知道Y 的分布而只需知道X 的分布就可以了.当然,我们也可以由的X 的分布,先求出其函数g 〔X 〕的分布,再根据数学期望的定义去求E [g 〔X 〕],然而,求Y =g 〔X 〕的分布是不容易的,所以一般不采用后一种方法.定理4.1的证明超出了本书的范围,这里不证.上述定理还可以推广到二个或二个以上随机变量的函数情形. 例如,设Z 是随机变量X ,Y 的函数,Z =g 〔X ,Y 〕〔g 是连续函数〕,那么Z 也是一个随机变量,当〔X ,Y 〕是二维离散型随机变量,其分布律为P {X =x i ,Y =y j }=p ij 〔i ,j =1,2,…〕时,假设∑∑ijijiipy x g ),(绝对收敛,那么有E 〔Z 〕=E [g 〔X ,Y 〕]=∑∑ijijiipy x g ),(. 〔4.5〕当〔X ,Y 〕是二维连续型随机变量,其概率密度为f 〔x ,y 〕时,假设⎰⎰+∞∞-+∞∞-yx y x f y z g d d ),(),(绝对收敛,那么有E 〔Z 〕=E [g 〔X ,Y 〕]=⎰⎰+∞∞-+∞∞-y x y x f y z g d d ),(),(. 〔4.6〕特别地有E 〔X 〕=⎰⎰+∞∞-+∞∞-y x y x xf d d ),(=⎰+∞∞-.)(x x xf X dE 〔Y 〕=⎰⎰+∞∞-+∞∞-y x y x yf d d ),(=⎰+∞∞-.)(y y yf Y d例4.5 设随机变量X 的分布律为表4-5求E 〔X 〕,E 〔-2x +1〕.解 由〔4.5〕式得E 〔X 2〕=〔-1〕2×18+02×14+22×38+32×14=318, E 〔-2X +1〕=[-2×〔-1〕+1]×18+[-2×0+1]×14+[-2×2+1]×38+[-2×3+1]×14= -74. 例4.6 对球的直径作近似测量,设其值均匀分布在区间[a ,b ]内,求球体积的数学期望.解 设随机变量X 表示球的直径,Y 表示球的体积,依题意,X 的概率密度为f 〔x 〕=⎪⎩⎪⎨⎧≤≤-.,0,,1其他b x a a b球体积Y =361X π,由〔4.6〕式得 E 〔Y 〕=x a b x X E ba d ππ-=⎰161)61(33=).)((24)(6223b a b a x x a b ba++=-⎰πd π例4.7 设国际市场每年对我国某种出口商品的需求量X 〔吨〕服从区间[2000,4000]上的均匀分布.假设售出这种商品1吨,可挣得外汇3万元,但假设销售不出而囤积于仓库,那么每吨需保管费1万元.问应预备多少吨这种商品,才能使国家的收益最大? 解设预备这种商品y 吨〔2000≤y ≤4000〕,那么收益〔万元〕为g 〔X 〕=⎩⎨⎧<--≥.),(3,,3y X X y X y X y那么 E [g 〔X 〕]=⎰⎰-⋅=+∞∞-40002000200040001)()()(x x g x x f x g d d=[]⎰⎰+--40002000320001)(320001y y x y x x y x d d =)1047000(1000162⨯-+-y y . 当y =3500吨时,上式到达最大值.所以预备3500吨此种商品能使国家的收益最大,最大收益为8250万元.例4.8 设二维随机变量〔X ,Y 〕在区域A 上服从均匀分布,其中A 为x 轴,y 轴及直线x +2y=1所围成的三角区域,求E 〔X 〕,E 〔Y 〕,E 〔XY 〕. 解 由于〔X ,Y 〕在A 内服从均匀分布,所以其概率密度f 〔x ,y 〕=⎪⎩⎪⎨⎧⎩⎨⎧∉∈=∉∈.),(,0,),(,1,),(,0,),(,1A y x A y x A y x A y x A 的面积 E 〔X 〕=12(1)001(,)d d d d d d ;3x Axf x y x y x x y x x y +∞+∞--∞-∞===⎰⎰⎰⎰⎰⎰E 〔Y 〕=2122(,)d d d d d d ;3y Ayf x y x y y x y y y x +∞+∞--∞-∞===⎰⎰⎰⎰⎰⎰E 〔XY 〕=;61)1(2),()1(2010210⎰⎰⎰⎰⎰+∞∞-+∞∞--=-==x x x x y y x x y x y x xyf d d d d d3.数学期望的性质下面讨论数学期望的几条重要性质.定理4.2 设随机变量X ,Y 的数学期望E 〔X 〕,E 〔Y 〕存在. 1°E 〔c 〕=c ,其中c 是常数; 2°E 〔cX 〕=cE 〔X 〕;3°E 〔X +Y 〕=E 〔X 〕+E 〔Y 〕;4°假设X ,Y 是互相独立的,那么有E 〔XY 〕=E 〔X 〕E 〔Y 〕.证 就连续型的情况我们来证明性质3°、4°,离散型情况和其他性质的证明留给读者. 3°设二维随机变量〔X ,Y 〕的概率密度为f 〔x ,y 〕,其边缘概率密度为f X 〔x 〕,f Y 〔y 〕,那么E 〔X +Y 〕=⎰⎰+∞∞-+∞∞-+y x y x f y x d d ),()(=⎰⎰⎰⎰+∞∞-+∞∞-+∞∞-+∞∞-+y x y x yf y x y x xf d d d d ),(),(=)()()()(Y E X E y y yf x x xf Y X +=+⎰⎰+∞∞-+∞∞-d d .4°又假设X 和Y 互相独立,此时f 〔x ,y 〕=f X 〔x 〕f Y 〔y 〕,故E 〔XY 〕=⎰⎰⎰⎰+∞∞-+∞∞-+∞∞-+∞∞-=y x y f x xyf y x y x xyf Y X d d d d )()(),(=).()()()(Y E X E y y yf x x xf Y X =⋅⎰⎰+∞∞-+∞∞-d d性质3°可推广到任意有限个随机变量之和的情形;性质4°可推广到任意有限个互相独立的随机变量之积的情形.例4.9 设一电路中电流I 〔安〕与电阻R 〔欧〕是两个互相独立的随机变量,其概率密度分别为g 〔i 〕=⎩⎨⎧≤≤.,0,10,2其他i i h 〔r 〕=⎪⎩⎪⎨⎧≤≤.,0,30,92其他r r试求电压V =IR 的均值.解 E 〔V 〕=E 〔IR 〕=E 〔I 〕E 〔R 〕=2392)()(303102=⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡⎰⎰⎰⎰∞+∞-∞+∞-r r i i r r rh i i ig d d d d 〔伏〕. 例4.10 设对某一目的进展射击,命中n 次才能彻底摧毁该目的,假定各次射击是独立的,并且每次射击命中的概率为p ,试求彻底摧毁这一目的平均消耗的炮弹数.解 设X 为n 次击中目的所消耗的炮弹数,X k 表示第k -1次击中后至k 次击中目的之间所消耗的炮弹数,这样,X k 可取值1,2,3,…,其分布律见表4-6.表4-61X =X 1+X 2+…+X n .由性质3°可得E 〔X 〕=E 〔X 1〕+E 〔X 2〕+…+E 〔X n 〕=nE 〔X 1〕. 又 E〔X 1〕=,111pkpq k k =∑∞=- 故 E 〔X 〕=pn . 4.常用分布的数学期望 〔1〕 两点分布 那么X 的数学期望为E 〔X 〕=0×〔1-p 〕+1×p =p .〔2〕 二项分布设X 服从二项分布,其分布律为P {X =k }=kn k k n p p --)1(C , 〔k =0,1,2,…,n 〕,〔0<p <1〕.那么X 的数学期望为E 〔X 〕=∑∑==----=-nk nk k n k kn kknp p k n k n kp p k 0)1()!(!!)1(C=[]∑=----------nk k n k p pk n k n np)]1()1[(1)1(!)1()1()!1()!1(,令k -1=t ,那么E 〔X 〕=[]∑-=------10])1[()1(!)1(!)!1(n t t n t p p t n t n np=np [p +〔1-p 〕]n -1=np .假设利用数学期望的性质,将二项分布表示为n 个互相独立的0-1分布的和,计算过程将简单得多.事实上,假设设X 表示在n 次独立重复试验中事件A 发生的次数,X i 〔i =1,2,…,n 〕表示A 在第i 次试验中出现的次数,那么有X =1nii X=∑.显然,这里X所以E 〔X i 〕=p ,i =1,2,…,n .由定理4.2的性质3°有E 〔X 〕=∑∑===⎪⎭⎫ ⎝⎛ni i n i i X E X E 11)( =np .〔3〕 泊松分布设X 服从泊松分布,其分布律为P {X =k }=λλ-e !k k, 〔k =0,1,2,…〕,〔λ>0〕.那么X 的数学期望为E 〔X 〕=∑∑∞=--∞=--=11)!1(!k k k kk k k λλλλλee,令k -1=t ,那么有E 〔X 〕=.!0λλλλλλλ=⋅=-∞=-∑e e ek tt .〔4〕 均匀分布设X 服从[a ,b ]上的均匀分布,其概率密度函数为f 〔x 〕=⎪⎩⎪⎨⎧≤≤-.,0,,1其他b x a a b那么X 的数学期望为E 〔X 〕=.2)(ba x ab x x x xf ba +=-=⎰⎰+∞∞-d d . 〔5〕 指数分布设X 服从指数分布,其分布密度为f 〔x 〕=⎩⎨⎧<≥-.0,0,0,x x x λλe那么X 的数学期望为E 〔X 〕=1()d e d x xf x x x x λλλ+∞+∞--∞-∞==⎰⎰.〔6〕 正态分布设X ~N 〔μ,σ2〕,其分布密度为f 〔x 〕=222)(21σμσ--x e π,那么X 的数学期望为E 〔X 〕=22()2()d ed ,x xf x x x x μσ--+∞+∞-∞-∞=⎰令σμ-x =t ,那么E 〔X 〕=⎰∞+∞--+t t t d e π22)(21σμ 注意到t t d eπ⎰∞+∞--222μ=μ,t σt t d e π⎰∞+∞--2221=0,故有E 〔X 〕=μ.第二节 方 差1.方差的定义数学期望描绘了随机变量取值的“平均〞.有时仅知道这个平均值还不够.例如,有A ,B 两名射手,他们每次射击命中的环数分别为X ,Y ,X ,Y 的分布律为:由于E 〔X 〕=E 〔Y 〕=9〔环〕,可见从均值的角度是分不出谁的射击技术更高,故还需考虑其他的因素.通常的想法是:在射击的平均环数相等的条件下进一步衡量谁的射击技术更稳定些.也就是看谁命中的环数比较集中于平均值的附近,通常人们会采用命中的环数X 与它的平均值E 〔X 〕之间的离差|X -E 〔X 〕|的均值E [|X -E 〔X 〕|]来度量,E [|X -E 〔X 〕|]愈小,说明X 的值愈集中于E 〔X 〕的附近,即技术稳定;E [|X -E 〔X 〕|]愈大,说明X 的值很分散,技术不稳定.但由于E [|X -E 〔X 〕|]带有绝对值,运算不便,故通常采用X 与E 〔X 〕的离差|X -E 〔X 〕|的平方平均值E [X -E 〔X 〕]2来度量随机变量X 取值的分散程度.此例中,由于E [X -E 〔X 〕]2=0.2×〔8-9〕2+0.6×〔9-9〕2+0.2×〔10-9〕2=0.4, E [Y -E 〔Y 〕]2=0.1×〔8-9〕2+0.8×〔9-9〕2+0.1×〔10-9〕2=0.2.由此可见B 的技术更稳定些.定义4.2 设X 是一个随机变量,假设E [X -E 〔X 〕]2存在,那么称E [X -E 〔X 〕]2为X 的方差〔Variance 〕,记为D 〔X 〕,即D 〔X 〕=E [X -E 〔X 〕]2. 〔4.7〕 称)(X D 为随机变量X 的标准差〔Standard deviation 〕或均方差〔Mean square deviation 〕,记为σ〔X 〕.根据定义可知,随机变量X 的方差反映了随机变量的取值与其数学期望的偏离程度.假设X 取值比较集中,那么D 〔X 〕较小,反之,假设X 取值比较分散,那么D 〔X 〕较大. 由于方差是随机变量X 的函数g 〔X 〕=[X -E 〔X 〕]2的数学期望.假设离散型随机变量X 的分布律为P {X =x k }=p k ,k =1,2,…,那么D 〔X 〕=k k kp X E x∑∞=-12)]([. 〔4.8〕假设连续型随机变量X 的概率密度为f 〔x 〕,那么D 〔X 〕=⎰+∞∞--.)()]([2x x f X E x d 〔4.9〕由此可见,方差D 〔X 〕是一个常数,它由随机变量的分布惟一确定.根据数学期望的性质可得:D 〔X 〕=E [X -E 〔X 〕]2=E [X 2-2X ·E 〔X 〕+[E 〔X 〕]2]=E 〔X 2〕-2E 〔X 〕·E 〔X 〕+[E 〔X 〕]2=E 〔X 2〕-[E 〔X 〕]2.于是得到常用计算方差的简便公式D 〔X 〕=E 〔X 2〕-[E 〔X 〕]2. 〔4.10〕例4.11 设有甲,乙两种棉花,从中各抽取等量的样品进展检验,结果如下表:其中X ,Y 分别表示甲,乙两种棉花的纤维的长度〔单位:毫米〕,求D 〔X 〕与D 〔Y 〕,且评定它们的质量.解 由于E 〔X 〕=28×0.1+29×0.15+30×0.5+31×0.15+32×0.1=30, E 〔Y 〕=28×0.13+29×0.17+30×0.4+31×0.17+32×0.13=30,故得D 〔X 〕=〔28-30〕2×0.1+〔29-30〕2×0.15+〔30-30〕2×0.5+〔31-30〕2×0.15+〔32-30〕2×0.1=4×0.1+1×0.15+0×0.5+1×0.15+4×0.1=1.1,D 〔Y 〕=〔28-30〕2×0.13+〔29-30〕2×0.17+〔30-30〕2×0.4+〔31-30〕2×0.17+〔32-30〕2×0.13=4×0.13+1×0.17+0×0.4+1×0.17+4×0.13=1.38.因D 〔X 〕<D 〔Y 〕,所以甲种棉花纤维长度的方差小些,说明其纤维比较均匀,故甲种棉花质量较好.例4.12 设随机变量X 的概率密度为f 〔x 〕=⎪⎩⎪⎨⎧<≤-<≤-+.,0,10,1,01,1其他x x x x求D 〔X 〕.解 E 〔X 〕=⎰⎰-++-11)1()1(x x x x x x d d =0,E 〔X 2〕=⎰⎰-++-12012)1()1(x x x x x x d d =1/6,于是 D 〔X 〕=E 〔X 2〕-[E 〔X 〕]2=1/6.2.方差的性质方差有下面几条重要的性质.设随机变量X 与Y 的方差存在,那么 1°设c 为常数,那么D 〔c 〕=0;2°设c 为常数,那么D 〔cX 〕=c 2D 〔X 〕; 3°D 〔X ±Y 〕=D 〔X 〕+D 〔Y 〕±2E [〔X -E 〔X 〕〕〔Y -E 〔Y 〕〕]; 4°假设X ,Y 互相独立,那么D 〔X ±Y 〕=D 〔X 〕+D 〔Y 〕; 5°对任意的常数c ≠E 〔X 〕,有D 〔X 〕<E [〔X -c 〕2]. 证 仅证性质4°,5°. 4°D 〔X ±Y 〕=E [〔X ±Y 〕-E 〔X ±Y 〕]2=E [〔X -E 〔X 〕〕±〔Y -E 〔Y 〕〕]2=E [X -E 〔X 〕]2±2E [〔X -E 〔X 〕〕〔Y -E 〔Y 〕〕]+E [Y -E 〔Y 〕]2 =D 〔X 〕+D 〔Y 〕±2E [〔X -E 〔X 〕〕〔Y -E 〔Y 〕〕].当X 与Y 互相独立时,X -E 〔X 〕与Y -E 〔Y 〕也互相独立,由数学期望的性质有E [〔X -E 〔X 〕〕〔Y -E 〔Y 〕〕]=E 〔X -E 〔X 〕〕E 〔Y -E 〔Y 〕〕=0.因此有D 〔X ±Y 〕=D 〔X 〕+D 〔Y 〕.性质4°可以推广到任意有限多个互相独立的随机变量之和的情况.5°对任意常数c ,有E [〔X -c 〕2]=E [〔X -E 〔X 〕+E 〔X 〕-c 〕2]=E [〔X -E 〔X 〕〕2]+2〔E 〔X 〕-c 〕·E [X -E 〔X 〕]+〔E 〔X 〕-c 〕2=D 〔X 〕+〔E 〔X 〕-c 〕2.故对任意常数c ≠EX ,有DX <E [〔X -c 〕2].例4.13 设随机变量X 的数学期望为E 〔X 〕,方差D 〔X 〕=σ2〔σ>0〕,令Y =σ)(X E X -,求E 〔Y 〕,D 〔Y 〕.解 E 〔Y 〕=[],0)()(1)]([1)(=-=-=⎥⎦⎤⎢⎣⎡-X E X E X E X E X E X E σσσ D 〔Y 〕=.1)(1)]([1)(2222===-=⎥⎦⎤⎢⎣⎡-σσσσσX D X E X D X E X D 常称Y 为X 的标准化随机变量.例4.14 设X 1,X 2,…,X n 互相独立,且服从同一〔0-1〕分布,分布律为P {X i =0}=1-p ,P {X i =1}=p , i =1,2,…,n .证明 X =X 1+X 2+…+X n 服从参数为n ,p 的二项分布,并求E 〔X 〕和D 〔X 〕.解 X 所有可能取值为0,1,…,n ,由独立性知X 以特定的方式〔例如前k 个取1,后n -k 个取0〕取k 〔0≤k ≤n 〕的概率为p k 〔1-p 〕n -k,而X 取k 的两两互不相容的方式共有knC 种,故P {X =k }=kn C p k 〔1-p 〕n -k , k =0,1,2,…,n ,即X 服从参数为n ,p 的二项分布. 由于E 〔X i 〕=0×〔1-p 〕+1×p =p ,D 〔X i 〕=〔0-p 〕2×〔1-p 〕+〔1-p 〕2×p =p 〔1-p 〕, i =1,2,…,n ,故有E 〔X 〕=.)(11np X E X E ni i n i i ==⎪⎭⎫ ⎝⎛∑∑==由于X 1,X 2,…,X n 互相独立,得D 〔X 〕= ).1()(11p np X D X D ni i n i i -==⎪⎭⎫ ⎝⎛∑∑==3.常用分布的方差 〔1〕 〔0-1〕分布设X 服从参数为p 的0-1分布,其分布律为由例4.14知,D 〔X 〕=p 〔1-p 〕. 〔2〕 二项分布设X 服从参数为n ,p 的二项分布,由例4.14知,D 〔X 〕=np 〔1-p 〕. 〔3〕 泊松分布设X 服从参数为λ的泊松分布,由上一节知E 〔X 〕=λ,又E 〔X 2〕=E [X 〔X -1〕+X ]=E [X 〔X -1〕]+E 〔X 〕=∑∑∞=--∞=-+-=+-2220)!2(!)1(k k k kk k k k λλλλλλλee=λ2e -λ·e λ+λ=λ2+λ,从而有D 〔X 〕=E 〔X 2〕-[E 〔X 〕]2=λ2+λ -λ2=λ.〔4〕 均匀分布设X 服从[a ,b ]上的均匀分布,由上一节知E 〔X 〕=2ba +,又 E 〔X 2〕=3222b ab a x a b x ba ++=-⎰d , 所以D 〔X 〕=E 〔X 2〕-[E 〔X 〕]2=12)()(41)(312222a b b a b ab a -=+-++.〔5〕 指数分布设X 服从参数为λ的指数分布,由上一节知.E 〔X 〕=1/λ,又E 〔X 2〕=222λλλ=⎰-bax x x d e ,所以D 〔X 〕=E 〔X 2〕-[E 〔X 〕]2=.112222λλλ=⎪⎭⎫⎝⎛-〔6〕 正态分布 设X ~N 〔μ,σ2〕,由上一节知E 〔X 〕=μ,从而D 〔X 〕=[]⎰⎰∞+∞--∞+∞--=--d e πd x x x x f X E x x 222)(2221)()()(σμσμ令σμ-x =t 那么D 〔X 〕=)(22222222222⎰⎰∞+∞--∞+∞--∞+∞--+-=t t t t t t t d eeπd eπσσ=)20(22ππ+σ =σ2.由此可知:正态分布的概率密度中的两个参数μ和σ分别是该分布的数学期望和均方差.因此正态分布完全可由它的数学期望和方差所确定.再者,由上一章第五节例3.17知道,假设X i ~N 〔μi ,σi 2〕,i =1,2,…,n ,且它们互相独立,那么它们的线性组合c 1X 1+c 2X 2+…+c n X n 〔c 1,c 2,…,c n 是不全为零的常数〕仍然服从正态分布.于是由数学期望和方差的性质知道:c 1X 1+c 2X 2+…+c n X n ~⎪⎭⎫⎝⎛∑∑==n i ni i i i i c c N 1122,σμ.这是一个重要的结果.例4.15 设活塞的直径〔以cm 计〕X ~N 〔22.40,0.032〕,气缸的直径Y ~N 〔22.50,0.042〕,X ,Y 互相独立,任取一只活塞,任取一只气缸,求活塞能装入气缸的概率. 解按题意需求P {X <Y }=P {X -Y <0}. 令Z =X -Y ,那么E 〔Z 〕=E 〔X 〕-E 〔Y 〕=22.40-22.50=-0.10, D 〔Z 〕=D 〔X 〕+D 〔Y 〕=0.032+0.042=0.052,即Z ~N 〔-0.10,0.052〕, 故有P {X <Y }=P {Z <0}=⎪⎭⎫⎝⎛Φ=⎭⎬⎫⎩⎨⎧--<--05.010.005.0)10.0(005.0)10.0(Z P =Φ〔2〕=0.9772.第三节 协方差与相关系数对于二维随机变量〔X ,Y 〕,数学期望E 〔X 〕,E 〔Y 〕只反映了X 和Y 各自的平均值,而D 〔X 〕,D 〔Y 〕反映的是X 和Y 各自偏离平均值的程度,它们都没有反映X 与Y 之间的关系.在实际问题中,每对随机变量往往互相影响、互相联络.例如,人的年龄与身高;某种产品的产量与价格等.随机变量的这种互相联络称为相关关系,它们也是一类重要的数字特征,本节讨论有关这方面的数字特征.定义4.3 设〔X ,Y 〕为二维随机变量,称E {[X -E 〔X 〕][Y -E 〔Y 〕]}为随机变量X ,Y 的协方差〔Covariance 〕,记为Cov 〔X ,Y 〕,即Cov 〔X ,Y 〕=E {[X -E 〔X 〕][Y -E 〔Y 〕]}. 〔4.11〕 而)()(),cov(Y D X D Y X 称为随机变量X ,Y 的相关系数〔Correlation coefficient 〕或标准协方差〔Standard covariance 〕,记为ρXY ,即ρXY =)()(),cov(Y D X D Y X . 〔4.12〕特别地,Cov 〔X ,X 〕=E {[X -E 〔X 〕][X -E 〔X 〕]}=D 〔X 〕, Cov 〔Y ,Y 〕=E {[Y -E 〔Y 〕][Y -E 〔Y 〕]}=D 〔Y 〕.故方差D 〔X 〕,D 〔Y 〕是协方差的特例.由上述定义及方差的性质可得D 〔X ±Y 〕=D 〔X 〕+D 〔Y 〕±2Cov 〔X ,Y 〕.由协方差的定义及数学期望的性质可得以下实用计算公式Cov 〔X ,Y 〕=E 〔XY 〕-E 〔X 〕E 〔Y 〕. 〔4.13〕假设〔X ,Y 〕为二维离散型随机变量,其结合分布律为P {X =x i ,Y =y j }=p ij ,i ,j =1,2,…,那么有Cov 〔X ,Y 〕=[][]∑∑--ijijiipY E y X E x )()(. 〔4.14〕假设〔X ,Y 〕为二维连续型随机变量,其概率密度为f 〔x ,y 〕,那么有Cov 〔X ,Y 〕=[][]⎰⎰+∞∞-+∞∞---y x y x f Y E y X E x d d ),()()(. 〔4.15〕例4.16 设〔X ,Y 〕的分布律为表4-120<p <1,求Cov 〔X ,Y 〕和XY .解 易知X 的分布律为P {X =1}=p ,P {X =0}=1-p ,故 E 〔X 〕=p , D 〔X 〕=p 〔1-p 〕.同理E 〔Y 〕=p ,D 〔Y 〕=p 〔1-p 〕,因此Cov 〔X ,Y 〕=E 〔XY 〕-E 〔X 〕·E 〔Y 〕=p -p 2=p 〔1-p 〕, 而ρXY =1)1()1()1(),cov(=-⋅--=⋅p p p p p p DY DX Y X例4.17 设〔X ,Y 〕的概率密度为f 〔x ,y 〕=⎩⎨⎧<<<<+.,0,10,10,其他y x y x求Cov 〔X ,Y 〕.解 由于f X 〔x 〕=⎪⎩⎪⎨⎧<<+,,0,10,21其他x x f Y 〔y 〕=⎪⎩⎪⎨⎧<<+.,0,10,21其他y y E 〔X 〕=127)21(10=+⎰x x x d ,E 〔Y 〕=127)21(10=+⎰y y y d ,E 〔XY 〕=31)(10102101021010=+=+⎰⎰⎰⎰⎰⎰y x xy y x y x y x y x xy d d d d d d因此 Cov 〔X ,Y 〕=E 〔XY 〕-E 〔X 〕E 〔Y 〕=144112712731-=⨯-. 协方差具有以下性质:1°假设X 与Y 互相独立,那么Cov 〔X ,Y 〕=0; 2°Cov 〔X ,Y 〕=Cov 〔Y ,X 〕; 3°Cov 〔aX ,bY 〕=ab Cov 〔X ,Y 〕;4°Cov 〔X 1+X 2,Y 〕=Cov 〔X 1,Y 〕+Cov 〔X 2,Y 〕. 证 仅证性质4°,其余留给读者.Cov 〔X 1+X 2,Y 〕 =E [〔X 1+X 2〕Y ]-E 〔X 1+X 2〕E 〔Y 〕=E 〔X 1Y 〕+E 〔X 2Y 〕-E 〔X 1〕E 〔Y 〕-E 〔X 2〕E 〔Y 〕 =[E 〔X 1Y 〕-E 〔X 1〕E 〔Y 〕]+[E 〔X 2Y 〕-E 〔X 2〕E 〔Y 〕] =Cov 〔X 1,Y 〕+Cov 〔X 2,Y 〕.下面给出相关系数ρXY 的几条重要性质,并说明ρXY 的含义.定理4.3 设D 〔X 〕>0,D 〔Y 〕>0,ρXY 为〔X ,Y 〕的相关系数,那么 1°假设X ,Y 互相独立,那么ρXY =0; 2°|ρXY |≤1;3°|ρXY |=1的充要条件是存在常数a ,b 使P {Y =aX +b }=1〔a ≠0〕. 证 由协方差的性质1°及相关系数的定义可知1°成立. 2°对任意实数t ,有D 〔Y -tX 〕=E [〔Y -tX 〕-E 〔Y -tX 〕]2=E [〔Y -E 〔Y 〕〕-t 〔X -E 〔X 〕〕]2 =E [Y -E 〔Y 〕]2-2tE [Y -E 〔Y 〕][X -E 〔X 〕]+t 2E [X -E〔X 〕]2=t 2D 〔X 〕-2t Cov 〔X ,Y 〕+D 〔Y 〕=[])(),cov()()(),cov()(22X D Y X Y D X D Y X t X D -+⎥⎦⎤⎢⎣⎡-. 令t =)(),cov(X D Y X =b ,于是D 〔Y -bX 〕=[][]).1)(()()(),cov(1)()(),cov()(222XY Y D Y D X D Y X Y D X D Y X Y D ρ-=⎥⎦⎤⎢⎣⎡-=-由于方差不能为负,所以1-2XY ρ≥0,从而|ρXY |≤1.性质3°的证明较复杂,从略.当ρXY =0时,称X 与Y 不相关,由性质1°可知,当X 与Y 互相独立时,ρXY =0,即X 与Y 不相关.反之不一定成立,即X 与Y 不相关,X 与Y 却不一定互相独立.例4.18 设X 服从[0,2π]上均匀分布,Y =cos X ,Z =cos 〔X +a 〕,这里a 是常数.求ρYZ .解 E 〔Y 〕=⎰⋅πd π2021cos x x =0, E 〔Z 〕= ⎰+πd π20)cos(21x a x =0, D 〔Y 〕=E {[Y -E 〔Y 〕]2}=21cos 21202=⎰πd πx x , D 〔Z 〕=E {[Z -E 〔Z 〕]2}=21)(cos 21202=+⎰πd πx a x , Cov 〔Y ,Z 〕=E {[Y -E 〔Y 〕][Z -E 〔Z 〕]}= a x a x x cos 21)cos(cos 2120=+•⎰πd π, 因此 ρYZ =.cos 2121cos 21)()(),cov(a a Z D Y D Z Y =⋅=⋅ ① 当a =0时,ρYZ =1,Y =Z ,存在线性关系;② 当a=π时,ρYZ =-1,Y =-Z ,存在线性关系; ③ 当a =2π或23π时,ρYZ =0,这时Y 与Z 不相关,但这时却有Y 2+Z 2=1,因此,Y 与Z不独立.这个例子说明:当两个随机变量不相关时,它们并不一定互相独立,它们之间还可能存在其他的函数关系.定理4.3 告诉我们,相关系数ρXY 描绘了随机变量X ,Y 的线性相关程度,|ρXY |愈接近1,那么X 与Y 之间愈接近线性关系.当|ρXY |=1时,X 与Y 之间依概率1线性相关.不过,下例说明当〔X ,Y 〕是二维正态随机变量时,X 和Y 不相关与X 和Y 互相独立是等价的.例4.19 设〔X ,Y 〕服从二维正态分布,它的概率密度为f 〔x ,y 〕=⨯-221121ρσσπ⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⎥⎦⎤⎢⎣⎡-+------2222212121212)())((2)()1(21exp σμσσμμρσμρy y x x 求Cov 〔X ,Y 〕和ρXY .解 可以计算得〔X ,Y 〕的边缘概率密度为f X 〔x 〕=21212)(121σμσ--x e π,-∞<x <+∞,f Y 〔y 〕=22222)(221σμσ--x e π,-∞<y <+∞,故E 〔X 〕=μ1,E 〔Y 〕=μ2, D 〔X 〕=σ12,D 〔Y 〕=σ22. 而Cov 〔X ,Y 〕=⨯-=--⎰⎰+∞∞-+∞∞-22121121),()()(ρσπσμμy x y x f y x d dy x y x x y x d d ee-2112222121)1(212)(21)()(⎥⎦⎤⎢⎣⎡------∞+∞-∞+∞---⎰⎰σμρσμρσμμμ令t =⎪⎪⎭⎫⎝⎛----1122211σμρσμρx y ,u =11σμ-x ,那么 Cov 〔X ,Y 〕=⎰⎰∞+∞-∞+∞---+-u t u tu t u d d e π2222122122)1(21σρσρσσ =⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛⎰⎰∞+∞--∞+∞--t e u u t u d d e π22221222ρσσ +⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫⎝⎛-⎰⎰∞+∞--∞+∞--t t u u t u d e d eπ222212221ρσσ =.2222121σρσσρσ=⋅πππ于是ρXY=ρ.这说明二维正态随机变量〔X ,Y 〕的概率密度中的参数ρ就是X 和Y 的相关系数,从而二维正态随机变量的分布完全可由X ,Y 的各自的数学期望、方差以及它们的相关系数所确定.由上一章讨论可知,假设〔X ,Y 〕服从二维正态分布,那么X 和Y 互相独立的充要条件是ρ=0,即X 与Y 不相关.因此,对于二维正态随机变量〔X ,Y 〕来说,X 和Y 不相关与X 和Y 互相独立是等价的.第四节 矩、协方差矩阵数学期望、方差、协方差是随机变量最常用的数字特征,它们都是特殊的矩〔Moment 〕.矩是更广泛的数字特征.定义4.4 设X 和Y 是随机变量,假设E 〔X k 〕,k =1,2,…存在,称它为X 的k 阶原点矩,简称k 阶矩.假设 E [X -E 〔X 〕]k , k =1,2,… 存在,称它为X 的k 阶中心矩.假设 E 〔X k Y l 〕, k ,l =1,2,… 存在,称它为X 和Y 的k +l 阶混合矩.假设 E {[X -E 〔X 〕]k [Y -E 〔Y 〕]l } 存在,称它为X 和Y 的k +l 阶混合中心矩.显然,X 的数学期望E 〔X 〕是X 的一阶原点矩,方差D 〔X 〕是X 的二阶中心矩,协方差Cov 〔X ,Y 〕是X 和Y 的1+1阶混合中心矩.当X 为离散型随机变量,其分布律为P {X =x i }=p i ,那么E 〔X k〕=∑∞=1i i kip x,E [X -E 〔X 〕]k=1[()]kii i x E X p ∞=-∑.当X 为连续型随机变量,其概率密度为f 〔x 〕,那么E 〔X k 〕=⎰+∞∞-x x f x k d )(,E [X -E 〔X 〕]k =⎰+∞∞--x x f X E x k d )()]([.下面介绍n 维随机变量的协方差矩阵.设n 维随机变量〔X 1,X 2,…,X n 〕的1+1阶混合中心矩σij =Cov 〔X i ,X j 〕=E {[X i -E 〔X i 〕][X j -E 〔X j 〕]}, i ,j =1,2,…,n都存在,那么称矩阵Σ=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡nn n n n n σσσσσσσσσ 212222111211 为n 维随机变量〔X 1,X 2,…,X n 〕的协方差矩阵. 由于σij =σji 〔i ,j =1,2,…,n 〕,因此Σ是一个对称矩阵. 协方差矩阵给出了n 维随机变量的全部方差及协方差,因此在研究n 维随机变量的统计规律时,协方差矩阵是很重要的.利用协方差矩阵还可以引入n 维正态分布的概率密度. 首先用协方差矩阵重写二维正态随机变量〔X 1,X 2〕的概率密度. f 〔x 1,x 2〕=221121ρσσ-π×.)())((2)()1(21exp 22222212211212112⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⎥⎦⎤⎢⎣⎡-+------σμσσμμρσμρx x x x 令X =⎪⎪⎭⎫⎝⎛21x x ,μ=⎪⎪⎭⎫⎝⎛21μμ,〔X 1,X 2〕的协方差矩阵为 Σ=.2121212122211211⎪⎪⎭⎫⎝⎛=⎪⎪⎭⎫ ⎝⎛σσρσσρσσσσσσ 它的行列式|Σ|=σ12σ22〔1-ρ2〕,逆阵Σ-1=.121212122⎪⎪⎭⎫⎝⎛--σσρσσρσσ∑ 由于 〔X -μ〕T Σ-1〔X -μ〕= .),(12211212121222211⎪⎪⎭⎫⎝⎛--⎪⎪⎭⎫ ⎝⎛----μμσσρσσρσσμμx x x x ∑ =,)())((2)(1122222212211212112⎥⎦⎤⎢⎣⎡-+-----σμσσμμρσμρx x x x , 因此〔X 1,X 2〕的概率密度可写成f 〔x 1,x 2〕=.)()(21exp 211⎭⎬⎫⎩⎨⎧----μ∑μ∑X X T π上式容易推广到n 维的情形.设〔X 1,X 2,…,X n 〕是n 维随机变量,令X =⎪⎪⎪⎪⎪⎭⎫ ⎝⎛n x x x 21, μ=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛)()()(2121n n X E X E X E μμμ, 定义n 维正态随机变量〔X 1,X 2,…,X n 〕的概率密度为f 〔x 1,x 2,…,x n 〕=111exp ()().2(2T nX X πμμ-⎧⎫--∑-⎨⎬⎩⎭其中Σ是〔X 1,X 2,…,X n 〕的协方差矩阵.n 维正态随机变量具有以下几条重要性质: 1°n 维随机变量〔X 1,X 2,…,X n 〕服从n 维正态分布的充要条件是X 1,X 2,…,X n的任意的线性组合l 1X 1+l 2X 2+…+l n X n服从一维正态分布.〔其中l 1,l 2,…,l n 不全为零〕.2°假设〔X 1,X 2,…,X n 〕服从n 维正态分布,设Y 1,Y 2,…,Y k 是X 1,X 2,…,X n 的线性函数,那么〔Y 1,Y 2,…,Y k 〕服从k 维正态分布.3°设〔X 1,X 2,…,X n 〕服从n 维正态分布,那么X 1,X 2,…,X n 互相独立的充要条件是X 1,X 2,…,X n 两两不相关.小结随机变量的数字特征是由随机变量的分布确定的,能描绘随机变量某一个方面的特征的常数.最重要的数字特征是数学期望和方差.数学期望E〔X〕描绘随机变量X取值的平均大小,方差D〔X〕=E{[X-E〔X〕]2}描绘随机变量X与它自己的数学期望E〔X〕的偏离程度.数学期望和方差虽不能像分布函数、分布律、概率密度一样完好地描绘随机变量,但它们能描绘随机变量的重要方面或人们最关心方面的特征,它们在应用和理论上都非常重要.要掌握随机变量的函数Y=g〔X〕的数学期望E〔Y〕=E[g〔X〕]的计算公式〔4.3〕和〔4.4〕.这两个公式的意义在于当我们求E〔Y〕时,不必先求出Y=g〔X〕的分布律或概率密度,而只需利用X的分布律或概率密度就可以了,这样做的好处是明显的.我们常利用公式D〔X〕=E〔X2〕-[E〔X〕]2来计算方差D〔X〕,请注意这里E〔X2〕和[E〔X〕]2的区别.要掌握数学期望和方差的性质,提请读者注意的是:〔1〕当X1,X2独立或X1,X2不相关时,才有E〔X1X2〕=E〔X1〕·E〔X2〕;〔2〕设c为常数,那么有D〔cX〕=c2D〔X〕;〔3〕D〔X1±X2〕=D〔X1〕+D〔X2〕±2Cov〔X1,X2〕,当X1,X2独立或不相关时才有D〔X1+X2〕=D〔X1〕+D〔X2〕.例如:假设X1,X2独立,那么有D〔2X1-3X2〕=4D〔X1〕+9D〔X2〕.相关系数ρXY有时也称为线性相关系数,它是一个可以用来描绘随机变量〔X,Y〕的两个分量X,Y之间的线性关系严密程度的数字特征.当|ρXY|较小时X,Y的线性相关的程度较差;当ρXY=0时称X,Y不相关.不相关是指X,Y之间不存在线性关系,X,Y不相关,它们还可能存在除线性关系之外的关系〔参见第3节例4.18〕,又由于X,Y互相独立是指X,Y的一般关系而言的,因此有以下的结论:X,Y互相独立那么X,Y一定不相关;反之,假设X,Y不相关那么X,Y不一定互相独立.特别,对于二维正态变量〔X,Y,〕,X和Y不相关与X和Y互相独立是等价的.而二元正态变量的相关系数ρXY就是参数ρ.于是,用“ρ=0〞是否成立来检验X,Y是否互相独立是很方便的.重要术语及主题数学期望随机变量函数的数学期望数学期望的性质方差标准差方差的性质协方差相关系数相关系数的性质X,Y不相关矩协方差矩阵分布名称分布律或概率密度期望方差参数范围两点分布P{X=1}=p, P{X=0}=q p pq 0<p<1q=1-p二项分布X~B〔n,p〕P{X=k}=knkknqpC〔k=0,1,2,…,n〕np npq 0<p<1q=1-pn为自然数习 题 四求E 〔X 〕,E 〔X 〕,E 〔2X +3〕.2.100个产品中有10个次品,求任意取出的5个产品中的次品数的数学期望、方差. 1234.袋中有N 只球,其中的白球数X 为一随机变量,E 〔X 〕=n ,问从袋中任取1球为白球的概率是多少?5.设随机变量X 的概率密度为f 〔x 〕=⎪⎩⎪⎨⎧≤≤-<≤.,0,21,2,10,其他x x x x求E 〔X 〕,D 〔X 〕.6.设随机变量X ,Y ,Z 互相独立,且E 〔X 〕=5,E 〔Y 〕=11,E 〔Z 〕=8,求以下随机变量的数学期望.〔1〕 U =2X +3Y +1; 〔2〕 V =YZ -4X .7.设随机变量X ,Y 互相独立,且E 〔X 〕=E 〔Y 〕=3,D 〔X 〕=12,D 〔Y 〕=16,求E 〔3X -2Y 〕,D 〔2X -3Y 〕.8.设随机变量〔X ,Y 〕的概率密度为f 〔x ,y 〕=⎩⎨⎧<<<<.,0,0,10,其他x y x k试确定常数k ,并求E 〔XY 〕.9.设X ,Y 是互相独立的随机变量,其概率密度分别为f X 〔x 〕=⎩⎨⎧≤≤;,0,10,2其他x x f Y 〔y 〕=⎩⎨⎧>--.,0,0,)5(其他y y e 求E 〔XY 〕.10.设随机变量X ,Y 的概率密度分别为f X 〔x 〕=⎩⎨⎧≤>-;0,0,0,22x x x e f Y 〔y 〕=⎩⎨⎧≤>-.0,0,0,44y y y e 求〔1〕 E 〔X +Y 〕;〔2〕 E 〔2X -3Y 2〕.11.设随机变量X 的概率密度为f 〔x 〕=⎪⎩⎪⎨⎧<≥-.0,0,0,22x x cx xke求〔1〕 系数c ;〔2〕 E 〔X 〕;〔3〕 D 〔X 〕.12.袋中有12个零件,其中9个合格品,3个废品.安装机器时,从袋中一个一个地取出〔取出后不放回〕,设在取出合格品之前已取出的废品数为随机变量X ,求E 〔X 〕和D 〔X 〕. 13.一工厂消费某种设备的寿命X 〔以年计〕服从指数分布,概率密度为f 〔x 〕=⎪⎩⎪⎨⎧≤>-.0,0,0,414x x xe为确保消费者的利益,工厂规定出售的设备假设在一年内损坏可以调换.假设售出一台设备,工厂获利100元,而调换一台那么损失200元,试求工厂出售一台设备赢利的数学期望. 14.设X 1,X 2,…,X n 是互相独立的随机变量,且有E 〔X i 〕=μ,D 〔X i 〕=σ2,i =1,2,…,n ,记∑==n i i S X n X 12,1,S 2=∑=--ni i X X n 12)(11. 〔1〕 验证)(X E =μ,)(X D =n2σ;〔2〕 验证S 2=)(11122∑=--ni i X n X n ; 〔3〕 验证E 〔S 2〕=σ2.15.对随机变量X 和Y ,D 〔X 〕=2,D 〔Y 〕=3,Cov 〔X ,Y 〕=-1, 计算:Cov 〔3X -2Y +1,X +4Y -3〕.16.设二维随机变量〔X ,Y 〕的概率密度为f 〔x ,y 〕=⎪⎩⎪⎨⎧≤+.,0,1122其他y x ,π试验证X 和Y 是不相关的,但X 和Y 不是互相独立的.验证X 和Y 是不相关的,但X 和Y 不是互相独立的. 18.设二维随机变量〔X ,Y 〕在以〔0,0〕,〔0,1〕,〔1,0〕为顶点的三角形区域上服从均匀分布,求Cov 〔X ,Y 〕,ρXY . 19.设〔X ,Y 〕的概率密度为f 〔x ,y 〕=⎪⎩⎪⎨⎧≤≤≤≤+.0,20,20),sin(21其他,y x y x ππ求协方差Cov 〔X ,Y 〕和相关系数ρXY . 20.二维随机变量〔X ,Y 〕的协方差矩阵为⎥⎦⎤⎢⎣⎡4111,试求Z 1=X -2Y 和Z 2=2X -Y 的相关系数. 21.对于两个随机变量V ,W ,假设E 〔V 2〕,E 〔W 2〕存在,证明:[E 〔VW 〕]2≤E 〔V 2〕E 〔W 2〕.这一不等式称为柯西许瓦兹〔Couchy -Schwarz 〕不等式.22.假设一设备开机后无故障工作的时间X 服从参数λ=1/5的指数分布.设备定时开机,出现故障时自动关机,而在无故障的情况下工作2小时便关机.试求该设备每次开机无故障工作的时间Y 的分布函数F 〔y 〕. 〔2002研考〕 23.甲、乙两箱中装有同种产品,其中甲箱中装有3件合格品和3件次品,乙箱中仅装有3件合格品.从甲箱中任取3件产品放乙箱后,求:〔1〕乙箱中次品件数Z 的数学期望;〔2〕从乙箱中任取一件产品是次品的概率. 〔2003研考〕 24.假设由自动线加工的某种零件的内径X 〔毫米〕服从正态分布N 〔μ,1〕,内径小于10或大于12为不合格品,其余为合格品.销售每件合格品获利,销售每件不合格品亏损,销售利润T 〔单位:元〕与销售零件的内径X 有如下关系T =⎪⎩⎪⎨⎧>-≤≤<-.12,5,1210,20,10,1X X X 若若若 问:平均直径μ取何值时,销售一个零件的平均利润最大? 〔1994研考〕25.设随机变量X 的概率密度为f 〔x 〕=⎪⎩⎪⎨⎧≤≤.,0,0,2cos 21其他πx x对X 独立地重复观察4次,用Y 表示观察值大于π/3的次数,求Y 2的数学期望.〔2002研考〕26.两台同样的自动记录仪,每台无故障工作的时间T i 〔i =1,2〕服从参数为5的指数分布,首先开动其中一台,当其发生故障时停用而另一台自动开启.试求两台记录仪无故障工作的总时间T =T 1+T 2的概率密度f T 〔t 〕,数学期望E 〔T 〕及方差D 〔T 〕. 〔1997研考〕 27.设两个随机变量X ,Y 互相独立,且都服从均值为0,方差为1/2的正态分布,求随机变量|X -Y |的方差. 〔1998研考〕 28.某流水消费线上每个产品不合格的概率为p 〔0<p <1〕,各产品合格与否互相独立,当出现一个不合格产品时,即停机检修.设开机后第一次停机时已消费了的产品个数为X ,求E 〔X 〕和D 〔X 〕. 〔2000研考〕 29.设随机变量X 和Y 的结合分布在点〔0,1〕,〔1,0〕及〔1,1〕为顶点的三角形区域上服从均匀分布.〔如图〕,试求随机变量U =X +Y 的方差. 〔2001研考〕 30.设随机变量U 在区间[-2,2]上服从均匀分布,随机变量X =⎩⎨⎧->-≤-,U ,U 1,11,1若若 Y =⎩⎨⎧>≤-.1,11,1U ,U 若若试求〔1〕X 和Y 的结合概率分布;〔2〕D 〔X +Y 〕. 〔2002研考〕 31.设随机变量X 的概率密度为f 〔x 〕=x-e 21,〔-∞<x <+∞〕 〔1〕 求E 〔X 〕及D 〔X 〕;〔2〕 求Cov 〔X ,|X |〕,并问X 与|X |是否不相关?〔3〕 问X 与|X |是否互相独立,为什么? 〔1993研考〕 32.随机变量X 和Y 分别服从正态分布N 〔1,32〕和N 〔0,42〕,且X 与Y 的相关系数ρXY =-1/2,设Z =23YX +. 〔1〕 求Z 的数学期望E 〔Z 〕和方差D 〔Z 〕; 〔2〕 求X 与Z 的相关系数ρXZ ;〔3〕 问X 与Z 是否互相独立,为什么? 〔1994研考〕33.将一枚硬币重复掷n 次,以X 和Y 表示正面向上和反面向上的次数.试求X 和Y 的相关系数ρXY . 〔2001研考〕 Y X -1 0 10 10.07 0.18 0.15 0.08 0.32 0.20试求X 和Y 的相关系数. 〔2002研考〕 35.对于任意两事件A 和B ,0<P 〔A 〕<1,0<P 〔B 〕<1,那么称。