第四节随机变量的数字特征

合集下载

概率论与数理统计第四章随机变量的数字特征

概率论与数理统计第四章随机变量的数字特征

第四章 随机变量的数字特征前面讨论了随机变量的分布函数,我们知道分布函数全面地描述了随机变量的统计特性.但是在实际问题中,一方面由于求分布函数并非易事;另一方面,往往不需要去全面考察随机变量的变化情况而只需知道随机变量的某些特征就够了.例如,在考察一个班级学生的学习成绩时,只要知道这个班级的平均成绩及其分散程度就可以对该班的学习情况作出比较客观的判断了.这样的平均值及表示分散程度的数字虽然不能完整地描述随机变量,但能更突出地描述随机变量在某些方面的重要特征,我们称它们为随机变量的数字特征.本章将介绍随机变量的常用数字特征:数学期望、方差、相关系数和矩.第一节 数学期望1.数学期望的定义粗略地说,数学期望就是随机变量的平均值.在给出数学期望的概念之前,先看一个例子.要评判一个射手的射击水平,需要知道射手平均命中环数.设射手A 在同样条件下进行射击,命中的环数X 是一随机变量,其分布律如下:表41X 10 9 8 7 6 5 0 p k0.1 0.1 0.2 0.3 0.1 0.1 0.10.1×N 次击中10环,0.1×N 次击中9环,0.2×N 次击中8环,0.3×N 次击中7环,0.1×N 次击中6环,0.1×N 次击中5环,0.1×N 次脱靶.于是在N 次射击中,射手A 击中的环数之和约为10×0.1N +9×0.1N +8×0.2N +7×0.3N +6×0.1N +5×0.1N +0×0.1N .平均每次击中的环数约为N1(10×0.1N +9×0.1N +8×0.2N +7×0.3N +6×0.1N +5×0.1N +0×0.1N ) =10×0.1+9×0.1+8×0.2+7×0.3+6×0.1+5×0.1+0×0.1 =6.7(环).由这样一个问题的启发,得到一般随机变量的“平均数”,应是随机变量所有可能取值与其相应的概率乘积之和,也就是以概率为权数的加权平均值,这就是所谓“数学期望的概念”.一般地,有如下定义:定义4.1 设离散型随机变量X 的分布律为P {X =x k }=p k k =1,2,…, 若级数∑∞=1k k kp x绝对收敛,则称级数∑∞=1k k kp x为随机变量X 的数学期望(Mathematicalexpectation),记为E (X ).即E (X )=∑∞=1k k kp x. (4.1)设连续型随机变量X 的概率密度为f (x ),若积分⎰+∞∞-x x xf d )(绝对收敛,则称积分⎰+∞∞-x x xf d )(的值为随机变量X 的数学期望,记为E (X ).即E (X )=⎰+∞∞-x x xf d )(. (4.2)数学期望简称期望,又称为均值.例4.1 某商店在年末大甩卖中进行有奖销售,摇奖时从摇箱摇出的球的可能颜色为:红、黄、蓝、白、黑五种,其对应的奖金额分别为:10000元、1000元、100元、10元、1元.假定摇箱内装有很多球,其中红、黄、蓝、白、黑的比例分别为:0.01%,0.15%,1.34%,10%,88.5%,求每次摇奖摇出的奖金额X 的数学期望. 解每次摇奖摇出的奖金额X 是一个随机变量,易知它的分布律为表42X 10000 1000 100 10 1 p k0.0001 0.0015 0.0134 0.1 0.885因此,E (X )=10000×0.0001+1000×0.0015+100×0.0134+10×0.1+1×0.885=5.725. 可见,平均起来每次摇奖的奖金额不足6元.这个值对商店作计划预算时是很重要的.例4.2 按规定,某车站每天8点至9点,9点至10点都有一辆客车到站,但到站的时刻是随机的,且两者到站的时间相互独立.其分布律为表43 到站时刻 8∶10,9∶10 8∶30,9∶30 8∶50,9∶50 概率1/6 3/6 2/6解 设旅客候车时间为X 分钟,易知X 的分布律为表44X 10 30 50 70 90 p k3/6 2/6 1/36 3/36 2/36k P {X =70}=P (AB )=P (A )P (B )=1/6×3/6=3/36,其中A 为事件“第一班车在8:10到站”,B 为事件“第二班车在9:30到站”,于是候车时间的数学期望为E (X )=10×3/6+30×2/6+50×1/36+70×3/36+90×2/36=27.22(分钟).例4.3 有5个相互独立工作的电子装置,它们的寿命X k (k =1,2,3,4,5)服从同一指数分布,其概率密度为f (x )=⎪⎩⎪⎨⎧≤>-.00,0,1/x ,x x θθe(1) 若将这5个电子装置串联起来组成整机,求整机寿命N 的数学期望;(2) 若将这5个电子装置并联组成整机,求整机寿命M 的数学期望. 解 X k (k =1,2,3,4,5)的分布函数为F (x )=⎩⎨⎧≤>--.0,0,0,1/x x x θe(1) 串联的情况由于当5个电子装置中有一个损坏时,整机就停止工作,所以这时整机寿命为N =min{X 1,X 2,X 3,X 4,X 5}.由于X 1,X 2,X 3,X 4,X 5是相互独立的,于是i=min{X 1,X 2,X 3,X 4,X 5}的分布函数为F N (x )=P {N ≤x }=1P {N >x }=1P {X 1>x ,X 2>x ,X 3>x ,X 4>x ,X 5>x }=1P {X 1>x }·P {X 2>x }·P {X 3>x }·P {X 4>x }·P {X 5>x }=1[1)(1x F X ][1 )(2x F X ][1)(3x F X ][1)(4x F X ][1)(5x F X ]=1[1F (x )]5=⎪⎩⎪⎨⎧≤>--.0,0,0,15x x x θe 因此N 的概率密度为f N (x )=⎪⎩⎪⎨⎧≤>-.0,0,0,55x x xθθe则N 的数学期望为E (N )=55)(5θθθ==-∞+∞-∞+∞-⎰⎰x xx x xf xN d ed(2) 并联的情况由于当且仅当5个电子装置都损坏时,整机才停止工作,所以这时整机寿命为M =max{X 1,X 2,X 3,X 4,X 5}.由于X 1,X 2,X 3,X 4,X 5相互独立,类似可得M 的分布函数为F M (x )=[F (x )]5=⎪⎩⎪⎨⎧≤>--.0,0,0,)1(5x x x θe 因而M 的概率密度为f M (x )=⎪⎩⎪⎨⎧≤>---.0,0,0,]1[54x x x x θθθe e于是M 的数学期望为E (M )=.60137)1(5)(0max θθθ=-=-∞+∞-∞+⎰⎰x xx x xf xd e d 这说明:5个电子装置并联联接工作的平均寿命要大于串联联接工作的平均寿命.例4.4 设随机变量X 服从柯西(Cauchy )分布,其概率密度为f (x )=)1(12x +π,x <x <+∞, 试证E (X )不存在.证 由于,)1(1)(2⎰⎰+∞∞-+∞∞-∞=+=x x xx x f x d πd 故E (X )不存在.2.随机变量函数的数学期望在实际问题与理论研究中,我们经常需要求随机变量函数的数学期望.这时,我们可以通过下面的定理来实现.定理4.1 设Y 是随机变量X 的函数Y =g (X )(g 是连续函数). (1) X 是离散型随机变量,它的分布律为P (X =x k )=p k ,k =1,2,…,若kk kp x g ∑∞=1)(绝对收敛,则有E (Y )=E [g (X )]=kk kp x g ∑∞=1)(. (4.3)(2) X 是连续型随机变量,它的概率密度为f (x ),若⎰+∞∞-x x f x g d )()(绝对收敛,则有E (Y )=E [g (X )]=⎰+∞∞-x x f x g d )()(. (4.4)定理4.4的重要意义在于当我们求E (Y )时,不必知道Y 的分布而只需知道X 的分布就可以了.当然,我们也可以由已知的X 的分布,先求出其函数g (X )的分布,再根据数学期望的定义去求E [g (X )],然而,求Y =g (X )的分布是不容易的,所以一般不采用后一种方法.定理4.1的证明超出了本书的范围,这里不证.上述定理还可以推广到二个或二个以上随机变量的函数情形. 例如,设Z 是随机变量X ,Y 的函数,Z =g (X ,Y )(g 是连续函数),那么Z 也是一个随机变量,当(X ,Y )是二维离散型随机变量,其分布律为P {X =x i ,Y =y j }=p ij (i ,j =1,2,…)时,若∑∑ijijiipy x g ),(绝对收敛,则有E (Z )=E [g (X ,Y )]=∑∑ijijiipy x g ),(. (4.5)当(X ,Y )是二维连续型随机变量,其概率密度为f (x ,y )时,若⎰⎰+∞∞-+∞∞-yx y x f y z g d d ),(),(绝对收敛,则有E (Z )=E [g (X ,Y )]=⎰⎰+∞∞-+∞∞-y x y x f y z g d d ),(),(. (4.6)特别地有例4.5 设随机变量X 的分布律为表45X 1 0 2 3 P1/8 1/4 3/8 1/4求E (X 2),E (2x +1).解 由(4.5)式得E (X 2)=(1)2×18+02×14+22×38+32×14=318, E (2X +1)=[2×(1)+1]×18+[2×0+1]×14+[2×2+1]×38+[2×3+1]×14= 74.例4.6 对球的直径作近似测量,设其值均匀分布在区间[a ,b ]内,求球体积的数学期望.解 设随机变量X 表示球的直径,Y 表示球的体积,依题意,X 的概率密度为f (x )=⎪⎩⎪⎨⎧≤≤-.,0,,1其他b x a a b球体积Y =361X π,由(4.6)式得 E (Y )=x ab x X E ba d ππ-=⎰161)61(33 =).)((24)(6223b a b a x x a b ba++=-⎰πd π例4.7 设国际市场每年对我国某种出口商品的需求量X (吨)服从区间[2000,4000]上的均匀分布.若售出这种商品1吨,可挣得外汇3万元,但如果销售不出而囤积于仓库,则每吨需保管费1万元.问应预备多少吨这种商品,才能使国家的收益最大? 解设预备这种商品y 吨(2000≤y ≤4000),则收益(万元)为g (X )=⎩⎨⎧<--≥.),(3,,3y X X y X y X y则 E [g (X )]=⎰⎰-⋅=+∞∞-40002000200040001)()()(x x g x x f x g d d =[]⎰⎰+--40002000320001)(320001y y x y x x y x d d =)1047000(1000162⨯-+-y y . 当y =3500吨时,上式达到最大值.所以预备3500吨此种商品能使国家的收益最大,最大收益为8250万元.例4.8 设二维随机变量(X ,Y )在区域A 上服从均匀分布,其中A 为x 轴,y 轴及直线x +2y=1所围成的三角区域,求E (X ),E (Y ),E (XY ).解 由于(X ,Y )在A 内服从均匀分布,所以其概率密度f (x ,y )=⎪⎩⎪⎨⎧⎩⎨⎧∉∈=∉∈.),(,0,),(,1,),(,0,),(,1A y x A y x A y x A y x A 的面积E (X )=12(1)1(,)d d d d d d ;3x Axf x y x y x x y x x y +∞+∞--∞-∞===⎰⎰⎰⎰⎰⎰E (Y )=2122(,)d d d d d d ;3y Ayf x y x y y x y y y x +∞+∞--∞-∞===⎰⎰⎰⎰⎰⎰E (XY )=;61)1(2),()1(201021⎰⎰⎰⎰⎰+∞∞-+∞∞--=-==x x x x y y x x y x y x xyf d d d d d3.数学期望的性质下面讨论数学期望的几条重要性质.定理4.2 设随机变量X ,Y 的数学期望E (X ),E (Y )存在. 1°E (c )=c ,其中c 是常数; 2°E (cX )=cE (X );3°E (X +Y )=E (X )+E (Y ); 4°若X ,Y 是相互独立的,则有E (XY )=E (X )E (Y ).证 就连续型的情况我们来证明性质3°、4°,离散型情况和其他性质的证明留给读者. 3°设二维随机变量(X ,Y )的概率密度为f (x ,y ),其边缘概率密度为f X (x ),f Y (y ),则E (X +Y )=⎰⎰+∞∞-+∞∞-+y x y x f y x d d ),()( =⎰⎰⎰⎰+∞∞-+∞∞-+∞∞-+∞∞-+y x y x yf y x y x xf d d d d ),(),(=)()()()(Y E X E y y yf x x xf Y X +=+⎰⎰+∞∞-+∞∞-d d .4°又若X 和Y 相互独立,此时f (x ,y )=f X (x )f Y (y ),故E (XY )=⎰⎰⎰⎰+∞∞-+∞∞-+∞∞-+∞∞-=y x y f x xyf y x y x xyf Y X d d d d )()(),(=).()()()(Y E X E y y yf x x xf Y X =⋅⎰⎰+∞∞-+∞∞-d d性质3°可推广到任意有限个随机变量之和的情形;性质4°可推广到任意有限个相互独立的随机变量之积的情形.例4.9 设一电路中电流I (安)与电阻R (欧)是两个相互独立的随机变量,其概率密度分别为g (i )=⎩⎨⎧≤≤.,0,10,2其他i i h (r )=⎪⎩⎪⎨⎧≤≤.,0,30,92其他r r试求电压V =IR 的均值.解E(V)=E(IR)=E (I )E (R )=2392)()(303102=⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡⎰⎰⎰⎰∞+∞-∞+∞-r r i i r r rh i i ig d d d d (伏). 例4.10 设对某一目标进行射击,命中n 次才能彻底摧毁该目标,假定各次射击是独立的,并且每次射击命中的概率为p ,试求彻底摧毁这一目标平均消耗的炮弹数.解 设X 为n 次击中目标所消耗的炮弹数,X k 表示第k 1次击中后至k 次击中目标之间所消耗的炮弹数,这样,X k 可取值1,2,3,…,其分布律见表4 6.表46X k1 2 3 … m …P (X k =m )p pq pq 2 … pq m 1 …其中q =1p ,X 1为第一次击中目标所消耗的炮弹数,则n 次击中目标所消耗的炮弹数为X =X 1+X 2+…+X n .由性质3°可得E (X )=E (X 1)+E (X 2)+…+E (X n )=nE (X 1). 又 E (X 1)=,111pkpq k k =∑∞=- 故 E (X )=pn . 4.常用分布的数学期望 (1) 两点分布 设X 的分布律为X 0 1 P1p p则X 的数学期望为E (X )=0×(1p )+1×p =p .(2) 二项分布设X 服从二项分布,其分布律为P {X =k }=kn k k np p --)1(C , (k =0,1,2,…,n),(0<p <1). 则X 的数学期望为E (X )=∑∑==----=-nk nk k n k kn kknp p k n k n kp p k 0)1()!(!!)1(C=[]∑=----------nk k n k p p k n k n np0)]1()1[(1)1(!)1()1()!1()!1(, 令k 1=t ,则E (X )=[]∑-=------10])1[()1(!)1(!)!1(n t t n t p p t n t n np=np [p +(1p )]n 1=np .若利用数学期望的性质,将二项分布表示为n 个相互独立的01分布的和,计算过程将简单得多.事实上,若设X 表示在n 次独立重复试验中事件A 发生的次数,X i (i =1,2,…,n )表示A 在第i 次试验中出现的次数,则有X =1nii X=∑.显然,这里X i (i =1,2,…,n )服从两点分布,其分布率为X i 1 0PP 1pi E (X )=∑∑===⎪⎭⎫ ⎝⎛ni i n i i X E X E 11)( =np .(3) 泊松分布设X 服从泊松分布,其分布律为P {X =k }=λλ-e !k k, (k =0,1,2,…),(λ>0).则X 的数学期望为E (X )=∑∑∞=--∞=--=11)!1(!k k k kk k k λλλλλee,令k 1=t ,则有E (X )=.!0λλλλλλλ=⋅=-∞=-∑e e ek tt .(4) 均匀分布设X 服从[a ,b ]上的均匀分布,其概率密度函数为f (x )=⎪⎩⎪⎨⎧≤≤-.,0,,1其他b x a a b则X 的数学期望为E (X )=.2)(ba x ab x x x xf ba +=-=⎰⎰+∞∞-d d . (5) 指数分布设X 服从指数分布,其分布密度为f (x )=⎩⎨⎧<≥-.0,0,0,x x x λλe则X 的数学期望为E (X )=1()d e d x xf x x x x λλλ+∞+∞--∞-∞==⎰⎰.(6) 正态分布设X ~N (μ,σ2),其分布密度为f (x )=222)(21σμσ--x e π,则X 的数学期望为E (X )=22()2()d ed ,x xf x x x x μσ--+∞+∞-∞-∞=⎰令σμ-x =t ,则E (X )=⎰∞+∞--+t t t d e π22)(21σμ 注意到t t d eπ⎰∞+∞--222μ=μ,t σt t d e π⎰∞+∞--2221=0,故有E (X )=μ.第二节 方 差1.方差的定义数学期望描述了随机变量取值的“平均”.有时仅知道这个平均值还不够.例如,有A ,B 两名射手,他们每次射击命中的环数分别为X ,Y ,已知X ,Y 的分布律为:表4-7其他的因素.通常的想法是:在射击的平均环数相等的条件下进一步衡量谁的射击技术更稳定些.也就是看谁命中的环数比较集中于平均值的附近,通常人们会采用命中的环数X 与它的平均值E (X )之间的离差|X -E (X )|的均值E [|X -E (X )|]来度量,E [|X -E (X )|]愈小,表明X 的值愈集中于E (X )的附近,即技术稳定;E [|X -E (X )|]愈大,表明X 的值很分散,技术不稳定.但由于E [|X -E (X )|]带有绝对值,运算不便,故通常采用X与E (X )的离差|X -E (X )|的平方平均值E [X -E (X )]2来度量随机变量X 取值的分散程度.此例中,由于E [X -E (X )]2=0.2×(8-9)2+0.6×(9-9)2+0.2×(10-9)2=0.4, E [Y -E (Y )]2=0.1×(8-9)2+0.8×(9-9)2+0.1×(10-9)2=0.2.由此可见B 的技术更稳定些.定义4.2 设X 是一个随机变量,若E [X -E (X )]2存在,则称E [X -E (X )]2为X 的方差(Variance ),记为D (X ),即D (X )=E [X -E (X )]2. (4.7) 称)(X D 为随机变量X 的标准差(Standard deviation )或均方差(Mean squaredeviation),记为σ(X ).根据定义可知,随机变量X 的方差反映了随机变量的取值与其数学期望的偏离程度.若X 取值比较集中,则D (X )较小,反之,若X 取值比较分散,则D (X )较大.由于方差是随机变量X 的函数g (X )=[X -E (X )]2的数学期望.若离散型随机变量X 的分布律为P {X =x k }=p k ,k =1,2,…,则D (X )=k k kp X E x∑∞=-12)]([. (4.8)若连续型随机变量X 的概率密度为f (x ),则D (X )=⎰+∞∞--.)()]([2x x f X E x d (4.9)由此可见,方差D (X )是一个常数,它由随机变量的分布惟一确定.根据数学期望的性质可得:D (X )=E [X -E (X )]2=E [X 2-2X ·E (X )+[E (X )]2]=E (X 2)-2E (X )·E (X )+[E (X )]2=E (X 2)-[E (X )]2.于是得到常用计算方差的简便公式D (X )=E (X 2)-[E (X )]2. (4.10)例4.11 设有甲,乙两种棉花,从中各抽取等量的样品进行检验,结果如下表:表4-9且评定它们的质量.解 由于E (X )=28×0.1+29×0.15+30×0.5+31×0.15+32×0.1=30, E (Y )=28×0.13+29×0.17+30×0.4+31×0.17+32×0.13=30,故得D (X )=(28-30)2×0.1+(29-30)2×0.15+(30-30)2×0.5+(31-30)2×0.15+(32-30)2×0.1=4×0.1+1×0.15+0×0.5+1×0.15+4×0.1=1.1,D (Y )=(28-30)2×0.13+(29-30)2×0.17+(30-30)2×0.4+(31-30)2×0.17+(32-30)2×0.13=4×0.13+1×0.17+0×0.4+1×0.17+4×0.13=1.38.因D (X )<D (Y ),所以甲种棉花纤维长度的方差小些,说明其纤维比较均匀,故甲种棉花质量较好.例4.12 设随机变量X 的概率密度为f (x )=⎪⎩⎪⎨⎧<≤-<≤-+.,0,10,1,01,1其他x x x x求D (X ).解 E (X )=⎰⎰-++-11)1()1(x x x x x x d d =0,E (X 2)=⎰⎰-++-12012)1()1(x x x x x x d d =1/6,于是 D (X )=E (X 2)-[E (X )]2=1/6.2.方差的性质方差有下面几条重要的性质.设随机变量X 与Y 的方差存在,则 1°设c 为常数,则D (c )=0;2°设c 为常数,则D (cX )=c 2D (X );3°D (X ±Y )=D (X )+D (Y )±2E [(X -E (X ))(Y -E (Y ))]; 4°若X ,Y 相互独立,则D (X ±Y )=D (X )+D (Y ); 5°对任意的常数c ≠E (X ),有D (X )<E [(X -c )2]. 证 仅证性质4°,5°.4°D (X ±Y )=E [(X ±Y )-E (X ±Y )]2=E [(X -E (X ))±(Y -E (Y ))]2=E [X -E (X )]2±2E [(X -E (X ))(Y -E (Y ))]+E [Y -E (Y )]2=D (X )+D (Y )±2E [(X -E (X ))(Y -E (Y ))].当X 与Y 相互独立时,X -E (X )与Y -E (Y )也相互独立,由数学期望的性质有E [(X -E (X ))(Y -E (Y ))]=E (X -E (X ))E (Y -E (Y ))=0.因此有D (X ±Y )=D (X )+D (Y ).性质4°可以推广到任意有限多个相互独立的随机变量之和的情况.5°对任意常数c ,有E [(X -c )2]=E [(X -E (X )+E (X )-c )2]=E [(X -E (X ))2]+2(E (X )-c )·E [X -E (X )]+(E (X )-c )2=D (X )+(E (X )-c )2.故对任意常数c ≠EX ,有DX <E [(X -c )2].例4.13 设随机变量X 的数学期望为E (X ),方差D (X )=σ2(σ>0),令Y =σ)(X E X -,求E (Y ),D (Y ).解 E (Y )=[],0)()(1)]([1)(=-=-=⎥⎦⎤⎢⎣⎡-X E X E X E X E X E X E σσσ D (Y )=.1)(1)]([1)(2222===-=⎥⎦⎤⎢⎣⎡-σσσσσX D X E X D X E X D 常称Y 为X 的标准化随机变量.例4.14 设X 1,X 2,…,X n 相互独立,且服从同一(0-1)分布,分布律为P {X i =0}=1-p ,P {X i =1}=p , i =1,2,…,n .证明 X =X 1+X 2+…+X n 服从参数为n ,p 的二项分布,并求E (X )和D (X ).解 X 所有可能取值为0,1,…,n ,由独立性知X 以特定的方式(例如前k 个取1,后n -k 个取0)取k (0≤k ≤n )的概率为p k (1-p )n -k ,而X 取k 的两两互不相容的方式共有k n C 种,故P {X =k }=k nC p k (1-p )n -k, k =0,1,2,…,n ,即X服从参数为n,p的二项分布.由于E (X i )=0×(1-p )+1×p =p ,D (X i )=(0-p )2×(1-p )+(1-p )2×p =p (1-p ), i =1,2,…,n ,故有E (X )=.)(11np X E X E ni i n i i ==⎪⎭⎫ ⎝⎛∑∑==由于X 1,X 2,…,X n 相互独立,得D (X )= ).1()(11p np X D X D ni i n i i -==⎪⎭⎫ ⎝⎛∑∑==3.常用分布的方差 (1) (0-1)分布设X 服从参数为p 的0-1分布,其分布律为(2) 二项分布设X 服从参数为n ,p 的二项分布,由例4.14知,D (X )=np (1-p ). (3) 泊松分布设X 服从参数为λ的泊松分布,由上一节知E (X )=λ,又E (X 2)=E [X (X -1)+X ]=E [X (X -1)]+E (X )=∑∑∞=--∞=-+-=+-2220)!2(!)1(k k k kk k k k λλλλλλλee=λ2e -λ·e λ+λ=λ2+λ,从而有D (X )=E (X 2)-[E (X )]2=λ2+λ -λ2=λ.(4) 均匀分布设X 服从[a ,b ]上的均匀分布,由上一节知E (X )=2ba +,又 E (X 2)=3222b ab a x a b x ba ++=-⎰d , 所以D (X )=E (X 2)-[E (X )]2=12)()(41)(312222a b b a b ab a -=+-++.(5) 指数分布设X 服从参数为λ的指数分布,由上一节知.E (X )=1/λ,又E (X 2)=222λλλ=⎰-ba xx x d e ,所以D (X )=E (X 2)-[E (X )]2=.112222λλλ=⎪⎭⎫⎝⎛-(6) 正态分布设X ~N (μ,σ2),由上一节知E (X )=μ,从而D (X )=[]⎰⎰∞+∞--∞+∞--=--d e πd x x x x f X E x x 222)(2221)()()(σμσμ令σμ-x =t 则D (X )=)(22222222222⎰⎰∞+∞--∞+∞--∞+∞--+-=t t t t t t t d eeπd eπσσ=)20(22ππ+σ =σ2.由此可知:正态分布的概率密度中的两个参数μ和σ分别是该分布的数学期望和均方差.因而正态分布完全可由它的数学期望和方差所确定.再者,由上一章第五节例3.17知道,若X i ~N (μi ,σi 2),i =1,2,…,n ,且它们相互独立,则它们的线性组合c 1X 1+c 2X 2+…+c n X n (c 1,c 2,…,c n 是不全为零的常数)仍然服从正态分布.于是由数学期望和方差的性质知道:c 1X 1+c 2X 2+…+c n X n ~⎪⎭⎫⎝⎛∑∑==n i ni i i i i c c N 1122,σμ.这是一个重要的结果.例4.15 设活塞的直径(以cm 计)X ~N (22.40,0.032),气缸的直径Y ~N (22.50,0.042),X ,Y 相互独立,任取一只活塞,任取一只气缸,求活塞能装入气缸的概率. 解按题意需求P {X <Y }=P {X -Y <0}. 令Z =X -Y ,则E (Z )=E (X )-E (Y )=22.40-22.50=-0.10,D (Z )=D (X )+D (Y )=0.032+0.042=0.052,即Z ~N (-0.10,0.052), 故有P {X <Y }=P {Z <0}=⎪⎭⎫⎝⎛Φ=⎭⎬⎫⎩⎨⎧--<--05.010.005.0)10.0(005.0)10.0(Z P =Φ(2)=0.9772.第三节 协方差与相关系数对于二维随机变量(X ,Y ),数学期望E (X ),E (Y )只反映了X 和Y 各自的平均值,而D (X ),D (Y )反映的是X 和Y 各自偏离平均值的程度,它们都没有反映X 与Y 之间的关系.在实际问题中,每对随机变量往往相互影响、相互联系.例如,人的年龄与身高;某种产品的产量与价格等.随机变量的这种相互联系称为相关关系,它们也是一类重要的数字特征,本节讨论有关这方面的数字特征.定义4.3 设(X ,Y )为二维随机变量,称E {[X -E (X )][Y -E (Y )]}为随机变量X ,Y 的协方差(Covariance ),记为Cov (X ,Y ),即Cov (X ,Y )=E {[X -E (X )][Y -E (Y )]}. (4.11) 而)()(),cov(Y D X D Y X 称为随机变量X ,Y 的相关系数(Correlation coefficient)或标准协方差(Standard covariance),记为ρXY ,即ρXY =)()(),cov(Y D X D Y X . (4.12)特别地,Cov(X ,X )=E {[X -E (X )][X -E (X )]}=D (X ), Cov(Y ,Y )=E {[Y -E (Y )][Y -E (Y )]}=D (Y ).故方差D (X ),D (Y )是协方差的特例.由上述定义及方差的性质可得D (X ±Y )=D (X )+D (Y )±2Cov(X ,Y ).由协方差的定义及数学期望的性质可得下列实用计算公式Cov (X ,Y )=E (XY )-E (X )E (Y ). (4.13)若(X ,Y )为二维离散型随机变量,其联合分布律为P {X =x i ,Y =y j }=p ij ,i ,j =1,2,…,则有Cov (X ,Y )=[][]∑∑--ijijiipY E y X E x )()(. (4.14)若(X ,Y )为二维连续型随机变量,其概率密度为f (x ,y ),则有Cov (X ,Y )=[][]⎰⎰+∞∞-+∞∞---y x y x f Y E y X E x d d ),()()(. (4.15)例4.16 设(X ,Y )的分布律为表4-12XY 解 易知X 的分布律为P {X =1}=p ,P {X =0}=1-p ,故 E (X )=p , D (X )=p (1-p ). 同理E (Y )=p ,D (Y )=p (1-p ),因此Cov(X ,Y )=E (XY )-E (X )·E (Y )=p -p 2=p (1-p ),而ρXY =1)1()1()1(),cov(=-⋅--=⋅p p p p p p DY DX Y X例4.17 设(X ,Y )的概率密度为f (x ,y )=⎩⎨⎧<<<<+.,0,10,10,其他y x y x求Cov (X ,Y ).解 由于f X (x )=⎪⎩⎪⎨⎧<<+,,0,10,21其他x x f Y (y )=⎪⎩⎪⎨⎧<<+.,0,10,21其他y y E (X )=127)21(10=+⎰x x x d ,E (Y )=127)21(10=+⎰y y y d ,E (XY )=31)(10102101021010=+=+⎰⎰⎰⎰⎰⎰y x xy y x y x y x y x xy d d d d d d因此 Cov (X ,Y )=E (XY )-E (X )E (Y )=144112712731-=⨯-.协方差具有下列性质:1°若X 与Y 相互独立,则Cov (X ,Y )=0; 2°Cov (X ,Y )=Cov (Y ,X ); 3°Cov (aX ,bY )=ab Cov (X ,Y );4°Cov (X 1+X 2,Y )=Cov (X 1,Y )+Cov (X 2,Y ). 证 仅证性质4°,其余留给读者.Cov(X 1+X 2,Y ) =E [(X 1+X 2)Y ]-E (X 1+X 2)E (Y )=E (X 1Y )+E (X 2Y )-E (X 1)E (Y )-E (X 2)E (Y ) =[E (X 1Y )-E (X 1)E (Y )]+[E (X 2Y )-E (X 2)E (Y )] =Cov (X 1,Y )+Cov (X 2,Y ).下面给出相关系数ρXY 的几条重要性质,并说明ρXY 的含义.定理4.3 设D (X )>0,D (Y )>0,ρXY 为(X ,Y )的相关系数,则 1°如果X ,Y 相互独立,则ρXY =0; 2°|ρXY |≤1;3°|ρXY |=1的充要条件是存在常数a ,b 使P {Y =aX +b }=1(a ≠0). 证 由协方差的性质1°及相关系数的定义可知1°成立. 2°对任意实数t ,有D (Y -tX )=E [(Y -tX )-E (Y -tX )]2=E [(Y -E (Y ))-t (X -E (X ))]2=E [Y -E (Y )]2-2tE [Y -E (Y )][X -E (X )]+t 2E [X -E (X )]2=t 2D (X )-2t Cov (X ,Y )+D (Y )=[])(),cov()()(),cov()(22X D Y X Y D X D Y X t X D -+⎥⎦⎤⎢⎣⎡-. 令t =)(),cov(X D Y X =b ,于是D (Y -bX )=[][]).1)(()()(),cov(1)()(),cov()(222XY Y D Y D X D Y X Y D X D Y X Y D ρ-=⎥⎦⎤⎢⎣⎡-=-由于方差不能为负,所以1-2XY ρ≥0,从而|ρXY |≤1.性质3°的证明较复杂,从略.当ρXY =0时,称X 与Y 不相关,由性质1°可知,当X 与Y 相互独立时,ρXY =0,即X 与Y 不相关.反之不一定成立,即X 与Y 不相关,X 与Y 却不一定相互独立.例4.18 设X 服从[0,2π]上均匀分布,Y =cos X ,Z =cos(X +a ),这里a 是常数.求ρYZ .解 E (Y )=⎰⋅πd π2021cos x x =0, E (Z )= ⎰+πd π20)cos(21x a x =0, D (Y )=E {[Y -E (Y )]2}=21cos 21202=⎰πd πx x , D (Z )=E {[Z -E (Z )]2}=21)(cos 21202=+⎰πd πx a x , Cov(Y ,Z )=E {[Y -E (Y )][Z -E (Z )]}= a x a x x cos 21)cos(cos 2120=+•⎰πd π, 因此 ρYZ =.cos 2121cos 21)()(),cov(a a Z D Y D Z Y =⋅=⋅ ① 当a =0时,ρYZ =1,Y =Z ,存在线性关系;② 当a=π时,ρYZ =-1,Y =-Z ,存在线性关系; ③ 当a =2π或23π时,ρYZ =0,这时Y 与Z 不相关,但这时却有Y 2+Z 2=1,因此,Y 与Z 不独立.这个例子说明:当两个随机变量不相关时,它们并不一定相互独立,它们之间还可能存在其他的函数关系.定理4.3 告诉我们,相关系数ρXY 描述了随机变量X ,Y 的线性相关程度,|ρXY |愈接近1,则X 与Y 之间愈接近线性关系.当|ρXY |=1时,X 与Y 之间依概率1线性相关.不过,下例表明当(X ,Y )是二维正态随机变量时,X 和Y 不相关与X 和Y 相互独立是等价的.例4.19 设(X ,Y )服从二维正态分布,它的概率密度为f (x ,y )=⨯-221121ρσσπ⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⎥⎦⎤⎢⎣⎡-+------2222212121212)())((2)()1(21exp σμσσμμρσμρy y x x 求Cov (X ,Y )和ρXY .解 可以计算得(X ,Y )的边缘概率密度为f X (x )=21212)(121σμσ--x e π,-∞<x <+∞,f Y (y )=22222)(221σμσ--x e π,-∞<y <+∞,故E (X )=μ1,E (Y )=μ2, D (X )=σ12,D (Y )=σ22. 而Cov (X ,Y )=⨯-=--⎰⎰+∞∞-+∞∞-22121121),()()(ρσπσμμy x y x f y x d dy x y x x y x d d ee-2112222121)1(212)(21)()(⎥⎦⎤⎢⎣⎡------∞+∞-∞+∞---⎰⎰σμρσμρσμμμ令t =⎪⎪⎭⎫ ⎝⎛----1122211σμρσμρx y ,u =11σμ-x ,则 Cov (X ,Y )=⎰⎰∞+∞-∞+∞---+-u t u tu t u d d e π2222122122)1(21σρσρσσ=⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫⎝⎛⎰⎰∞+∞--∞+∞--t e u u t u d d eπ22221222ρσσ +⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛-⎰⎰∞+∞--∞+∞--t t u u t u d e d e π222212221ρσσ =.2222121σρσσρσ=⋅πππ于是ρXYρ.这说明二维正态随机变量(X ,Y )的概率密度中的参数ρ就是X 和Y 的相关系数,从而二维正态随机变量的分布完全可由X ,Y 的各自的数学期望、方差以及它们的相关系数所确定.由上一章讨论可知,若(X ,Y )服从二维正态分布,那么X 和Y 相互独立的充要条件是ρ=0,即X 与Y 不相关.因此,对于二维正态随机变量(X ,Y )来说,X 和Y 不相关与X 和Y 相互独立是等价的.第四节 矩、协方差矩阵数学期望、方差、协方差是随机变量最常用的数字特征,它们都是特殊的矩(Moment ).矩是更广泛的数字特征.定义4.4 设X 和Y 是随机变量,若E (X k ),k =1,2,…存在,称它为X 的k 阶原点矩,简称k 阶矩.若E[X-E(X)]k, k=1,2,…存在,称它为X 的k 阶中心矩.若 E (X k Y l), k ,l =1,2,… 存在,称它为X 和Y 的k +l 阶混合矩.若 E {[X -E (X )]k [Y -E (Y )]l} 存在,称它为X 和Y 的k +l 阶混合中心矩.显然,X 的数学期望E (X )是X 的一阶原点矩,方差D (X )是X 的二阶中心矩,协方差Cov (X ,Y )是X 和Y 的1+1阶混合中心矩.当X 为离散型随机变量,其分布律为P {X =x i }=p i ,则E (X k)=∑∞=1i i kip x,E [X -E (X )]k=1[()]kii i x E X p ∞=-∑.当X 为连续型随机变量,其概率密度为f (x ),则E (X k)=⎰+∞∞-x x f x k d )(,E [X -E (X )]k =⎰+∞∞--x x f X E x k d )()]([.下面介绍n 维随机变量的协方差矩阵.设n 维随机变量(X 1,X 2,…,X n )的1+1阶混合中心矩σij =Cov (X i ,X j )=E {[X i -E (X i )][X j -E (X j )]}, i ,j =1,2,…,n都存在,则称矩阵Σ=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡nn n n n n σσσσσσσσσ 212222111211 为n 维随机变量(X 1,X 2,…,X n )的协方差矩阵. 由于σij =σji (i ,j =1,2,…,n ),因此Σ是一个对称矩阵. 协方差矩阵给出了n 维随机变量的全部方差及协方差,因此在研究n 维随机变量的统计规律时,协方差矩阵是很重要的.利用协方差矩阵还可以引入n 维正态分布的概率密度. 首先用协方差矩阵重写二维正态随机变量(X 1,X 2)的概率密度.f (x 1,x 2)=221121ρσσ-π×.)())((2)()1(21exp 22222212211212112⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⎥⎦⎤⎢⎣⎡-+------σμσσμμρσμρx x x x 令X =⎪⎪⎭⎫⎝⎛21x x ,μ=⎪⎪⎭⎫⎝⎛21μμ,(X 1,X 2)的协方差矩阵为Σ=.2121212122211211⎪⎪⎭⎫⎝⎛=⎪⎪⎭⎫ ⎝⎛σσρσσρσσσσσσ 它的行列式|Σ|=σ12σ22(1-ρ2),逆阵Σ-1=.121212122⎪⎪⎭⎫⎝⎛--σσρσσρσσ∑ 由于 (X -μ)T Σ-1(X -μ)=.),(12211212121222211⎪⎪⎭⎫⎝⎛--⎪⎪⎭⎫ ⎝⎛----μμσσρσσρσσμμx x x x ∑ =,)())((2)(1122222212211212112⎥⎦⎤⎢⎣⎡-+-----σμσσμμρσμρx x x x , 因此(X 1,X 2)的概率密度可写成f (x 1,x 2)=.)()(21exp 211⎭⎬⎫⎩⎨⎧----μ∑μ∑X X T π上式容易推广到n 维的情形.设(X 1,X 2,…,X n )是n 维随机变量,令X =⎪⎪⎪⎪⎪⎭⎫ ⎝⎛n x x x 21, μ=⎪⎪⎪⎪⎪⎭⎫⎝⎛=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛)()()(2121n n X E X E X E μμμ, 定义n 维正态随机变量(X 1,X 2,…,X n )的概率密度为f (x 1,x 2,…,x n )=111exp ()().2(2T nX X πμμ-⎧⎫--∑-⎨⎬⎩⎭其中Σ是(X 1,X 2,…,X n )的协方差矩阵.n 维正态随机变量具有以下几条重要性质: 1°n 维随机变量(X 1,X 2,…,X n )服从n 维正态分布的充要条件是X 1,X 2,…,X n 的任意的线性组合l 1X 1+l 2X 2+…+l n X n服从一维正态分布.(其中l 1,l 2,…,l n 不全为零).2°若(X 1,X 2,…,X n )服从n 维正态分布,设Y 1,Y 2,…,Y k 是X 1,X 2,…,X n 的线性函数,则(Y 1,Y 2,…,Y k )服从k 维正态分布.3°设(X 1,X 2,…,X n )服从n 维正态分布,则X 1,X 2,…,X n 相互独立的充要条件是X 1,X 2,…,X n 两两不相关.小 结随机变量的数字特征是由随机变量的分布确定的,能描述随机变量某一个方面的特征的常数.最重要的数字特征是数学期望和方差.数学期望E (X )描述随机变量X 取值的平均大小,方差D (X )=E {[X -E (X )]2}描述随机变量X 与它自己的数学期望E (X )的偏离程度.数学期望和方差虽不能像分布函数、分布律、概率密度一样完整地描述随机变量,但它们能描述随机变量的重要方面或人们最关心方面的特征,它们在应用和理论上都非常重要.要掌握随机变量的函数Y =g (X )的数学期望E (Y )=E [g (X )]的计算公式(4.3)和(4.4).这两个公式的意义在于当我们求E (Y )时,不必先求出Y =g (X )的分布律或概率密度,而只需利用X 的分布律或概率密度就可以了,这样做的好处是明显的.我们常利用公式D (X )=E (X 2)-[E (X )]2来计算方差D (X ),请注意这里E (X 2)和[E (X )]2的区别.要掌握数学期望和方差的性质,提请读者注意的是:(1) 当X 1,X 2独立或X 1,X 2不相关时,才有E (X 1X 2)=E (X 1)·E (X 2);(2) 设c 为常数,则有D (cX )=c 2D (X );(3) D (X 1±X 2)=D (X 1)+D (X 2)±2Cov (X 1,X 2),当X 1,X 2独立或不相关时才有D (X 1+X 2)=D (X 1)+D (X 2).例如:若X 1,X 2独立,则有D (2X 1-3X 2)=4D (X 1)+9D (X 2).相关系数ρXY 有时也称为线性相关系数,它是一个可以用来描述随机变量(X ,Y )的两个分量X ,Y 之间的线性关系紧密程度的数字特征.当|ρXY |较小时X ,Y 的线性相关的程度较差;当ρXY =0时称X ,Y 不相关.不相关是指X ,Y 之间不存在线性关系,X ,Y 不相关,它们还可能存在除线性关系之外的关系(参见第3节例4.18),又由于X ,Y 相互独立是指X ,Y 的一般关系而言的,因此有以下的结论:X ,Y 相互独立则X ,Y 一定不相关;反之,若X ,Y 不相关则X ,Y 不一定相互独立.特别,对于二维正态变量(X ,Y ,),X 和Y 不相关与X 和Y 相互独立是等价的.而二元正态变量的相关系数ρXY 就是参数ρ.于是,用“ρ=0”是否成立来检验X ,Y 是否相互独立是很方便的.重要术语及主题数学期望 随机变量函数的数学期望 数学期望的性质 方差 标准差 方差的性质 协方差 相关系数 相关系数的性质 X ,Y 不相关 矩 协方差矩阵 为了使用方便,我们列出常见分布及其期望和方差,如下表: 分布名称 分布律或概率密度期望方差参数范围 两点分布 P {X =1}=p , P {X =0}=qp pq 0<p <1 q =1-p 二项分布 X ~B (n ,p ) P {X =k }=kn k k nq p -C (k =0,1,2,…,n )npnpq0<p <1 q =1-p n 为自然数 泊松分布 X ~P (λ) P {X =k }=λλ-e !k k(k =0,1,2,…)λ λλ>0均匀分布 X ~U [a ,b ]f (x )⎪⎩⎪⎨⎧≤≤-.,0,,1其他b x a a b2ba + 12)(2a b - b >a习 题 四1.设随机变量X 的分布律为2.已知100个产品中有10个次品,求任意取出的5个产品中的次品数的数学期望、方差.3.设随机变量的分布律为1234.袋中有N 只球,其中的白球数X 为一随机变量,已知E (X )=n ,问从袋中任取1球为白球的概率是多少?5.设随机变量X 的概率密度为f (x )=⎪⎩⎪⎨⎧≤≤-<≤.,0,21,2,10,其他x x x x求E (X ),D (X ).6.设随机变量X ,Y ,Z 相互独立,且E (X )=5,E (Y )=11,E (Z )=8,求下列随机变量的数学期望.(1) U =2X +3Y +1; (2) V =YZ -4X .7.设随机变量X ,Y 相互独立,且E (X )=E (Y )=3,D (X )=12,D (Y )=16,求E (3X -2Y ),D (2X -3Y ).8.设随机变量(X ,Y )的概率密度为f (x ,y )=⎩⎨⎧<<<<.,0,0,10,其他x y x k试确定常数k ,并求E (XY ).9.设X ,Y 是相互独立的随机变量,其概率密度分别为f X (x )=⎩⎨⎧≤≤;,0,10,2其他x x f Y (y )=⎩⎨⎧>--.,0,0,)5(其他y y e求E (XY ).10.设随机变量X ,Y 的概率密度分别为f X (x )=⎩⎨⎧≤>-;0,0,0,22x x x e f Y (y )=⎩⎨⎧≤>-.0,0,0,44y y y e 求(1) E (X +Y );(2) E (2X -3Y 2).11.设随机变量X 的概率密度为f (x )=⎪⎩⎪⎨⎧<≥-.0,0,0,22x x cx xke求(1) 系数c ;(2) E (X );(3) D (X ).12.袋中有12个零件,其中9个合格品,3个废品.安装机器时,从袋中一个一个地取出(取出后不放回),设在取出合格品之前已取出的废品数为随机变量X ,求E (X )和D (X ). 13.一工厂生产某种设备的寿命X (以年计)服从指数分布,概率密度为f (x )=⎪⎩⎪⎨⎧≤>-.0,0,0,414x x xe为确保消费者的利益,工厂规定出售的设备若在一年内损坏可以调换.若售出一台设备,工厂获利100元,而调换一台则损失200元,试求工厂出售一台设备赢利的数学期望.14.设X 1,X 2,…,X n 是相互独立的随机变量,且有E (X i )=μ,D (X i )=σ2,i =1,2,…,n ,记∑==n i i S X n X 12,1,S 2=∑=--n i i X X n 12)(11. (1) 验证)(X E =μ,)(X D =n2σ;(2) 验证S 2=)(11122∑=--ni i X n X n ;(3) 验证E (S 2)=σ2.15.对随机变量X 和Y ,已知D (X )=2,D (Y )=3,Cov(X ,Y )=-1, 计算:Cov (3X -2Y +1,X +4Y -3).16.设二维随机变量(X ,Y )的概率密度为f (x ,y )=⎪⎩⎪⎨⎧≤+.,0,1122其他y x ,π试验证X 和Y 是不相关的,但X 和Y 不是相互独立的.18.设二维随机变量(X ,Y )在以(0,0),(0,1),(1,0)为顶点的三角形区域上服从均匀分布,求Cov (X ,Y ),ρXY . 19.设(X ,Y )的概率密度为f (x ,y )=⎪⎩⎪⎨⎧≤≤≤≤+.0,20,20),sin(21其他,y x y x ππ求协方差Cov (X ,Y )和相关系数ρXY .20.已知二维随机变量(X ,Y )的协方差矩阵为⎥⎦⎤⎢⎣⎡4111,试求Z 1=X -2Y 和Z 2=2X -Y 的相关系数.21.对于两个随机变量V ,W ,若E (V 2),E (W 2)存在,证明:[E (VW )]2≤E (V 2)E (W 2).这一不等式称为柯西许瓦兹(Couchy-Schwarz )不等式.22.假设一设备开机后无故障工作的时间X 服从参数λ=1/5的指数分布.设备定时开机,出现故障时自动关机,而在无故障的情况下工作2小时便关机.试求该设备每次开机无故障工作的时间Y 的分布函数F (y ). (2002研考) 23.已知甲、乙两箱中装有同种产品,其中甲箱中装有3件合格品和3件次品,乙箱中仅装有3件合格品.从甲箱中任取3件产品放乙箱后,求:(1)乙箱中次品件数Z 的数学期望;(2)从乙箱中任取一件产品是次品的概率. (2003研考) 24.假设由自动线加工的某种零件的内径X (毫米)服从正态分布N (μ,1),内径小于10或大于12为不合格品,其余为合格品.销售每件合格品获利,销售每件不合格品亏损,已知销售利润T (单位:元)与销售零件的内径X 有如下关系T =⎪⎩⎪⎨⎧>-≤≤<-.12,5,1210,20,10,1X X X 若若若 问:平均直径μ取何值时,销售一个零件的平均利润最大? (1994研考)25.设随机变量X 的概率密度为f (x )=⎪⎩⎪⎨⎧≤≤.,0,0,2cos 21其他πx x 对X 独立地重复观察4次,用Y 表示观察值大于π/3的次数,求Y 2的数学期望.(2002研考)26.两台同样的自动记录仪,每台无故障工作的时间T i (i =1,2)服从参数为5的指数分布,首先开动其中一台,当其发生故障时停用而另一台自动开启.试求两台记录仪无故障工作的总时间T =T 1+T 2的概率密度f T (t ),数学期望E (T )及方差D (T ). (1997研考) 27.设两个随机变量X ,Y 相互独立,且都服从均值为0,方差为1/2的正态分布,求随机变量|X -Y |的方差. (1998研考) 28.某流水生产线上每个产品不合格的概率为p (0<p <1),各产品合格与否相互独立,当出现一个不合格产品时,即停机检修.设开机后第一次停机时已生产了的产品个数为X ,求E (X )和D(X). (2000研考)29.设随机变量X 和Y 的联合分布在点(0,1),(1,0)及(1,1)为顶点的三角形区域上服从均匀分布.(如图),试求随机变量U =X +Y 的方差. (2001研考)30.设随机变量U 在区间[-2,2]上服从均匀分布,随机变量X =⎩⎨⎧->-≤-,U ,U 1,11,1若若 Y =⎩⎨⎧>≤-.1,11,1U ,U 若若试求(1)X 和Y 的联合概率分布;(2)D (X +Y ). (2002研考)31.设随机变量X 的概率密度为f (x )=x -e 21,(-∞<x <+∞)(1) 求E (X )及D (X );(2) 求Cov(X ,|X |),并问X 与|X |是否不相关?(3) 问X 与|X |是否相互独立,为什么? (1993研考)32.已知随机变量X 和Y 分别服从正态分布N (1,32)和N (0,42),且X 与Y 的相关系数ρXY =-1/2,设Z =23Y X +. (1) 求Z 的数学期望E (Z )和方差D (Z );(2) 求X 与Z 的相关系数ρXZ ;(3) 问X 与Z 是否相互独立,为什么? (1994研考)33.将一枚硬币重复掷n 次,以X 和Y 表示正面向上和反面向上的次数.试求X 和Y 的相关系数ρXY . (2001研考) YX-1 0 1 01 0.07 0.18 0.15 0.08 0.32 0.2035.对于任意两事件A 和B ,0<P (A )<1,0<P (B )<1,则称ρ=())()()()()()(B P A P B P A P B P A P AB P ⋅-为事件A 和B 的相关系数.试证:(1) 事件A 和B 独立的充分必要条件是ρ=0;(2) |ρ|≤1. (2003研考)36. 设随机变量X 的概率密度为。

随机变量的数字特征大数定律和中心极限定理

随机变量的数字特征大数定律和中心极限定理

02
大数定律
切比雪夫大数定律
定义
设${X_n}$是独立同分布的随机变量序列,若存在常 数$M$,使得$P( |X_n| > M ) leq frac{1}{n^2}$, 则对任意的$varepsilon > 0$,有$P( left| frac{X_1 + X_2 + cdots + X_n}{n} - E(X_1) right| < varepsilon ) to 1$,当$n to infty$。
相应的概率。
性质
03
数学期望具有可加性和线性性质,即E(aX+b)=a*E(X)+b。
方差
定义
方差是随机变量与其数学期望的差的平方的平均值,表示随机变 量取值与其数学期望的偏离程度。
计算方法
D(X) = Σ[(x-E(X))^2*p(x)]。
性质
方差具有可加性和线性性质,即D(aX+b)=a^2*D(X)。
矩与偏态
定义
矩是描述随机变量取值分布形状的数字特征,包括原点矩和中心矩。偏态是描述随机变量取值分布偏斜程度的数字特 征。
计算方法
原点矩包括原点均方、原点方差等;中心矩包括中心均方、中心方差等。偏态的计算公式为S=Σ[(x-μ)^n*p(x)]/n!,其中 μ为数学期望,n为正整数。
性质
偏态具有可加性和线性性质,即S(aX+b)=a^n*S(X)。
李雅普诺夫定理指出,对于任何正整数 n,如果一个随机变量的所有n阶矩都存 在,则其分布函数可以由其n阶原点矩 确定。
该定理是关于随机变量的数字特征的重要定 理,它表明随机变量的数字特征可以完全描 述其分布。
它对于研究随机变量的性质和分布 具有重要意义。

概率论与数理统计随机变量的数字特征

概率论与数理统计随机变量的数字特征

第四章随机变量的数字特征前面讨论了随机变量的分布函数, 从中知道随机变量的分布函数能完整地描述随机变量的统计规律性.但在许多实际问题中, 人们并不需要去全面考察随机变量的变化情况, 而只要知道它的某些数字特征即可.例如, 在评价某地区粮食产量的水平时, 通常只要知道该地区粮食的平均产量;又如, 在评价一批棉花的质量时, 既要注意纤维的平均长度, 又要注意纤维长度与平均长度之间的偏离程度, 平均长度较大, 偏离程度小, 则质量就较好. 等等实际上, 描述随机变量的平均值和偏离程度的某些数字特征在理论和实践上都具有重要的意义, 它们能更直接、更简洁更清晰和更实用地反映出随机变量的本质.本章将要讨论的随机变量的常用数字特征包括: 数学期望、方差、相关系数、矩.第一节数学期望内容分布图示★引言★离散型随机变量的数学期望★例1 ★例2 ★例3★连续型随机变量的数学期望★例4★例5 ★例6 ★例7★随机变量函数的数学期望★例8★例9 ★例10 ★例11★数学期望的性质★例12 ★例13 ★例14★内容小结★课堂练习★习题4-1 ★返回内容要点:一、离散型随机变量的数学期望平均值是日常生活中最常用的一个数字特征, 它对评判事物、作出决策等具有重要作用.定义设X是离散型随机变量的概率分布为,2,1,}{===ipxXP ii如果∑∞=1iiipx绝对收敛, 则定义X的数学期望(又称均值)为.)(1∑∞==iiipxXE二、连续型随机变量的数学期望定义设X是连续型随机变量, 其密度函数为)(xf,如果⎰∞∞-dxx xf) (绝对收敛, 定义X 的数学期望为 .)()(⎰∞∞-=dx x xf X E三、 随机变量函数的数学期望设X 是一随机变量, )(x g 为一实函数,则)(X g Y =也是一随机变量, 理论上, 虽然可通过X 的分布求出)(X g 的分布, 再按定义求出)(X g 的数学期望)]([X g E . 但这种求法一般比较复杂. 下面不加证明地引入有关计算随机变量函数的数学期望的定理.定理1 设X 是一个随机变量, )(X g Y =,且)(Y E 存在, 则(1) 若X 为离散型随机变量, 其概率分布为,2,1,}{===i p x X P i i则Y 的数学期望为.)()]([)(1∑∞===i i i p x g X g E Y E(2) 若X 为连续型随机变量, 其概率密度为)(x f , 则Y 的数学期望为.)()()]([)(⎰∞∞-==dx x f x g X g E Y E注: (i)定理的重要性在于:求)]([X g E 时, 不必知道)(X g 的分布, 只需知道X 的分布即可. 这给求随机变量函数的数学期望带来很大方便;(ii) 上述定理可推广到二维以上的情形, 即有定理2 设),(Y X 是二维随机向量, ),(Y X g Z =,且)(Z E 存在, 则 (1)若),(Y X 为离散型随机向量, 其概率分布为),2,1,(},{ ====j i p y Y x X P ij j i则Z 的数学期望为,),()],([)(11∑∑∞=∞===j i ij j i p y x g Y X g E Z E(2) 若),(Y X 为连续型随机向量, 其概率密度为),(y x f 则Z 的数学期望为.),(),()],([)(⎰⎰∞∞-∞∞-==dx y x f y x g Y X g E Z E四、数学期望的性质1. 设C 是常数, 则;)(C C E =2.若k 是常数,则);()(X kE kX E =3. );()()(2121X E X E X X E +=+4. 设Y X ,独立, 则)()()(Y E X E XY E =;注: (i) 由)()()(Y E X E XY E =不一定能推出Y X ,独立,例如,在例10中,已计算得 49)()()(==Y E X E XY E , 但 81}0{},431{,0}0,1{=======Y P X P Y X P ,显然}0{}1{}0,1{=⋅=≠==Y P X P Y X P 故X 与Y 不独立(ii) 这个性质可推广到有限个随机变量之和的情形.例题选讲:离散型随机变量的数学期望例1 (讲义例1) 甲, 乙两人进行打靶, 所得分数分别记为21,X X , 它们的分布律分别为,8.02.002101i p X1.03.06.02102ip X试评定他们的成绩的好坏.例2 (讲义例2) 某种产品的每件表面上的疵点数服从参数8.0=λ的泊松分布, 若规定疵点数不超过1个为一等品, 价值10元; 疵点数大于1个不多于4个为二等品, 价值8元; 疵点数超过4个为废品. 求:(1) 产品的废品率; (2) 产品价值的平均值.例3 按规定,某车站每天8:00~9:00和9:00~10:00之间都恰有一辆客车到站, 但到站的时刻是随机的, 且两者到站的时间相互独立. 其规律为一旅客8:20连续型随机变量的数学期望例4 (讲义例3) 已知随机变量X 的分布函数 ⎪⎩⎪⎨⎧>≤<≤=4,140,4/0,0)(x x x x x F , 求).(X E例5 (讲义例4) 某商店对某种家用电器的销售采用先使用后付款的方式. 记使用寿命为X (以年计), 规定:.3000,3;2500,32;2000,21;1500,1元一台付款元一台付款元一台付款元一台付款>≤<≤≤X X X X设寿命X 服从指数分布, 概率密度为()⎪⎩⎪⎨⎧≤>=-.0,00,10110/x x e x f x试求该商店一台电器收费Y 的数学期望.例6 (讲义例5) 设随机变量,127)(),(~=X E x f X 且 ⎩⎨⎧≤≤+=其它,010,)(x b ax x f求a 与b 的值, 并求分布函数)(x F .例7 有2个相互独立工作的电子装置, 它们的寿命)2,1(=k X k 服从统一指数分布,其概率密度为⎪⎩⎪⎨⎧≤>=-0,00,1)(/x x e x f x θθ,.0>θ若将这2个电子装置串联联接组成整机, 求整机寿命(以小时计)N 的数学期望.随机变量函数的数学期望例8 (讲义例6) 设),(Y X 的联合概率分布为:求).(),(),(XY E Y E X E例9 (讲义例7) 设随机变量X 在],0[π上服从均匀分布, 求)(),(sin 2X E X E 及.)]([2X E X E -例10 (讲义例8) 设随机变量),(Y X 的概率密度⎪⎩⎪⎨⎧><<=.,0,1,1,23),(23其它x x y x yx y x f 求数学期望.1),(⎪⎭⎫⎝⎛XY E Y E例11 (讲义例9) 设某商店经营一种商品, 每周的进货量X 和顾客对该种商品的需求量Y 是两个相互独立的随机变量, 均服从[10,20]上的均匀分布. 此商店每售出一个单位的商品可获利1000元, 若需求量超过进货量, 可从其他商店调剂供应, 此时售出的每单位商品仅获利500元. 求此商店经销这种商品每周获利的期望.例12 设)(),(2X E X E 均存在,证明222)]([)()]([X E X E X E X E -=-. 例13 (二项分布的数学期望)若),,(~p n b X 求).(X E 数学期望的性质例14 (讲义例10) 一民航送各车载有20位旅客自机场开出, 旅客有10个车站可以下车. 如到达一个车站没有旅客下车就不停车. 以X 表示停车的次数, 求E (X ) (设每位旅客在各个车站下车是等可能的, 并设各旅客是否下车相互独立).课堂练习1. 设甲、乙两人玩必分胜负的赌博游戏, 假定游戏的规则不公正, 以致两人获胜的概率不等,甲为p , 乙为q ,,q p >1=+q p . 为了补偿乙的不利地位, 另行规定两人下的赌注不相等, 甲为a , 乙为b , b a >. 现在的问题是: a 究竟应比b 大多少, 才能做到公正?2. 某种新药在400名病人中进行临床试验有一半人服用,一班人未服,经过5天后,有210人痊愈,其中190人是服了新药的.试用概率统计方法说明新药的疗效.3. 把数字n ,,2,1 任意地排成一列, 如果数字k 恰好出现在第k 个位置上, 则称为一个巧合, 求巧合个数的数学期望.第二节 方差随机变量的数学期望是对随机变量取值水平的综合评价, 而随机变量取值的稳定性是判断随机现象性质的另一个十分重要的指标.内容分布图示★ 引言 ★ 方差的定义★ 方差的计算 ★ 例1 ★ 例2★ 例3 ★ 例4 ★ 例5 ★ 例6★ 例7★ 方差的性质 ★ 例8 ★ 例9 ★ 例10★ 补充说明 ★ 例11 ★ 例12 ★ 条件期望与条件方差简介★ 例13★ 内容小结 ★ 课堂练习 ★ 习题4-2 ★ 返回内容要点:一、 方差的定义定义1 设X 是一个随机变量, 若2)]([(X E X E -存在,则称它为X 的方差, 记为.)]([)(2X E X E X D -=方差的算术平方根)(X D 称为标准差或均方差, 它与X 具有相同的度量单位, 在实际应用中经常使用.方差刻划了随机变量X 的取值与数学期望的偏离程度,它的大小可以衡量随机变量取值的稳定性.从方差的定义易见:(1)若X 的取值比较集中,则方差较小; (2)若X 的取值比较分散,则方差较大;(3)若方差0)(=X D , 则随机变量X 以概率1取常数值,此时X 也就不是随机变量了.二、 方差的计算若X 是离散型随机变量,且其概率分布为,2,1,}{===i p x X P i i则 ;)]([)(12∑∞=-=i i i p X E x X D若X 是连续型随机变量,且其概率密度为),(x f 则.)()]([)(2⎰∞∞--=dx x f X E x X D i利用数学期望的性质, 易得计算方差的一个简化公式:22)]([)()(X E X E X D -=.三、方差的性质1. 设C 常数, 则0)(=C D ;2. 若X 是随机变量, 若C 是常数, 则);()(2X D C CX D =3. 设Y X ,是两个随机向量,则)));())((((2)()()(Y E Y X E X E Y D X D Y X D --±+=± 特别地, 若Y X ,相互独立, 则).()()(Y D X D Y X D +=±注: 对n 维情形, 有: 若n X X X ,,,21 相互独立, 则.)(,)(12111∑∑∑∑=====⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡n i i i n i i i n i i n i i X D C X C D X D X D四、 条件数学期望和条件方差简介由于随机变量之间存在相互联系, 一个随机变量的取值可能会对另一随机变量的分布产生影响, 这种影响会在数字特征上得到反映. 下面要讨论的是:在某个随机变量取某值的条件下,求另一个与之相关的随机变量的数字特征. 作为简介,这里我们直接给出它们的定义.1. 设),(Y X 是离散型随机向量, 其概率分布为),,2,1,,2,1(},{ =====j i p y Y x X P ijj i定义2 (i) 称}|{)|(i j jj i x X y Y P y x X Y E ====∑(绝对收敛)为在 i x X =条件下Y 的条件数学期望.类似地,称 }|{)|(j i ii i y Y x X P x y Y X E ====∑(绝对收敛)为在 i y Y =条件下X 的条件数学期望;(ii) 称}|{)]|([)|(2i j ji j i x X y Y P x X Y E y x X Y D ===-==∑(绝对收敛)为在 i x X =条件下Y 的条件方差.类似地,称}|{)]|([)|(2j i ij i i y Y x X P y Y X E x y Y X D ===-==∑(绝对收敛)为在j y Y =条件下X 的条件方差.2.设),(Y X 是连续型随机向量, )|(|x y f X Y 是在x X =条件下的概率密度,)|(|y x f Y X 是在y Y =条件下X 的概率密度.定义3 (i) 称 ⎰+∞∞-==dy x y yf x X Y E X Y )|(]|[|(绝对收敛)为在 x X =条件下Y 的条件数学期望;类似地,称⎰+∞∞-==dx y x xf y Y X E Y X )|(]|[|(绝对收敛)为在 y Y =条件下X 的条件数学期望;(ii) 称dy x y f x X Y E y x X Y D X Y )|()]|([)|(|2⎰+∞∞-=-==(绝对收敛)为在x X =条件下Y 的条件方差;类似地,称dx y x f y Y X E x y Y X D Y X )|()]|([)|(|2⎰+∞∞-=-==(绝对收敛)为在y Y =条件下X 的条件方差.例题选讲:方差的计算例 1 (讲义例1) 设随机变量X 具有数学期望,)(μ=X E 方差.0)(2≠=σX D 记,*σμ-=X X 则;0])([1)(1)(*=-=-=μσμσX E X E X E.1])[(1])[()]([)()(222222*2**==-=-=-=σσμσσμX E X E X E XE X D即σμ-=X X *的数学期望为0, 方差为1. *X 称为X 的标准化变量.例2 (讲义例2) 设随机变量X 具有)10(-分布, 其分布律为,}1{,1}0{p X P p X P ==-==求),(X E ).(X D例3 (讲义例3) 设),(~λP X 求),(X E ).(X D 例4 (讲义例4) 设),,(~b a U X 求),(X E ).(X D例5 (讲义例5) 设随机变量X 服从指数分布, 其概率密度为⎪⎩⎪⎨⎧≤>=-.0,0,0,1)(/x x e x f x θθ其中,0>θ 求).(),(X D X E例6 (讲义例6) 设随机变量X 服从几何分布, 概率函数n k p p k X P k ,,2,1,)1(}{1 =-==-其中10<<p , 求)(),(X D X E .例7 (讲义例7) 设随机变量Y X ,的联合点分布在以点(0,1), (1,0), (1,1)为顶点的三角形区域上服从均匀分布, 试求随机变量Y X Z +=的期望与方差.方差的性质例8 (讲义例8) 设,,)()(2R x x X E x f ∈-= 证明当)(X E x =时, )(x f 达到最小值. 注:本例子说明了数学期望)(X E 是随机变量X 取值的集中位置, 反映了X 的平均值. 例9 (讲义例9) 设),(~p n b X , 求).(),(X D X E 例10 (讲义例10) 设),,(~2σμN X 求).(),(X D X E例11 (讲义例11) 设活塞的直径(以cm 计),40.22(~N X )03.02,气缸的直径,50.22(~N Y ),04.02 Y X ,相互独立, 任取一只活塞, 任取一只气缸, 求活塞能装入气缸的概率.例12 设随机变量X 和Y 相互独立, 试证).()]([)()]([)()()(22X D Y E Y D X E Y D X D XY D ++=条件数学期望和条件方差简介例 13 (讲义例12) 设),,,,(~),(222121ρσσμμN Y X ,求),|(x X Y E = )|(x X Y D =.课堂练习1. 设随机变量X 的密度函数为⎪⎩⎪⎨⎧≤≤-<≤=.,021,210,)(其它x x x x x f 求).(X E2. 设随机变量X 的概率分布律为4/112/16/16/13/1212/101i p X -试求1+-=X Y 及2X Z =的期望与方差.第三节 协方差及相关系数对多维随机变量, 随机变量的数学期望和方差只反映了各自的平均值与偏离程度,并没能反映随机变量之间的关系. 本节将要讨论的协方差是反映随机变量之间依赖关系的一个数字特征.内容分布图示★ 引言★ 协方差的定义★ 协方差的性质★ 例1 ★ 例2★ 相关系数的定义 ★ 相关系数的性质★ 例3 ★ 例4 ★ 例5 ★ 例6★ 矩的概念 ★ 协方差矩阵 ★ n 维正态分布的概率密度★ n 维正态分布的几个重要性质 ★ 例7★ 内容小结 ★ 课堂练习 ★ 习题4-3 ★ 返回内容要点:一、 协方差的定义定义 设),(Y X 为二维随机向量,若)]}()][({[Y E Y X E X E --存在, 则称其为随机变量X 和Y 的协方差, 记为),(Y XC o v ,即 )]}.()][({[),cov(Y E Y X E X E Y X --=按定义, 若),(Y X 为离散型随机向量,其概率分布为),2,1,(},{ ====j i p y Y x X P ijj i则 ∑--=ji j i Y E y X E x E Y X ,)]}.()][({[),cov(若),(Y X 为连续型随机向量, 其概率分布为),,(y x f 则⎰⎰+∞∞-+∞∞---=dxdy y x f Y E y X E x E Y X ),()]}()][({[),cov(.此外, 利用数学期望的性质, 易将协方差的计算化简.).()()()()()()()()()()]}()][({[),cov(Y E X E XY E Y E X E X E Y E Y E X E XY E Y E Y X E X E Y X -=+--=--=特别地, 当X 与Y 独立时, 有 .0),cov(=Y X二、协方差的性质1. 协方差的基本性质 );(),cov()1(X D X X = );,cov(),cov()2(X Y Y X =),cov(),cov()3(Y X ab bY aX =,其中b a ,是常数; C X C ,0),cov()4(=为任意常数;).,cov(),cov(),cov()5(2121Y X Y X Y X X +=+(6) 若X 与Y 相互独立时,则.0),cov(=Y X2. 随机变量和的方差与协方差的关系),,cov(2)()()(Y X Y D X D Y X D ++=+ 特别地, 若X 与Y 相互独立时, 则)()()(Y D X D Y X D +=+.三、相关系数的定义与性质定义 设),(Y X 为二维随机变量,,0)(,0)(>>Y D X D 称)()(),(Y D X D Y X Cov XY =ρ为随机变量X 和Y 的相关系数.有时也记XY ρ为ρ. 特别地,当0=XY ρ时,称X 与Y 不相关. 相关系数的性质1. ;1||≤XY ρ2. 若X 和Y 相互独立, 则0=XY ρ.3. 若0,0>>DY DX ,则1||=XY ρ当且仅当存在常数).0(,≠a b a 使1}{=+=b aX Y P , 而且当0>a 时, 1=XY ρ;当0<a 时, 1-=XY ρ.注: 相关系数XY ρ刻画了随机变量Y 与X 之间的“线性相关”程度. ||XY ρ的值越接近1, Y 与X 的线性相关程度越高; ||XY ρ的值越近于0, Y 与Y 的线性相关程度越弱.当1||=XY ρ时, Y 与X 的变化可完全由X 的线性函数给出. 当0=XY ρ时, Y 与X 之间不是线性关系.4. 设,)]([2b aX Y E e +-=称为用b aX +来近似Y 的均方误差,则有下列结论. 设,0)(,0)(>>Y D X D 则)()(,)(),cov(000X E a Y E b X D Y X a -==使均方误差达到最小.注: 我们可用均方误差e 来衡量以b aX +近似表示Y 的好坏程度, e 值越小表示b aX +与Y 的近似程度越好.且知最佳的线性近似为.0b X a +而其余均方误差)1)((2XY Y D e ρ-=. 从这个侧面也能说明. ||XY ρ越接近1, e 越小.反之, ||XY ρ越近于0, e 就越大.Y 与X 的线性相关性越小.四、矩的概念定义 设X 和Y 为随机变量, l k ,为正整数, 称)(k X E 为k 阶原点矩(简称k 阶矩阵); ))](([k X E X E - 为k 阶中心矩; )|(|k X E 为k 阶绝对原点矩; )|)((|k X E X E - 为k 阶绝对中心矩; )(l k Y X E 为X 和Y 的l k +阶混合矩;})]([)]({[l k Y E Y X E X E -- 为X 和Y 的l k +阶混合中心矩;注: 由定义可见:(1) X 的数学期望)(X E 是X 的一阶原点矩; (2) X 的方差)(X D 是X 的二阶中心矩;(3)协方差),(Y X Cov 是X 和Y 的二阶混合中心矩.五、协方差矩阵将二维随机变量),(21X X 的四个二阶中心矩)]}.()][({[)]},()][({[},)]({[},)]({[1122212211122222221111X E X X E X E c X E X X E X E c X E X E c X E X E c --=--=-=-=排成矩阵的形式: ⎪⎪⎭⎫⎝⎛22211211c c c c (对称矩阵),称此矩阵为),(21X X 的协方差矩阵. 类似定义n 维随机变量),,,(21n X X X 的协方差矩阵.若n j i X E X X E X E X X Cov c j j i i j i ij ,,2,1,)]}()][({[),( =--==都存在, 则称⎪⎪⎪⎪⎪⎭⎫⎝⎛=nn n n n n c c cc c cc c c C212222111211 为),,,(21n X X X 的协方差矩阵.六、n 维正态分布的概率密度七、n 维正态分布的几个重要性质例题选讲:协方差的性质例1 (讲义例1) 已知离散型随机向量),(Y X 的概率分布为求),cov(Y X .例2 (讲义例2) 设连续型随机变量),(Y X 的密度函数为⎩⎨⎧≤≤≤=其它,010,8),(y x xy y x f求),cov(Y X 和)(Y X D +.相关系数的性质例3 (易知,0)(=X E 于是XY 不相关. 这表示Y X ,不存在线性关系. 但},1{}2{0}1,2{=-=≠==-=Y P X P Y X P 知Y X ,不是相互独立的. 事实上, X 和Y 具有关系: ,2X Y =Y 的值完全可由X 的值所确定.例4 (讲义例4) 设θ服从],[ππ-上的均匀分布, ,sin θ=X θcos =Y 判断X 与Y 是否不相关, 是否独立.例5 (讲义例5) 已知)3,1(~2N X , ),4,0(~2N Y 且X 与Y 的相关系数 .21-=XY ρ 设,23YX Z -=求)(Z D 及.XZ ρ 例6 (讲义例6) 设),(Y X 服从二维正态分布, 它的概率密度为,)())((2)()1(21exp 121),(2222212121212221⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⎥⎥⎦⎤⎢⎢⎣⎡-+-------=σμσσμμρσμρρσπσy y x x y x f 求X 和Y 的相关系数XY ρ.注:在上一章中我们已经得到:若),(Y X 服从二维正态分布, 那么X 和Y 相互独立的充要条件为0=ρ. 现在知道ρ即为X 与Y 的相关系数, 故有下列结论:“若),(Y X 服从二维正态分布,则X 与Y 相互独, 立当且仅当X 与Y 不相关”.n 维正态分布的几个重要性质例7 (讲义例7) 设随机变量X 和Y 相互独立且),.2,1(~N X )1,0(~N Y ,试求32+-=Y X Z 的概率密度.课堂练习1. 对不同品牌的某种机械的两项重要指标评分, 设21,X X 为其所得分数(百分制). 已知,9.68)(1=X E 8.72)(2=X E ; ,81)(1=X D ;49)(2=X D .36),cov(21=X X现以服从正态分布的综合分21167169X X Y +=来决定各参评品牌的名次 .(1) 试求Y 的分布; (2) 如果对综合分85≥Y 的品牌颁奖, 试计算获奖者的百分比.第四节 大数定理与中心极限定理概率论与数理统计是研究随机现象统计规律性的学科. 而随机现象的规律性在相同的条件下进行大量重复试验时会呈现某种稳定性. 例如, 大量的抛掷硬币的随机试验中, 正面出现频率; 在大量文字资料中, 字母使用频率; 工厂大量生产某种产品过程中, 产品的废品率等. 一般地, 要从随机现象中去寻求事件内在的必然规律, 就要研究大量随机现象的问题.在生产实践中, 人们还认识到大量试验数据、测量数据的算术平均值也具有稳定性. 这种稳定性就是我们将要讨论的大数定律的客观背景. 在这一节中,我们将介绍有关随机变量序列的最基本的两类极限定理----大数定理和中心极限定理.内容分布图示★大数定理的引入 ★依概率收敛 ★切比雪夫不等式 ★例1 ★例2★切比雪夫大数定理 ★例3★泊努力大数定理★辛钦大数定理 ★例4★例5大数定理★中心极限定理的引入 ★林德伯格—勒维定理★棣莫佛—拉普拉斯定理 ★例6 ★例7 ★例8 ★例9★例10 ★例11 ★用频率估计概率的误差 ★例12 ★李维普诺夫定理★高尔顿钉板试验中心极限定理★内容小结 ★课堂练习 ★习题4-4★返回内容要点:一、依概率收敛与微积分学中的收敛性的概念类似, 在概率论中, 我们要考虑随机变量序列的收敛性. 定义1 设 ,,,,21n X X X 是一个随机变量序列, a 为一个常数,若对于任意给定的正数ε,有 ,1}|{|lim =<-∞→εa X P n n 则称序列 ,,,,21n X X X 依概率收敛于a , 记为).(∞→−→−n a X Pn定理1 设,,b Y a X Pn P n −→−−→−又设函数),(y x g 在点),(b a 连续, 则),(),(b a g Y X g Pn n −→−.二、切比雪夫不等式定理2设随机变量X 有期望μ=)(X E 和方差2)(σ=X D ,则对于任给0>ε, 有22}|{|εσεμ≤≥-X P .上述不等式称切比雪夫不等式.注:(i) 由切比雪夫不等式可以看出,若2σ越小, 则事件}|)({|ε<-X E X的概率越大, 即, 随机变量X 集中在期望附近的可能性越大. 由此可见方差刻划了随机变量取值的离散程度.(ii) 当方差已知时,切比雪夫不等式给出了X 与它的期望的偏差不小于ε的概率的估计式.如取,3σε= 则有.111.09}3|)({|22≈≤≥-σσσX E X P故对任给的分布,只要期望和方差2σ存在, 则随机变量X 取值偏离)(X E 超过σ3的概率小于0.111.三、大数定理1.切比雪夫大数定律定理3 (切比雪夫大数定律)设 ,,,,21n X X X 是两两不相关的随机变量序列,它们数学期望和方差均存在, 且方差有共同的上界, 即,,2,1,)( =≤i K X D i 则对任意0>ε, 有1)(11lim 11=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<-∑∑==∞→εn i i n i i n X E n X n P 注: 定理表明: 当n 很大时,随机变量序列}{n X 的算术平均值∑=ni i X n 11依概率收敛于其数学期望∑=ni i X E n 1)(1.2.伯努利大数定理定理4 (伯努利大数定律)设A n 是n 重伯努利试验中事件A 发生的次数, p 是事件A 在每次试验中发生的概率, 则对任意的0>ε, 有1lim =⎭⎬⎫⎩⎨⎧<-→∞εp n n P A n 或 0l i m =⎭⎬⎫⎩⎨⎧≥-→∞εp n n P A n . 注:(i) 伯努利大数定律是定理1的推论的一种特例, 它表明: 当重复试验次数n 充分大时, 事件A 发生的频率nn A依概率收敛于事件A 发生的概率p .定理以严格的数学形式表达了频率的稳定性. 在实际应用中, 当试验次数很大时,便可以用事件发生的频率来近似代替事件的概率.(ii) 如果事件A 的概率很小,则由伯努利大数定律知事件A 发生的频率也是很小的,或者说事件A 很少发生. 即“概率很小的随机事件在个别试验中几乎不会发生”,这一原理称为小概率原理,它的实际应用很广泛. 但应注意到,小概率事件与不可能事件是有区别的. 在多次试验中,小概率事件也可能发生.3.辛钦大数定理定理5 (辛钦大数定律) 设随机变量 ,,,,21n X X X 相互独立, 服从同一分布,且具有数学期望,,2,1,)( ==i X E i μ 则对任意0>ε, 有11lim 1=⎭⎬⎫⎩⎨⎧<-∑=∞→εμn i i n X n P . 注: (i) 定理不要求随机变量的方差存在;(ii) 伯努利大数定律是辛钦大数定律的特殊情况;(iii) 辛钦大数定律为寻找随机变量的期望值提供了一条实际可行的途径. 例如, 要估计某地区的平均亩产量, 可收割某些有代表性的地块, 如n 块,计算其平均亩产量, 则当n 较大时,可用它作为整个地区平均亩产量的一个估计. 此类做法在实际应用中具有重要意义.四、中心极限定理在实际问题中, 许多随机现象是由大量相互独立的随机因素综合影响所形成, 其中每一个因素在总的影响中所起的作用是微小的. 这类随机变量一般都服从或近似服从正态分布. 以一门大炮的射程为例, 影响大炮的射程的随机因素包括: 大炮炮身结构的制造导致的误差, 炮弹及炮弹内炸药在质量上的误差, 瞄准时的误差, 受风速、风向的干扰而造成的误差等. 其中每一种误差造成的影响在总的影响中所起的作用是微小的, 并且可以看成是相互独立的, 人们关心的是这众多误差因素对大炮射程所造成的总影响. 因此需要讨论大量独立随机变量和的问题.中心极限定理回答了大量独立随机变量和的近似分布问题, 其结论表明: 当一个量受许多随机因素(主导因素除外) 的共同影响而随机取值, 则它的分布就近似服从正态分布.1.林德伯格—勒维定理定理6 (林德伯格—勒维) 设 ,,,,21n X X X 是独立同分布的随机变量序列, 且,,,2,1,)(,)(2n i X D X E i i ===σμ则 ⎰∑∞--=∞→=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧≤-x t n i i n dt e x n n X P 2/1221lim πσμ 注: 定理6表明: 当n 充分大时, n 个具有期望和方差的独立同分布的随机变量之和近似服从正态分布. 虽然在一般情况下, 我们很难求出n X X X +++ 21的分布的确切形式,但当n 很大时, 可求出其近似分布. 由定理结论有.1),/,(~)1,0(~/1)1,0(~1211∑∑∑====⇒-⇒-n i i ni i ni i X n X n N X N nX n N n n X σμσμσμ近似近似故定理又可表述为: 均值为μ, 方差的02>σ的独立同分布的随机变量 ,,,,21n X X X 的算术平均值X , 当n 充分大时近似地服从均值为μ,方差为n /2σ的正态分布. 这一结果是数理统计中大样本统计推断的理论基础.2. 棣莫佛—拉普拉斯定理在第二章中,作为二项分布的正态近似,我们曾经介绍了棣莫佛—拉普拉斯定理,这里再次给出,并利用上述中心极限定理证明之.定理7(棣莫佛—拉普拉斯定理)设随机变量n Y 服从参数p n ,)10(<<p 的二项分布, 则对任意x , 有)(21)1(lim 22x dt e x p np np Y P x tn n Φ==⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤--⎰∞--∞→π注: 易见,棣莫佛—拉普拉斯定理就是林德伯格—勒维定理的一个特殊情况.3.用频率估计概率的误差设n μ为n 重贝努里试验中事件A 发生的频率, p 为每次试验中事件A 发生的概率,,1p q -=由棣莫佛—拉普拉斯定理,有⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<-<-=⎭⎬⎫⎩⎨⎧<-pq n npqnp pq nP p n P n n εμεεμ .12-⎪⎪⎭⎫ ⎝⎛Φ=⎪⎪⎭⎫ ⎝⎛-Φ-⎪⎪⎭⎫ ⎝⎛Φ≈pq n pq n pq n εεε这个关系式可用解决用频率估计概率的计算问题:4. 李雅普诺夫定理定理8(李雅普诺夫定理) 设随机变量 ,,,,21n X X X 相互独立, 它们具有数学期望和方差: ,2,1,0)(,)(2=>==i X D X E kk k k σμ,记.122∑==nk k nB σ 若存在正数δ, 使得当∞→n 时,,0}|{|1122→-∑=++nk k knXE Bδδμ则随机变量之和∑=n k k X 1的标准化变量:nnk kn k kn k k n k k nk k n B X X D X E X Z ∑∑∑∑∑=====-=⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛-=11111μ的分布函数)(x F n 对于任意x , 满足).(21lim )(lim 2/112x dt e x B X P x F x t n n k k n k k n n n Φ==⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤-=⎰∑∑∞--==∞→∞→πμ注:定理8表明, 在定理的条件下, 随机变量.11nnk kn k kn B X Z ∑∑==-=μ当n 很大时,近似地服从正态分布)1,0(N . 由此, 当n 很大时,∑∑==+=nk k n n nk k Z B X 11μ近似地服从正态分布⎪⎪⎭⎫ ⎝⎛∑=21,n n k k B N μ.这就是说,无论各个随机变量),2,1( =k X k 服从什么分布,只要满足定理的条件,那么它们的和∑=nk k X 1当n 很大时,就近似地服从正态分布.这就是为什么正态随机变量在概率论中占有重要地位的一个基本原因.在很多问题中,所考虑的随机变量可以表示成很多个独立的随机变量之和,例如,在任一指定时刻,一个城市的耗电量是大量用户耗电量的总和;一个物理实验的测量误差是由许多观察不到的、可加的微小误差所合成的,它们往往近似地服从正态分布.例题选讲:切比雪夫不等式例1 (讲义例1) 已知正常男性成人血液中, 每一毫升白细胞数平均是7300, 均方差是700. 利用切比雪夫不等式估计每毫升白细胞数在5200~9400之间的概率.例2 (讲义例2) 在每次试验中, 事件A 发生的概率为0.75, 利用切比雪夫不等式求: 事件A 出现的频率在0.74~0.76之间的概率至少为0.90? 切比雪夫大数定律例3 (讲义例3) 设}{k X 为相互独立的随机变量序列, 且,212112120212212++--k kk kk k pX ,2,1=k 试证}{k X 服从大数定律.辛钦大数定理例4 (讲义例4) 设}{k X 为相互独立且同分布的随机变量序列, 并且k X 的概率分布为),,2,1(2}2{ln 2 ===--i X P ii i k试证}{k X 服从大数定律.中心极限定理例5 在一个罐子中,装有10个编号为0-9的同样的球,从罐中放回地抽取若干次,每次抽一个,并记下号码. 设⎩⎨⎧=否则次取到号码第,00,1k X k , n k ,2,1=问对序列}{k X 能否应用大数定律?例6 (讲义例5) 一盒同型号螺丝钉共有100个,已知该型号的螺丝钉的重量是一个随机变量,期望值是100g 标准差是10g, 一盒螺丝钉的重量超过10.2kg 的概率.例7 (讲义例6)一船舶在某海区航行,已知每遭受一次波浪的冲击,纵摇角大于 3的概率为,3/1=p 若船舶遭受了90000次波浪冲击,问其中有29500~30500次纵摇角度大于 3的概率是多少?例8 对于一个学校而言, 来参加家长会的家长人数是一个随机变量, 设一个学生无家长, 1名家长, 2名家长来参加会议的概率分别0.05, 0.8, 0.15. 若学校共有400名学生, 设各学生参加会议的家长数相互独立, 且服从同一分布.(1)求参加会议的家长数X 超过450的概率;(2)求有1名家长来参加会议的学生数不多于340的概率.例9 (讲义例7)(供电问题)某车间有200台车床, 在生产期间由于需要检修、调换刀具、变换位置及调换工作等常需停车. 设开工率为0.6,并设每台车床的工作是独立的, 且在开工时需电力1千瓦. 问应供应多少瓦电力就能以99.9%的概率保证该车间不会因供电不足而影响生产?例10 设有1000人独立行动, 每个人能够按时进入掩蔽体的概率为0.9. 以95%概率估计, 在一次行动中:(1)至少有多少人能进入掩蔽体; (2)至多有多少人能进入掩蔽体.例11 (讲义例8) 设一大批产品中一级品率为10%, 现从中任取500件.(1) 分别用切比雪夫不等式估计和中心极限定理计算: 这500件中一级品的比例与10%之差的绝对值小于2%的概率;(2) 至少应取多少件才能使一级品的比例与10%之差的绝对值小于2%的把握大于95%?用频率估计概率的误差例12 (讲义例9 现从某厂生产的一批同型号电子元件中抽取395件, 由于次品率未知,需要通过次品的相对频率来估计, 这时估计的可靠性大于95%. (1)求绝对误差ε;(2)如果样品中有十分之一是次品, 应对p 怎样估计?李雅普诺夫定理例13 (讲义例10高尔顿钉板试验如图4-4-2是高尔顿钉板, 常常在赌博游戏中见到, 庄家常常在两边放置值钱的东西来吸引顾客, 现在可用中心极限定理来揭穿这个赌博中的奥秘.设n 为钉子的排数, 记随机变量。

第四章 随机变量的数字特征

第四章  随机变量的数字特征

第四章 随机变量的数字特征内 容 提 要1、随机变量的数学期望设离散型随机变量X 的分布律为 ,2,1,}{===k p x X P k k ,如果级数∑∞=1k k k p x 绝对收敛,则称级数的和为随机变量X 的数学期望.设连续型随机变量X 的密度函数为)(x p ,如果广义积分⎰+∞∞-dx x xp )(绝对收敛,则称此积分值⎰+∞∞-=dx x xp X E )()(为随机变量X 的数学期望.数学期望有如下性质:(1)设C 是常数,则C C E =)(; (2)设C 是常数,则)()(X CE CX E =;(3)若21X X 、是随机变量,则)()()(2121X E X E X X E +=+; 对任意n 个随机变量n X X X ,,,21 ,有)()()()(2121n n X E X E X E X X X E +++=+++ ;(4)若21X X 、相互独立,则)()()(2121X E X E X X E =; 对任意n 个相互独立的随机变量n X X X ,,,21 ,有)()()()(2121n n X E X E X E X X X E =.2、随机变量函数的数学期望设离散型随机变量X 的分布律为 ,2,1,}{===k p x X P k k ,则X 的函数)(X g Y =的数学期望为 2,1,)()]([1==∑∞=k p xg x g E k k k,式中级数绝对收敛.设连续型随机变量X 的密度函数为)(x p ,则X 的函数)(X g Y =的数学期望为⎰+∞∞-=dx x p x g x g E )()()]([,式中积分绝对收敛.3、随机变量的方差设X 是一个随机变量,则})]({[)()(2X E X E X Var X D -==称为X 的方差.)()(X X D σ=称为X 的标准差或均方差.计算方差也常用公式22)]([)()(X E X E X D -=. 方差具有如下性质:(1)设C 是常数,则0)(=C D ;(2)设C 是常数,则)()(2X D C CX D =;(3)若21X X 、相互独立,则)()()(2121X D X D X X D +=+; 对任意n 个相互独立的随机变量n X X X ,,,21 ,有)()()()(2121n n X D X D X D X X X D +++=+++ ;(4)0)(=X D 的充要条件是:存在常数C ,使))((1}{X E C C X P ===.4、几种常见分布的数学期望与方差(1))1()(,)().10(~p p X D p X E X -==-; (2))1()(,)().,(~p np X D np X E p n B X -==;(3))1())(()(,)().,,(~2---==N N n N M N nM X D NnM X E N M n H X ;(4)λλλπ==)(,)().(~X D X E X ;(5)2/)1()(,/1)().(~p p X D p X E p G X -==; (6)12/)()(,2/)()().,(~2a b X D b a X E b a U X -=+=; (7)2/1)(,/1)().(~λλλ==X D X E e X ; (8)22)(,)().,(~σμσμ==X D X E N X .5、矩设X 是随机变量,则 ,2,1),(==k X E kk α称为X 的k 阶原点矩.如果)(X E 存在,则 ,2,1},)]({[=-=k X E X E kk μ称为X 的k 阶中心矩.设),(Y X 是二维随机变量,则 ,2,1,),(==l k Y X E l k kl α称为),(Y X 的l k +阶混合原点矩; ,2,1,},)]([)]({[=-⋅-=l k Y E Y X E X E l k kl μ称为),(Y X 的l k +阶混合中心矩.5、二维随机变量的数字特征(1) ),(Y X 的数学期望)](),([),(Y E X E Y X E =;若),(Y X 是离散型随机变量,则∑∑∞=∞==11)(i j ij ip xX E ,∑∑∞=∞==11)(i j ij i p y Y E .若),(Y X 是连续型随机变量,则 ⎰⎰+∞∞-+∞∞-=dxdy y x xp X E ),()(,⎰⎰+∞∞-+∞∞-=dxdy y x yp Y E ),()(.这里,级数与积分都是绝对收敛的.(2)),(Y X 的方差)](),([),(Y D X D Y X D =若),(Y X 是离散型随机变量,则∑∑∞=∞=-=112)]([)(i j ij ip X E xX D ,∑∑∞=∞=-=112)]([)(i j ij ip Y E yY D .若),(Y X 是连续型随机变量,则⎰⎰+∞∞-+∞∞--=dxdy y x p X E x X D ),()]([)(2,⎰⎰+∞∞-+∞∞--=dxdy y x p Y E y Y D ),()]([)(2.这里,级数与积分都是绝对收敛的.6、协方差与相关系数随机变量),(Y X 的协方差为)]}()][({[),cov(Y E Y X E X E Y X --=.它是1+1阶混合中心矩,有计算公式:)()()(),cov(Y E X E XY E Y X -=.随机变量),(Y X 的相关系数为DYDXY X XY ),cov(=ρ.相关系数具有如下性质: (1)1≤XY ρ;(2)⇔=1XY ρ存在常数b a ,,使}{b aX Y P +==1,即X 与Y 以概率1线性相关; (3)若Y X ,独立,则0=XY ρ,即Y X ,不相关.反之,不一定成立.疑 难 分 析1、随机变量的数字特征在概率论中有什么意义?知道一个随机变量的分布函数,就掌握了这个随机变量的统计规律性.但求得一个随机变量的分布函数是不容易的,而且往往也没有这个必要.随机变量的数字特征则比较简单易求,也能满足我们研究分析具体问题的需要,所以在概率论中很多的应用,同时也刻画了随机变量的某些特征,有重要的实际意义.例如,数学期望反映了随机变量取值的平均值,表现为具体问题中的平均长度、平均时间、平均成绩、期望利润、期望成本等;方差反映了随机变量取值的波动程度;偏态系数、峰态系数则反映了随机变量取值的对称性和集中性.因此,在不同的问题上考察不同的数字特征,可以简单而切实地解决我们面临的实际问题.2、在数学期望定义中为什么要求级数和广义积分绝对收敛?首先,数学期望是一个有限值;其次,数学期望反映随机变量取值的平均值.因此,对级数和广义积分来说,绝对收敛保证了值的存在,且对级数来说,又与项的次序无关,从而更便于运算求值.而由于连续型随机变量可以离散化,从而广义积分与无穷级数有同样的意义.要求级数和广义积分绝对收敛是为了保证数学期望的存在与求出. 3、相关系数XY ρ反映了随机变量X 和Y 之间的什么关系?相关系数XY ρ是用随机变量X 和Y 的协方差和标准差来定义的,它反映了随机变量X 和Y 之间的相关程度.当1=XY ρ时,称X 与Y 依概率1线性相关;当0=XYρ时,称X 与Y 不相关;当10<<XY ρ时,又分为强相关与弱相关.4、两个随机变量X 与Y 相互独立和不相关是一种什么样的关系?(1)若X 、Y 相互独立,则X 、Y 不相关.因为X 、Y 独立,则)()()(Y E X E XY E =,故0)()()(),cov(=--=Y E X E XY E Y X ,从而0=XY ρ,所以X 、Y 不相关.(2)若X 、Y 不相关,则X 、Y 不一定独立.如:⎩⎨⎧≤+=.,0,1,/1),(22 其它 y x y x p π 因为0)()(==Y E X E ,4/1)()(==Y D X D0,0),cov(==XY Y X ρ,知X 、Y 不相关.但π/12)(2x x p X -=,π/12)(2yy p Y -=,)()(),(Y p x p y x p y X ≠,知X 、Y 不独立.(3)若X 、Y 相关,则X 、Y 一定不独立.可由反证法说明. (4)若X 、Y 不相关,则X 、Y 不一定不相关.因为X 、Y 不独立,)()()(Y E X E XY E ≠,但若0)()()(===XY E Y E X E 时,可以有0=XY ρ,从而可以有X 、Y 不相关.但是,也有特殊情况,如),(Y X 服从二维正态分布时,X 、Y 不相关与X 、Y 独立是等价的.例 题 解 析【例1】设随机变量X 的分布律为 ,1,0,0,)1/(}{1=>+==+k k X P k kααα求)(X E 和)(X D .分析:可直接按离散型随机变量的期望和方差的定义进行计算.解: ααααααα=+⋅+=+⋅=-∞=∞=+∑∑1121)1()1/()1/()(k k k k kk k X E ;同理)21()1()1/()1/()(11221122αααααααα+=+⋅+=+⋅=-∞=∞=+∑∑k k k k kk k X E ,所以)1()]([)()(22αα+=-=X E X E X D .【例2】设),(Y X 的概率密度函数为⎩⎨⎧≤≤≤≤=.,0,0,20,16/3),(2 其它x y x xy y x p 求(1))(),(Y E X E ;(2))(),(Y D X D ;(3)XY Y X ρ),,cov(.分析:由数学期望的定义及方差、协方差、相关系数的计算公式,首先须求出关于Y X 、的边缘密度函数)()(y p x p Y X 、,然后在分别求数学期望、方差、协方差、相关系数等.解:(1)20,32/316/3)(52≤≤=⋅=⎰x x dy xy x p xX ,40,32/)4(316/3)(2≤≤-=⋅=⎰y y y dx xy y p Y ,所以 232/)4(3)(,7/1232/3)(4025=⋅-⋅==⋅⋅=⎰⎰dy y y y Y E dx x x X E ;(2)5/2432/)4(3)(,332/3)(4222522=⋅-⋅==⋅⋅=⎰⎰dy y y y Y E dx x x X E所以49/3)7/12(3)(2=-=X D ,5/425/24)(2=-=Y D ; (3)⎰⎰=⋅⋅=209/3216/3)(2xdxdy xy xy XY E ,所以63/8)()()(),cov(=-=Y E X E XY E Y X ;574.027/154]/[),cov(≈==DY DXY X XY ρ.【例3】设事件A 在第i 次试验中出现的概率为),,2,1(n i p i =,X 表示在n 次独立试验中A 出现的次数,求)(X E 和)(X D .分析:可先求出随机变量的分布,再依公式计算数字特征.解:设⎩⎨⎧=.,1,,0出现次试验第不出现次试验第A i A i X i 于是:n X X X X +++= 21.),,2,1(}0{,}1{n i q X P p X P i i i i =====,故i i p X E =)(,∑∑====ni i ni ip XE X E 11)()(;i i i i i q p X E X E X D =-=22)]([)()(,由于各i X 相互独立,所以∑∑====ni i i n i iq p XD X D 11)()(.(式中1=+i i q p )【例4】设),(~2σμN X ,),(~2σμN Y ,且Y X 、相互独立,试求 Y X Z βα+=1和Y X Z βα-=2的相关系数.βα、为不等于零的常数.分析:求函数的数字特征,可有以下三种方法:(1)先求函数的概率分布,再依公式计算数字特征;(2)直接依随机变量函数数字特征的公式计算;(3)利用数字特征的有关定理计算. 解:),cov(),cov(),cov(),cov(221Y X Y X Y X Y X Z Z αβαβαβα-=-+=222222)()()(),cov(),cov(σβαβαβαβ-=-=-+Y D X D Y X Y X ;而)()()(222221Z D Y X D Z D =+=+=σβσαβα,所以2222222222)()(21βαβασβασβαρ+-=+-=Z Z.【例5】设 n X X X ,,,21 是相互独立的随机变量,且,)(,)(2σμ==i i X D X En i ,,2,1 =.记∑∑==--==ni ini iX X n S X nX 1221)(11,1.证明(1)nX D X E 2)(,)(σμ==;(2)22)(σ=S E .分析:运用随机变量数字特征的某些性质及一定的技巧进行证明证明:(1)μ==⎥⎦⎤⎢⎣⎡=∑∑==ni ini i XE n X n E X E 11)(11)(,nn nXD n X nD X D ni ini i 2221211)(11)(σσ=⋅==⎥⎦⎤⎢⎣⎡=∑∑==;(2)})]()[({11)(122∑=----=ni i X X E n S E μμ22221211)(])[(11σσσμμ=⎥⎦⎤⎢⎣⎡⋅--=----=∑=n n n n X nE X E n ni i .。

第四章随机变量的数字特征

第四章随机变量的数字特征

(2)若(X,Y)为连续型随机变量,且积分 收敛,则
证明略。
【例4-10】已知(X,Y)的分布律为 求:(1)E(2X+3Y);(2)E(XY). 解 (1)由数学期望定义知
【例4-11】设二维随机变量(X,Y)的概率密度为
求:(1)E(X+Y);(2)E(XY); (3)P{ X+Y≤1}. 解:
求E(X) 解 E(X)=(-1)×0.3+0×0.2+1×0.5=0.2
【例4-2】甲乙两人进行打靶,所得分数 分别记为X,Y,它们的分布律分别为
试比较他们成绩的好坏。 解 我们分别计算X和Y的数学期望: EX=0×0+1×0.2+2×0.8=1.8(分)。 EY=0×0.1+1×0.8+2×0.1=1(分)。 这意味着,如果进行多次射击,甲所得 分数的平均值接近于1.8分,而乙得分的平均 值接近1分。很明显乙的成绩远不如甲。
(1) 0-1分布 设X的分布律为 其中0<P<1,则X的方差D(X)=P(1-P). 因为 而 故 (2)二项分布 设X~B(n,p) 则有DX=np(1-p) (3)泊松分布 设X~P (λ),则有DX= λ
(4)均匀分布 设X~U(a,b),则有
(5)指数分布 设
(6)正态分布 可以证明,若
下表是六种常见分布的期望和方差的结果. 要求大家熟记下面公式.
【例4-18】 若X~U(a,b)且EX=3,DX=1/3, 求:a,b及X的概率密度f(x) 解:
【例4-19】已知随机变量X服从二项分布,且 E(X)=2.4,D(X)=1.44,求二项分布的参数n,p. 解:因为E(X)=np,D(X)=npq, 由已知E(X)=2.4,D(X)=1.44,np=2.4, npq=1.44, 得q=0.6,p=0.4,n=6 【例4-20】已知(X,Y)的分布律为

第四章随机变量的数字特征要点

第四章随机变量的数字特征要点

第四章 随机变量的数字特征要点一、数学期望的定义和性质1、数学期望是反映随机变量取值平均状态的数字特征 离散型: E(X)=i i x p ∑2、数学期望定义连续型:E(X)=⎰+∞∞-dx x xf )(3、数学期望的性质:(1) E(C)=C C 为常数,下同 (2)E(CX)=CE(X) (3)E(X+Y)=E(X)+E(Y)结合(1)(2)(3)可以推广为 E(C 1X 1+C 2X 2+…+C n X n )=C 1E(X 1)+C 2E(X 2)+ …+C n E(X n ) (4)若X,Y 互相独立,则 E(XY)=E(X)E(Y)可以推广为 若X 1,X 2,…,X n 互相独立,则E(X 1X 2,…X n )=E(X 1)E(X 2) …E(X n ) 二、方差的定义和性质1、方差是反映随机变量取值(相对于均值)集中程度的数字特征2、方差的定义和计算D(X)= E[X-E(X)]2 (用于定义,也可用于计算,但计算一般用下式方便) D(X)= E(X 2)- [E(X)]2 (用于计算,只要计算机出E(X)和E(X 2)相减即可) 3、方差的性质(1) D(C)=0 , D(X+C)=D(X) C 为常数,下同(2)D(CX)=C2D(X) (注意:C提到方差号外以后是C的平方)(3)若X与Y互相独立,则D(X±Y)=D(X)+D(Y) (注意独立条件)可以推广到n个互相独立随机变量情况:D(C1X1±C2X2±…±C n X n)=C12D(X1)+C22D(X2)+ …+Cn2D(Xn)三、协方差的定义和性质1、协方差反映的是两个随机变量的关系密切程度的数字特征2、协方差的定义与计算(1)定义式:COV(X,Y)=E[(X-E(X))(Y-E(Y)](2)计算式:COV(X,Y)=E(XY)-E(X)E(Y)3、协方差的性质(1)COV(X,Y)=COV(Y,X)(2)COV(ax,by)=abCOV(X,Y) a,b为常数(3)COV(X1+X2,Y)=COV(X1,Y)+COV(X2,Y)(4)若X,Y互相独立⇒ COV(X,Y)=0 (反过来不成立)4、协方差与方差的关系(1)COV(X,Y)=E(XY)-E(X)E(Y)时YX=COV(X,X)=E(X2)-[E(X)]2=D(X) (2) 一般情况下:D(X+Y)=D(X)+D(Y)+2COV(X,Y)X,Y独立时,由于COV(X,Y)=0⇒D(X+Y)=D(X)+D(Y)四、相关系数的定义和性质1、相关系数也是反映两个随机变量的关系的数字特征2、相关系数的定义: = D(X)>0 D(Y)>03、相关系数的性质:相关系数4、相关系数的意义:相关系数是两个随机变量间线性关系密切程度的度量,越接近1,X与Y的线性关系越密切,时,X与Y存在完全的线性关系;当时,X与Y无线性关系,称X与Y线性无关,或X与Y不相关。

概率论课件第四章 随机变量数字特征

概率论课件第四章 随机变量数字特征

(3) E f (X ) g(Y ) Ef (X ) Eg(Y )
特别地 E( X Y ) EX EY
E(aX bY c) aEX bEY c
(4) 如X ,Y 相互独立,则E( XY ) EX EY (5) 如a X b,则EX 存在,且a EX b
注:这些性质可以推广到多个随机变量上。
为偶数为奇数如果绝对收敛则数学期望存在且有1离散型随机向量函数的数学期望设二维离散型随机向量xy的分布律为设二维连续型随机向量xy的密度函数为如果绝对收敛则fxy的数学期望存在且有2连续型随机向量函数的数学期望dydx例12设服从半圆域内的均匀分布求和dxydyydydxdxdyxdydxdxdy二维随机变量xy其协方差定义为ov421由定义xyxeyyexexeyxyexeyexeyexeyxyexeyxyexeyczacccovaxczacexzbceyzacexezbceyezaccovxyexeyxyexeyexeyexey证明随机变量xy的相关系数rxy简记为r0表示xy不线性相关相关系数只是x与y间线性关系程度的一种量度
e
2 2 dx
2
令u x a ,得
D 2
u
2e
u2 2
du
2
2
u2
ud(e 2 )
2
2 2
u2
(ue 2 )
2 2
u2
e 2 du
2
1
u2
e2
du
2
2
D
例7 设随机变量ξ服从参数为λ的指数分布,求
Dξ。
解:E 2 x2 exdx x2d (ex )
D npq
例2 设ξ~P(λ),试求Dξ。

E 2

概率教材第4章随机变量的数字特征

概率教材第4章随机变量的数字特征

第4章随机变量的数字特征前面我们讨论的随机变量的分布函数,能够完整地描述随机变量的统计规律性,但是在许多实际问题中,人们并不需要去全面考察随机变量的变化情况,而只要知道它的某些特征即可.例如,评定射击运动员的射击水平时,常感兴趣的是他命中的环数的平均值,以及命中点的集中程度.命中环数的平均值越大,说明运动员的水平越高;命中点越集中,说明运动员水平越稳定.这些与随机变量有关的数值,我们称之为随机变量的数字特征,这些数字特征在概率论与数理统计中起着重要的作用.本章主要介绍随机变量的数学期望和方差、随机变量的矩以及两个随机变量的协方差和相关系数.4.1随机变量的数学期望一、离散型随机变量的数学期望平均值是日常生活中最重要的数字特征之一,已经广泛应用于社会生活和生产实践的各个领域,它对评判事物、做出决策等具有重要作用.例如,在某次教师技能大奖赛上,七位评委为某选手打出的分数如下:9.5,8.9,9.5,9.8,9.6,9.5,9.7,去掉一个最高分和一个最低分后,该教师的平均分是多少?如果用随机变量X表示有效分数,则X的概率分布为:X9.59.69.7P0.60.20.2这时该选手的平均分为:39.519.619.75⨯+⨯+⨯=0.69.50.29.60.29.79.56⨯+⨯+⨯=这个平均分数称为随机变量的数学期望,不难看出,它等于随机变量的取值与对应概率乘积的和,下面我们把这个现象用分析的语言描述出来.定义1设离散型随机变量X 的概率分布为:X 1x 2x …n x …P1p 2p …np …即{},1,2,i i P X x p i ===…,若级数11221iin n i x px p x p x p ∞==++⋅⋅⋅++⋅⋅⋅∑绝对收敛(即1iii x p∞=<+∞∑),则称其和为X 的数学期望,简称期望,也叫均值,记作EX ,即1i ii EX x p ∞==∑(4.1)否则,称X 的数学期望不存在.例1设随机变量X 服从参数为p 的0—1分布,求EX .解由题设知,X 的概率分布为:于是0(1)1EX p p p =⋅-+⋅=.例2一批产品中有一、二、三等品及废品四种,相对应的比例分别为%%%60,20,10和%10,若各等级产品对应的产值分别为6元,4.8元,4元和0元,求产品的平均产值.X 01P1p-p解设产品的产值为X 元,根据题意X 的概率分布为:X 04 4.86P0.10.10.20.6于是40.1 4.80.260.6 4.96EX =⨯+⨯+⨯=(元).例3设随机变量~(,)X B n p ,求EX .解因为~(,)X B n p ,所以X 的概率分布为:{}(1),0,1,2,,.k kn k n P X k C p p k n -==-= 于是00!(1)(1)!()!nnkkn kk n knk k kn EX kC p p p p k n k --===-=--∑∑1(1)(1)1(1)!(1)(1)![(1)(1)]!k n k nk np n p p k n k ----=--=----∑1[(1)]n np p p np -=+-=.例4设随机变量X 服从参数为λ的泊松分布,求EX .解根据题意,X 的概率分布为:{},0,1,2,,.!m e P X m m n m λλ-=== 于是101!(1)!m m m m e EX m e e e m m λλλλλλλλλ--∞∞--======-∑∑.二、连续型随机变量的数学期望定义2设连续型随机变量X 的概率密度为()f x ,若()xf x dx +∞-∞⎰绝对收敛(即()xf x dx +∞-∞<+∞⎰),则称()xf x dx +∞-∞⎰为X 的数学期望,记作EX ,即()EX xf x dx+∞-∞=⎰(4.2)否则,称X 数学期望不存在.例5设随机变量X 服从区间[,]a b 上的均匀分布,求EX .解根据题意得1,,~()0,a xb X f x b a⎧≤≤⎪=-⎨⎪⎩其他,于是1()baEX xf x dx x dx b a+∞-∞==⋅-⎰⎰2122b ax a bb a +==-.该例表明,一维均匀分布的期望为该随机变量取值区间的中点.例6设随机变量X 服从参数0λλ>()的指数分布,求EX .解根据题意得,0,~()0,x e x X f x λλ-⎧>=⎨⎩其他,于是()x EX xf x dx xe dxλλ+∞+∞--∞==⎰⎰xx xe e dx λλ+∞+∞--=-+⎰+011xeλλλ∞-=-=.例7已知连续型随机变量X 的分布函数0,01(),0221,2x F x x x x ≤⎧⎪⎪=<≤⎨⎪>⎪⎩,求EX .解根据题意随机变量X 的密度函数为1,02,()()20,x f x F x ⎧<≤⎪'==⎨⎪⎩其他,所以222001()124x EX xf x dx x dx +∞-∞==⋅==⎰⎰.例8已知随机变量X 的概率密度为:,01()0,ax b x f x +≤≤⎧=⎨⎩其他且7=12EX ,求a 与b 的值.解根据题意1()()12af x dx ax b dx b +∞-∞=+=+=⎰⎰1207()()3212a b EX xf x dx ax bx dx +∞-∞==+=+=⎰⎰解关于a 与b 的方程组得,1a =,1=2b .定义3在考虑n 维随机向量12(,,,)Tn X X X 时,若每个iEX (1,2,,)i n = 都存在,则称12(,,,)T n EX EX EX 为n 维随机向量12(,,,)T n X X X 的数学期望或均值.三、随机变量函数的数学期望设X 是随机变量,()g x 为实函数,则()Y g X =也是随机变量.理论上,可以通过X 的分布求出()Y g X =的分布,再按定义求出数学期望[()]E g X ,但是这种求法一般比较复杂,下面的定理给出了一种直接求解方法.定理1设X 是随机变量,Y 是随机变量X 的函数,()Y g X =,其中()y g x =是一元连续函数.(1)若X 为离散型随机变量,其概率分布为{}i i P X x p ==,1,2,i = ,如果无穷级数1()iii g x p∞=∑绝对收敛,即1|()|iii g x p∞=<+∞∑,则Y 的数学期望为1[()]()i i i EY E g X g x p ∞===∑.(4.3)(2)若X 为连续型随机变量,其概率密度为()f x ,如果广义积分()()g x f x dx +∞-∞⎰绝对收敛,即|()|()g x f x dx +∞-∞<+∞⎰,则Y 的数学期望为[()]()()EY E g X g x f x dx +∞-∞==⎰.(4.4)根据定理1,求随机变量()Y g X =的数学期望时,只需知道X 的分布,无需求Y 的分布,这给我们计算提供了极大的方便.上述定理可以推广到二元或二元以上随机变量函数的情形.定理2设(,)X Y 是二维随机向量,Z 是关于随机向量X 和Y 的函数,(,)Z g X Y =,其中(,)Z g x y =是二元连续函数.(1)若(,)X Y 是二维离散型随机向量,其概率分布为{,}i j ij P X x Y y p ===,,1,2i j = ,,并且11|(,)|i j ij i j g x y p ∞∞==<+∞∑∑,则11[(,)](,)i j ij i j EZ E g X Y g x y p ∞∞====∑∑.(4.5)(2)若(,)X Y 是二维连续型随机向量,其概率密度为(,)f x y ,并且|(,)|(,)g x y f x y dxdy +∞+∞-∞-∞<+∞⎰⎰,则[(,)](,)(,)EZ E g X Y g x y f x y dxdy +∞+∞-∞-∞==⎰⎰.(4.6)定理1和定理2的证明超出本书范围,略.例9设(,)X Y 的概率分布为:Y X 0123103838031818求EX ,EY ,2EX 和()E XY .解关于X 和Y 的边缘分布为:于是31313442EX =⨯+⨯=,13313=0+1+2+3=88882EY ⨯⨯⨯⨯22231=1+3=344EX ⨯⨯,331()(10)0(11)(12)(13)0(30)88819(31)0(32)0(33).84E XY =⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=例10随机变量X 服从区间],0[π上的均匀分布,求EX ,2EX ,)(sin X E 及2)]([X E X E -解1()2EX xf x dx x dx πππ+∞-∞==⋅=⎰⎰,22221()3EX x f x dx x dx πππ+∞-∞==⋅=⎰⎰,0112(sin )sin ()sin (cos )0E X xf x dx x x πππππ+∞-∞==⋅=-=⎰⎰X 13i p ⋅3414Y 0123jp ⋅18383818222201[()]()()2212E X E X E X X dx πππππ-=-=-⋅=⎰.例11假定国际市场对我国某种商品的需求量是随机变量X (单位:吨),它服从区间[2000,4000]上的均匀分布,每销售出一吨该商品,可为国家赚取外汇3万元,若销售不出去,则每吨商品需贮存费1万元,问如何计划出口量,能使国家收益最大?解设计划年出口量为t 吨,国家年收益Y 万元,根据题意20004000t ≤≤,且有120004000,~()20000,x X f x ⎧≤≤⎪=⎨⎪⎩,其它,3,=()4,t X t Y g X X t X t ≥⎧=⎨-<⎩,,于是由(4.4)式有400020001()()()2000EY g x f x dx g x dx +∞-∞==⎰⎰400020001(4)32000tt x t dx tdx ⎡⎤=-=⎢⎥⎣⎦⎰⎰()26170004101000t t =-+-⨯易得当3500t =时,EY 达到最大,所以计划出口量为3500吨时,国家年收益最大.例12已知随机变量X 表示某电子元件的使用寿命(单位:小时),并且服从参数为0.001的指数分布,若规定使用寿命X 在500小时以下为废品,产值为0元;在500到1000小时之间为次品,产值为10元;在1000到1500小时之间为二等品,产值为30元;在1500小时以上者为一等品,产值为40元,求该电子元件的平均产值.解设该电子元件的产值为Y 元,由题设知0.0010.001,0,~()0,0,x e x X f x x -⎧>=⎨≤⎩0,500,10,5001000,()30,10001500,40,1500.X X Y g X X X <⎧⎪≤<⎪==⎨≤<⎪⎪≥⎩于是由(4.4)式有()()EY g x f x dx +∞-∞=⎰50010000.0010.00105000(0.001)10(0.001)x x e dx e dx --=⋅+⋅⎰⎰15000.001100030(0.001)xedx -+⋅⎰0.001150040(0.001)x e dx+∞-+⋅⎰15.65≈(元).该例表明,在利用定理1求[()]E g X 时,允许函数()y g x =不连续.例13设,01,01,(,)~(,)0,x y x y X Y f x y +≤≤≤≤⎧=⎨⎩其他,求2EX ,()E X Y +及()E XY .解由(4.6)式,有11222005(,)()12EX x f x y dxdy x x y dxdy +∞+∞-∞-∞==+=⎰⎰⎰⎰,112007()()(,)()6E X Y x y f x y dxdy x y dxdy +∞+∞-∞-∞+=+=+=⎰⎰⎰⎰,11001()(,)()3E XY xyf x y dxdy xy x y dxdy +∞+∞-∞-∞==+=⎰⎰⎰⎰.四、数学期望的性质设,,a b c 为常数,X 和Y 是随机变量,且EX 和EY 都存在,则数学期望有下列性质:性质1Ec c =.(4.7)性质2()E aX b aEX b +=+.(4.8)性质1请读者自己证明,下面给出性质2的证明.证明令Y aX b =+,因为y ax b =+是单调的,所以可以排除X 是连续型随机变量而Y 却是离散型随机变量的可能,也就是说只需分两种情况来证明,即X 与Y 都是离散型随机变量或者X 与Y 都是连续型随机变量.1.当X 为离散型随机变量时,设X 的概率分布为{}1,2,i i P X x p i === ,.则Y 的概率分布为{}i i P Y ax b p =+=,1,2i = .于是1()()i ii EY E aX b ax b p ∞==+=+∑11i i i i i a x p b p ∞∞===+∑∑aEX b =+.2.当X 为连续型随机变量时,设~()X X f x ,并且不失一般性地假设0a ≠(显然Eb b =),则1~()()Y X y bY f y f a a-=.于是()()Y EY E aX b yf y dy +∞-∞=+=⎰1[(X y by f dy a a+∞-∞-=⎰()()X y ax b ax b f x dx +∞-∞=++⎰令()()X X a xf x dx b f x dx+∞+∞-∞-∞=+⎰⎰aEX b =+.性质3()E X Y EX EY ±=±.(4.9)性质3可以推广到任意有限个随机变量的情况,即1212()()()()n n E X X X E X E X E X ±±⋅⋅⋅±=±±⋅⋅⋅±.(4.10)性质4设X 与Y 相互独立,则()E XY EX EY =⋅.(4.11)性质4可以推广到任意有限个相互独立的随机变量的情况,即设12,,,n X X X ⋅⋅⋅相互独立,则1212()()()()n n E X X X E X E X E X ⋅⋅⋅=⋅⋅⋅.(4.12)下面我们来证明性质3和性质4.证明仅就(,)X Y 为二维连续型随机向量的情形加以证明.设二维连续型随机向量(,)X Y 的概率密度为(,)f x y ,其关于X 和关于Y 的边缘概率密度分别为()X f x 和()Y f y ,则()()(,)E X Y x y f x y dxdy +∞+∞-∞-∞±=±⎰⎰(,)(,)xf x y dxdy yf x y dxdy+∞+∞+∞+∞-∞-∞-∞-∞=±⎰⎰⎰⎰EX EY =±.性质3得证.又若X 与Y 相互独立,此时(,)()()X Y f x y f x f y =⋅.于是()(,)E XY xyf x y dxdy+∞+∞-∞-∞=⎰⎰()()X Y xf x dx yf y dy +∞+∞-∞-∞=⋅⎰⎰EX EY =⋅.性质4得证.注意到:只要将证明中的“积分”用“和式”代替,就能得到(,)X Y 为二维离散型随机向量情形的证明.性质4的逆命题不成立,即由()E XY EX EY =⋅不能得到X 与Y 一定独立.例如,在例9中,我们已经计算得()94E XY EX EY =⋅=,但{1,0}0,P X Y ==={1}3{0}18,P X P Y ====显然{1,0}{1}{0}P X Y P X P Y ==≠=⋅=,故X 与Y 不独立.例14已知X 与Y 的概率分布分别为并且()8.5E X Y +=,求(1)EX ,(2)E X ,EY ;(2)2(23)E Y +.解(1)10.320.530.2 1.9EX =⨯+⨯+⨯=.由(4.8)式及(4.9)式,有(2)22 1.9 3.8E X EX ==⨯=,()8.5 1.9 6.6EY E X Y EX =+-=-=.(2)由于60.40.6 6.6EY a =⨯+⨯=,故7a =.由(4.3)式,有222(23)(263)0.4(273)0.690.6E Y +=⨯+⨯+⨯+⨯=.这里我们也可以利用定义1计算(2)E X 和2(23)E Y +,只是需要先求出2X 和223Y +的概率分布.例15设(,)X Y 等可能地取(1,0)-,(0,1)-,(1,0)和(0,1),试判断(1)()E XY 与EX EY ⋅是否相等;(2)X 与Y 是否独立.解由题设知(,)X Y 的概率分布为:Y X 1-011-0140014014114X 123P0.30.50.2Y 6a P0.40.6()(1)(1)0E XY =-⨯-⨯11(1)0(1)100(1)00044+-⨯⨯+-⨯⨯+⨯-⨯+⨯⨯1014+⨯⨯1(1)0+⨯-⨯11011004+⨯⨯+⨯⨯=,11(1)0(1)(1)0044EX EY ==-⨯+-⨯+-⨯+⨯1000104+⨯+⨯+⨯111004+⨯+⨯=,于是()E XY EX EY =⋅.(2)由于{0,0}0P X Y ===,并且111{0}{0}0442P X P Y ====++=,于是{0,0}{0}{0}P X Y P X P Y ==≠=⋅=,故X 与Y 不独立.这里已知(,)X Y 的概率分布,也可以利用期望的定义4.1计算()E XY ,EX 和EY .4.2随机变量的方差上一节我们介绍了随机变量的数学期望,它主要用来描述随机变量的平均特征,但是在许多实际问题中,仅仅知道平均值是不够的,为此本节我们引入方差的概念,用它来描述随机变量取值的离散程度.一、方差的概念先看一个例子.设甲、乙两位射击运动员打中靶的环数分别为1X ,2X ,其概率分布为:1X 78910P0.40.30.20.12X 05610计算两位运动员打中靶的环数的期望为170.480.390.2100.18EX =⨯+⨯+⨯+⨯=200.0450.1660.2100.68EX =⨯+⨯+⨯+⨯=虽然两位运动员打中靶环数的期望相同,但是比较两组数据可知甲射手比乙射手技术稳定,因此甲打中靶的环数比较集中.可见在实际问题中,仅仅靠期望来描述随机变量的分布特征还不够完善,还需要进一步研究其离散程度,通常人们关心的是随机变量X 对均值EX 的离散程度.定义4如果随机变量X 的数学期望EX 存在,则称X EX -为随机变量X 的离差.显然,随机变量X 离差的期望为零,即()=0E X EX -.(4.13)这样,如果用()E X EX -来度量X 与EX 的偏差,结果是正负偏差相互抵消,为了消除离差X EX -的符号,通常用2()E X EX -来度量X 与EX 的偏差.定义5设X 是一个随机变量,若2()E X EX -存在,则称其为X 的方差,记作DX 或VarX ,即2()DX E X EX =-.(4.14)为X 的标准差或均方差.由定义5知,方差实际上就是随机变量函数2()X EX -的数学期望,所以可以用求随机变量函数2()X EX -的数学期望的方法来求随机变量X 的方差.1.设X 为离散型随机变量,其概率分布为{}i i P X x p ==,1,2,,i = P 0.040.160.20.6若21()ii i x EX p +∞=-<+∞∑,则21()i i i DX x EX p +∞==-∑.(4.15)2.设X 为连续型随机变量,其概率密度为()f x ,若2()()x EX f x dx +∞-∞-<+∞⎰,则2()()DX x EX f x dx +∞-∞=-⎰.(4.16)可见,随机变量的方差是一个非负数.当X 的可能值密集在它的期望值EX 附近时,方差较小,反之则方差较大.因此,方差刻画了随机变量的取值的离散程度.由方差的定义式容易得到下面的常用计算式22()DX EX EX =-.(4.17)证明2()DX E X EX =-22[2()]E X X EX EX =-⋅+222()EX EX EX EX =-⋅+22()EX EX =-.(4.17)式表明2EX 不小于2()EX ,而且提供了一种计算方差的主要方法,即它把方差的计算归结为计算两个容易求得的期望EX 和2EX .例16设随机变量X 服从参数为p 的0—1分布,求DX .解由题设知,X 的概率分布为X 01P1p-p由例1知,EX p =,再由(4.3)式2220(1)1EX p p p =⋅-+⋅=,于是222()(1)DX EX EX p p p p =-=-=-.例17在本节开始所举甲、乙两位射击运动员射击一例中,求1DX 及2DX .解前面已经计算过128EX EX ==,又22222170.480.390.2+100.165EX =⨯+⨯+⨯⨯=22222200.0450.1660.2+100.671.2EX =⨯+⨯+⨯⨯=,所以22111()1DX EX EX =-=,22222()7.2DX EX EX =-=.例18设X 服从区间[,]a b 上的均匀分布,求DX .解由题设知1,,~()0,a xb X f x b a⎧≤≤⎪=-⎨⎪⎩其他.由(4.4)式,有222221()3ba a ab b EX x f x dx x dx b a +∞-∞++==⋅=-⎰⎰,由例5知,2a bEX +=,于是222222()()()3212a ab b a b b a DX EX EX +++-=-=-=.*例19设随机变量~()X P λ,其中0λ>,求DX .解X 的概率分布为{}!m P X m e m λλ-==,(0,1,2,...)m =.由例4可知=EX λ,根据(4.3)式2201(11)!(1)!m m i i EX m e m em m λλλλ∞∞--====-+-∑∑21(2)!(1)!m m m m e e m m λλλλ∞∞--===+--∑∑2122010(2)!(1)!m m m m e e m m λλλλλλ--∞∞---=-==+--∑∑2λλ=+.因此利用(4.17)式有2222()()DX EX EX λλλλ=-=+-=.即=EX DX λ=.例20设X 服从参数为λ的指数分布,即X 的概率密度为,0,()0,x e x f x λλ-⎧>=⎨⎩其他.其中0λ>,求DX .解由例6可知1=EX λ,再由(4.4)式,有2220()x EX x f x dx x e dxλλ+∞+∞--∞==⎰⎰220xx x e xe dxλλ+∞--+∞=-+⎰22λ=.因此,利用(4.17)式有2221()DX EX EX λ=-=.*例21设随机变量2~(,)X N μσ,即X的概率密度为22()2(),x f x μσ--=(x -∞<<+∞),其中μ,σ为实数,并且0σ>,求,EX DX .解根据题意得22()2()x EX xf x dx dxμσ--+∞+∞-∞-∞==⎰⎰令x y μσ-=,则dxdy σ=,由泊松积分221y dy -+∞-∞=⎰,有22y EX dy-+∞-∞=⎰2222y y yedyμ--+∞+∞-∞-∞=+⎰μ=.由(4.16)式,有2()()DX x EX f x dx+∞-∞=-⎰22()22x e dxμσ--+∞-∞=⎰2222y y e d y-+∞-∞⎰=222y de σ-+∞-∞=-⎰222222y y ye dyσ--+∞-∞+∞=+-∞⎰2σ=.特别地,若~(0,1)X N ,则0EX =,1DX =.定义4.6在考虑n 维随机向量12(,,,)Tn X X X 时,若每个i DX (1,2,)i = 都存在,则称12(,,,)T n DX DX DX 为n 维随机向量12(,,,)T n X X X 的方差.二、方差的性质关于方差,我们有下面几个重要性质.设X ,Y 是随机变量,a ,b ,c 为实值常数,则性质10Dc =.(4.18)性质22()D aX a DX =.(4.19)性质3()D X b DX +=.(4.20)性质1到性质3的证明留给读者自己完成.性质42()D aX b a DX +=.(4.21)证明222()[()()][()]D aX bE aX b E aX b E a X EX +=+-+=-222()a E X EX a DX =-=.性质5若X 与Y 相互独立,则()D X Y DX DY ±=+.(4.22)证明由(4.17)式,有22()()[()]D X Y E X Y E X Y ±=±-±2222(2)[()2()]E X XY Y EX EX EY EY =±+-±⋅+2222[2()][()2()]EX E XY EY EX EX EY EY =±+-±⋅+2222[()][()]2[()]EX EX EY EY E XY EX EY =-+-±-⋅2[()]DX DY E XY EX EY =+±-⋅.由X 与Y 独立,有()E XY EX EY =⋅.于是()D X Y DX DY ±=+.性质5的逆命题不成立,即由()D X Y DX DY ±=+,不能得到X 与Y 相互独立.但是它可以推广到任意有限个相互独立的随机变量的情形,即若12,,,n X X X 相互独立,则11()n niii i D X DX===∑∑.(4.23)例22设随机变量~(,)X B n p ,求DX .解根据题意{}ii n in P X i C p q-==,(0,1,,)i n = ,则X 可以理解为n 重伯努利试验中“成功”的次数.若令1,1,2,,,0,i i X i n i ⎧==⎨⎩ 第次成功,第次失败,则12n X X X X =++⋅⋅⋅+,并且(1,2,,)i X i n = 相互独立同服从参数为p 的0—1分布,于是i EX p =,i DX pq =,(1,2i = ,).由(4.10)式及(4.23)式,有11()nni ii i EX E X EXnp =====∑∑,11()nni ii i DX D X DXnpq =====∑∑.例23设随机变量X 与Y 相互独立,并且0EX EY ==,2DX DY σ==,求2()E X Y -.解由(4.9)式,有()0E X Y EX EY -=-=,由X 与Y 独立,得222()2D X Y DX DY σσσ-=+=+=,于是2222()()[()]202E X Y D X Y E X Y σσ-=-+-=+=.4.3常用分布及其数学期望与方差表为了方便今后查询,现将七种常用分布的期望与方差总结为下表.表4—1常用分布及其数学期望与方差总结表4.4协方差与相关系数前面我们介绍了随机变量的数学期望和方差,本节将讨论反映多维随机变量的两个分量之间关系的强弱的数字特征.一、协方差在证明方差的性质时,我们已经知道,在X 与Y 相互独立的条件下,有[()()]0E X EX Y EY --=,可知,当[()()]0E X EX Y EY --≠时,X 与Y 一定不独立.这说明[()()]E X EX Y EY --在一定程度上反映了随机变量X 与Y 之间的关系.定义7设(,)X Y 为二维随机向量,EX 和EY 均存在,若数学期望[()()]E X EX Y EY --存在,则称数值[()()]E X EX Y EY --为X 与Y的协方差,记作cov(,)X Y ,即cov(,)[()()]X Y E X EX Y EY =--.(4.24)显然,cov(,)X X DX=(4.25)由定义7知,X 与Y 的协方差实际上就是二元随机变量函数()()X EX Y EY --的数学期望,因此由定理2有(1)设(,)X Y 是二维离散型随机向量,其概率分布为{,}i j ij P X x Y y p ===,,1,2,i j = ,并且|()()|ij ijijx EX y EY p--<+∞∑∑,则cov(,)()()i j ij ijX Y x EX y EY p =--∑∑.(4.26)(2)设(,)X Y 是二维连续型随机向量,其概率密度为(,)f x y ,并且|()()|(,)x EX y EY f x y dxdy +∞+∞-∞-∞--<+∞⎰⎰,则cov(,)()()(,)X Y x EX y EY f x y dxdy +∞+∞-∞-∞=--⎰⎰.(4.27)此外,协方差还有下面常用性质:1.cov(,)()X Y E XY EX EY =-⋅.(4.28)证明cov(,)()()X Y E X EX Y EY =--()E XY XEY YEX EX EY =--+⋅()E XY EX EY =-⋅.公式(4.28)提供了一种计算协方差的主要方法,即它将协方差的计算归结为计算三个数学期望EX ,EY 和()E XY .2.cov(C,X)0,=C 为任意常数.3.cov(X,X)DX =.4.设X 与Y 独立,则cov(,)0X Y =.5.()2cov(,)D X Y DX DY X Y ±=+±.(4.29)6.对称性cov(,)cov(,)X Y Y X =.(4.30)7.齐次性cov(,)cov(,)aX bY ab X Y =.(4.31)8.可加性cov(,)cov(,)cov(,)X Y Z X Z Y Z ±=±.(4.32)性质2至性质8的证明留给读者自行完成.二、相关系数和相关性协方差在一定程度上反映了X 与Y 相互间的关系,但它还受X 与Y 本身度量单位的影响.例如,kX 和kY 之间的统计关系与X 和Y 之间的统计关系应该是一样的,但协方差却扩大了2k 倍,即2cov(,)cov(,)kX kY k X Y =为了克服这一缺点,可将每个随机变量标准化,即取*X=*Y =并将**cov(,)X Y 作为X 和Y 之间相互关系的一种度量,而********cov(,)()()()()X Y E X Y E X E Y E X Y =-=E===此结果表明,可利用标准差对协方差进行修正,从而得到一个新的数字特征—相关系数.定义8设(,)X Y 为二维随机向量,0DX >,0DY >,则称为X 与Y 的相关系数,记作XY ρ,也可简记为ρ,即XYρ==(4.33)显然,XY ρ的协方差.定理3设X 与Y 是两个随机变量,并且XY ρ存在,则有||1XY ρ≤.证明由定义8知,只需证明2cov (,)X Y DX DY ≤⋅.由于任何随机变量的方差都是一个非负实数,所以对任意实数k ,恒有()D Y kX -2()E Y kX EY kEX =--+222[()2()()()]E Y EY k Y EY X EX k X EX =----+-0≥,即22cov(,)0DY k X Y k DX -+≥.上面不等式的左边是一个关于k 的一元二次函数,因此该不等式成立的充分必要条件为判别式0∆≤,即2[2cov(,)]40X Y DX DY ∆=--⋅≤,于是2cov (,)X Y DX DY ≤⋅.定理4设Y 是随机变量X 的线性函数:Y aX b =+,则当0a >时,1XY ρ=;当0a <时,1XY ρ=-.证明由定义7知cov(,)()()X Y E X EX Y EY =--()[()()]E X EX aX b E aX b =-+-+2()aE X EX =-aDX =.因为2()DY D aX b a DX =+=,所以||||XY aDX aa DX a ρ===,即当0a >时,1XY ρ=;当0a <时,1XY ρ=-.以上两个定理表明,当Y aX b =+时,XY ρ的绝对值达到最大值1.事实上,还可以证明定理4的逆命题也是成立的.因此,X 与Y 的相关系数XY ρ反映了X 与Y 线性关系的密切程度.定义9设XY ρ为X 与Y 的相关系数.(1)如果0XY ρ≠,则称X 与Y 是相关的(实为一定程度的线性相关).其中当||1XY ρ=时,称X 与Y 是完全相关的;当0XY ρ>时,称X 与Y 正相关;当0XY ρ<时,称X 与Y 负相关.(2)如果0XY ρ=,则称X 与Y 不相关(实为线性无关).显然,若X 与Y 相互独立,则0XY ρ=.例24设(,)X Y 的概率分布为Y X 1231-0.10.20.1000.20.110.20.1求X 与Y 的协方差及相关系数.解由(,)X Y 的概率分布,不难得到其关于X 和关于Y 的边缘概率分布为于是(1)0.400.310.30.1EX =-⨯+⨯+⨯=-,10.320.530.2 1.9EY =⨯+⨯+⨯=.由(4.3)式及(4.5)式,有222(1)0.410.30.7EX =-⨯+⨯=,222210.320.530.2 4.1EY =⨯+⨯+⨯=,()(1)10.1(1)20.2(1)30.1010020.2E XY =-⨯⨯+-⨯⨯+-⨯⨯+⨯⨯+⨯⨯030.1110.2120.11300.4+⨯⨯+⨯⨯+⨯⨯+⨯⨯=-.于是222()0.7(0.1)0.69DX EX EX =-=--=,222() 4.11.90.49DY EY EY =-=-=,cov(,)()0.40.11.90.21X Y E XY EX EY =-⋅=-+⨯=-,0.210.360.830.7XY ρ-===-⨯.例25已知随机变量X 服从区间[0,2]π上的均匀分布,并且sin Y X =,sin()Z X k =+,k 为常数,求Y 与Z 的相关系数YZ ρ.解由题设知1,[0,2],~()20,X x X f x ππ⎧∈⎪=⎨⎪⎩其他.由(4.4)及(4.6)式,有201(sin )sin 02EY E X xdx ππ===⎰,X 1-01P0.40.30.3Y 123P0.30.50.2201[sin()])02EZ E X k x k dx ππ=+=+=⎰,222201(sin )sin 0.52EY E X xdx ππ===⎰,222201[sin ()]sin ()0.52EZ E X k x k dx ππ=+=+=⎰,()[sin sin()]E YZ E X X k =+201sin sin()2x x k dx ππ=+⎰201[cos cos(2)]4k x k dxππ=-+⎰1cos 2k =.于是22()0.5DY EY EY =-=,22()0.5DZ EZ EZ =-=,cov(,)()Y Z E YZ EY EZ =-⋅1cos 2k =,1cos 2cos YZ k k ρ==.若2k π=,则0YZ ρ=,此时221Y Z +=.但由于Y 与Z 满足关系221Y Z +=,所以Y 与Z 不独立.例26对于二维随机向量(,)X Y ,设X 服从[1,1]-上的均匀分布,并且2Y X =,证明0XY ρ=.证明由题设知1,[1,1],~()20,X x X f x ⎧∈-⎪=⎨⎪⎩其他.于是0EX =.由(4.4)式及(4.28)式,有13311()02E X x dx -==⎰,cov(,)()X Y E XY EX EY =-⋅3()0E X ==,因此0XY ρ=.但由于X 与Y 满足关系2Y X =,所以X 与Y 不独立.上两例表明,X 与Y 不相关,但它们不独立.因此,由X 与Y 不相关不能得到X 与Y 相互独立.事实上,X 与Y 不相关是指没有线性关系,但并不排除存在其他关系,如平方关系.*例27设二维随机向量1212(,)~(,,,,)X Y N μμσσρ,求X 与Y 的相关系数XY ρ.解根据二维正态分布的边缘概率密度知221212,,,EX EY DX DX μμσσ====而12cov(,)()()(,)X Y x y f x y dxdyμμ+∞+∞-∞-∞=--⎰⎰12()()x y μμ+∞+∞-∞-∞=--⎰222112211()exp 2y x x dxdy μμμρσσσ⎡⎤⎫---⎥⨯--⎪⎥⎭⎦令211211,,y x x t u μμμρσσσ⎛⎫---=-=⎪⎭则有222()/21121cov(,)()2ut X Y u e dtduσσρσσπ+∞+∞-+-∞-∞=+⎰⎰2221222()()2u tu e du e dt ρσσπ+∞+∞---∞-∞=⎰⎰2222)()u tue du te dt +∞+∞---∞-∞⎰⎰12ρσσ==于是XYρρ==.注 1.二维正态分布随机向量(,)X Y 的概率密度中的参数ρ是X 与Y 的相关系数,X 和Y 的各自的数学期望、方差及它们的相关系数可以确定二维正态随机向量的分布;2.在第三章已经讲过,若(,)X Y 服从二维正态分布,则X 和Y 相互独立的充分必要条件为0ρ=.现知XY ρρ=,故对于二维正态随机向量(,)X Y 来讲,X 和Y 不相关与X 和Y 相互独立是等价的.4.5矩、协方差矩阵与相关矩阵本节在推广随机变量的期望、方差和两个随机变量的协方差、相关系数等数字特征基础上,引入矩、协方差矩阵和相关矩阵这些概念.一、矩定义10设X 为随机变量,若1,2,k EX k =,…存在,则称其为X 的k 阶原点矩,(简称k 阶矩),也记作k v .若()2,3,k E X EX k -=,…存在,则称其为X 的k 阶中心矩,也记作k μ.若2,3,kE X EX k -=,…存在,称其为X 的k 阶绝对中心矩.对于二维随机向量X Y (,),若(,1,2,k l E X Y k l =),…存在,则称其为X 和Y 的+k l 阶混合矩.若[()(),1,2,k l E X EX Y EY k l --=],…存在,则称其为X 和Y 的+k l 阶混合中心矩.注1.随机变量X 的数学期望EX 是X 的一阶原点矩;2.随机变量X 的方差DX 是X 的二阶中心矩.二、协方差矩阵与相关矩阵定义11设12(,,,)n X X X 是n 维随机向量,并且(1,2,,)i DX i n = 存在,则以cov(,)i j X X 为元素的n 阶矩阵111212122212.....................n n n n nn v v v v v v V v v v ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎣⎦,ii i v DX =,cov(,)ij i j v X X =,,1,2,,i j n = 称为该n 维随机向量的协方差矩阵,记作V .显然,协方差矩阵V 是对称矩阵,即ij ji v v =,,1,2,,i j n = .定义12设12(,,,)n X X X 是n 维随机向量,其任意两个分量i X 与j X 的相关系数ij ρ(,1,2,,i j n = )都存在,则以ij ρ为元素的n 阶矩阵111212122212.....................n n n n nn R ρρρρρρρρρ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎣⎦称为该n 维随机向量的相关矩阵,记作R .由于cov(,)i i i X X DX =,1,2,,i n =,因此1ii ρ==,(1,2,,i n = ),ij ρ==(,1,2,,i j n = ).对于协方差矩阵和相关矩阵,我们主要讨论2n =的情况.例28已知二维随机向量(,)X Y 的协方差矩阵为251236a V ⎡⎤=⎢⎥⎣⎦,求参数a 以及相关矩阵R .解根据题意知11221ρρ==,1221120.456ρρ====⨯又由对称性知12a =,因此10.40.41R ⎡⎤=⎢⎥⎣⎦.例29已知随机变量X 的方差2DX σ=,并且32Y X =-,求(,)X Y 的协方差矩阵及相关矩阵.解211v DX σ==,222(32)4v DY D X σ==-=.由于32Y X =-为线性函数,所以1XY ρ=-,即12211ρρ==-.于是2122112cov(,)2XY v v X Y ρρσ===-.因此222221222424V σσσσσ-⎡⎤-⎡⎤==⎢⎥⎢⎥--⎣⎦⎣⎦,1111R -⎡⎤=⎢⎥-⎣⎦.例30计算例24中(,)X Y 的协方差矩阵V .解由于110.69v DX ==,220.49v DY ==,12cov(,)0.21v X Y ==-,因此0.690.210.210.49V -⎡⎤=⎢⎥-⎣⎦.例31设(,)X Y 的概率密度为221,1,(,)0,x y f x y π⎧+≤⎪=⎨⎪⎩其他,求(,)X Y 的相关矩阵R .解由(4.6)式,有11()()0E XY dy -==⎰11()0EX EY dy -===⎰于是cov(,)()0X Y E XY EX EY =-⋅=显然0DX DY =>,所以120ρ==于是1001R ⎡⎤=⎢⎥⎣⎦.习题四1.盒中有5个球,其中有3个白球、2个黑球,从中一次任取两个球,求取得白球数X 的数学期望与方差.2.设随机变量X 的概率分布为{}1(2,4,,18,20),10P X k k ===…求EX .3.袋中有5个乒乓球,编号为1,2,3,4,5,现从中一次任取3个,用X 表示取出的3个球中最大编号,求EX .4.设随机变量X 的概率分布为求EX ,2EX 和2(35)E X +.5.连续型随机变量X 的概率密度为,01()0,kx x f x α⎧<<=⎨⎩其他,,0k α>(),且0.75EX =,求(1),k α;(2)DX .6.一个螺丝钉的重量是随机变量,平均重10克,标准差为1克,求100个同型号螺丝钉重量的数学期望和方差.7.设随机变量X 的概率密度为110()1010x x f x x x +-≤<⎧⎪=-≤≤⎨⎪⎩,,,其他,求EX 和DX .8.设随机变量||1~()0x X f x <=⎩,其他,求EX 和DX .X 2-02P0.40.30.39.设随机变量X 的概率密度为0()00,x e x f x x -⎧≥=⎨<⎩,,,求:(1)2Y X=的数学期望;(2)2XY e-=的数学期望.10.设随机变量X 与Y 相互独立,概率密度分别为01()0,X x x f x ≤≤⎧=⎨⎩2,,,其他和55()05,y Y e y f y y -⎧>=⎨≤⎩,,,求()E XY .11.设随机变量X 与Y 相互独立,概率密度分别为01()0,X x f x ≤≤⎧=⎨⎩1,,,其他和0()00,y Y e y f y y -⎧>=⎨≤⎩,,,求()E X Y +.12.设随机变量X 服从柯西分布,即其概率密度为21()(),(1)f x x x π=-∞<<+∞+试证明X 的数学期望不存在.13.设随机变量X 的分布函数为10()0x e x F x λ-⎧->=⎨⎩,,其他,求EX 和DX .14.一台实验仪器中有3个元件,各元件发生故障是相互独立的,其概率分别为0.2,0.3,0.4,求发生故障的元件数的数学期望及方差.15.同时掷2颗骰子,设随机变量X 表示出现点数的最大值,求EX 和DX .16.把4只球随机的投入4个盒子中,设X 表示空盒子的个数,求EX 和DX .17.一批零件中有9个合格品和3个废品,在安装机器时,从这批零件中任取1个,如果取出的是废品就不再放回去.求在取得合格品以前,已经取出废品数的数学期望和方差.18.调查结果表明:某地区的科技人员年龄X 具有如下概率密度4(24)(84),2484,()0,k x x x f x ⎧--≤≤=⎨⎩其他,(1)求常数k 的值;(2)计算该地区科技人员的平均年龄.19.设随机变量X 服从参数为λ的指数分布,并且Y =,求Y 的数学期望与方差.20.设随机变量X 服从区间[0,2]上的均匀分布,并且|1|Y X =-,求EY 和DY .21.对某一目标进行射击,每次射击相互独立并且击中概率为p ,(1)若直到击中为止,求射击次数的数学期望与方差;(2)若直到击中k 次为止,求射击次数的数学期望与方差.22.设X 服从参数为2的泊松分布,32Y X =-,试求,,EY DY cov(,)XY X Y ρ及.23.设随机向量(,)X Y 的概率密度为1(),02,02(,)80,x y x y f x y ⎧+≤≤≤≤⎪=⎨⎪⎩,其他,试求,,cov(,)()XY EX EY X Y D X Y ρ+,,.24.设随机向量(,)X Y 的概率密度为(),0,0,(,)0,x y e x y f x y -+⎧<<+∞<<+∞=⎨⎩其他,求cov(,)X Y .25.设随机变量X 的方差16DX =,随机变量Y 的方差25DY =,又X 与Y 的相关系数0.5XY ρ=,求()D X Y +与()D X Y -.26.设随机向量(,)X Y 服从单位圆域{}22(,)1x y x y +≤上的均匀分布,试证明X ,Y 不相关.27.将3个球随机地放入4个盒子,记(1,2)i X i =表示第i 个盒子内球的个数,求随机向量12(,)X X 的协方差矩阵.28.设随机变量X 的概率密度为0.5,02()0,x x f x <<⎧=⎨⎩其他,求随机变量X 的1至4阶原点矩和中心距.29.设随机变量X 服从拉普拉斯分布,即其概率密度为1(),2xf x e x λλ-=-∞<<+∞,其中0λ>为常数,求X 的k 阶中心距.30.设随机向量21.502,01(,)~(,)0xy x y X Y f x y ⎧≤≤≤≤=⎨⎩,,其他,求随机向量(,)X Y 的均值和协方差矩阵.31.设随机向量22[(5)8(5)(3)25(3)](,)~(,)x x y y X Y f x y Ae -+++-+-=,试确定A 的值,并求X 与Y 的相关矩阵.32.设二维随机向量(,)X Y 的概率密度为sin()(,)(,)0A x y x y Df x y +∈⎧=⎨⎩,,其他,其中D 为矩形区域(,)0,022x y x y ππ⎧⎫≤≤≤≤⎨⎬⎩⎭.(1)求系数A ;(2)求EX EY DX 及DY ;(3)求cov(,)X Y 及XY ρ;(4)求协方差矩阵C 及相关系数矩阵R .选做题四1.某流水生产线上每个产品部合格的概率为01p p <<(),各产品合格与否相互独立,当出现一个不合格产品时即停机检修.设开机后第一次停机时已生产了的产品个数为X ,求X 的数学期望E X ()和方差D X ().2.已知甲、乙两箱中装有同种产品,其中甲箱中装有3件合格产品和3件次品,乙箱中仅装有3件合格品.从甲箱中任取3件产品放入乙箱后,求:(1)乙箱中次品件数X 的数学期望;(2)从乙箱中任取一件产品是次品的概率.3.设随机变量X 的概率密度函数为()1cos ,0,220,x x f x π⎧≤≤⎪=⎨⎪⎩其他,对X 独立地重复观察4次,用Y 表示观察值大于3π的次数,求2Y 的数学期望.4.设两个随机变量,X Y 相互独立,且都服从均值为0,方差为12的正态分布,求随机变量X Y -的方差.5.假设二维随机向量,X Y ()在矩形(){},02,01G x y x y =≤≤≤≤上服从均匀分布,记0,,1,X Y U X Y ≤⎧=⎨⎩若若>,0,2,1,2,X Y V X Y ≤⎧=⎨>⎩若若(1)求U V 和的联合分布;(2)求U V 和的相关系数γ.6.箱中装有6个球,其中红、白、黑球个数分别为1,2,3,现从箱中随机地取出2个球,记X 为取出红球的个数,Y 为取出白球的个数.(1)求随机向量,X Y ()的概率分布;(2)求Cov(,)X Y .7.设二维离散型随机向量,X Y ()的概率分布为Y X 012014014101302112112(1)求{}2P X Y =;(2)求Cov(,)X Y Y -.8.设A B 和为随机事件,且()14P A =,()13P B A =,()12P A B =,令110X Y ⎧⎧==⎨⎨⎩⎩, A发生,, B发生,0,A不发生,,B不发生.(1)求二维随机向量(),X Y 的概率分布;(2)求X Y 和的相关系数XY ρ.9.游客乘电梯从底层到电视塔顶层观光,电梯于每个整点的第5分钟、25分钟和55分钟从底层起行.假设一游客在早晨8点的第X 分钟到底层候梯处,且X 在[0,60]上服从均匀分布,求该游客等候时间的数学期望.10.两台同样自动记录仪,每台无故障工作的时间服从参数为5的指数分布,首先开动其中一台,当其发生故障时停用而另一台自行开动,试求两台记录仪无故障工作的总时间T 的概率密度f t ()、数学期望和方差.11.一商店经销某种商品,每周进货的数量X 与顾客对该种商品的需求量Y 是相互独立的随机变量,且都服从区间[10,20]上的均匀分布,商品每销售出一单位商品获得利润1000元;若需求量超过了进货量,商店可从其他商店调剂供应,这时每单位商品获得利润500元,试计算此商点经销该种商品每周所得利润的期望值.12.设,A B 是两个随机事件,随机变量111,1,A B X Y A B ⎧⎧==⎨⎨--⎩⎩,若出现,,若出现,若不出现,若不出现,试证明:随机变量X Y 和不相关的充分必要条件是A B 与相互独立.13.假设随机变量U 在区间[2,2]-上服从均匀分布,随机变量11111,11,1U U X Y U U ≤-≤⎧⎧==⎨⎨->-->⎩⎩,若,,若,若,若,试求:(1)X Y 和的联合概率分布;(2)()D X Y +.14.设随机变量X 的概率密度为()1,10,21,0240,X x f x x ⎧-<<⎪⎪⎪=≤<⎨⎪⎪⎪⎩,其他,令()2,,Y X F x y =为二维随机向量(),X Y 的分布函数,求:(1)Y 的概率密度()Y y f ;(2)()Cov ,X Y ;(3)1,42F ⎛⎫- ⎪⎝⎭.。

概率统计-随机变量的数字特征_68704

概率统计-随机变量的数字特征_68704
(1) X 的分布律: X 10 30 50 P 1/6 3/6 2/6
EX=10*(1/6)+30*(3/6)+50*(2/6)=33.33(分)
返回主目录
第四章 随机变量的数字特征
(2)旅客8:20分到达 X的分布率为
§1 数学期望
X 10 30 50
70
90
P 3/6 2/6 (1/6)*(1/6) (3/6)*(1/6) (2/6)*(1/6)
设 Y=g(X), g(x) 是连续函数,
(1)若 X 的分布率为 Pk P{X xk } k 1,2,

Pk g( xk ) 绝对收敛, 则 EY= Pk g(xk )
k 1
k 1
(2).若 X 的概率密度为 f (x) ,且 g(x) f (x)dx绝对收敛,
则 EY= g(x) f (x)dx 。
轴,y轴和直线x+y+1=0所围成的区域。
求EX,E(-3X+2Y),EXY。
y
解:
2,(x, y) A f (x, y) 0,其它;
0x
x y 1 0
0
0
EX= xf (x, y)dxdy dx x 2dy
返回主目录
第四章 随机变量的数字特征
定理 2:
§1 数学期望
若(X ,Y ) 是二维随机变量,g(x, y) 是二元连续函数,
Z g(x, y)
(1). 若( X ,Y ) 的分布律为 P{X xi ,Y y j } Pij ,
且 g(xi , y j )Pij 绝对收敛;则 EZ= g(xi , y j )Pij 。
k
ai P{X
i 1
ai}

概率统计-随机变量的数字特征

概率统计-随机变量的数字特征
第四章 随机变量的数字特征
§1 数学期望
§1 数学期望
例 1:某班有 N 个人,其中有 ni 个人为 ai 分, i 1,2,k ,
k
ni N , 求平均成绩。
i 1
解:
平均成绩为:
1 N
k
ai ni
i 1
k
ai
i 1
ni N
若用 X表示成绩,则
P{ X
ai}
ni N
k
i 1
ai
ni N
记为 EX,即 EX= xk pk 。 k 1
数学期望也称为均值。
返回主目录
第四章
(2)、连续型
随机变量的数字特征
§1 数学期望
设连续型随机变量 X 的概率密度为 f (x) ,
若积分 xf (x)dx 绝对收敛,则称积分 xf (x)dx
的值为 X 的数学期望。记为 EX= xf (x)dx ,
k 1
k 1
(2).若 X 的概率密度为 f (x) ,且 g(x) f (x)dx绝对收敛,
则 EY= g(x) f (x)dx 。
返回主目录
第四章 随机变量的数字特征
定理 2:
§1 数学期望
若(X ,Y ) 是二维随机变量,g(x, y) 是二元连续函数,
Z g(x, y)
(1). 若( X ,Y ) 的分布律为 P{X xi ,Y y j } Pij ,
数学期望也称为均值。
返回主目录
说明
第四章
随机变量的数字特征
§1 数学期望
返回主目录
第四章 随机变量的数字特征
例2
§1 数学期望
X
8
9
10
P

随机变量的数字特征

随机变量的数字特征

随机变量的数字特征
随机变量的数字特征包括均值、方差、标准差、偏度和峰度等。

其中,均值是衡量随机变量中心位置的指标,是所有取值的平均数;方差是随机变量离均值的距离平方的平均数;标准差是方差的算术平方根,也是随机变量离均值距离的度量,具有与随机变量相同的量纲;偏度是随机变量概率分布的偏斜程度,为其分布的非对称程度的度量;峰度则是随机变量概率分布的尖锐程度,衡量随机变量的概率分布在平均值附近的峰值高低。

可以通过计算公式来求解以上数字特征,例如均值的计算公式为所有取值的总和除以取值的数量;方差的计算公式为将每个取值与均值的差值平方后的总和除
以取值的数量;标准差的计算公式则是方差的算术平方根;偏度的计算公式为三阶中心矩与标准差的比值;峰度的计算公式为四阶中心矩与标准差的四次幂的比值。

了解随机变量的数字特征有助于描绘随机变量的特征与规律,进而分析和预测其行为。

同时,对于特定应用领域,也需要针对性地选择数字特征进行分析,以
更好地满足应用的需求。

第四节 随机变量的数字特征

第四节 随机变量的数字特征
课堂教学安排
教学过程
主要教学内容及步骤
1、任务目标
能力目标:会求数学期望与方差
知识目标:理解数学期望与方差的概念,掌握它们的性质与计算;掌握二项分布、柏松分布、正态分布、均匀分布、指数分布的数学期望与方差
德育目标:提高学生学习数学的兴趣,树立学生学好数学的信心;培养学生锲而不舍的钻研精神和科学态度。
从而在一次射击中,该射手平均命中的环数为
(环)
它是 的可能取值与对应概率的乘积之和.由此引进定义。
二、讲解新课
第四节随机变量的数字特征
(一)数学期望
1、离散型随机变量的数学期望
定义6.17:设 为一离散型堕机变量,其分布列为 , ,若级数 绝对收敛,则称这级数为 的数学期望,简称期望或均值.
记为 =
以讲授法为主,结合运用练习法和引导探究法,
一、教学过程
0 5 6 7 8 9 10
0 0.05 0.05 0.1 0.1 0.2 0.5
经过长期观察积累,某射手在每次射击中命中的环数 服从分布:
(其中0表示脱靶)
一种很自然的考虑是:假定该射击手进行了100次射击,那么,约有5次命中5环,5次命中6环,10次命中7环,10次命中8环,20次命中9环,50次命中10,没有脱靶的.
更新、补
充、删减
内容

课外作业
书本 2,5,7,9
教学后记
授课主要内容或板书设计
第四节随机变量的数字特征
1、离散型随机变量的数学期望
定义6.17: =
2、连续型随机变量的期望
定义6.18:设连续型随机变量X的概率密度为 ,若广义积分 绝对收敛,则称该积分为随机变量X的数学期望(简称期望或均值),记为 ,即 =

04第四讲 随机变量的数字特征

04第四讲 随机变量的数字特征

第四讲 随机变量的数字特征考纲要求1.理解随机变量数字特征(数学期望、方差、标准差、矩、协方差、相关系数),会运用数字特征的基本性质,并掌握常用分布的数字特征.2.会求随机变量函数的数学期望. 一、随机变量的数字特征问题1 叙述随机变量的数学期望的定义、性质及随机变量函数的数学期望公式. 答 随机变量的数学期望是随机变量的平均值,它反映随机变量取值的中心位置. 1.定义与公式⑴离散型随机变量X 的概率分布为{}(1,2,)i i P X x p i ===,i i iEX x p =∑;⑵离散型随机变量X 的概率分布为{}(1,2,)i i P X x p i ===,()()i i iEg X g x p =∑;⑶二维离散型随机变量(,)X Y 的概率分布为{},(,1,2,)i j ij P X x Y y p i j ====,(,)(,)i j ij ijEg X Y g x y p =∑∑;⑷连续型随机变量X 的概率密度为()f x ,()EX xf x dx +∞-∞=⎰;⑸连续型随机变量X 的概率密度为()f x ,()()()Eg X g x f x dx +∞-∞=⎰;⑹二维连续型随机变量(,)X Y 的概率密度(,)f x y ,(,)(,)(,)Eg X Y g x y f x y dxdy +∞+∞-∞-∞=⎰⎰.2性质⑴Ec c =;⑵EkX kEX =; ⑶()E X c EX c +=+; ⑷()E X Y EX EY +=+;⑸若X 与Y 相互独立,则()E XY EX EY =⋅; 问题2 叙述随机变量的方差的定义与性质.答 随机变量的方差反映随机变量取值的离散程度.1.定义 随机变量X 的方差2()DX E X EX =-2.性质 ⑴()0D c =; ⑵2()D kX k DX =;⑶()D X c DX +=;⑷若X 与Y 相互独立,则()D X Y DX DY ±=+; ⑸22()DX EX EX =-.问题3 叙述随机变量的矩的定义.答 随机变量X 的k 阶原点矩k k a EX =,k 阶中心矩()k k b E X EX =-.显然,随机变量的数学期望是一阶原点矩,随机变量的方差是二阶中心矩. 问题4 如何求随机变量的数字特征?答 随机变量的数字特征是重点,也是常考点,读者务必在理解概念的基础上,熟练掌握计算数字特征的方法:⑴利用定义(6个公式)⑵用性质,计算时,要充分利用独立性条件. 例1.设随机变量X 在[]2,1-上服从均匀分布,令随机变量1,0,1,Y ⎧⎪=⎨⎪-⎩0,0,0,X X X >=<则方差=DY .【98,提示:先求Y 的分布,再利用公式22()DY EY EY =-】2.已知甲、乙两箱中装有同种产品,其中甲箱中装有3件合格品和3件次品,乙箱中仅装有3件合格品.从甲箱中任取3件产品放入乙箱后,求:⑴乙箱中次品数X 的数学期望;⑵从乙箱中任取一件产品是次品的概率p .【⑴23=EX ⑵14】 3.设随机变量X 的概率密度为,()0,ax b f x +⎧=⎨⎩]1,0[]1,0[∉∈x x 且已知127=EX ,则=a ,=b .【提示:10()()1f x dx ax b dx +∞-∞=+=⎰⎰,17()()12xf x dx x ax b dx +∞-∞=+=⎰⎰】 4.设某种商品每周的需求量X 是服从区间]30,10[上均匀分布的随机变量,而经销商店进货量为区间]30,10[中的某一整数,商店每销售一单位商品可获利500元;若供大于求,则削价处理,每处理一单位商品亏损100元;若供不应求,则可以从外部调剂供应,此时每 一单位商品仅获利300元,为使商店所获利润期望值不少于9280元,试确定最少进货量.解 X 服从区间]30,10[上均匀分布,概率密度1,1030,()200,.x f x else ⎧≤≤⎪=⎨⎪⎩设进货量为a ,则当10X a ≤≤时,利润500100()600100Y X a X X a =--=- 当30a X <≤时,利润500300()300200Y a X a X a =+-=+故600100,10,()300200,30,X a X a Y g X X a a X -≤≤⎧==⎨+<≤⎩利润期望值令9280EY ≥,解得21a = 5.已知随机变量X 的概率密度函数221()xx f x-+-=,则EX = ,DX = .【1;12】 问题5 叙述协方差、相关系数的定义与性质 答1.协方差定义 随机变量X 与Y 的协方差(,)()()Cov X Y E X EX Y EY =--. 协方差具有如下性质: ⑴(,)(,)Cov X Y Cov Y X =; ⑵(,)(,)Cov aX bY abCov X Y =; ⑶(,)(,)Cov X k Y h Cov X Y ++=;⑷(,)(,)(,)Cov X Y Z Cov X Y Cov X Z +=+; ⑸(,)Cov X X DX =;⑹(,)Cov X Y EXY EX EY =-⋅; ⑺()2(,)D X Y DX DY Cov X Y ±=+±.2.相关系数相关系数刻画两个随机变量X 与Y 的线性相关程度. 定义 随机变量X 与Y 的相关系数XY ρ=. 若0XY ρ=,则称随机变量X 与Y 不相关.相关系数具有如下性质: ⑴1XY ρ≤;⑵{}11XY P Y aX b ρ=⇔=+=,特别:若Y aX b =+,则当0a >时,1XY ρ=,当0a <时,1XY ρ=-.问题6 设0,0DX DY ≠≠,证明下列命题等价: ⑴X 与Y 不相关; ⑵(,)0Cov X Y =; ⑶EXY EX EY =⋅; ⑷()D X Y DX DY +=+. 证 由XY ρ=知,命题⑴和⑵等价;由(,)Cov X Y EXY EX EY =-⋅知,命题⑵和⑶等价; 由()2(,)D X Y DX DY Cov X Y +=++知,命题⑵和⑷等价; 由等价关系的传递性知,这四个命题等价.问题7 随机变量的独立性与相关性有何关系? 答 若X 与Y 独立,则X 与Y 一定不相关.证明如下:X 与Y 独立⇒EXY EX EY =⋅⇒(,)0Cov X Y =⇒0XY ρ=,即X 与Y 一定不相关.若X 与Y 不相关,则X 与Y 不一定独立. 例如二维随机变量),(Y X 服从单位圆}1),{(22≤+=y x y x G 上的均匀分布,则X 和Y 不相关,且X 与Y 不独立.注意 若X 与Y 的联合分布为二维正态分布,则X 与Y 独立的充要条件是X 与Y 不相关.例1.设随机变量X 与Y 独立同分布,且X 的概率分布为{}213P X ==,{}123P X ==,max(,)U X Y =,min(,)V X Y =,求U 与V 的协方差(,)Cov U V .【481】2.设Y X ,独立且都服从))21(,0(2N ,求Y X -的期望与方差.2π-】3.对40个人的血液进行化验时,将每4个人并为一组化验一次,如果合格,则4个人只化验一次,若不合格,再对这组4个人逐个进行化验,共化验5次。

第四章-随机变量的数字特征PPT课件

第四章-随机变量的数字特征PPT课件

k 1
k 1
变量X的数学期望,记为E(X),即
EX xk pk k1
§4.1 数学期望
关于定义的几点说明 (1) E(X)是一个实数,而非变量,它是一种加权平均,与
一般的算术平均值不同 , 它从本质上体现了随机变量 X 取可能值的真正的平均值, 也称均值.
(2) 级数的绝对收敛性保证了级数的和不随级数各 项次序的改变而改变 , 之所以这样要求是因为数学期望 是反映随机变量X 取可能值的平均值,它不应随可能值的 排列次序而改变.
❖ 例3:设 X(),求 E (X)。
解 : X 的 分 布 律 为 : P ( X k ) k e k 0 , 1 , 0 k ! X的 数 学 期 望 为 :
E(X) k ke
k0 k!
e
k1
k1
(k 1)!
ee
即E(X)
§4.1 数学期望
三、连续型随机变量的数学期望
设连续型随机变量X 的概率密度为f ( x), 若积分
§4.2 方差
(2) 利用公式计算
D (X ) E (X 2 ) [E (X )2 .] 证明 D (X ) E {X [ E (X )2 } ]
E { X 2 2 X ( X ) E [ E ( X )2 } ] E ( X 2 ) 2 E ( X ) E ( X ) [ E ( X )2] E (X 2)[E (X )2] E (X2)E 2(X).
§4.1 数学期望
❖ 例2:某车站每天8:00—9:00,9:00—10:00都恰有一 辆客车到站,但到站的时刻是随机的,且两者到站的时间 相互独立。其规律为
8:10 8:30 8:50
到站时刻
9:10 9:30 9:50

第四章随机变量的数字特征

第四章随机变量的数字特征



首先将二维正态随机变量的概率密度改写成另一种形式 二维正态随机变量(X1,X2)的概率密度为
( x1 1 ) 2 ( x1 1 )( x 2 2 ) ( x 2 2 ) 2 2 2 2 2 ( 1 2 ) 1 2 1 2 1
协方差 Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}=E(XY)-E(X)E(Y) 相关系数 XY
Cov( X , Y ) D( X ) D(Y )
相关系数的性质
1° |XY|£1
XY仅说明X和Y的线性相关性,因此X,Y不相关,不一定独立
对于二维正态随机变量X,Y则存在特例:=0 ÛX和Y相互独立 矩、协方差矩阵 l阶中心矩 E{[X-E(X)]l} l阶原点矩 E(Xl) l+m阶混合原点矩 E(XlYm)
第四章 随机变量的数字特征

§4.1 数学期望 §4.2 方差 §4.3 协方差及相关系数

§4.4 矩、协方差矩阵
1/21
§4.4 矩、协方差矩阵

本节引入随机变量的另外几个数字特征
定义:X和Y是随机变量 1°若E(Xk)存在,k=1,2,…,称它为X的k阶原点矩,简称k阶矩 当k=1时即为数学期望E(X),它是X的一阶原点矩 2°若E{[X-E(X)]k}存在,k=1,2,…,称它为X的k阶中心矩

Cov(X1,X2)
Cov(X2,X1) D(X2)
将它们排成矩阵的形式, c11 c12 这个矩阵称为随机变量 (X1,X2)的协方差矩阵 c c 21 22 3/21
§4.4 矩、协方差矩阵
设 n 维随机变量( X 1 , X 2 ,, X n ) 的二阶混合中心矩

第四章 随机变量的数字特征

第四章  随机变量的数字特征

7
7
7
7
7
79.3
以频率为权重的加权平均
数学期望E(X)
Mathematical Expectation 离散型随机变量
定义 设离散型随机变量的概率分布为
P( X xk ) pk k 1, 2,
若级数 pk xk 绝对收敛, 则称此级数为
k
随机变量X的数学期望,记作E(X),即
E( X ) p1x1 p2x2 pk xk pk xk
若广义积分 xf ( x)dx 绝对收敛, 则称此积分为
X的数学期望
即 E(X ) x f (x)dx
数学期望的计算
例 已知随机变量X的密度函数为
1
f (x) 1 x2
0
x 1 x 1
求数学期望。

E(X )
xf (x)dx
1
1
x 0 dx x
1
dx x 0 dx
x f (x, y)dxdy,
E(Y )
y fY ( y)dy
y f (x, y)dxdy.
例 设(X,Y)的联合密度为
kxy x [0,1], y [1, 3]
f (x, y)
0
其它
(1) 求k
(2) 求X和Y的边缘密度 (3) 求E(X), E(Y).
解 (1)由
f ( x, y)dxdy 1
E(Y ) E[g( X )] g( xk ) pk k 1
➢ 连续型 概率密度为f (x)
E(Y ) E[g( X )] g( x) f ( x)dx
例 已知 X 服从0,2 上的均匀分布,求
Y sin X 的数学期望。

E(Y

第四章 随机变量的数字特征总结

第四章 随机变量的数字特征总结

第四章 随机变量的数字特征㈠ 数学期望 表征随机变量取值的平均水平、“中心”位置或“集中”位置. 1、数学期望的定义(1) 定义 离散型和连续型随机变量X 的数学期望定义为{}⎪⎩⎪⎨⎧==⎰∑∞∞- d )( )()( ,,连续型离散型x x xf x X x X kk k P E其中Σ表示对X 的一切可能值求和.对于离散型变量,若可能值个数无限,则要求级数绝对收敛;对于连续型变量,要求定义中的积分绝对收敛;否则认为数学期望不存在. ①常见的离散型随机变量的数学期望1、离散型随机变量的数学期望设离散型随机变量的概率分布为,若,则称级数为随机变量的数学期望(或称为均值),记为, 即2、两点分布的数学期望设服从0—1分布,则有,根据定义,的数学期望为.3、二项分布的数学期望设服从以为参数的二项分布,,则。

4、泊松分布的数学期望设随机变量服从参数为的泊松分布,即,从而有。

①常见的连续型随机变量的数学期望1)均匀分布设随机变量ξ服从均匀分布,ξ~U [a ,b ] (a <b ),它的概率密度函数为:= 则=∴ E (ξ)=(a+b )/2. 即数学期望位于区间的中点.2)正态分布设随机变量ξ服从正态分布, ξ~N (μ,σ2),它的概率密度函数为:(σ>0, -<μ<+ ) 则令得∴ E (ξ)= μ .3)指数分布设随机变量服从参数为的指数分布,的密度函数为,则.(2) 随机变量的函数的数学期望 设)(x g y =为连续函数或分段连续函数,而X 是任一随机变量,则随机变量)(X g Y=的数学期望可以通过随机变量X 的概率分布直接来求,而不必先求出Y 的概率分布再求其数学期望;对于二元函数),(Y X g Z=,有类似的公式:(){}⎪⎩⎪⎨⎧===⎰∑∞∞.;(连续型)离散型-d )()( )( )(x x f x g x X x g X g Y kk k P E E ()(){}()()()()⎪⎩⎪⎨⎧====⎰⎰∑∑∞∞-∞∞-.;连续型离散型 d d ,, ,,,y x y x f y x g y Y x X y x g Y X g Z i j j i j i P E E 设(,)X Y 为二维离散型随机变量,其联合概率函数(,),,1,2,,i j ij P X a Y b p i j ====如果级数(,)i j ij j i g a b p ∑∑绝对收敛,则(,)X Y 的函数(,)g X Y 的数学期望为 [(,)](,)i j ij j i E g X Y g a b p =∑∑; 特别地();()i ij j iji i j i E X a p E Y b p ==∑∑∑∑.设X 为连续型随机变量,其概率密度为()f x ,如果广义积分 ()()g x f x dx+∞-∞⎰绝对收敛,则X 的函数()g X 的数学期望为[()]()()E g X g x f x dx+∞-∞=⎰.设(,)X Y 为二维连续型随机变量,其联合概率密度为(,)f x y ,如果广义积分(,)(,)g x y f x y dxdy+∞+∞-∞-∞⎰⎰绝对收敛,则(,)X Y 的函数(,)g X Y 的数学期望为[(,)](,)(,)E g x y g x y f x y dxdy+∞+∞-∞-∞=⎰⎰; 特别地()(,)E x xf x y dxdy +∞+∞-∞-∞=⎰⎰,()(,)E Y yf x y dxdy+∞+∞-∞-∞=⎰⎰.注:求E(X,Y)是无意义的,比如说二维(身高,胖瘦)的数学期望是无意义的,但是二维随机变量函数Z= E(X,Y)是有意义的,他表示的是函数下的另一个一维意义。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

这意味着,如果进行多次射击,甲所得分数的平均 值接近于1.8分,而乙得分的平均值接近1分。很明 显乙的成绩远不如甲。
例 4 甲、乙两位外科医生,各自对10名心脏病患者进行手术治疗。 假定这两组病人的年龄、病情等基本相同,用 X,Y 分别表示他们 的手术成功例数,其概率函数如下表,试比较两位医生技术水平的 高低。 X 甲 0 1 2 3 4
练习1:你(花1美元) ,机器掷出三颗骰子(骰子从1到6中)。 三颗骰子都是6,你可赢3美元;三颗骰子有两个6,你可赢2美 元;三颗骰子仅有一个6,你可赢1美元. 没有6时,你才输1美元. • 请问你愿意赌吗? 练习2:设电气设备在某时段最大负荷的时间x(单位:
min)是一个随机变量,其分布密度为
(i 1, 2,)
机变量 X 的数学期望(mathematical expectation)或总体均数(population mean),
i 1 i
xp 记为 E(X) 或简记为 EX,即 EX=
i

【例3】甲乙两人进行打靶,所得分数分别记 为X,Y,它们的分布律分别为
试比较他们成绩的好坏 解 我们分别计算X和Y的数学期望: EX=0×0+1×0.2+2×0.8=1.8(分)。 EY=0×0.1+1×0.8+2×0.1=1(分)。
X表示分数,X的分布:
X pi 90 3/8 80 4/8 60 1/8
例2 一批钢筋共有10 根,抗拉强度指标为120和130 的各2根,125的有3根,110,135,140的各1根,求 它们的平均抗拉强度。
120 2 130 2 125 3 110 135 140 10 2 2 3 1 1 1 120 130 125 110 135 140 10 10 10 10 10 10 126
医用高等数学
第四节 随机变量的数字特征
一、数学期望及其性质 二、方差及其性质 三、几个常见分布的数学期望和方差
医用高等数学
随机变量的数字特征 表示随机变量分布特征的数量指标,称为随机 变量的数字特征。 常用的数字特征有二类: 位置参数:表示随机变量分布的集中程度、平均 水平。如:数学期望等。 变异参数:表示随机变量分布的离散程度、变 异大小。如:方差、协方差、变异系数等。
2
2 2 2 2 乙: E(Y EY ) (8 9) 0.1 (9 9) 0.8 (10 9) 0.1 0.2
由于 E X EX EY EY
2
2
,
因此,我们认为乙的射击水平更稳定些。
医用高等数学
07-04-20
二 方差(variance)及其性质 设 X 为一随机变量,若 E(XEX)2 存在,则称它为随机变量 X 的方差, 记作 V(X),即 V(X)=E(XEX)2 标准差(standard deviation) 设随机变量 X 的方差为 V(X),则称 V ( X ) 为随机变量 X 的标准差,记为 SD。即 SD V ( X )
EX
试求 V(X)。

指数分布:
D( X )
1
2
医用高等数学
变异系数(coefficient of variation) 设随机变量 X 的数学期望为 EX,标准差为 V ( X ) , 则称
解:分组,每组有k个人。k个人血混在一起。若检验为阴性, 说明k个人全部为阴性。只检验一次即可,平均每人检验1/k次。 若检验为阳性, k个人再一一检验,共检验k+1次。 平均每人检验(k+1)/k次。 设发病率p很小,且每人的反应是独立的。 X P
1/k
(1 P)k
(k+1)/k
1 (1 P)k
E (aX ) axp( x)dx a




xp( x)dx E (aX )
(3)设 X 为一随机变量,a 和 b 为常数,则 E(aX+b)=aE(X)+b
E (aX b) (ax b) p( x)dx a

xp( x)dx bp( x)dx
X
P
EX
1/k
(1 P)
k
(k+1)/k
1 (1 P)k
1 k 1 1 (1 p) k [1 (1 p) k ] 1 (1 p) k k k k
为了减少检验的工作量,
EX <1
1 <(1 p) k k
1 1 (1 p) k <1, k
min)是一个随机变量,其分布密度为
1 15002 x, 1 ( x 3000), p( x) 15002 0, 0 x 1500 1500 x 3000 其他
试求最大负荷的平均时间。
解:最大负荷的平均时间,即为x的数学期望,故
Ex xp( x )dx


aE ( X ) b
(4)两个随机变量的和的数学期望,等于它们各自数学 期望之代数和,即 E( X Y ) E ( X ) E (Y )
有限多个
E( X1 X 2 X n ) E( X1 ) E( X 2 ) E( X n )
(5)若随机变量 X 与 Y 独立,则 E(XY)=EXEY
若p 0.01, 取k 11
1 EX 1 (1 p) k 0.1956 k
平均每人检验0.1956次。
【例6】设随机变量X的分布律为
X
pi
–1
0.1
0
0.2
1
0.4
2
0.3
求E(2X – 1),E(X 2). 解: E(2X – 1) = [2(–1) –1] 0.1 + [2 0 – 1] 0.2 + [21 – 1] 0.4 + [2 2 – 1] 0.3 = 0.8.
一、数学期望及其性质 数学期望(mathematical expectation) 例1 小组 8 个人,英语得 90 分的 3 人,80 分的 4 人, 60 分的 1 人,求平均分数.
90 3 80 4 60 1 3 4 1 90 80 60 3 4 1 8 8 8



1500
0
3000 x 1 x dx x ( x 3000)dx 2 2 1500 1500 1500
1500 (min)
注:数学期望是体现随机变量集中位置的数字特征。
• 方差的概念 回顾 • 例: 现有甲、乙两位射手,甲射手射击中命中的环数 • 用X表示,乙射手射击中命中的环数用Y表示,甲、乙两射手射 击中命中的环数分布分别为: • 现在问甲、乙两位射手谁的射击水平谁更稳定些? • 易知,甲、乙两位射手每次射击命中的平均环数分别为 • , • . 甲 乙
e x , x 0 p( x) 试求 EX。 0 ,x 0
E ( X ) xe
0

x
dx xde x
0

xe
x 0
e
0

x
dx
1

数学期望的性质:
(1)常数 C 的数学期望等于常数 C,即 E(C)=C。
(2)若 a 是常数,X 是任一随机变量,则 E(aX)=aE(X)。
07-04-28
V(X)=E(X2)(EX)2 方差的性质: (1)常数的方差等于零,即 V(C)=0
(2)设 X 为一随机变量,a 为常数,则 V(aX)=a2V(X) (3)设 X 为一随机变量,a 和 b 为常数,则 V(aX+b)=a2V(X) (4)设 X,Y 是任意两个相互独立的随机变量,则 V(X+Y)=V(X)+V(Y) 推广:(a) 有限多个; (b) V(XY)=V(X)+V(Y)
P 5 0.103
Y P
0.028 6 0.037
0 0.001
0.121 7 0.009
1 0.010
0.234 8 0.001
2 0.044
0.267 9 0.000
3 0.117
0.200 10 0.000
4 0.205

5 0.247
EX xi pi
i 1
10
6 0.205
7 0.117
2 E ( x Ex xE Ex E )
E( x Ex )2 E( E )2
Dx D
医用高等数学
例 设随机变量 X 服从参数为 的指数分布,其概率密 度函数为 e x , x 0 p( x) 1 0 ,x 0
医用高等数学
07-04-22
对离散型随机变量 X
V ( X ) ( xi EX ) pi
2 i 1

对连续型随机变量 X
V ( X ) ( x EX ) p( x)dx
2

计算方差的常用计算公式 V(X)=E(X2)(EX)2 证明: D(X)=E[X-E(X)]2
D( x ) E( x ) E( x )
E( x Ex ) ( E )
2
2
E( x Ex )2 E( E )2
2 E [( x Ex )( E )]
独立性
E( x Ex )2 E( E )2
1 15002 x, 1 ( x 3000), 2 p( x) 1500 0, 0 x 1500 1500 x 3000 其他
试求最大负荷的平均时间。
练习1:你(花1美元) ,机器掷出三颗骰子(骰子从1到6中)。 三颗骰子都是6,你可赢3美元;三颗骰子有两个6,你可赢2美 元;三颗骰子仅有一个6,你可赢1美元. 没有6时,你才输1美元. • 请问你愿意赌吗?
相关文档
最新文档