2019精品概率论及数理统计随机变量的数字特征化学
2019年概率论与数理统计第四章随机变量的数字特征第一节数学期望.ppt
三、随机变量函数的数学期望
使用这种方法必须先求出随机变量函数g(X)的 分布,一般是比较复杂的 . 那么是否可以不先求g(X)的分布而只根据X的 分布求得E[g(X)]呢?
于是
1 1 (1 n)n n 1 E(X) k n 2 n 2 k 1
n
二、连续型随机变量的数学期望
定义2 设连续型随机变量X的概率密度为f(x),如
果积分
绝对收敛,则称该积分的值
为随机变量X的数学期望或者均值,记为EX,即
如果积分
发散,则称X的数学期
望不存在。
二、连续型随机变量的数学期望
随机变量的数字特征
第一节 数学期望
在第二章中,我们讨论了随机变量及其分布, 如果知道了随机变量X的概率分布,那么X的全部概 率特征也就知道了. 然而,在实际问题中,概率分布一般是较难确 定的. 而在一些实际应用中,人们并不需要知道随 机变量的一切概率性质,只要知道它的某些数字特 征就够了. 因此,在对随机变量的研究中,确定某些数字 特征是重要的 . 常用的数字特征:数学期望,方差.
E (5 X ) 5 E ( X ) 5 0.45 2.25 (元).
设寿命 X 服从指数分布, 概率密度为 1 x 10 , x 0, e f ( x ) 10 x 0. 0, 试求该商店一台家用电 器收费 Y 的数学期望.
二、连续型随机变量的数学期望
1 x 10 0.1 1 e 0.0952, dx 解: P{ X 1} e 0 10 2 1 x 10 P{1 X 2} e dx 1 10 e 0.1 e 0.2 0.0861,
概率论与数理统计随机变量的数字特征
第四章随机变量的数字特征前面讨论了随机变量的分布函数, 从中知道随机变量的分布函数能完整地描述随机变量的统计规律性.但在许多实际问题中, 人们并不需要去全面考察随机变量的变化情况, 而只要知道它的某些数字特征即可.例如, 在评价某地区粮食产量的水平时, 通常只要知道该地区粮食的平均产量;又如, 在评价一批棉花的质量时, 既要注意纤维的平均长度, 又要注意纤维长度与平均长度之间的偏离程度, 平均长度较大, 偏离程度小, 则质量就较好. 等等实际上, 描述随机变量的平均值和偏离程度的某些数字特征在理论和实践上都具有重要的意义, 它们能更直接、更简洁更清晰和更实用地反映出随机变量的本质.本章将要讨论的随机变量的常用数字特征包括: 数学期望、方差、相关系数、矩.第一节数学期望内容分布图示★引言★离散型随机变量的数学期望★例1 ★例2 ★例3★连续型随机变量的数学期望★例4★例5 ★例6 ★例7★随机变量函数的数学期望★例8★例9 ★例10 ★例11★数学期望的性质★例12 ★例13 ★例14★内容小结★课堂练习★习题4-1 ★返回内容要点:一、离散型随机变量的数学期望平均值是日常生活中最常用的一个数字特征, 它对评判事物、作出决策等具有重要作用.定义设X是离散型随机变量的概率分布为,2,1,}{===ipxXP ii如果∑∞=1iiipx绝对收敛, 则定义X的数学期望(又称均值)为.)(1∑∞==iiipxXE二、连续型随机变量的数学期望定义设X是连续型随机变量, 其密度函数为)(xf,如果⎰∞∞-dxx xf) (绝对收敛, 定义X 的数学期望为 .)()(⎰∞∞-=dx x xf X E三、 随机变量函数的数学期望设X 是一随机变量, )(x g 为一实函数,则)(X g Y =也是一随机变量, 理论上, 虽然可通过X 的分布求出)(X g 的分布, 再按定义求出)(X g 的数学期望)]([X g E . 但这种求法一般比较复杂. 下面不加证明地引入有关计算随机变量函数的数学期望的定理.定理1 设X 是一个随机变量, )(X g Y =,且)(Y E 存在, 则(1) 若X 为离散型随机变量, 其概率分布为,2,1,}{===i p x X P i i则Y 的数学期望为.)()]([)(1∑∞===i i i p x g X g E Y E(2) 若X 为连续型随机变量, 其概率密度为)(x f , 则Y 的数学期望为.)()()]([)(⎰∞∞-==dx x f x g X g E Y E注: (i)定理的重要性在于:求)]([X g E 时, 不必知道)(X g 的分布, 只需知道X 的分布即可. 这给求随机变量函数的数学期望带来很大方便;(ii) 上述定理可推广到二维以上的情形, 即有定理2 设),(Y X 是二维随机向量, ),(Y X g Z =,且)(Z E 存在, 则 (1)若),(Y X 为离散型随机向量, 其概率分布为),2,1,(},{ ====j i p y Y x X P ij j i则Z 的数学期望为,),()],([)(11∑∑∞=∞===j i ij j i p y x g Y X g E Z E(2) 若),(Y X 为连续型随机向量, 其概率密度为),(y x f 则Z 的数学期望为.),(),()],([)(⎰⎰∞∞-∞∞-==dx y x f y x g Y X g E Z E四、数学期望的性质1. 设C 是常数, 则;)(C C E =2.若k 是常数,则);()(X kE kX E =3. );()()(2121X E X E X X E +=+4. 设Y X ,独立, 则)()()(Y E X E XY E =;注: (i) 由)()()(Y E X E XY E =不一定能推出Y X ,独立,例如,在例10中,已计算得 49)()()(==Y E X E XY E , 但 81}0{},431{,0}0,1{=======Y P X P Y X P ,显然}0{}1{}0,1{=⋅=≠==Y P X P Y X P 故X 与Y 不独立(ii) 这个性质可推广到有限个随机变量之和的情形.例题选讲:离散型随机变量的数学期望例1 (讲义例1) 甲, 乙两人进行打靶, 所得分数分别记为21,X X , 它们的分布律分别为,8.02.002101i p X1.03.06.02102ip X试评定他们的成绩的好坏.例2 (讲义例2) 某种产品的每件表面上的疵点数服从参数8.0=λ的泊松分布, 若规定疵点数不超过1个为一等品, 价值10元; 疵点数大于1个不多于4个为二等品, 价值8元; 疵点数超过4个为废品. 求:(1) 产品的废品率; (2) 产品价值的平均值.例3 按规定,某车站每天8:00~9:00和9:00~10:00之间都恰有一辆客车到站, 但到站的时刻是随机的, 且两者到站的时间相互独立. 其规律为一旅客8:20连续型随机变量的数学期望例4 (讲义例3) 已知随机变量X 的分布函数 ⎪⎩⎪⎨⎧>≤<≤=4,140,4/0,0)(x x x x x F , 求).(X E例5 (讲义例4) 某商店对某种家用电器的销售采用先使用后付款的方式. 记使用寿命为X (以年计), 规定:.3000,3;2500,32;2000,21;1500,1元一台付款元一台付款元一台付款元一台付款>≤<≤≤X X X X设寿命X 服从指数分布, 概率密度为()⎪⎩⎪⎨⎧≤>=-.0,00,10110/x x e x f x试求该商店一台电器收费Y 的数学期望.例6 (讲义例5) 设随机变量,127)(),(~=X E x f X 且 ⎩⎨⎧≤≤+=其它,010,)(x b ax x f求a 与b 的值, 并求分布函数)(x F .例7 有2个相互独立工作的电子装置, 它们的寿命)2,1(=k X k 服从统一指数分布,其概率密度为⎪⎩⎪⎨⎧≤>=-0,00,1)(/x x e x f x θθ,.0>θ若将这2个电子装置串联联接组成整机, 求整机寿命(以小时计)N 的数学期望.随机变量函数的数学期望例8 (讲义例6) 设),(Y X 的联合概率分布为:求).(),(),(XY E Y E X E例9 (讲义例7) 设随机变量X 在],0[π上服从均匀分布, 求)(),(sin 2X E X E 及.)]([2X E X E -例10 (讲义例8) 设随机变量),(Y X 的概率密度⎪⎩⎪⎨⎧><<=.,0,1,1,23),(23其它x x y x yx y x f 求数学期望.1),(⎪⎭⎫⎝⎛XY E Y E例11 (讲义例9) 设某商店经营一种商品, 每周的进货量X 和顾客对该种商品的需求量Y 是两个相互独立的随机变量, 均服从[10,20]上的均匀分布. 此商店每售出一个单位的商品可获利1000元, 若需求量超过进货量, 可从其他商店调剂供应, 此时售出的每单位商品仅获利500元. 求此商店经销这种商品每周获利的期望.例12 设)(),(2X E X E 均存在,证明222)]([)()]([X E X E X E X E -=-. 例13 (二项分布的数学期望)若),,(~p n b X 求).(X E 数学期望的性质例14 (讲义例10) 一民航送各车载有20位旅客自机场开出, 旅客有10个车站可以下车. 如到达一个车站没有旅客下车就不停车. 以X 表示停车的次数, 求E (X ) (设每位旅客在各个车站下车是等可能的, 并设各旅客是否下车相互独立).课堂练习1. 设甲、乙两人玩必分胜负的赌博游戏, 假定游戏的规则不公正, 以致两人获胜的概率不等,甲为p , 乙为q ,,q p >1=+q p . 为了补偿乙的不利地位, 另行规定两人下的赌注不相等, 甲为a , 乙为b , b a >. 现在的问题是: a 究竟应比b 大多少, 才能做到公正?2. 某种新药在400名病人中进行临床试验有一半人服用,一班人未服,经过5天后,有210人痊愈,其中190人是服了新药的.试用概率统计方法说明新药的疗效.3. 把数字n ,,2,1 任意地排成一列, 如果数字k 恰好出现在第k 个位置上, 则称为一个巧合, 求巧合个数的数学期望.第二节 方差随机变量的数学期望是对随机变量取值水平的综合评价, 而随机变量取值的稳定性是判断随机现象性质的另一个十分重要的指标.内容分布图示★ 引言 ★ 方差的定义★ 方差的计算 ★ 例1 ★ 例2★ 例3 ★ 例4 ★ 例5 ★ 例6★ 例7★ 方差的性质 ★ 例8 ★ 例9 ★ 例10★ 补充说明 ★ 例11 ★ 例12 ★ 条件期望与条件方差简介★ 例13★ 内容小结 ★ 课堂练习 ★ 习题4-2 ★ 返回内容要点:一、 方差的定义定义1 设X 是一个随机变量, 若2)]([(X E X E -存在,则称它为X 的方差, 记为.)]([)(2X E X E X D -=方差的算术平方根)(X D 称为标准差或均方差, 它与X 具有相同的度量单位, 在实际应用中经常使用.方差刻划了随机变量X 的取值与数学期望的偏离程度,它的大小可以衡量随机变量取值的稳定性.从方差的定义易见:(1)若X 的取值比较集中,则方差较小; (2)若X 的取值比较分散,则方差较大;(3)若方差0)(=X D , 则随机变量X 以概率1取常数值,此时X 也就不是随机变量了.二、 方差的计算若X 是离散型随机变量,且其概率分布为,2,1,}{===i p x X P i i则 ;)]([)(12∑∞=-=i i i p X E x X D若X 是连续型随机变量,且其概率密度为),(x f 则.)()]([)(2⎰∞∞--=dx x f X E x X D i利用数学期望的性质, 易得计算方差的一个简化公式:22)]([)()(X E X E X D -=.三、方差的性质1. 设C 常数, 则0)(=C D ;2. 若X 是随机变量, 若C 是常数, 则);()(2X D C CX D =3. 设Y X ,是两个随机向量,则)));())((((2)()()(Y E Y X E X E Y D X D Y X D --±+=± 特别地, 若Y X ,相互独立, 则).()()(Y D X D Y X D +=±注: 对n 维情形, 有: 若n X X X ,,,21 相互独立, 则.)(,)(12111∑∑∑∑=====⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡n i i i n i i i n i i n i i X D C X C D X D X D四、 条件数学期望和条件方差简介由于随机变量之间存在相互联系, 一个随机变量的取值可能会对另一随机变量的分布产生影响, 这种影响会在数字特征上得到反映. 下面要讨论的是:在某个随机变量取某值的条件下,求另一个与之相关的随机变量的数字特征. 作为简介,这里我们直接给出它们的定义.1. 设),(Y X 是离散型随机向量, 其概率分布为),,2,1,,2,1(},{ =====j i p y Y x X P ijj i定义2 (i) 称}|{)|(i j jj i x X y Y P y x X Y E ====∑(绝对收敛)为在 i x X =条件下Y 的条件数学期望.类似地,称 }|{)|(j i ii i y Y x X P x y Y X E ====∑(绝对收敛)为在 i y Y =条件下X 的条件数学期望;(ii) 称}|{)]|([)|(2i j ji j i x X y Y P x X Y E y x X Y D ===-==∑(绝对收敛)为在 i x X =条件下Y 的条件方差.类似地,称}|{)]|([)|(2j i ij i i y Y x X P y Y X E x y Y X D ===-==∑(绝对收敛)为在j y Y =条件下X 的条件方差.2.设),(Y X 是连续型随机向量, )|(|x y f X Y 是在x X =条件下的概率密度,)|(|y x f Y X 是在y Y =条件下X 的概率密度.定义3 (i) 称 ⎰+∞∞-==dy x y yf x X Y E X Y )|(]|[|(绝对收敛)为在 x X =条件下Y 的条件数学期望;类似地,称⎰+∞∞-==dx y x xf y Y X E Y X )|(]|[|(绝对收敛)为在 y Y =条件下X 的条件数学期望;(ii) 称dy x y f x X Y E y x X Y D X Y )|()]|([)|(|2⎰+∞∞-=-==(绝对收敛)为在x X =条件下Y 的条件方差;类似地,称dx y x f y Y X E x y Y X D Y X )|()]|([)|(|2⎰+∞∞-=-==(绝对收敛)为在y Y =条件下X 的条件方差.例题选讲:方差的计算例 1 (讲义例1) 设随机变量X 具有数学期望,)(μ=X E 方差.0)(2≠=σX D 记,*σμ-=X X 则;0])([1)(1)(*=-=-=μσμσX E X E X E.1])[(1])[()]([)()(222222*2**==-=-=-=σσμσσμX E X E X E XE X D即σμ-=X X *的数学期望为0, 方差为1. *X 称为X 的标准化变量.例2 (讲义例2) 设随机变量X 具有)10(-分布, 其分布律为,}1{,1}0{p X P p X P ==-==求),(X E ).(X D例3 (讲义例3) 设),(~λP X 求),(X E ).(X D 例4 (讲义例4) 设),,(~b a U X 求),(X E ).(X D例5 (讲义例5) 设随机变量X 服从指数分布, 其概率密度为⎪⎩⎪⎨⎧≤>=-.0,0,0,1)(/x x e x f x θθ其中,0>θ 求).(),(X D X E例6 (讲义例6) 设随机变量X 服从几何分布, 概率函数n k p p k X P k ,,2,1,)1(}{1 =-==-其中10<<p , 求)(),(X D X E .例7 (讲义例7) 设随机变量Y X ,的联合点分布在以点(0,1), (1,0), (1,1)为顶点的三角形区域上服从均匀分布, 试求随机变量Y X Z +=的期望与方差.方差的性质例8 (讲义例8) 设,,)()(2R x x X E x f ∈-= 证明当)(X E x =时, )(x f 达到最小值. 注:本例子说明了数学期望)(X E 是随机变量X 取值的集中位置, 反映了X 的平均值. 例9 (讲义例9) 设),(~p n b X , 求).(),(X D X E 例10 (讲义例10) 设),,(~2σμN X 求).(),(X D X E例11 (讲义例11) 设活塞的直径(以cm 计),40.22(~N X )03.02,气缸的直径,50.22(~N Y ),04.02 Y X ,相互独立, 任取一只活塞, 任取一只气缸, 求活塞能装入气缸的概率.例12 设随机变量X 和Y 相互独立, 试证).()]([)()]([)()()(22X D Y E Y D X E Y D X D XY D ++=条件数学期望和条件方差简介例 13 (讲义例12) 设),,,,(~),(222121ρσσμμN Y X ,求),|(x X Y E = )|(x X Y D =.课堂练习1. 设随机变量X 的密度函数为⎪⎩⎪⎨⎧≤≤-<≤=.,021,210,)(其它x x x x x f 求).(X E2. 设随机变量X 的概率分布律为4/112/16/16/13/1212/101i p X -试求1+-=X Y 及2X Z =的期望与方差.第三节 协方差及相关系数对多维随机变量, 随机变量的数学期望和方差只反映了各自的平均值与偏离程度,并没能反映随机变量之间的关系. 本节将要讨论的协方差是反映随机变量之间依赖关系的一个数字特征.内容分布图示★ 引言★ 协方差的定义★ 协方差的性质★ 例1 ★ 例2★ 相关系数的定义 ★ 相关系数的性质★ 例3 ★ 例4 ★ 例5 ★ 例6★ 矩的概念 ★ 协方差矩阵 ★ n 维正态分布的概率密度★ n 维正态分布的几个重要性质 ★ 例7★ 内容小结 ★ 课堂练习 ★ 习题4-3 ★ 返回内容要点:一、 协方差的定义定义 设),(Y X 为二维随机向量,若)]}()][({[Y E Y X E X E --存在, 则称其为随机变量X 和Y 的协方差, 记为),(Y XC o v ,即 )]}.()][({[),cov(Y E Y X E X E Y X --=按定义, 若),(Y X 为离散型随机向量,其概率分布为),2,1,(},{ ====j i p y Y x X P ijj i则 ∑--=ji j i Y E y X E x E Y X ,)]}.()][({[),cov(若),(Y X 为连续型随机向量, 其概率分布为),,(y x f 则⎰⎰+∞∞-+∞∞---=dxdy y x f Y E y X E x E Y X ),()]}()][({[),cov(.此外, 利用数学期望的性质, 易将协方差的计算化简.).()()()()()()()()()()]}()][({[),cov(Y E X E XY E Y E X E X E Y E Y E X E XY E Y E Y X E X E Y X -=+--=--=特别地, 当X 与Y 独立时, 有 .0),cov(=Y X二、协方差的性质1. 协方差的基本性质 );(),cov()1(X D X X = );,cov(),cov()2(X Y Y X =),cov(),cov()3(Y X ab bY aX =,其中b a ,是常数; C X C ,0),cov()4(=为任意常数;).,cov(),cov(),cov()5(2121Y X Y X Y X X +=+(6) 若X 与Y 相互独立时,则.0),cov(=Y X2. 随机变量和的方差与协方差的关系),,cov(2)()()(Y X Y D X D Y X D ++=+ 特别地, 若X 与Y 相互独立时, 则)()()(Y D X D Y X D +=+.三、相关系数的定义与性质定义 设),(Y X 为二维随机变量,,0)(,0)(>>Y D X D 称)()(),(Y D X D Y X Cov XY =ρ为随机变量X 和Y 的相关系数.有时也记XY ρ为ρ. 特别地,当0=XY ρ时,称X 与Y 不相关. 相关系数的性质1. ;1||≤XY ρ2. 若X 和Y 相互独立, 则0=XY ρ.3. 若0,0>>DY DX ,则1||=XY ρ当且仅当存在常数).0(,≠a b a 使1}{=+=b aX Y P , 而且当0>a 时, 1=XY ρ;当0<a 时, 1-=XY ρ.注: 相关系数XY ρ刻画了随机变量Y 与X 之间的“线性相关”程度. ||XY ρ的值越接近1, Y 与X 的线性相关程度越高; ||XY ρ的值越近于0, Y 与Y 的线性相关程度越弱.当1||=XY ρ时, Y 与X 的变化可完全由X 的线性函数给出. 当0=XY ρ时, Y 与X 之间不是线性关系.4. 设,)]([2b aX Y E e +-=称为用b aX +来近似Y 的均方误差,则有下列结论. 设,0)(,0)(>>Y D X D 则)()(,)(),cov(000X E a Y E b X D Y X a -==使均方误差达到最小.注: 我们可用均方误差e 来衡量以b aX +近似表示Y 的好坏程度, e 值越小表示b aX +与Y 的近似程度越好.且知最佳的线性近似为.0b X a +而其余均方误差)1)((2XY Y D e ρ-=. 从这个侧面也能说明. ||XY ρ越接近1, e 越小.反之, ||XY ρ越近于0, e 就越大.Y 与X 的线性相关性越小.四、矩的概念定义 设X 和Y 为随机变量, l k ,为正整数, 称)(k X E 为k 阶原点矩(简称k 阶矩阵); ))](([k X E X E - 为k 阶中心矩; )|(|k X E 为k 阶绝对原点矩; )|)((|k X E X E - 为k 阶绝对中心矩; )(l k Y X E 为X 和Y 的l k +阶混合矩;})]([)]({[l k Y E Y X E X E -- 为X 和Y 的l k +阶混合中心矩;注: 由定义可见:(1) X 的数学期望)(X E 是X 的一阶原点矩; (2) X 的方差)(X D 是X 的二阶中心矩;(3)协方差),(Y X Cov 是X 和Y 的二阶混合中心矩.五、协方差矩阵将二维随机变量),(21X X 的四个二阶中心矩)]}.()][({[)]},()][({[},)]({[},)]({[1122212211122222221111X E X X E X E c X E X X E X E c X E X E c X E X E c --=--=-=-=排成矩阵的形式: ⎪⎪⎭⎫⎝⎛22211211c c c c (对称矩阵),称此矩阵为),(21X X 的协方差矩阵. 类似定义n 维随机变量),,,(21n X X X 的协方差矩阵.若n j i X E X X E X E X X Cov c j j i i j i ij ,,2,1,)]}()][({[),( =--==都存在, 则称⎪⎪⎪⎪⎪⎭⎫⎝⎛=nn n n n n c c cc c cc c c C212222111211 为),,,(21n X X X 的协方差矩阵.六、n 维正态分布的概率密度七、n 维正态分布的几个重要性质例题选讲:协方差的性质例1 (讲义例1) 已知离散型随机向量),(Y X 的概率分布为求),cov(Y X .例2 (讲义例2) 设连续型随机变量),(Y X 的密度函数为⎩⎨⎧≤≤≤=其它,010,8),(y x xy y x f求),cov(Y X 和)(Y X D +.相关系数的性质例3 (易知,0)(=X E 于是XY 不相关. 这表示Y X ,不存在线性关系. 但},1{}2{0}1,2{=-=≠==-=Y P X P Y X P 知Y X ,不是相互独立的. 事实上, X 和Y 具有关系: ,2X Y =Y 的值完全可由X 的值所确定.例4 (讲义例4) 设θ服从],[ππ-上的均匀分布, ,sin θ=X θcos =Y 判断X 与Y 是否不相关, 是否独立.例5 (讲义例5) 已知)3,1(~2N X , ),4,0(~2N Y 且X 与Y 的相关系数 .21-=XY ρ 设,23YX Z -=求)(Z D 及.XZ ρ 例6 (讲义例6) 设),(Y X 服从二维正态分布, 它的概率密度为,)())((2)()1(21exp 121),(2222212121212221⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⎥⎥⎦⎤⎢⎢⎣⎡-+-------=σμσσμμρσμρρσπσy y x x y x f 求X 和Y 的相关系数XY ρ.注:在上一章中我们已经得到:若),(Y X 服从二维正态分布, 那么X 和Y 相互独立的充要条件为0=ρ. 现在知道ρ即为X 与Y 的相关系数, 故有下列结论:“若),(Y X 服从二维正态分布,则X 与Y 相互独, 立当且仅当X 与Y 不相关”.n 维正态分布的几个重要性质例7 (讲义例7) 设随机变量X 和Y 相互独立且),.2,1(~N X )1,0(~N Y ,试求32+-=Y X Z 的概率密度.课堂练习1. 对不同品牌的某种机械的两项重要指标评分, 设21,X X 为其所得分数(百分制). 已知,9.68)(1=X E 8.72)(2=X E ; ,81)(1=X D ;49)(2=X D .36),cov(21=X X现以服从正态分布的综合分21167169X X Y +=来决定各参评品牌的名次 .(1) 试求Y 的分布; (2) 如果对综合分85≥Y 的品牌颁奖, 试计算获奖者的百分比.第四节 大数定理与中心极限定理概率论与数理统计是研究随机现象统计规律性的学科. 而随机现象的规律性在相同的条件下进行大量重复试验时会呈现某种稳定性. 例如, 大量的抛掷硬币的随机试验中, 正面出现频率; 在大量文字资料中, 字母使用频率; 工厂大量生产某种产品过程中, 产品的废品率等. 一般地, 要从随机现象中去寻求事件内在的必然规律, 就要研究大量随机现象的问题.在生产实践中, 人们还认识到大量试验数据、测量数据的算术平均值也具有稳定性. 这种稳定性就是我们将要讨论的大数定律的客观背景. 在这一节中,我们将介绍有关随机变量序列的最基本的两类极限定理----大数定理和中心极限定理.内容分布图示★大数定理的引入 ★依概率收敛 ★切比雪夫不等式 ★例1 ★例2★切比雪夫大数定理 ★例3★泊努力大数定理★辛钦大数定理 ★例4★例5大数定理★中心极限定理的引入 ★林德伯格—勒维定理★棣莫佛—拉普拉斯定理 ★例6 ★例7 ★例8 ★例9★例10 ★例11 ★用频率估计概率的误差 ★例12 ★李维普诺夫定理★高尔顿钉板试验中心极限定理★内容小结 ★课堂练习 ★习题4-4★返回内容要点:一、依概率收敛与微积分学中的收敛性的概念类似, 在概率论中, 我们要考虑随机变量序列的收敛性. 定义1 设 ,,,,21n X X X 是一个随机变量序列, a 为一个常数,若对于任意给定的正数ε,有 ,1}|{|lim =<-∞→εa X P n n 则称序列 ,,,,21n X X X 依概率收敛于a , 记为).(∞→−→−n a X Pn定理1 设,,b Y a X Pn P n −→−−→−又设函数),(y x g 在点),(b a 连续, 则),(),(b a g Y X g Pn n −→−.二、切比雪夫不等式定理2设随机变量X 有期望μ=)(X E 和方差2)(σ=X D ,则对于任给0>ε, 有22}|{|εσεμ≤≥-X P .上述不等式称切比雪夫不等式.注:(i) 由切比雪夫不等式可以看出,若2σ越小, 则事件}|)({|ε<-X E X的概率越大, 即, 随机变量X 集中在期望附近的可能性越大. 由此可见方差刻划了随机变量取值的离散程度.(ii) 当方差已知时,切比雪夫不等式给出了X 与它的期望的偏差不小于ε的概率的估计式.如取,3σε= 则有.111.09}3|)({|22≈≤≥-σσσX E X P故对任给的分布,只要期望和方差2σ存在, 则随机变量X 取值偏离)(X E 超过σ3的概率小于0.111.三、大数定理1.切比雪夫大数定律定理3 (切比雪夫大数定律)设 ,,,,21n X X X 是两两不相关的随机变量序列,它们数学期望和方差均存在, 且方差有共同的上界, 即,,2,1,)( =≤i K X D i 则对任意0>ε, 有1)(11lim 11=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<-∑∑==∞→εn i i n i i n X E n X n P 注: 定理表明: 当n 很大时,随机变量序列}{n X 的算术平均值∑=ni i X n 11依概率收敛于其数学期望∑=ni i X E n 1)(1.2.伯努利大数定理定理4 (伯努利大数定律)设A n 是n 重伯努利试验中事件A 发生的次数, p 是事件A 在每次试验中发生的概率, 则对任意的0>ε, 有1lim =⎭⎬⎫⎩⎨⎧<-→∞εp n n P A n 或 0l i m =⎭⎬⎫⎩⎨⎧≥-→∞εp n n P A n . 注:(i) 伯努利大数定律是定理1的推论的一种特例, 它表明: 当重复试验次数n 充分大时, 事件A 发生的频率nn A依概率收敛于事件A 发生的概率p .定理以严格的数学形式表达了频率的稳定性. 在实际应用中, 当试验次数很大时,便可以用事件发生的频率来近似代替事件的概率.(ii) 如果事件A 的概率很小,则由伯努利大数定律知事件A 发生的频率也是很小的,或者说事件A 很少发生. 即“概率很小的随机事件在个别试验中几乎不会发生”,这一原理称为小概率原理,它的实际应用很广泛. 但应注意到,小概率事件与不可能事件是有区别的. 在多次试验中,小概率事件也可能发生.3.辛钦大数定理定理5 (辛钦大数定律) 设随机变量 ,,,,21n X X X 相互独立, 服从同一分布,且具有数学期望,,2,1,)( ==i X E i μ 则对任意0>ε, 有11lim 1=⎭⎬⎫⎩⎨⎧<-∑=∞→εμn i i n X n P . 注: (i) 定理不要求随机变量的方差存在;(ii) 伯努利大数定律是辛钦大数定律的特殊情况;(iii) 辛钦大数定律为寻找随机变量的期望值提供了一条实际可行的途径. 例如, 要估计某地区的平均亩产量, 可收割某些有代表性的地块, 如n 块,计算其平均亩产量, 则当n 较大时,可用它作为整个地区平均亩产量的一个估计. 此类做法在实际应用中具有重要意义.四、中心极限定理在实际问题中, 许多随机现象是由大量相互独立的随机因素综合影响所形成, 其中每一个因素在总的影响中所起的作用是微小的. 这类随机变量一般都服从或近似服从正态分布. 以一门大炮的射程为例, 影响大炮的射程的随机因素包括: 大炮炮身结构的制造导致的误差, 炮弹及炮弹内炸药在质量上的误差, 瞄准时的误差, 受风速、风向的干扰而造成的误差等. 其中每一种误差造成的影响在总的影响中所起的作用是微小的, 并且可以看成是相互独立的, 人们关心的是这众多误差因素对大炮射程所造成的总影响. 因此需要讨论大量独立随机变量和的问题.中心极限定理回答了大量独立随机变量和的近似分布问题, 其结论表明: 当一个量受许多随机因素(主导因素除外) 的共同影响而随机取值, 则它的分布就近似服从正态分布.1.林德伯格—勒维定理定理6 (林德伯格—勒维) 设 ,,,,21n X X X 是独立同分布的随机变量序列, 且,,,2,1,)(,)(2n i X D X E i i ===σμ则 ⎰∑∞--=∞→=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧≤-x t n i i n dt e x n n X P 2/1221lim πσμ 注: 定理6表明: 当n 充分大时, n 个具有期望和方差的独立同分布的随机变量之和近似服从正态分布. 虽然在一般情况下, 我们很难求出n X X X +++ 21的分布的确切形式,但当n 很大时, 可求出其近似分布. 由定理结论有.1),/,(~)1,0(~/1)1,0(~1211∑∑∑====⇒-⇒-n i i ni i ni i X n X n N X N nX n N n n X σμσμσμ近似近似故定理又可表述为: 均值为μ, 方差的02>σ的独立同分布的随机变量 ,,,,21n X X X 的算术平均值X , 当n 充分大时近似地服从均值为μ,方差为n /2σ的正态分布. 这一结果是数理统计中大样本统计推断的理论基础.2. 棣莫佛—拉普拉斯定理在第二章中,作为二项分布的正态近似,我们曾经介绍了棣莫佛—拉普拉斯定理,这里再次给出,并利用上述中心极限定理证明之.定理7(棣莫佛—拉普拉斯定理)设随机变量n Y 服从参数p n ,)10(<<p 的二项分布, 则对任意x , 有)(21)1(lim 22x dt e x p np np Y P x tn n Φ==⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤--⎰∞--∞→π注: 易见,棣莫佛—拉普拉斯定理就是林德伯格—勒维定理的一个特殊情况.3.用频率估计概率的误差设n μ为n 重贝努里试验中事件A 发生的频率, p 为每次试验中事件A 发生的概率,,1p q -=由棣莫佛—拉普拉斯定理,有⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<-<-=⎭⎬⎫⎩⎨⎧<-pq n npqnp pq nP p n P n n εμεεμ .12-⎪⎪⎭⎫ ⎝⎛Φ=⎪⎪⎭⎫ ⎝⎛-Φ-⎪⎪⎭⎫ ⎝⎛Φ≈pq n pq n pq n εεε这个关系式可用解决用频率估计概率的计算问题:4. 李雅普诺夫定理定理8(李雅普诺夫定理) 设随机变量 ,,,,21n X X X 相互独立, 它们具有数学期望和方差: ,2,1,0)(,)(2=>==i X D X E kk k k σμ,记.122∑==nk k nB σ 若存在正数δ, 使得当∞→n 时,,0}|{|1122→-∑=++nk k knXE Bδδμ则随机变量之和∑=n k k X 1的标准化变量:nnk kn k kn k k n k k nk k n B X X D X E X Z ∑∑∑∑∑=====-=⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛-=11111μ的分布函数)(x F n 对于任意x , 满足).(21lim )(lim 2/112x dt e x B X P x F x t n n k k n k k n n n Φ==⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤-=⎰∑∑∞--==∞→∞→πμ注:定理8表明, 在定理的条件下, 随机变量.11nnk kn k kn B X Z ∑∑==-=μ当n 很大时,近似地服从正态分布)1,0(N . 由此, 当n 很大时,∑∑==+=nk k n n nk k Z B X 11μ近似地服从正态分布⎪⎪⎭⎫ ⎝⎛∑=21,n n k k B N μ.这就是说,无论各个随机变量),2,1( =k X k 服从什么分布,只要满足定理的条件,那么它们的和∑=nk k X 1当n 很大时,就近似地服从正态分布.这就是为什么正态随机变量在概率论中占有重要地位的一个基本原因.在很多问题中,所考虑的随机变量可以表示成很多个独立的随机变量之和,例如,在任一指定时刻,一个城市的耗电量是大量用户耗电量的总和;一个物理实验的测量误差是由许多观察不到的、可加的微小误差所合成的,它们往往近似地服从正态分布.例题选讲:切比雪夫不等式例1 (讲义例1) 已知正常男性成人血液中, 每一毫升白细胞数平均是7300, 均方差是700. 利用切比雪夫不等式估计每毫升白细胞数在5200~9400之间的概率.例2 (讲义例2) 在每次试验中, 事件A 发生的概率为0.75, 利用切比雪夫不等式求: 事件A 出现的频率在0.74~0.76之间的概率至少为0.90? 切比雪夫大数定律例3 (讲义例3) 设}{k X 为相互独立的随机变量序列, 且,212112120212212++--k kk kk k pX ,2,1=k 试证}{k X 服从大数定律.辛钦大数定理例4 (讲义例4) 设}{k X 为相互独立且同分布的随机变量序列, 并且k X 的概率分布为),,2,1(2}2{ln 2 ===--i X P ii i k试证}{k X 服从大数定律.中心极限定理例5 在一个罐子中,装有10个编号为0-9的同样的球,从罐中放回地抽取若干次,每次抽一个,并记下号码. 设⎩⎨⎧=否则次取到号码第,00,1k X k , n k ,2,1=问对序列}{k X 能否应用大数定律?例6 (讲义例5) 一盒同型号螺丝钉共有100个,已知该型号的螺丝钉的重量是一个随机变量,期望值是100g 标准差是10g, 一盒螺丝钉的重量超过10.2kg 的概率.例7 (讲义例6)一船舶在某海区航行,已知每遭受一次波浪的冲击,纵摇角大于 3的概率为,3/1=p 若船舶遭受了90000次波浪冲击,问其中有29500~30500次纵摇角度大于 3的概率是多少?例8 对于一个学校而言, 来参加家长会的家长人数是一个随机变量, 设一个学生无家长, 1名家长, 2名家长来参加会议的概率分别0.05, 0.8, 0.15. 若学校共有400名学生, 设各学生参加会议的家长数相互独立, 且服从同一分布.(1)求参加会议的家长数X 超过450的概率;(2)求有1名家长来参加会议的学生数不多于340的概率.例9 (讲义例7)(供电问题)某车间有200台车床, 在生产期间由于需要检修、调换刀具、变换位置及调换工作等常需停车. 设开工率为0.6,并设每台车床的工作是独立的, 且在开工时需电力1千瓦. 问应供应多少瓦电力就能以99.9%的概率保证该车间不会因供电不足而影响生产?例10 设有1000人独立行动, 每个人能够按时进入掩蔽体的概率为0.9. 以95%概率估计, 在一次行动中:(1)至少有多少人能进入掩蔽体; (2)至多有多少人能进入掩蔽体.例11 (讲义例8) 设一大批产品中一级品率为10%, 现从中任取500件.(1) 分别用切比雪夫不等式估计和中心极限定理计算: 这500件中一级品的比例与10%之差的绝对值小于2%的概率;(2) 至少应取多少件才能使一级品的比例与10%之差的绝对值小于2%的把握大于95%?用频率估计概率的误差例12 (讲义例9 现从某厂生产的一批同型号电子元件中抽取395件, 由于次品率未知,需要通过次品的相对频率来估计, 这时估计的可靠性大于95%. (1)求绝对误差ε;(2)如果样品中有十分之一是次品, 应对p 怎样估计?李雅普诺夫定理例13 (讲义例10高尔顿钉板试验如图4-4-2是高尔顿钉板, 常常在赌博游戏中见到, 庄家常常在两边放置值钱的东西来吸引顾客, 现在可用中心极限定理来揭穿这个赌博中的奥秘.设n 为钉子的排数, 记随机变量。
概率论与数理统计 第四章 随机变量的数字特征
到最小值.此时得到最好的分组方法.
若 N 1000 ,此时以 k 4 分组,则按第二种方案平均只 需化验
1 4 1000 1 0.9 594 (次 ), 4
这样平均来说,可以减少 40%的工作量.
2014年8月30日星期六
13 / 102
§4.1 数学期望
解 : E ( X ) 1 p 0 (1 p ) p .
2014年8月30日星期六
7 / 102
§4.1 数学期望
[ 例 1-3] 设 随 机 变 量 X ~ B (n, p ) , 求 E ( X ) .
解 由于随机变量 X 只取有限个值,所以 E ( X ) 一定存 在.而
2014年8月30日星期六
10 / 102
§4.1 数学期望
解 各人的血呈阴性反应的概率为 q 1 p .因而 k 个人的混合血
k k q 1 q 呈阴性反应的概率为 ,而呈阳性反应的概率为 .
设以 k 个人为一组时,组内每人化验的次数为 X ,则 X 是 一个随机变量,其分布律为
X
pk
1 x k p k ( 1) ln 2 虽然有 ,但是随机变量 X 的数学期 k k 1 k 1
k
望是不存在的.因为
| x k p k |
k 1
1 . k 1 k
[例 1-1] 常数 C 数学期望等于它本身,即随机变量 X 是单点分 布, X C 的概率为 1,则 E (C ) C . [ 例 1-2] 设 随 机 变 量 X 服 从 (0-1) 分 布 , 求 E ( X ) .
b
[ 例 1-7]
设随机变量 X 服从参数为 的指数分布,求 E(X ) .
概率论与数理统计课件:随机变量的数字特征
首页 返回 退出
例7 (正态分布的数学期望)设 X ~ N( μ, σ 2 ), 求E(X).
解:
E(X) =
+
-
xf ( x )dx =
+
-
1
x
e
2πσ
( x - μ )2
2σ 2
dx
x-μ
, 则
令 t=
σ
E(X) =
+
-
t2
2
t2
+ 2
-
1
μ
( μ + t σ)
+
若级数 | g( xk ) | pk < + , 则 Y = g( X ) 的数学期望为
k =1
+
E(Y ) = E(g( X )) = g( xk ) pk
k =1
随机变量的数字特征
首页 返回 退出
定理4.2 (连续型随机变量函数的数学期望) 设连续型随
机变量X的概率密度函数为f(x),若
随机变量的数字特征
第一节 随机变量的数学期望
第二节 方差
第三节 协方差和相关系数
第四节 R实验
随机变量的数字特征
首页 返回 退出
第一节 随机变量的数学期望
一、离散型随机变量数学期望
二、连续型随机变量数学期望
二、随机变量函数的数学期望
三、数学期望的性质
随机变量的数字特征
首页 返回 退出2
§4.1随机变量的数学期望
P{X = xi } = pi , i = 1,2,
如果
+
| x
i
.
| pi < +
[理学]概率论与数理统计第04章随机变量的数字特征第1讲
又设飞机机翼受到的正压力W是V的函数, W=kV2(k>0, 常数), 求W的数学期望. 解 由(1.4)式有
E (W ) kv f (v) d v
2
a
0
1 1 2 kv d v ka . a 3
2
24
例9 设随机变量(X,Y)的概率密度
1 3 y x, x 1. 3 2, x f ( x, y ) 2 x y 其它. 0, 1 求数学期望E (Y ), E . XY
3 1 3 3 ln x 3 dx . 2 4 2 x 1 2 1 x x 3 1 1 E f ( x, y ) d y d x d x 1 4 3 d y 1 xy XY x 2x y 3 . 5
12
例4 某商店对某种家用电器的销售采用先使 用后付款的方式, 记使用寿命为X(以年计), 规 定: X1, 一台付款1500元; 1<X2, 一台付款2000元; 2<X3, 一台付款2500元; X>3, 一台付款3000元. 设寿命X服从指数分布, 概率密度为 1 x /10 e , x 0 f ( x) 10 x 0. 0, 试求该商店一台收费Y的数学期望.
5
例1 甲乙二人打靶, 所得分数分别记为X1,X2, 它们的分布律分别为
X1 pk 0 0 1 2
X2
0
1
2
0.2 0.8
pk 0.6 0.3 0.1
试评定他们成绩的好坏. 解 计算X1,X2的数学期望为 E(X1)=00+10.2+20.8=1.8(分) E(X2)=00.6+10.3+20.1=0.5(分) 很明显乙的成绩远不如甲的成绩.
概率论与数理统计随机变量的数字特征课件
03
通过数值模拟方法可以直观地 展示随机变量的分布情况,帮 助理解概率论与数理统计中的 概念和理论。
06
总结与展望
主要内容回顾
随机变量的概念与分类
常见随机变量的性质与 分布
01
02
03
随机变量的数字特征: 均值、方差、协方差等
04
大数定律和中心极限定 理的应用
存在的问题与不足之处
学生对概念的理解不够深入 ,容易混淆不同概念之间的
掷骰子
假设掷一个六面体的骰子,每个数字出现的概率为1/6。通过数值模拟方法计算在掷n次骰子时,每个 数字出现的次数。
结果解释与讨论
01
对于投掷硬币的实例,当n逐 渐增大时,正面和反面出现的 次数逐渐接近,符合理论上的 期望值。
02
对于掷骰子的实例,当n逐渐 增大时,每个数字出现的次数 也逐渐接近理论上的期望值。
相关系数
相关系数是协方差与两个随机变量方差的比值, 用于衡量两个随机变量的线性相关程度。
意义
协方差和相关系数可以反映两个随机变量之间的 线性相关程度,正值表示正相关,负值表示负相 关,值为0表示无关。
03
随机变量的矩与特征
矩的定义
01
矩:对于实随机变量X,其k阶原点矩定义为E[X^k]
,k为非负整数。
概率论与数理统计随机变量 的数字特征课件
目 录
• 随机变量的基本概念 • 随机变量的期望值与方差 • 随机变量的矩与特征 • 随机变量的函数与变换 • 随机变量的数值模拟与实例分析 • 总结与展望
01
随机变量的基本概念
随机变量的定义
定义
设E是随机试验,S是样本空 间,对于E的每一个样本点e ,都有唯一的实数X(e)与之对 应,则称X(e)为随机变量。
(精品) 概率论与数理统计课件:随机变量的数字特征
D( ) E E 2 E E 2
D D
性质4可以推广到如下情形。
当1,
2
,,
两两独立时,有
n
n
D(1 2 n ) Di i 1
一般地,对n个随机变量1、
随机变量的数字特征
▪数学期望 ▪方差 ▪协方差与相关系数 ▪矩 ▪条件数学期望
§5.1 数学期望
离散型随机变量的数学期望
设随机变量的分布律为 P( xk ) pk
则当
k
xk
pk
时,称
xk pk 为随机变
k
量的数学期望或均值,记作E ,即有
E xk pk xk P( xk )
k
k
例1 甲、乙两射手的稳定成绩分别为
并且有 Ei 0 1 p 1 p p
设 1 2 n
则 E E1 2 n
E1 E2 En
np
此外,我们可以推导出 η~B(n,p)
超几何分布
在一箱N件装的产品中混进了M件次品,今从中抽 取n 件 (n≤M) ,求从中查出次品的件数的概率分布.
解
P(
k)
C C k nk M NM CNn
p p2 p1 p
p 1 p 2 1 24
例5 设随机变量ξ服从[a,b]上的均匀分布,
求Dξ。
解:(x)
1 ba
0
a xb 其他
E 2 b x2 dx 1 (a2 ab b2 )
a ba 3
而E a b
2
D E 2 (E )2 1 (b a)2
12
例6
设随机变量ξ服从正态分布N(a,σ2),求Dξ。
指数分布 (参数为a)
np
λ
1 p
概率论及数理统计:第四章 随机变量的数字特征
E(X k) E(| X |k )
— X 的 k 阶原点矩 — X 的 k 阶绝对原点矩
E(( X E( X ))k ) — X 的 k 阶中心矩
E(( X E( X ))2 ) D( X )
— X 的 方差
E( X kY l )
Ch4-12
— X ,Y 的 k + l 阶混合原点矩
E ( X E( X ))k (Y E(Y ))l
B(n,p)
P()
几何分布
P( X 1) p
P( X 0) 1 p
p
P(X
k)
C
k n
pk (1
p)nk
np
k 0,1, 2, , n
ke
P(X k)
k!
k 0,1, 2,
P( X k ) p(1 p)k1
1
0 p 1 k 0,1, 2,
p
分布 区间(a,b)上的 均匀分布
Ch4-27
例 将 4 个球随机地放入 4 个盒子中,每盒容纳 的球数无限,求空着的盒子数的数学期望.
解一 设 X 为空着的盒子数,则 X 的概率分布为
X0 1
P
4! C41C
1 3
P42
44
44
2
3
C
2 4
(C
2 4
C21C43
)
C41
44
44
E( X ) 81 64
解二 再引入 X i ,i = 1,2,3,4
注:逆命题不成立,即 E (X Y ) = E (X )E (Y ) X,Y 不一定 相互独立, 反例有兴趣见后续
若存在常数 a 使 P(X a) = 1, 则 E (X ) a ;
概率论与数理统计教案随机变量的数字特征
概率论与数理统计教案-随机变量的数字特征一、教学目标1. 了解随机变量的数字特征的概念及其重要性。
2. 掌握随机变量的期望、方差、协方差、相关系数等基本数字特征的计算方法。
3. 能够运用随机变量的数字特征解决实际问题,提高数据分析能力。
二、教学内容1. 随机变量的期望1.1 期望的定义与性质1.2 离散随机变量的期望1.3 连续随机变量的期望2. 随机变量的方差2.1 方差的定义与性质2.2 离散随机变量的方差2.3 连续随机变量的方差3. 随机变量的协方差与相关系数3.1 协方差的定义与性质3.2 离散随机变量的协方差3.3 连续随机变量的协方差3.4 相关系数的定义与性质3.5 离散随机变量的相关系数3.6 连续随机变量的相关系数三、教学方法1. 采用讲授法,系统讲解随机变量的数字特征的理论知识。
2. 利用案例分析法,让学生通过实例理解随机变量的数字特征在实际问题中的应用。
3. 运用互动教学法,鼓励学生提问、讨论,提高课堂氛围。
4. 利用数理统计软件,演示随机变量的数字特征的计算过程,增强学生的实践操作能力。
四、教学准备1. 教案、教材、课件等教学资源。
2. 计算机、投影仪等教学设备。
3. 数理统计软件(如Excel、R、Python等)。
五、教学评价1. 课堂问答:检查学生对随机变量的数字特征的基本概念的理解。
2. 课后作业:布置相关练习题,巩固所学知识。
3. 课程报告:让学生选择一个实际问题,运用随机变量的数字特征进行分析和解决,培养学生的实际应用能力。
4. 期末考试:评估学生对随机变量的数字特征的掌握程度。
六、教学内容4. 随机变量的偏度和峰度4.1 偏度的定义与性质4.2 离散随机变量的偏度4.3 连续随机变量的偏度4.4 峰度的定义与性质4.5 离散随机变量的峰度4.6 连续随机变量的峰度5. 随机变量的标准化5.1 标准化的定义与方法5.2 离散随机变量的标准化5.3 连续随机变量的标准化七、教学重点与难点1. 随机变量的期望、方差、协方差、相关系数、偏度和峰度的计算方法。
概率论和数理统计 随机变量的数字特征17页PPT文档
10
7、常见分布的期望方差:
(1)二点分布: (2)二项分布: (3)泊松分布: (4)正态分布:
(5)均匀分布: (6) 指数分布
存在,则称之为X的方差.记为D(X)或Var(X)
D(x)=Var(X)= E X E( X )2
另外,记 ( X ) D( X ) ,称为标准差或均方差
5、方差的计算方法:
当X为离散型随机变
D( X ) E X E( X )2 xk E( X )2 pk
2
2、 数学期望的性质: (1)设C是常数,则 E(C)=C
这里C视为 退化的随机变量
(2)设X为一随机变量,C为常数,则有
E(CX)=CE(X) (3)设X,Y为两个随机变量,则有
E(X+Y)=E(X)+E(Y)
(4)若X,Y为两个相互独立的随机变量,则有
E(XY)=E(X)E(Y)
注: (1) Ein1 Xi in1E(Xi)
6
例1.26 设随机变量 X ~ U 0 , , 求 E (X s ) E ( X , i ) E [ n X , E ( X ) 2 .
解 依题知,X的概率密度为f(x)1 , x0,
故
0 , 其 他
1 1
2
E(sin
X
)
sx in f(x )d xsx in d x sx in dx
gxk pk 绝对收敛
概率论与数理统计 第4章 随机变量的数字特征
解:
1 (5 0.5x)( 3 x2 x)dx
0
2
4.65(元)
2021/7/22
21
4.1.2 随机变量函数的数学期望
将定理4.1推广到二维随机变量的情形.
定理4.2 设Z是随机变量X,Y的函数Z = g(X,Y), g是连续函数.
(1) 若(X,Y)是二维离散型随机变量,其分布律
为P{X xi ,Y yj } pij, i, j 1,2,, 则有
解:由于 P{ X k} k e ,k = 0,1,2,…,
k!
因而
E( X ) kP{ X k} k k e
k0
k0 k!
k e
k1 (k 1)!
e
k 1
k1 (k 1)!
e k ee k0 k!
2021/7/22
12
4.1.1 数学期望的概念
2. 连续型随机变量的数学期望
2021/7/22
18
4.1.2 随机变量函数的数学期望
定理4.1 设Y为随机变量X的函数:Y = g(X) (g是连续
函数).
(1) 设X是离散型随机变量,其分布律为
P{X xk } pk , k 1,2,
若级数 g( xk ) pk绝对收敛,则 E(Y ) E[g( X )] g( xk ) pk
f ( x) 25( x 4.2), 4 x 4.2,
0,
其 它.
求pH值X的数学期望E(X).
解:
E( X ) xf ( x)dx
4
4.2
x 25( x 3.8)dx x (25)(x 4.2)dx
3.8
4
4
2021/7/22
15
概率论与数理统计第四章随机变量的数字特征
第四章 随机变量的数字特征前面讨论了随机变量的分布函数,我们知道分布函数全面地描述了随机变量的统计特性.但是在实际问题中,一方面由于求分布函数并非易事;另一方面,往往不需要去全面考察随机变量的变化情况而只需知道随机变量的某些特征就够了.例如,在考察一个班级学生的学习成绩时,只要知道这个班级的平均成绩及其分散程度就可以对该班的学习情况作出比较客观的判断了.这样的平均值及表示分散程度的数字虽然不能完整地描述随机变量,但能更突出地描述随机变量在某些方面的重要特征,我们称它们为随机变量的数字特征.本章将介绍随机变量的常用数字特征:数学期望、方差、相关系数和矩.第一节 数学期望1.数学期望的定义粗略地说,数学期望就是随机变量的平均值.在给出数学期望的概念之前,先看一个例子.要评判一个射手的射击水平,需要知道射手平均命中环数.设射手A 在同样条件下进行射击,命中的环数X 是一随机变量,其分布律如下:表4-1由X 的分布律可知,若射手A 共射击N 次,根据频率的稳定性,所以在N 次射击中,大约有0.1×N 次击中10环,0.1×N 次击中9环,0.2×N 次击中8环,0.3×N 次击中7环,0.1×N 次击中6环,0.1×N 次击中5环,0.1×N 次脱靶.于是在N 次射击中,射手A 击中的环数之和约为10×0.1N +9×0.1N +8×0.2N +7×0.3N +6×0.1N +5×0.1N +0×0.1N .平均每次击中的环数约为N1(10×0.1N +9×0.1N +8×0.2N +7×0.3N +6×0.1N +5×0.1N +0×0.1N ) =10×0.1+9×0.1+8×0.2+7×0.3+6×0.1+5×0.1+0×0.1 =6.7(环).由这样一个问题的启发,得到一般随机变量的“平均数”,应是随机变量所有可能取值与其相应的概率乘积之和,也就是以概率为权数的加权平均值,这就是所谓“数学期望的概念”.一般地,有如下定义:定义4.1 设离散型随机变量X 的分布律为P {X =x k }=p k k =1,2,…, 若级数∑∞=1k k kp x绝对收敛,则称级数∑∞=1k k kp x为随机变量X 的数学期望(Mathematical expectation),记为E (X ).即E (X )=∑∞=1k k kp x. (4.1)设连续型随机变量X 的概率密度为f (x ),若积分⎰+∞∞-x x xf d )(绝对收敛,则称积分⎰+∞∞-x x xf d )(的值为随机变量X 的数学期望,记为E (X ).即E (X )=⎰+∞∞-x x xf d )(. (4.2)数学期望简称期望,又称为均值.例4.1 某商店在年末大甩卖中进行有奖销售,摇奖时从摇箱摇出的球的可能颜色为:红、黄、蓝、白、黑五种,其对应的奖金额分别为:10000元、1000元、100元、10元、1元.假定摇箱内装有很多球,其中红、黄、蓝、白、黑的比例分别为:0.01%,0.15%,1.34%,10%,88.5%,求每次摇奖摇出的奖金额X 的数学期望. 解每次摇奖摇出的奖金额X 是一个随机变量,易知它的分布律为因此,E (X )=10000×0.0001+1000×0.0015+100×0.0134+10×0.1+1×0.885=5.725. 可见,平均起来每次摇奖的奖金额不足6元.这个值对商店作计划预算时是很重要的.例4.2 按规定,某车站每天8点至9点,9点至10点都有一辆客车到站,但到站的时刻是随机的,且两者到站的时间相互独立.其分布律为一旅客8点20分到车站,求他候车时间的数学期望.解 设旅客候车时间为X 分钟,易知X 的分布律为表4-4在上表中p k 的求法如下,例如P {X =70}=P (AB )=P (A )P (B )=1/6×3/6=3/36,其中A 为事件“第一班车在8:10到站”,B 为事件“第二班车在9:30到站”,于是候车时间的数学期望为E (X )=10×3/6+30×2/6+50×1/36+70×3/36+90×2/36=27.22(分钟).例4.3 有5个相互独立工作的电子装置,它们的寿命X k (k =1,2,3,4,5)服从同一指数分布,其概率密度为f (x )=⎪⎩⎪⎨⎧≤>-.00,0,1/x ,x x θθe(1) 若将这5个电子装置串联起来组成整机,求整机寿命N 的数学期望;(2) 若将这5个电子装置并联组成整机,求整机寿命M 的数学期望.解 X k (k =1,2,3,4,5)的分布函数为F (x )=⎩⎨⎧≤>--.0,0,0,1/x x x θe(1) 串联的情况由于当5个电子装置中有一个损坏时,整机就停止工作,所以这时整机寿命为N =min{X 1,X 2,X 3,X 4,X 5}.由于X 1,X 2,X 3,X 4,X 5是相互独立的,于是i=min{X 1,X 2,X 3,X 4,X 5}的分布函数为F N (x )=P {N ≤x }=1-P {N >x }=1-P {X 1>x ,X 2>x ,X 3>x ,X 4>x ,X 5>x }=1-P {X 1>x }·P {X 2>x }·P {X 3>x }·P {X 4>x }·P {X 5>x }=1-[1-)(1x F X ][1- )(2x F X ][1-)(3x F X ][1-)(4x F X ][1-)(5x F X ] =1-[1-F (x )]5=⎪⎩⎪⎨⎧≤>--.0,0,0,15x x xθe 因此N 的概率密度为f N (x )=⎪⎩⎪⎨⎧≤>-.0,0,0,55x x xθθe则N 的数学期望为E (N )=55)(5θθθ==-∞+∞-∞+∞-⎰⎰x xx x xf xN d ed(2) 并联的情况由于当且仅当5个电子装置都损坏时,整机才停止工作,所以这时整机寿命为M =max{X 1,X 2,X 3,X 4,X 5}.由于X 1,X 2,X 3,X 4,X 5相互独立,类似可得M 的分布函数为F M (x )=[F (x )]5=⎪⎩⎪⎨⎧≤>--.0,0,0,)1(5x x x θe因而M 的概率密度为f M (x )=⎪⎩⎪⎨⎧≤>---.0,0,0,]1[54x x x x θθθe e于是M 的数学期望为E (M )=.60137)1(5)(0max θθθ=-=-∞+∞-∞+⎰⎰x xx x xf xd e d 这说明:5个电子装置并联联接工作的平均寿命要大于串联联接工作的平均寿命.例4.4 设随机变量X 服从柯西(Cauchy )分布,其概率密度为f (x )=)1(12x +π,-x <x <+∞, 试证E (X )不存在.证 由于,)1(1)(2⎰⎰+∞∞-+∞∞-∞=+=x x xx x f x d πd 故E (X )不存在.2.随机变量函数的数学期望在实际问题与理论研究中,我们经常需要求随机变量函数的数学期望.这时,我们可以通过下面的定理来实现.定理4.1 设Y 是随机变量X 的函数Y =g (X )(g 是连续函数). (1) X 是离散型随机变量,它的分布律为P (X =x k )=p k ,k =1,2,…,若kk kpx g ∑∞=1)(绝对收敛,则有E (Y )=E [g (X )]=kk kpx g ∑∞=1)(. (4.3)(2) X 是连续型随机变量,它的概率密度为f (x ),若⎰+∞∞-x x f x g d )()(绝对收敛,则有E (Y )=E [g (X )]=⎰+∞∞-x x f x g d )()(. (4.4)定理4.4的重要意义在于当我们求E (Y )时,不必知道Y 的分布而只需知道X 的分布就可以了.当然,我们也可以由已知的X 的分布,先求出其函数g (X )的分布,再根据数学期望的定义去求E [g (X )],然而,求Y =g (X )的分布是不容易的,所以一般不采用后一种方法.定理4.1的证明超出了本书的范围,这里不证.上述定理还可以推广到二个或二个以上随机变量的函数情形. 例如,设Z 是随机变量X ,Y 的函数,Z =g (X ,Y )(g 是连续函数),那么Z 也是一个随机变量,当(X ,Y )是二维离散型随机变量,其分布律为P {X =x i ,Y =y j }=p ij (i ,j =1,2,…)时,若∑∑ijijiipy x g ),(绝对收敛,则有E (Z )=E [g (X ,Y )]=∑∑ijijiipy x g ),(. (4.5)当(X ,Y )是二维连续型随机变量,其概率密度为f (x ,y )时,若⎰⎰+∞∞-+∞∞-yx y x f y z g d d ),(),(绝对收敛,则有E (Z )=E [g (X ,Y )]=⎰⎰+∞∞-+∞∞-y x y x f y z g d d ),(),(. (4.6)特别地有E (X )=⎰⎰+∞∞-+∞∞-y x y x xf d d ),(=⎰+∞∞-.)(x x xf X dE (Y )=⎰⎰+∞∞-+∞∞-y x y x yf d d ),(=⎰+∞∞-.)(y y yf Y d例4.5 设随机变量X 的分布律为表4-5求E (X ),E (-2x +1).解 由(4.5)式得E (X 2)=(-1)2×18+02×14+22×38+32×14=318, E (-2X +1)=[-2×(-1)+1]×18+[-2×0+1]×14+[-2×2+1]×38+[-2×3+1]×14= -74.例4.6 对球的直径作近似测量,设其值均匀分布在区间[a ,b ]内,求球体积的数学期望.解 设随机变量X 表示球的直径,Y 表示球的体积,依题意,X 的概率密度为f (x )=⎪⎩⎪⎨⎧≤≤-.,0,,1其他b x a a b球体积Y =361X π,由(4.6)式得 E (Y )=x ab xX E b a d ππ-=⎰161)61(33 =).)((24)(6223b a b a x x a b ba++=-⎰πd π例4.7 设国际市场每年对我国某种出口商品的需求量X (吨)服从区间[2000,4000]上的均匀分布.若售出这种商品1吨,可挣得外汇3万元,但如果销售不出而囤积于仓库,则每吨需保管费1万元.问应预备多少吨这种商品,才能使国家的收益最大? 解设预备这种商品y 吨(2000≤y ≤4000),则收益(万元)为g (X )=⎩⎨⎧<--≥.),(3,,3y X X y X y X y则 E [g (X )]=⎰⎰-⋅=+∞∞-40002000200040001)()()(x x g x x f x g d d =[]⎰⎰+--40002000320001)(320001y y x y x x y x d d =)1047000(1000162⨯-+-y y . 当y =3500吨时,上式达到最大值.所以预备3500吨此种商品能使国家的收益最大,最大收益为8250万元.例4.8 设二维随机变量(X ,Y )在区域A 上服从均匀分布,其中A 为x 轴,y 轴及直线x +2y=1所围成的三角区域,求E (X ),E (Y ),E (XY ). 解 由于(X ,Y )在A 内服从均匀分布,所以其概率密度f (x ,y )=⎪⎩⎪⎨⎧⎩⎨⎧∉∈=∉∈.),(,0,),(,1,),(,0,),(,1A y x A y x A y x A y x A 的面积 E (X )=12(1)1(,)d d d d d d ;3x Axf x y x y x x y x x y +∞+∞--∞-∞===⎰⎰⎰⎰⎰⎰E (Y )=2122(,)d d d d d d ;3y Ayf x y x y y x y y y x +∞+∞--∞-∞===⎰⎰⎰⎰⎰⎰E (XY )=;61)1(2),()1(201021⎰⎰⎰⎰⎰+∞∞-+∞∞--=-==x x x x y y x x y x y x xyf d d d d d3.数学期望的性质下面讨论数学期望的几条重要性质.定理4.2 设随机变量X ,Y 的数学期望E (X ),E (Y )存在. 1°E (c )=c ,其中c 是常数; 2°E (cX )=cE (X );3°E (X +Y )=E (X )+E (Y ); 4°若X ,Y 是相互独立的,则有E (XY )=E (X )E (Y ).证 就连续型的情况我们来证明性质3°、4°,离散型情况和其他性质的证明留给读者. 3°设二维随机变量(X ,Y )的概率密度为f (x ,y ),其边缘概率密度为f X (x ),f Y (y ),则E (X +Y )=⎰⎰+∞∞-+∞∞-+y x y x f y x d d ),()(=⎰⎰⎰⎰+∞∞-+∞∞-+∞∞-+∞∞-+y x y x yf y x y x xf d d d d ),(),(=)()()()(Y E X E y y yf x x xf Y X +=+⎰⎰+∞∞-+∞∞-d d .4°又若X 和Y 相互独立,此时f (x ,y )=f X (x )f Y (y ),故E (XY )=⎰⎰⎰⎰+∞∞-+∞∞-+∞∞-+∞∞-=y x y f x xyf y x y x xyf Y X d d d d )()(),(=).()()()(Y E X E y y yf x x xf Y X =⋅⎰⎰+∞∞-+∞∞-d d性质3°可推广到任意有限个随机变量之和的情形;性质4°可推广到任意有限个相互独立的随机变量之积的情形.例4.9 设一电路中电流I (安)与电阻R (欧)是两个相互独立的随机变量,其概率密度分别为g (i )=⎩⎨⎧≤≤.,0,10,2其他i i h (r )=⎪⎩⎪⎨⎧≤≤.,0,30,92其他r r试求电压V =IR 的均值.解 E (V )=E (IR )=E (I )E (R )=2392)()(303102=⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡⎰⎰⎰⎰∞+∞-∞+∞-r r i i r r rh i i ig d d d d (伏). 例4.10 设对某一目标进行射击,命中n 次才能彻底摧毁该目标,假定各次射击是独立的,并且每次射击命中的概率为p ,试求彻底摧毁这一目标平均消耗的炮弹数.解 设X 为n 次击中目标所消耗的炮弹数,X k 表示第k -1次击中后至k 次击中目标之间所消耗的炮弹数,这样,X k 可取值1,2,3,…,其分布律见表4-6.其中q =1-p ,X 1为第一次击中目标所消耗的炮弹数,则n 次击中目标所消耗的炮弹数为X =X 1+X 2+…+X n .由性质3°可得E (X )=E (X 1)+E (X 2)+…+E (X n )=nE (X 1). 又E (X 1)=,111pkpqk k =∑∞=- 故 E (X )=pn . 4.常用分布的数学期望 (1) 两点分布 设X 的分布律为 E (X )=0×(1-p )+1×p =p .(2) 二项分布设X 服从二项分布,其分布律为P {X =k }=kn k k n p p --)1(C , (k =0,1,2,…,n),(0<p <1). 则X 的数学期望为E (X )=∑∑==----=-nk nk k n k kn kknp p k n k n kp p k 0)1()!(!!)1(C=[]∑=----------nk k n k p p k n k n np0)]1()1[(1)1(!)1()1()!1()!1(, 令k -1=t ,则E (X )=[]∑-=------1])1[()1(!)1(!)!1(n t t n tp p t n t n np=np [p +(1-p )]n -1=np .若利用数学期望的性质,将二项分布表示为n 个相互独立的0-1分布的和,计算过程将简单得多.事实上,若设X 表示在n 次独立重复试验中事件A 发生的次数,X i (i =1,2,…,n )表示A 在第i 次试验中出现的次数,则有X =1nii X=∑.所以E (X i )=p ,i =1,2,…,n .由定理4.2的性质3°有E (X )=∑∑===⎪⎭⎫ ⎝⎛ni i n i i X E X E 11)( =np .(3) 泊松分布设X 服从泊松分布,其分布律为P {X =k }=λλ-e !k k, (k =0,1,2,…),(λ>0).则X 的数学期望为E (X )=∑∑∞=--∞=--=11)!1(!k k k kk k k λλλλλee,令k -1=t ,则有E (X )=.!0λλλλλλλ=⋅=-∞=-∑e e ek tt .(4) 均匀分布设X 服从[a ,b ]上的均匀分布,其概率密度函数为f (x )=⎪⎩⎪⎨⎧≤≤-.,0,,1其他b x a a b则X 的数学期望为E (X )=.2)(ba x ab x x x xf ba +=-=⎰⎰+∞∞-d d . (5) 指数分布设X 服从指数分布,其分布密度为f (x )=⎩⎨⎧<≥-.0,0,0,x x x λλe则X 的数学期望为E (X )=1()d e d x xf x x x x λλλ+∞+∞--∞-∞==⎰⎰.(6) 正态分布设X ~N (μ,σ2),其分布密度为f (x )=222)(21σμσ--x e π,则X 的数学期望为E (X )=2()2()d ed ,x xf x x x x μσ--+∞+∞-∞-∞=⎰⎰令σμ-x =t ,则E (X )=⎰∞+∞--+t t t d e π22)(21σμ注意到t t d eπ⎰∞+∞--222μ=μ,t σt t d e π⎰∞+∞--2221=0, 故有E (X )=μ.第二节 方 差1.方差的定义数学期望描述了随机变量取值的“平均”.有时仅知道这个平均值还不够.例如,有A ,B 两名射手,他们每次射击命中的环数分别为X ,Y ,已知X ,Y 的分布律为:由于E (X )=E (Y )=9(环),可见从均值的角度是分不出谁的射击技术更高,故还需考虑其他的因素.通常的想法是:在射击的平均环数相等的条件下进一步衡量谁的射击技术更稳定些.也就是看谁命中的环数比较集中于平均值的附近,通常人们会采用命中的环数X 与它的平均值E (X )之间的离差|X -E (X )|的均值E [|X -E (X )|]来度量,E [|X -E (X )|]愈小,表明X 的值愈集中于E (X )的附近,即技术稳定;E [|X -E (X )|]愈大,表明X 的值很分散,技术不稳定.但由于E [|X -E (X )|]带有绝对值,运算不便,故通常采用X 与E (X )的离差|X -E (X )|的平方平均值E [X -E (X )]2来度量随机变量X 取值的分散程度.此例中,由于E [X -E (X )]2=0.2×(8-9)2+0.6×(9-9)2+0.2×(10-9)2=0.4, E [Y -E (Y )]2=0.1×(8-9)2+0.8×(9-9)2+0.1×(10-9)2=0.2.由此可见B 的技术更稳定些.定义4.2 设X 是一个随机变量,若E [X -E (X )]2存在,则称E [X -E (X )]2为X的方差(Variance ),记为D (X ),即D (X )=E [X -E (X )]2. (4.7)称)(X D 为随机变量X 的标准差(Standard deviation )或均方差(Mean square deviation),记为σ(X ).根据定义可知,随机变量X 的方差反映了随机变量的取值与其数学期望的偏离程度.若X 取值比较集中,则D (X )较小,反之,若X 取值比较分散,则D (X )较大. 由于方差是随机变量X 的函数g (X )=[X -E (X )]2的数学期望.若离散型随机变量X 的分布律为P {X =x k }=p k ,k =1,2,…,则D (X )=k k kp X E x∑∞=-12)]([. (4.8)若连续型随机变量X 的概率密度为f (x ),则D (X )=⎰+∞∞--.)()]([2x x f X E x d (4.9)由此可见,方差D (X )是一个常数,它由随机变量的分布惟一确定.根据数学期望的性质可得:D (X )=E [X -E (X )]2=E [X 2-2X ·E (X )+[E (X )]2]=E (X 2)-2E (X )·E (X )+[E (X )]2=E (X 2)-[E (X )]2.于是得到常用计算方差的简便公式D (X )=E (X 2)-[E (X )]2. (4.10)例4.11 设有甲,乙两种棉花,从中各抽取等量的样品进行检验,结果如下表:表4-10且评定它们的质量.解 由于E (X )=28×0.1+29×0.15+30×0.5+31×0.15+32×0.1=30, E (Y )=28×0.13+29×0.17+30×0.4+31×0.17+32×0.13=30,故得D (X )=(28-30)2×0.1+(29-30)2×0.15+(30-30)2×0.5+(31-30)2×0.15+(32-30)2×0.1=4×0.1+1×0.15+0×0.5+1×0.15+4×0.1=1.1, D (Y )=(28-30)2×0.13+(29-30)2×0.17+(30-30)2×0.4+(31-30)2×0.17+(32-30)2×0.13 =4×0.13+1×0.17+0×0.4+1×0.17+4×0.13=1.38.因D (X )<D (Y ),所以甲种棉花纤维长度的方差小些,说明其纤维比较均匀,故甲种棉花质量较好.例4.12 设随机变量X 的概率密度为f (x )=⎪⎩⎪⎨⎧<≤-<≤-+.,0,10,1,01,1其他x x x x求D (X ).解 E (X )=⎰⎰-++-11)1()1(x x x x x x d d =0,E (X 2)=⎰⎰-++-12012)1()1(x x x x x x d d =1/6,于是 D (X )=E (X 2)-[E (X )]2=1/6.2.方差的性质方差有下面几条重要的性质.设随机变量X 与Y 的方差存在,则 1°设c 为常数,则D (c )=0;2°设c 为常数,则D (cX )=c 2D (X );3°D (X ±Y )=D (X )+D (Y )±2E [(X -E (X ))(Y -E (Y ))]; 4°若X ,Y 相互独立,则D (X ±Y )=D (X )+D (Y ); 5°对任意的常数c ≠E (X ),有D (X )<E [(X -c )2]. 证 仅证性质4°,5°.4°D (X ±Y )=E [(X ±Y )-E (X ±Y )]2=E [(X -E (X ))±(Y -E (Y ))]2=E [X -E (X )]2±2E [(X -E (X ))(Y -E (Y ))]+E [Y -E (Y )]2 =D (X )+D (Y )±2E [(X -E (X ))(Y -E (Y ))].当X 与Y 相互独立时,X -E (X )与Y -E (Y )也相互独立,由数学期望的性质有E [(X -E (X ))(Y -E (Y ))]=E (X -E (X ))E (Y -E (Y ))=0.因此有D (X ±Y )=D (X )+D (Y ).性质4°可以推广到任意有限多个相互独立的随机变量之和的情况.5°对任意常数c ,有E [(X -c )2]=E [(X -E (X )+E (X )-c )2]=E [(X -E (X ))2]+2(E (X )-c )·E [X -E (X )]+(E (X )-c )2=D (X )+(E (X )-c )2.故对任意常数c ≠EX ,有DX <E [(X -c )2].例4.13 设随机变量X 的数学期望为E (X ),方差D (X )=σ2(σ>0),令Y =σ)(X E X -,求E (Y ),D (Y ).解 E (Y )=[],0)()(1)]([1)(=-=-=⎥⎦⎤⎢⎣⎡-X E X E X E X E X E X E σσσ D (Y )=.1)(1)]([1)(2222===-=⎥⎦⎤⎢⎣⎡-σσσσσX D X E X D X E X D 常称Y 为X 的标准化随机变量.例4.14 设X 1,X 2,…,X n 相互独立,且服从同一(0-1)分布,分布律为P {X i =0}=1-p ,P {X i =1}=p , i =1,2,…,n .证明 X =X 1+X 2+…+X n 服从参数为n ,p 的二项分布,并求E (X )和D (X ).解 X 所有可能取值为0,1,…,n ,由独立性知X 以特定的方式(例如前k 个取1,后n -k 个取0)取k (0≤k ≤n )的概率为p k (1-p )n -k,而X 取k 的两两互不相容的方式共有k nC 种,故P {X =k }=k n C p k (1-p )n -k, k =0,1,2,…,n ,即X 服从参数为n ,p 的二项分布.由于E (X i )=0×(1-p )+1×p =p ,D (X i )=(0-p )2×(1-p )+(1-p )2×p =p (1-p ), i =1,2,…,n ,故有E (X )=.)(11np X E X E ni i n i i ==⎪⎭⎫ ⎝⎛∑∑==由于X 1,X 2,…,X n 相互独立,得D (X )= ).1()(11p np X D X D ni i n i i -==⎪⎭⎫ ⎝⎛∑∑==3.常用分布的方差 (1) (0-1)分布设X 服从参数为p 的0-1分布,其分布律为(2) 二项分布设X 服从参数为n ,p 的二项分布,由例4.14知,D (X )=np (1-p ). (3) 泊松分布设X 服从参数为λ的泊松分布,由上一节知E (X )=λ,又E (X 2)=E [X (X -1)+X ]=E [X (X -1)]+E (X )=∑∑∞=--∞=-+-=+-2220)!2(!)1(k k k kk k k k λλλλλλλee=λ2e -λ·e λ+λ=λ2+λ,从而有D (X )=E (X 2)-[E (X )]2=λ2+λ -λ2=λ.(4) 均匀分布设X 服从[a ,b ]上的均匀分布,由上一节知E (X )=2ba +,又 E (X 2)=3222b ab a x a b x ba ++=-⎰d , 所以D (X )=E (X 2)-[E (X )]2=12)()(41)(312222a b b a b ab a -=+-++.(5) 指数分布设X 服从参数为λ的指数分布,由上一节知.E (X )=1/λ,又E (X 2)=222λλλ=⎰-bax x x d e ,所以D (X )=E (X 2)-[E (X )]2=.112222λλλ=⎪⎭⎫⎝⎛-(6) 正态分布 设X ~N (μ,σ2),由上一节知E (X )=μ,从而D (X )=[]⎰⎰∞+∞--∞+∞--=--d e πd x x x x f X E x x 222)(2221)()()(σμσμ令σμ-x =t 则D (X )=)(22222222222⎰⎰∞+∞--∞+∞--∞+∞--+-=t t t t t t t d eeπd eπσσ=)20(22ππ+σ =σ2.由此可知:正态分布的概率密度中的两个参数μ和σ分别是该分布的数学期望和均方差.因而正态分布完全可由它的数学期望和方差所确定.再者,由上一章第五节例3.17知道,若X i ~N (μi ,σi 2),i =1,2,…,n ,且它们相互独立,则它们的线性组合c 1X 1+c 2X 2+…+c n X n (c 1,c 2,…,c n 是不全为零的常数)仍然服从正态分布.于是由数学期望和方差的性质知道:c 1X 1+c 2X 2+…+c n X n ~⎪⎭⎫⎝⎛∑∑==n i ni i i i i c c N 1122,σμ.这是一个重要的结果.例4.15 设活塞的直径(以cm 计)X ~N (22.40,0.032),气缸的直径Y ~N (22.50,0.042),X ,Y 相互独立,任取一只活塞,任取一只气缸,求活塞能装入气缸的概率. 解按题意需求P {X <Y }=P {X -Y <0}. 令Z =X -Y ,则E (Z )=E (X )-E (Y )=22.40-22.50=-0.10,D (Z )=D (X )+D (Y )=0.032+0.042=0.052,即Z ~N (-0.10,0.052), 故有P {X <Y }=P {Z <0}=⎪⎭⎫⎝⎛Φ=⎭⎬⎫⎩⎨⎧--<--05.010.005.0)10.0(005.0)10.0(Z P =Φ(2)=0.9772.第三节 协方差与相关系数对于二维随机变量(X ,Y ),数学期望E (X ),E (Y )只反映了X 和Y 各自的平均值,而D (X ),D (Y )反映的是X 和Y 各自偏离平均值的程度,它们都没有反映X 与Y 之间的关系.在实际问题中,每对随机变量往往相互影响、相互联系.例如,人的年龄与身高;某种产品的产量与价格等.随机变量的这种相互联系称为相关关系,它们也是一类重要的数字特征,本节讨论有关这方面的数字特征.定义4.3 设(X ,Y )为二维随机变量,称E {[X -E (X )][Y -E (Y )]}为随机变量X ,Y 的协方差(Covariance ),记为Cov (X ,Y ),即Cov (X ,Y )=E {[X -E (X )][Y -E (Y )]}. (4.11) 而)()(),cov(Y D X D Y X 称为随机变量X ,Y 的相关系数(Correlation coefficient)或标准协方差(Standard covariance),记为ρXY ,即ρXY =)()(),cov(Y D X D Y X . (4.12)特别地,Cov(X ,X )=E {[X -E (X )][X -E (X )]}=D (X ), Cov(Y ,Y )=E {[Y -E (Y )][Y -E (Y )]}=D (Y ).故方差D (X ),D (Y )是协方差的特例.由上述定义及方差的性质可得D (X ±Y )=D (X )+D (Y )±2Cov(X ,Y ).由协方差的定义及数学期望的性质可得下列实用计算公式Cov (X ,Y )=E (XY )-E (X )E (Y ). (4.13)若(X ,Y )为二维离散型随机变量,其联合分布律为P {X =x i ,Y =y j }=p ij ,i ,j =1,2,…,则有Cov (X ,Y )=[][]∑∑--ijijiipY E y X E x )()(. (4.14)若(X ,Y )为二维连续型随机变量,其概率密度为f (x ,y ),则有Cov (X ,Y )=[][]⎰⎰+∞∞-+∞∞---y x y x f Y E y X E x d d ),()()(. (4.15)例4.16 设(X ,Y )的分布律为表4-120<p <1,求Cov(X ,Y )和ρXY .解 易知X 的分布律为P {X =1}=p ,P {X =0}=1-p ,故 E (X )=p , D (X )=p (1-p ).同理E (Y )=p ,D (Y )=p (1-p ),因此Cov(X ,Y )=E (XY )-E (X )·E (Y )=p -p 2=p (1-p ), 而ρXY =1)1()1()1(),cov(=-⋅--=⋅p p p p p p DY DX Y X例4.17 设(X ,Y )的概率密度为f (x ,y )=⎩⎨⎧<<<<+.,0,10,10,其他y x y x求Cov (X ,Y ).解 由于f X (x )=⎪⎩⎪⎨⎧<<+,,0,10,21其他x x f Y (y )=⎪⎩⎪⎨⎧<<+.,0,10,21其他y y E (X )=127)21(10=+⎰x x x d ,E (Y )=127)21(10=+⎰y y y d ,E (XY )=31)(10102101021010=+=+⎰⎰⎰⎰⎰⎰y x xy y x y x y x y x xy d d d d d d因此 Cov (X ,Y )=E (XY )-E (X )E (Y )=144112712731-=⨯-.协方差具有下列性质:1°若X 与Y 相互独立,则Cov (X ,Y )=0; 2°Cov (X ,Y )=Cov (Y ,X ); 3°Cov (aX ,bY )=ab Cov (X ,Y );4°Cov (X 1+X 2,Y )=Cov (X 1,Y )+Cov (X 2,Y ). 证 仅证性质4°,其余留给读者.Cov(X 1+X 2,Y ) =E [(X 1+X 2)Y ]-E (X 1+X 2)E (Y )=E (X 1Y )+E (X 2Y )-E (X 1)E (Y )-E (X 2)E (Y ) =[E (X 1Y )-E (X 1)E (Y )]+[E (X 2Y )-E (X 2)E (Y )] =Cov (X 1,Y )+Cov (X 2,Y ).下面给出相关系数ρXY 的几条重要性质,并说明ρXY 的含义.定理4.3 设D (X )>0,D (Y )>0,ρXY 为(X ,Y )的相关系数,则 1°如果X ,Y 相互独立,则ρXY =0; 2°|ρXY |≤1;3°|ρXY |=1的充要条件是存在常数a ,b 使P {Y =aX +b }=1(a ≠0). 证 由协方差的性质1°及相关系数的定义可知1°成立. 2°对任意实数t ,有D (Y -tX )=E [(Y -tX )-E (Y -tX )]2=E [(Y -E (Y ))-t (X -E (X ))]2 =E [Y -E (Y )]2-2tE [Y -E (Y )][X -E (X )]+t 2E [X -E (X )]2 =t 2D (X )-2t Cov (X ,Y )+D (Y )=[])(),cov()()(),cov()(22X D Y X Y D X D Y X t X D -+⎥⎦⎤⎢⎣⎡-. 令t =)(),cov(X D Y X =b ,于是D (Y -bX )=[][]).1)(()()(),cov(1)()(),cov()(222XY Y D Y D X D Y X Y D X D Y X Y D ρ-=⎥⎦⎤⎢⎣⎡-=-由于方差不能为负,所以1-2XY ρ≥0,从而|ρXY |≤1.性质3°的证明较复杂,从略.当ρXY =0时,称X 与Y 不相关,由性质1°可知,当X 与Y 相互独立时,ρXY =0,即X 与Y 不相关.反之不一定成立,即X 与Y 不相关,X 与Y 却不一定相互独立.例4.18 设X 服从[0,2π]上均匀分布,Y =cos X ,Z =cos(X +a ),这里a 是常数.求ρYZ .解 E (Y )=⎰⋅πd π2021cos x x =0, E (Z )= ⎰+πd π20)cos(21x a x =0, D (Y )=E {[Y -E (Y )]2}=21cos 21202=⎰πd πx x , D (Z )=E {[Z -E (Z )]2}=21)(cos 21202=+⎰πd πx a x , Cov(Y ,Z )=E {[Y -E (Y )][Z -E (Z )]}= a x a x x cos 21)cos(cos 2120=+∙⎰πd π, 因此 ρYZ =.cos 2121cos 21)()(),cov(a a Z D Y D Z Y =⋅=⋅ ① 当a =0时,ρYZ =1,Y =Z ,存在线性关系;② 当a=π时,ρYZ =-1,Y =-Z ,存在线性关系; ③ 当a =2π或23π时,ρYZ =0,这时Y 与Z 不相关,但这时却有Y 2+Z 2=1,因此,Y 与Z不独立.这个例子说明:当两个随机变量不相关时,它们并不一定相互独立,它们之间还可能存在其他的函数关系.定理4.3 告诉我们,相关系数ρXY 描述了随机变量X ,Y 的线性相关程度,|ρXY |愈接近1,则X 与Y 之间愈接近线性关系.当|ρXY |=1时,X 与Y 之间依概率1线性相关.不过,下例表明当(X ,Y )是二维正态随机变量时,X 和Y 不相关与X 和Y 相互独立是等价的.例4.19 设(X ,Y )服从二维正态分布,它的概率密度为f (x ,y )=⨯-221121ρσσπ⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⎥⎦⎤⎢⎣⎡-+------2222212121212)())((2)()1(21exp σμσσμμρσμρy y x x 求Cov (X ,Y )和ρXY .解 可以计算得(X ,Y )的边缘概率密度为f X (x )=21212)(121σμσ--x e π,-∞<x <+∞,f Y (y )=22222)(221σμσ--x e π,-∞<y <+∞,故E (X )=μ1,E (Y )=μ2, D (X )=σ12,D (Y )=σ22.而Cov (X ,Y )=⨯-=--⎰⎰+∞∞-+∞∞-22121121),()()(ρσπσμμy x y x f y x d dy x y x x y x d d ee-2112222121)1(212)(21)()(⎥⎦⎤⎢⎣⎡------∞+∞-∞+∞---⎰⎰σμρσμρσμμμ令t =⎪⎪⎭⎫ ⎝⎛----1122211σμρσμρx y ,u =11σμ-x ,则 Cov (X ,Y )=⎰⎰∞+∞-∞+∞---+-u t u tu t u d d e π2222122122)1(21σρσρσσ =⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫⎝⎛⎰⎰∞+∞--∞+∞--t e u u t u d d eπ22221222ρσσ +⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛-⎰⎰∞+∞--∞+∞--t t u u t u d e d eπ222212221ρσσ =.2222121σρσσρσ=⋅πππ于是ρXY=ρ.这说明二维正态随机变量(X ,Y )的概率密度中的参数ρ就是X 和Y 的相关系数,从而二维正态随机变量的分布完全可由X ,Y 的各自的数学期望、方差以及它们的相关系数所确定.由上一章讨论可知,若(X ,Y )服从二维正态分布,那么X 和Y 相互独立的充要条件是ρ=0,即X 与Y 不相关.因此,对于二维正态随机变量(X ,Y )来说,X 和Y 不相关与X 和Y 相互独立是等价的.第四节 矩、协方差矩阵数学期望、方差、协方差是随机变量最常用的数字特征,它们都是特殊的矩(Moment ).矩是更广泛的数字特征.定义4.4 设X 和Y 是随机变量,若E (X k ),k =1,2,…存在,称它为X 的k 阶原点矩,简称k 阶矩.若 E [X -E (X )]k , k =1,2,… 存在,称它为X 的k 阶中心矩.若 E (X k Y l ), k ,l =1,2,… 存在,称它为X 和Y 的k +l 阶混合矩.若 E {[X -E (X )]k [Y -E (Y )]l } 存在,称它为X 和Y 的k +l 阶混合中心矩.显然,X 的数学期望E (X )是X 的一阶原点矩,方差D (X )是X 的二阶中心矩,协方差Cov (X ,Y )是X 和Y 的1+1阶混合中心矩.当X 为离散型随机变量,其分布律为P {X =x i }=p i ,则E (X k)=∑∞=1i i kip x,E [X -E (X )]k=1[()]kii i x E X p ∞=-∑.当X 为连续型随机变量,其概率密度为f (x ),则E (X k )=⎰+∞∞-x x f x k d )(,E [X -E (X )]k =⎰+∞∞--x x f X E x k d )()]([.下面介绍n 维随机变量的协方差矩阵.设n 维随机变量(X 1,X 2,…,X n )的1+1阶混合中心矩σij =Cov (X i ,X j )=E {[X i -E (X i )][X j -E (X j )]}, i ,j =1,2,…,n都存在,则称矩阵Σ=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡nn n n n n σσσσσσσσσ 212222111211 为n 维随机变量(X 1,X 2,…,X n )的协方差矩阵. 由于σij =σji (i ,j =1,2,…,n ),因此Σ是一个对称矩阵. 协方差矩阵给出了n 维随机变量的全部方差及协方差,因此在研究n 维随机变量的统计规律时,协方差矩阵是很重要的.利用协方差矩阵还可以引入n 维正态分布的概率密度. 首先用协方差矩阵重写二维正态随机变量(X 1,X 2)的概率密度. f (x 1,x 2)=221121ρσσ-π×.)())((2)()1(21exp 22222212211212112⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⎥⎦⎤⎢⎣⎡-+------σμσσμμρσμρx x x x 令X =⎪⎪⎭⎫⎝⎛21x x ,μ=⎪⎪⎭⎫⎝⎛21μμ,(X 1,X 2)的协方差矩阵为 Σ=.2121212122211211⎪⎪⎭⎫⎝⎛=⎪⎪⎭⎫ ⎝⎛σσρσσρσσσσσσ 它的行列式|Σ|=σ12σ22(1-ρ2),逆阵Σ-1=.121212122⎪⎪⎭⎫⎝⎛--σσρσσρσσ∑ 由于 (X -μ)T Σ-1(X -μ)=.),(12211212121222211⎪⎪⎭⎫⎝⎛--⎪⎪⎭⎫ ⎝⎛----μμσσρσσρσσμμx x x x ∑ =,)())((2)(11222221221112112⎥⎦⎤⎢⎣⎡-+-----σμσσμμρσμρx x x x , 因此(X 1,X 2)的概率密度可写成f (x 1,x 2)=.)()(21exp 211⎭⎬⎫⎩⎨⎧----μ∑μ∑X X T π上式容易推广到n 维的情形.设(X 1,X 2,…,X n )是n 维随机变量,令X =⎪⎪⎪⎪⎪⎭⎫ ⎝⎛n x x x 21, μ=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛)()()(2121n n X E X E X E μμμ,定义n 维正态随机变量(X 1,X 2,…,X n )的概率密度为f (x 1,x 2,…,x n)=111()().2(2T X X πμμ-⎧⎫--∑-⎨⎬⎩⎭其中Σ是(X 1,X 2,…,X n )的协方差矩阵.n 维正态随机变量具有以下几条重要性质: 1°n 维随机变量(X 1,X 2,…,X n )服从n 维正态分布的充要条件是X 1,X 2,…,X n的任意的线性组合l 1X 1+l 2X 2+…+l n X n服从一维正态分布.(其中l 1,l 2,…,l n 不全为零).2°若(X 1,X 2,…,X n )服从n 维正态分布,设Y 1,Y 2,…,Y k 是X 1,X 2,…,X n 的线性函数,则(Y 1,Y 2,…,Y k )服从k 维正态分布.3°设(X 1,X 2,…,X n )服从n 维正态分布,则X 1,X 2,…,X n 相互独立的充要条件是X 1,X 2,…,X n 两两不相关.小结随机变量的数字特征是由随机变量的分布确定的,能描述随机变量某一个方面的特征的常数.最重要的数字特征是数学期望和方差.数学期望E(X)描述随机变量X取值的平均大小,方差D(X)=E{[X-E(X)]2}描述随机变量X与它自己的数学期望E(X)的偏离程度.数学期望和方差虽不能像分布函数、分布律、概率密度一样完整地描述随机变量,但它们能描述随机变量的重要方面或人们最关心方面的特征,它们在应用和理论上都非常重要.要掌握随机变量的函数Y=g(X)的数学期望E(Y)=E[g(X)]的计算公式(4.3)和(4.4).这两个公式的意义在于当我们求E(Y)时,不必先求出Y=g(X)的分布律或概率密度,而只需利用X的分布律或概率密度就可以了,这样做的好处是明显的.我们常利用公式D(X)=E(X2)-[E(X)]2来计算方差D(X),请注意这里E(X2)和[E(X)]2的区别.要掌握数学期望和方差的性质,提请读者注意的是:(1)当X1,X2独立或X1,X2不相关时,才有E(X1X2)=E(X1)·E(X2);(2)设c为常数,则有D(cX)=c2D(X);(3)D(X1±X2)=D(X1)+D(X2)±2Cov(X1,X2),当X1,X2独立或不相关时才有D(X1+X2)=D(X1)+D(X2).例如:若X1,X2独立,则有D(2X1-3X2)=4D(X1)+9D(X2).相关系数ρXY有时也称为线性相关系数,它是一个可以用来描述随机变量(X,Y)的两个分量X,Y之间的线性关系紧密程度的数字特征.当|ρXY|较小时X,Y的线性相关的程度较差;当ρXY=0时称X,Y不相关.不相关是指X,Y之间不存在线性关系,X,Y不相关,它们还可能存在除线性关系之外的关系(参见第3节例4.18),又由于X,Y相互独立是指X,Y的一般关系而言的,因此有以下的结论:X,Y相互独立则X,Y一定不相关;反之,若X,Y不相关则X,Y不一定相互独立.特别,对于二维正态变量(X,Y,),X和Y不相关与X和Y相互独立是等价的.而二元正态变量的相关系数ρXY就是参数ρ.于是,用“ρ=0”是否成立来检验X,Y是否相互独立是很方便的.重要术语及主题数学期望随机变量函数的数学期望数学期望的性质方差标准差方差的性质协方差相关系数相关系数的性质X,Y不相关矩协方差矩阵习 题 四求E (X ),E (X ),E (2X +3).2.已知100个产品中有10个次品,求任意取出的5个产品中的次品数的数学期望、方差. 1234.袋中有N 只球,其中的白球数X 为一随机变量,已知E (X )=n ,问从袋中任取1球为白球的概率是多少?5.设随机变量X 的概率密度为f (x )=⎪⎩⎪⎨⎧≤≤-<≤.,0,21,2,10,其他x x x x求E (X ),D (X ).6.设随机变量X ,Y ,Z 相互独立,且E (X )=5,E (Y )=11,E (Z )=8,求下列随机变量的数学期望.(1) U =2X +3Y +1; (2) V =YZ -4X .7.设随机变量X ,Y 相互独立,且E (X )=E (Y )=3,D (X )=12,D (Y )=16,求E (3X -2Y ),D (2X -3Y ).8.设随机变量(X ,Y )的概率密度为f (x ,y )=⎩⎨⎧<<<<.,0,0,10,其他x y x k试确定常数k ,并求E (XY ).9.设X ,Y 是相互独立的随机变量,其概率密度分别为f X (x )=⎩⎨⎧≤≤;,0,10,2其他x x f Y (y )=⎩⎨⎧>--.,0,0,)5(其他y y e 求E (XY ).10.设随机变量X ,Y 的概率密度分别为f X (x )=⎩⎨⎧≤>-;0,0,0,22x x x e f Y (y )=⎩⎨⎧≤>-.0,0,0,44y y y e 求(1) E (X +Y );(2) E (2X -3Y 2). 11.设随机变量X 的概率密度为f (x )=⎪⎩⎪⎨⎧<≥-.0,0,0,22x x cx xke求(1) 系数c ;(2) E (X );(3) D (X ).12.袋中有12个零件,其中9个合格品,3个废品.安装机器时,从袋中一个一个地取出(取出后不放回),设在取出合格品之前已取出的废品数为随机变量X ,求E (X )和D (X ). 13.一工厂生产某种设备的寿命X (以年计)服从指数分布,概率密度为f (x )=⎪⎩⎪⎨⎧≤>-.0,0,0,414x x xe为确保消费者的利益,工厂规定出售的设备若在一年内损坏可以调换.若售出一台设备,工厂获利100元,而调换一台则损失200元,试求工厂出售一台设备赢利的数学期望.14.设X 1,X 2,…,X n 是相互独立的随机变量,且有E (X i )=μ,D (X i )=σ2,i =1,2,…,n ,记∑==n i i S X n X 12,1,S 2=∑=--n i i X X n 12)(11. (1) 验证)(X E =μ,)(X D =n2σ;(2) 验证S 2=)(11122∑=--ni i X n X n ;(3) 验证E (S 2)=σ2.15.对随机变量X 和Y ,已知D (X )=2,D (Y )=3,Cov(X ,Y )=-1, 计算:Cov (3X -2Y +1,X +4Y -3).16.设二维随机变量(X ,Y )的概率密度为f (x ,y )=⎪⎩⎪⎨⎧≤+.,0,1122其他y x ,π试验证X 和Y 是不相关的,但X 和Y 不是相互独立的.验证X 和Y 是不相关的,但X 和Y 不是相互独立的. 18.设二维随机变量(X ,Y )在以(0,0),(0,1),(1,0)为顶点的三角形区域上服从均匀分布,求Cov (X ,Y ),ρXY . 19.设(X ,Y )的概率密度为f (x ,y )=⎪⎩⎪⎨⎧≤≤≤≤+.0,20,20),sin(21其他,y x y x ππ求协方差Cov (X ,Y )和相关系数ρXY .20.已知二维随机变量(X ,Y )的协方差矩阵为⎥⎦⎤⎢⎣⎡4111,试求Z 1=X -2Y 和Z 2=2X -Y 的相关系数.21.对于两个随机变量V ,W ,若E (V 2),E (W 2)存在,证明:[E (VW )]2≤E (V 2)E (W 2).这一不等式称为柯西许瓦兹(Couchy -Schwarz )不等式.22.假设一设备开机后无故障工作的时间X 服从参数λ=1/5的指数分布.设备定时开机,出现故障时自动关机,而在无故障的情况下工作2小时便关机.试求该设备每次开机无故障工作的时间Y 的分布函数F (y ). (2002研考)23.已知甲、乙两箱中装有同种产品,其中甲箱中装有3件合格品和3件次品,乙箱中仅装有3件合格品.从甲箱中任取3件产品放乙箱后,求:(1)乙箱中次品件数Z 的数学期望;(2)从乙箱中任取一件产品是次品的概率. (2003研考) 24.假设由自动线加工的某种零件的内径X (毫米)服从正态分布N (μ,1),内径小于10或大于12为不合格品,其余为合格品.销售每件合格品获利,销售每件不合格品亏损,已知销售利润T (单位:元)与销售零件的内径X 有如下关系T =⎪⎩⎪⎨⎧>-≤≤<-.12,5,1210,20,10,1X X X 若若若 问:平均直径μ取何值时,销售一个零件的平均利润最大? (1994研考)25.设随机变量X 的概率密度为f (x )=⎪⎩⎪⎨⎧≤≤.,0,0,2cos 21其他πx x 对X 独立地重复观察4次,用Y 表示观察值大于π/3的次数,求Y 2的数学期望.(2002研考)26.两台同样的自动记录仪,每台无故障工作的时间T i (i =1,2)服从参数为5的指数分布,首先开动其中一台,当其发生故障时停用而另一台自动开启.试求两台记录仪无故障工作的总时间T =T 1+T 2的概率密度f T (t ),数学期望E (T )及方差D (T ). (1997研考) 27.设两个随机变量X ,Y 相互独立,且都服从均值为0,方差为1/2的正态分布,求随机变量|X -Y |的方差. (1998研考) 28.某流水生产线上每个产品不合格的概率为p (0<p <1),各产品合格与否相互独立,当出现一个不合格产品时,即停机检修.设开机后第一次停机时已生产了的产品个数为X ,求E (X )和D (X ). (2000研考) 29.设随机变量X 和Y 的联合分布在点(0,1),(1,0)及(1,1)为顶点的三角形区域上服从均匀分布.(如图),试求随机变量U =X +Y 的方差. (2001研考) 30.设随机变量U 在区间[-2,2]上服从均匀分布,随机变量X =⎩⎨⎧->-≤-,U ,U 1,11,1若若 Y =⎩⎨⎧>≤-.1,11,1U ,U 若若试求(1)X 和Y 的联合概率分布;(2)D (X +Y ). (2002研考) 31.设随机变量X 的概率密度为f (x )=x-e21,(-∞<x <+∞)(1) 求E (X )及D (X );(2) 求Cov(X ,|X |),并问X 与|X |是否不相关?(3) 问X 与|X |是否相互独立,为什么? (1993研考) 32.已知随机变量X 和Y 分别服从正态分布N (1,32)和N (0,42),且X 与Y 的相关系数ρXY =-1/2,设Z =23YX +. (1) 求Z 的数学期望E (Z )和方差D (Z ); (2) 求X 与Z 的相关系数ρXZ ;(3) 问X 与Z 是否相互独立,为什么? (1994研考)33.将一枚硬币重复掷n 次,以X 和Y 表示正面向上和反面向上的次数.试求X 和Y 的相关系数ρXY . (2001研考)试求X 和Y 的相关系数ρ. (2002研考) 35.对于任意两事件A 和B ,0<P (A )<1,0<P (B )<1,则称 ρ=())()()()()()(B P A P B P A P B P A P AB P ⋅-为事件A 和B 的相关系数.试证:(1) 事件A 和B 独立的充分必要条件是ρ=0;(2) |ρ|≤1. (2003研考) 36. 设随机变量X 的概率密度为f X (x )=⎪⎪⎪⎩⎪⎪⎪⎨⎧<≤<<-.,0,20,41,01,21其他x x令Y =X 2,F (x ,y )为二维随机变量(X ,Y )的分布函数,求:(1) Y 的概率密度f Y (y ); (2) Cov(X ,Y );(3) F (-1/2,4). (2006研考)。
概率论与数理统计第3章随机变量的数字特征2-5节精品文档
1
D(X ) 21002
1
7002 21002
1 (1)2 3
8. 9
即P(5200X9400)8. 9
2019/10/16
n
n
D( CiXi) Ci2D(Xi).
i1
i1
(4) 对于任意实数C∈R,有 (书P93. 8题)
E ( X-C )2≥D( X )
当且仅当C = E(X)时, E ( X-C )2取得最小值D(X).
2019/10/16
19
求证
E ( X-C )2≥D( X )
证: E(XC)2 E {X [E]X [E X C )]2}
证: D(C)E{C [E(X)2 ]}E{C [ C]2} 0.
(2 )若 D (X )存则 在 D (C) , X C 2D (X )C ,为; 常
证: D(CX) E{C [ X E(C)X2]}
E{C [ X C(E X)2]} E{C2[XE(X)2 ]}
C2E{X [E(X)2]}C2D(X).
复习: 数学期望
它反映随机变量取值的平均水平,是随机变量的 一个重要的数字特征.
EX xk pk, k1
X离散型
E X xf(x )d x,
X 连 续 型
EYE[g(X)]
g(xk)pk,
k1
X离散型
g(x)f(x)dx, X连续型
2019/10/16
0
E(X 2)
函数有下列结论:
(1 ) (1 ) ();
(2Γ()n1 )n!;
tx
1
2
t2etdt
概率论与数理统计第三章随机变量的数字特征3-2
解:由于EX p
所以
EX 2 12 p 0 (1 p) p
DX EX 2 (EX )2
p p2 p(1 p) ˆ pq
(2)Binomial Distribution X ~ B(n,p)
解:由于 X ~ B(n,p),故
P{X k} Cnk pk qnk (k 0,1,2,, n)
(4)设X 与Y 相互独立,则
D( X Y ) DX DY
证明: D( X Y) E[( X Y) E( X Y)]2
E[( X EX ) (Y EY )]2 E( X EX )2 2E( X EX )(Y EY ) E(Y EY )2 DX DY
其中 E( X EX )(Y EY ) E[ XY XEY YEX EXEY ]
EXY EXEY EXEY EXEY EXY EXEY EXEY EXEY 0
对于有限个相互独立的随机变量 X1, X 2,, X n 有 D( X1 X 2 X n ) DX1 DX 2 DX n
二.几种常见分布的r v 的方差
(1)(0-1)分布 X ~ B(1,p)
Standard Deviation
对于离散型随机变量X ,若其概率分布为
P{X xk } pk(k 1,2,)则有
DX
( xk
EX )2 pk
k 1
(3-9)
对于连续型r v X ,若其概率分布为 f ( x) ,则有
DX (x EX )2 f (x)dx
(3-10)
计算方差的一个重要公式:
由定义 3-1 及(p75)可得 EX np,DX npq。
现介绍一种简单方法:令
X i 0,1,第第i次i次试试验验事事件件AA不发发生生(i 1,2,,n)
概率论与数理统计(经管类)复习要点 第4章 随机变量的数字特征
第四章 随机变量的数字特征1. 把刻画随机变量某些方面特征的数值称为随机变量的数字特征,如期望、方差、协方差、相关系数等。
2. 随机变量的期望反映了随机变量取值的集中位置。
离散型随机变量的期望设离散型随机变量X 的分布律为P {X =x k }=p k ,k=1,2,…若级数∑ix i p i 绝对收敛(即级数∑i丨x i 丨p i 收敛),则定义X 的数学期望(简称均值或期望)为E (X )=∑ix i p i注:当X 的可能取值为有限多个x 1,x 2,…,x n 时,E (X )=∑=ni 1x i p i 当X 的可能取值为可列多个x 1,x 2,…,x n ,…时,E (X )=∑∞=1i x i p i三种重要离散型随机变量的数学期望:3. 离散型随机变量函数的数学期望 设离散型随机变量X 的分布律为P {X =x k }=p k ,k=1,2,…令Y =g (X ),若级数∑∞=1k g (x k )p k 绝对收敛,则随机变量Y 的数学期望为E (Y )= E[g (X )] =∑∞=1k g (x k )p k4. 连续型随机变量的期望三种重要连续型随机变量的数学期望:5. 连续型随机变量函数的数学期望2017.4单解:6. 二维随机变量的期望二维随机变量函数的期望7. 期望的性质(1)常数的期望等于这个常数,即E (C )=C ,其中C 为常数证明 常数C 作为随机变量,它只可能取一个值C ,即P {X =C }=1,所以E (C )=C ⋅1=C(2)常数与随机变量X 乘积的期望等于该常数与随机变量X 的期望的乘积,即E (C X )=C ⋅E (X ) (3)随机变量和的期望等于随机变量期望之和,即E (X +Y )= E (X )+ E (Y ) 推广:E (C 1X +C 2Y )= C 1E (X )+ C 2E (Y ),其中C 1,C 2为常数 一般地,设X 1,X 2,…,X n ,为n 个随机变量,则有E (∑=ni iX 1)=∑=ni iX E 1)(E (∑=ni ii X C 1)=∑=ni iiX E C 1)( 其中C i(i=1,2,…)为常数(4)两个相互独立的随机变量乘积的期望等于期望的乘积,即若X ,Y 是相互独立的随机变量,则E (XY )= E (X )E (Y )由数学归纳法可证得:当X1,X2,…,X n相互独立时有E(X1,X2,…,X n)= E(X1)E(X2)…E(X n)2018.4单解:指数分布的期望值为 1,故E(X)= E(Y)=21,所以E(X Y)= E(X)E(Y)=412018.4计解:(1)平均收益率E(X)=1%×0.1+2%×0.2+3%×0.1+4%×0.3+5%×0.2+6%×0.1=3.6%(2)预期利润10×3.6%=0.36万元2017.10单解:E(-3X +2)=-3 E(X)+2=-3×51+2=572017.4填解:E(X+Y)= E(X)+ E(Y)=20×0.1+2=48. 方差反映了随机变量偏离中心——期望的平均偏离程度。
概率论与数理统计讲义第三章随机变量的数字特征
概率论与数理统计讲义第三章随机变量的数字特征第三章随机变量的数字特征【授课对象】理工类本科二年级【授课时数】4学时【授课方法】课堂讲授与提问相结合【基本要求】1、理解数学期望、方差的概念,并掌握它们的性质。
2、会计算随机变量函数的数学期望。
3、了解协方差、相关系数的概念。
【本章重点】对数学期望、方差、相关系数等数字特征概念的理解与计算。
【本章难点】对不相关与相互独立间关系的理解。
【授课内容及学时分配】§3.0 前言从上一章我们可以看出,分布函数(或密度函数、分布列)给出了随机变量的一种最完全的描述。
因此,原则上讲,全面认识和分析随机现象就应当求出随机变量的分布,但是对许多实际问题来讲,要想精确地求出其分布是很困难的。
其实,通过对现实问题的分析,人们发现对某些随机现象的认识并不要求了解它的确切分布,而只要求掌握他们的某些重要特征,这些特征往往更能集中地反映随机现象的特点。
例如要评价两个不同厂家生产的灯泡的质量,人们最关心的是谁家的灯泡使用的平均寿命更长些,而不需要知道其寿命的完全分布,同时还要考虑其寿命与平均寿命的偏离程度等,这些数据反映了它在某些方面的重要特征。
我们把刻划随机变量(或其分布)某些特征的确定的数值称为随机变量的数字特征。
本章主要介绍反应随机变量取值的集中位置、分散程度以及随机变量之间的线性相依程度的数字特征——数学期望、方差与相关系数(矩)。
§3.1 随机变量的数学期望一、离散型随机变量的数学期望引例:甲、乙二人进行射击比赛,以、分别表示他们命中的环数,其分布列分别为~~试问谁的技术好些?解:这个问题的答案并不是一眼看得出的。
这说明了分布列虽然完整地描述了离散型随机变量的概率特征,但是却不够“集中”地反映出它的变化情况,因此我们有必要找出一些量来更集中、更概括地描述随机变量,这些量多是某种平均值。
若在上述问题中,使两个射手各射N枪,则他们打中靶的总环数大约是:甲 8N+90.1N+100.6N=9.3N乙 80.2N+90.5N+100.3N=9.1N平均起来甲每枪射中9.3环,乙每枪射中9.1环,因此可以认为甲射手的本领要好些。
概率论与数理统计:4-1随机变量的数字特征
解 X的分布率为
P{ X k} ke , k 0,1,2,, 0
k!
X的数学期望为
E( X )
k e
k
e
k 1
ee
k0 k!
k1 (k 1)!
即E( X )
例3 按规定,某车站每天8:00~9:00,9:00~10:00 都恰有一辆客车到站,但到站时刻是随机的,且两者 到站的时间相互独立。其规律为:
X1 0 1 2 pk 0 0.2 0.8
X2 0 1 2 pk 0.6 0.3 0.1
解:我们先来算 X1 和 X2的数学期望,
E( X1) 0 0 1 0.2 2 0.8 1.8(分) E( X2 ) 0 0.6 1 0.3 2 0.1 0.5(分)
例2 设X ~ ( ),求E( X ).
54321 0 45
命中次数 nk 7 13 15 10 15 30
频率 nk n
7 13 15 10 15 30 90 90 90 90 90 90
试问:该射手每次射击平均命中靶多少环?
解
平均射中环数
射中靶的总环数 射击次数
07 113 215 310 415 5 30 90
0 7 1 13 2 15 3 10 4 15 90 90 90 90 90
第四章 随机变量的数字特征
在前面的课程中,我们讨论了随机变量及其分 布,如果知道了随机变量X的概率分布,那么X的 全部概率特征也就知道了.
然而,在实际问题中,概率分布一般是较难 确定的. 而在一些实际应用中,人们并不需要知 道随机变量的一切概率性质,只要知道它的某些 数字特征就够了.
因此,在对随机变量的研究中,确定某些数 字特征是重要的 .
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
求EX
解:
EX
xf (x)dx
b
x dx a b.
a ba
2
例6.(指数分布)设X的概率密度为
ex
f (x) 0
x0
x 0 0 求EX
解:
EX
xf ( x)dx
xexdx xde x
X连续型
该公式的重要性在于: 当我们求E[g(X)] 时, 不必知道g(X)的分布,而只需知道X的 分布就可以了. 这给求随机变量函数的期 望带来很大方便.
将g(X)特殊化,可得到各种数字特征: k阶原点矩 E( X k ) k阶中心矩 E([ X E( X )]k ) k阶绝对原点矩 E(| X |k )
| x | f (x)dx
有限,定义X的数学期望为
E( X ) x f (x)dx
也就是说,连续型随机变量的数学期望是一个绝 对收敛的积分.
EX物理意义:以f(x)为密度的一维连续质点 系的重心坐标。
例5.(均匀分布)设X的概率密度为
f
(
x)
b
1
a
0
axb 其它
解: 设每小时内乘客到达车站的时间为X,
等车时间为Y.
则 X~U [0, 60]
f ( x ) 610 , 0 x 60, 0, 其它.
10 - X,
0 X 10
则
Y
g(
X
)
30 - X, 50 X ,
10 X 30 30 X 50
60 X 10, 50 X 60
在数轴上取很密的分点x0 <x1<x2< …,则X落
在小区间[xi, xi+1)的概率是
xi1 f ( x)dx xi
阴影面积
近似为
f ( xi )xi
f ( xi )( xi1 xi )
f ( xi )xi
小区间[xi, xi+1)
由于xi与xi+1很接近, 所以区间[xi, xi+1)中 的值可以用xi来近似代替.
注意:由E(XY)=E(X)E(Y)
3. E(X1+X2) = E(X1)+E(X2);不一定能推出X,Y独立
n
n
推广 : E[ Xi ] E( Xi )
可以得到n天中每天的平均废品数为
0 n0 1 n1 2 n2 3 n3 nn n n
0 n0 1 n1 2 n2 3 n3 nn n n
由频率和概率的关系
这是以频率为权的 加权平均
不难想到,在求废品数X 的平均值时,用概率代替 频率,得平均值为
这是以概率为权的 加权平均
但是,如果试验次数很大,出现Xk的频率会 接近于pk,于是可期望试验值的平均值接近
xk pk
k 1
由此引入离散型r.vX的数学期望的定义如下:
定义1 设X是离散型随机变量,它的概率分布
列是: P(X=Xk)=pk , k=1,2,…
如果 | xk | pk 有限,定义X的数学期望
k 1
i 1
g( xi , y j ) pij ,
j1
( X ,Y )离散型
g( x, y) f ( x, y)dxdy,
(X ,Y )连续型
当( X, Y )是离散型时:分布列为
P( X xiY y j ) pij i , j 1,2,
当( X, Y )是连续型时:联合概率密度为f(x, y)
这个数能否作为 X的平均值呢?
可以想象,若另外统计100天,车工小张不 出废品,出一件、二件、三件废品的天数与 前面的100天一般不会完全相同,这另外100 天每天的平均废品数也不一定是1.27.
一般来说,若统计n天,
(假定小张每天至多出
三件废品)
n0天没有出废品; n1天每天出一件废品; n2天每天出两件废品; n3天每天出三件废品.
0 p0 1 p1 2 p2 3 p3 这样得到一个确定的数. 我们就用这个数作为 随机变量X的平均值 .
这样做是否合理呢?
我们采用计算机模拟.
不妨把小张生产中出废品的情形 用一个球箱模型来描述:
有一个箱子,里面装有10个 0 0 0 2 2 大小,形状完全相同的球, 1 1 1 3 3 号码如图.
t2 2
dt
2
t2
e 2 dt
t2
te 2 dt .
2
2
例8.(柯西分布)设X的概率密度为
f
(
x)
(1
1
x
2
)
x
求EX
解:
x
dx (1 x2
)
0
(1
xdx x2
因此X与以概率 f ( xi )xi 取值xi的离散型r.v
近似, 该离散型r.v 的数 学期望是
阴影面积
近似为
f ( xi )xi
xi f ( xi )xi
i
这正是
x f (x)dx
的渐近和式.
小区间[Xi, Xi+1)
由此启发我们引进如下定义. 定义2 设X是连续型随机变量,其密度函数 为 f (x),如果
使用这种方法必须先求出随机变量函数 g(X)的分布,一般是比较复杂的 .
那么是否可以不先求g(X)的分布而只 根据X的分布求得E[g(X)]呢?
下面的基本公式指出,答案是肯定的.
类似引入上述E(X)的推理,可得如下的 基本公式:
设X是一个随机变量,Y=g(X),则
E (Y
)
E[
g(
X
)]
第五章
随机变量的数字特征 与极限定理
第一讲 数学期望
在前面的课程中,我们讨论了随机变量 及其分布,如果知道了随机变量X的概率分 布,那么X的全部概率特征也就知道了.
然而,在实际问题中,概率分布一般 是较难确定的. 而在一些实际应用中,人 们并不需要知道随机变量的一切概率性质, 只要知道它的某些数字特征就够了.
P( X k) k e k 0,1,2, 求EX。
k!
解:
EX
k
k
e
k
e e
k 1
k0 k!
k1 (k 1)!
k1 (k 1)!
e- e
二、连续型随机变量的数学期望
设X是连续型随机变量,其密度函数为f (x),
解: 设试开次数为X,
P(X=k)= 1/n , k=1,2,…,n
于是
E(X)
n k1 k1 n
1 (1 n)n n2
n1 2
例3 (0-1分布) 设X的分布列为
X0 1
P 1-p p
求EX
解: EX=0 × ( 1-p )+1 × p= p
例4.(泊松分布)设X的分布列为
由此可知:已知( X, Y )的联合概率密度f(x, y), 可以求EX,EY
即
EX
xf ( x, y )dxdy
EY
yf ( x, y )dxdy
四、数学期望的性质
1. 设C是常数,则E(C)=C;
2. 若k是常数,则E(kX)=kE(X);
E( X ) xk pk
k 1
也就是说,离散型随机变量的数学期望是一个绝
对收敛的级数的和.
如果 xi pi 发散,则X的数学期望不存在。 i 1
EX的物理意义:表示一维离散质点系的重心坐标
例2 某人的一串钥匙上有n把钥匙,其中只有 一把能打开自己的家门,他随意地试用这串钥 匙中的某一把去开门. 若每把钥匙试开一次后 除去,求打开门时试开次数的数学期望.
)
xdx
0 (1 x2 )
2
xdx
0 (1 x2 )
1
ln(1
x
2
)
0
故 EX不存在。
由随机变量数学期望的定义,不难计算得:
若X~U[ a, b],即X服从[a, b]上的均匀分布,则
E(X) a b 2
若X服从参数为 的泊松分布,则
0
0
[( xex )0 exdx] exdx
0
0
(1
e
x
)0
1
例7.(正态分布)设 X ~ N (, 2 ), 求EX
解:
EX x
1
e
(
x )2 2 2
dx
2
令t x
te
三、随机变量函数的数学期望
1. 问题的提出:
设已知随机变量X的分布,我们需要计 算的不是X的期望,而是X的某个函数的期 望,比如说g(X)的期望. 那么应该如何计算 呢?
如何计算随机变量函数的数学期望? 一种方法是,因为g(X)也是随机变量,
故应有概率分布,它的分布可以由已知的X 的分布求出来. 一旦我们知道了g(X)的分布, 就可以按照期望的定义把E[g(X)]计算出来.
我们来看第一个问题.
例1 某车间对工人的生产情况进行考察. 车工