概率论与数理统计课件(第4章)
概率论与数理统计第四章
E (b) b E (aX ) aE ( X )
2. E(X+Y) = E(X)+E(Y);
推广 : E [ X i ] E ( X i )
i 1 i 1 n n
E ( ai X i ) ai E ( X i )
i 1 i 1
n
n
3. 设X、Y独立,则 E(XY)=E(X)E(Y);
例2.(X,Y)服从二维正态分布,其概率密度为 1 f ( x, y ) 2 21 2 1
1 y 1 2 x 1 y 2 y 2 2 exp{ [( ) 2 ( )( )( ) ]} 2 1 1 2 2 (1 )
证明: XY
Cov(kX, kY)=k2Cov(X,Y)
■相关系数
定义 设D(X)>0, D(Y)>0, 称
XY
Cov( X , Y ) X EX Y EY E[ ] D( X ) D(Y ) DX DY
为随机变量X和Y的相关系数(标准协方差)
X Y E( X Y ) XY
练习
1.设离散型随机变量(X,Y)的分布列为 Y 0 1 2 X 则E(XY)=( ) 0 1/3 1/6 1/9 1 0 1/6 1/9 2 0 0 1/9
2.设随机变量X的概率密度为
e x f ( x) 0 x0 其它
Y=e-2X,则EY=( )
■数学期望的性质
1. 设a,b是常数,则E(aX+b)=aE(X)+b;
对正态分布而言,X、Y相互独立 与互不相关是等价的。
例4.设随机变量(X,Y)~N(1, 1, 9, 16, -0.5) 令
第四章 随机变量的数字特征
概率论与数理统计教程(茆诗松)第4章
解:用 Xi=1表示第i个部件正常工作, 反之记为Xi=0. 又记Y=X1+X2+…+X100,则 E(Y)=90,Var(Y)=9.
由此得:
P{Y
85}
ห้องสมุดไป่ตู้
1
85
0.5 9
90
0.966.
13 July 2020
华东师范大学
第四章 大数定律与中心极限定理
第10页
二、给定 n 和概率,求 y
例4.4.4 有200台独立工作(工作的概率为0.7)的机床,
第6页
4.4.3 二项分布的正态近似
定理4.4.2 棣莫弗—拉普拉斯中心极限定理
设n 为服从二项分布 b(n, p) 的随机变量,则当 n
充分大时,有
lim
n
P
n
np npq
y
( y)
是林德贝格—勒维中心极限定理的特例.
13 July 2020
华东师范大学
第四章 大数定律与中心极限定理
第7页
13 July 2020
华东师范大学
第四章 大数定律与中心极限定理
第5页
例4.4.2 设 X 为一次射击中命中的环数,其分布列为
X 10 9 8 7
6
P 0.8 0.1 0.05 0.02 0.03
求100次射击中命中环数在900环到930环之间的概率.
解: 设 Xi 为第 i 次射击命中的环数,则Xi 独立同分布,
且 E(Xi) =9.62,Var(Xi) =0.82,故
P
900
100 i 1
Xi
930
930 100 9.62 100 0.82
900 100 9.62 100 0.82
北京理工大学《概率论与数理统计》课件-第4章随机变量的数字特征
北京理工大学《概率论与数理统计》分布函数能够完整地描述随机变量的统计特性,但在某些实际问题中,不需要全面考查随机变量的变化,只需知道它的随机变量的某些数字特征也就够了.评定某企业的经营能力时,只要知道该企业例如:年平均赢利水平研究水稻品种优劣时,我们关心的是稻穗的平均粒数及平均重量考察一射手的水平,既要看他的平均环数是否高,还要看他弹着点的范围是否小,即数据的波动是否小.由上面的例子看到,平均盈利水平、平均粒数、平均环数、数据的波动大小等,都是与随机变量有关的某个数值,能清晰地描述随机变量在某些方面的重要特征,这些数字特征在理论和实践上都具有重要意义.另一方面,对于一些常用的重要分布,如二项分布、泊松分布、指数分布、正态分布等,其中的参数恰好就是某些数字特征,因此,只要知道了这些数字特征,就能完全确定其具体的分布.第四章随机变量的数字特征4.1随机变量的平均取值——数学期望4.2随机变量取值平均偏离平均值的情况——方差4.3 描述两个随机变量之间的某种关系的数——协方差与相关系数4.1 数学期望一离散型随机变量的数学期望二连续型随机变量的数学期望三常见分布的数学期望四随机变量函数的数学期望五数学期望的性质六、数学期望的应用一离散型随机变量的数学期望引例射击问题设某射击手在同样的条件下,瞄准靶子相继射击90次,(命中的环数是一个随机变量).射中次数记录如下命中环数Y0 1 2 3 4 5命中次数n k 2 13 15 10 20 30频率n k/n2/90 13/90 15/90 10/90 20/90 30/90试问:该射手每次射击平均命中靶多少环?解:平均命中环数这是以频率为权的加权平均命中环数Y0 1 2 3 4 5命中次数n k2 13 15 10 20 30频率n k /n 2/90 13/90 15/90 10/90 20/90 30/900211321531042053090×+×+×+×+×+×=21315102030012345909090909090=×+×+×+×+×+×50k k n k n =⋅∑ 3.37.==射中靶的总环数射击次数平均射中环数频率随机波动随机波动“平均射中环数”的稳定值?=由频率的稳定性知:当n 很大时:频率n k /n 稳定于概率p k 稳定于50k k n k n =⋅∑50k k k p =⋅∑50k k n k n =⋅∑“平均射中环数”等于射中环数的可能值与其概率之积的累加定义1 设X 是离散型随机变量,它的概率分布是:P {X =x k }=p k , k =1,2,…如果绝对收敛,则称它为X 的数学期望或均值.记为E (X ), 即如果发散,则称X 的数学期望不存在.1k k k x p ∞=∑1()k k k E X x p ∞==∑1||k k k x p∞=∑注意:随机变量的数学期望的本质就是加权平均数,它是一个数,不再是随机变量.注1:随机变量X 的数学期望完全是由它的概率分布确定的,而不应受X 的可能取值的排列次序的影响,因此要求绝对收敛1k k k xp ∞=<+∞∑11111(1)1ln 2234212n n−+−++−→− 1111111(2)1ln 22436852−−+−−+→注2.E (X )是一个实数,而非随机变量,它是一种以概率为权的加权平均,与一般的算术平均值不同,它从本质上体现了随机变量X 取可能值的真正的平均值,也称均值.当随机变量X 取各个可能值是等概率分布时,X 的期望值与算术平均值相等.假设X 1P80 85 90 1/4 1/4 1/21()800.25850.25+900.586.25E X =×+××=X 2P80 85 901/3 1/3 1/32()85.E X =注3.数学期望E(X)完全由随机变量X的概率分布确定,若X服从某一分布,也称E(X)是这一分布的数学期望.乙射手甲射手例1.甲、乙两个射击手,他们射击的分布律如下表所示,问:甲和乙谁的技术更好?击中环数8 9 10概率0.3 0.1 0.6击中环数8 9 10概率0.2 0.5 0.3单从分布列看不出好坏,解:设甲,乙两个射击手击中的环数分别为X 1,X 2E (X 1)=8×0.3+9×0.1+10×0.6=9.3(环)E (X 2)=8×0.2+9×0.5+10×0.3=9.1(环)例2.1654年职业赌徒德.梅尔向法国数学家帕斯卡提出一个使他苦恼很久的分赌本问题:甲、乙两赌徒赌技相同,各出赌注50法郎,每局中无平局.他们约定,谁先赢三局,则得到全部100法郎的赌本.当甲赢了2局,乙赢了1局时,因故要中止赌博.现问这100法郎如何分才算公平?解:假如比赛继续进行下去,直到结束为止. 则需要2局.这时,可能的结果为:甲甲,甲乙,乙甲,乙乙即:甲赢得赌局的概率为3/4,而乙赢的概率为1/4.设:X、Y分别表示甲和乙得到的赌金数. 则分布律分别为:X0 100 P1/4 3/4Y0 100 P3/4 1/4这时,可能的结果为:甲甲,甲乙,乙甲,乙乙即:甲赢得赌局的概率为3/4,而乙赢的概率为1/4.E(X)=0×1/4+100×3/4=75E(Y)=0×3/4+100×1/4=25即甲、乙应该按照3:1的比例分配全部的赌本.例3.确定投资决策方向?某人有10万元现金,想投资于某项目,预估成功的机会为30%,可得利润8万元,失败的机会为70%,将损失2万元.若存入银行,同期间的利率为5%,问是否做此项投资?解:设X 为此项投资的利润,则存入银行的利息:故应该选择该项投资.(注:投资有风险,投资须谨慎)X 8 −2P0.3 0.7此项投资的平均利润为:E (X )=8×0.3+(−2)×0.7=1(万元)10×0.05=0.5(万元)设X 是连续型随机变量,密度函数为f (x ).问题:如何寻找一个体现随机变量平均值的量.将X 离散化.二、连续型随机变量的数学期望在数轴上取等分点:…x −2<x −1<x 0<x 1<x 2<…x k +1−x k =∆x ,k =0,±1,….,并设x k 都是f (x )的连续点.则小区间[x i ,x i+1)阴影面积近似为f (x i )∆x i1()i x x f x dx+=∫()i f x x≈∆P {x i <X ≤x i +1}定义一个离散型随机变量X *如下:其数学期望存在,且绝对收敛时,P {X *=x i }=P {x i ≤X <x i +1} ≈f (x i )∆x对于X *,当当分点越来越密,即∆x →0时,可以认为X *=x i 当且仅当x i ≤X <x i +1(*)i i ix P X x =∑(*){*}i i iE X x P X x ==∑()i i ix f x x ≈∆∑0=lim ()i i x ix f x x ∆→∆∑则其分布律为E (X *) →E (X ) *0=lim x EX EX ∆→即有:+()xf x dx∞−∞=∫定义2:设X 是连续型随机变量,其密度函数为f (x ),如果绝对收敛,则称的值为X 的数学期望,如果积分发散,则称随机变量X 的数学期望不存在.+()xf x dx ∞−∞∫+||()x f x dx∞−∞∫即+()()E X xf x dx∞−∞=∫+()xf x dx ∞−∞∫记为E (X ).注意:随机变量的数学期望的本质就是加权平均数,它是一个数,不再是随机变量.三、常见分布的数学期望1.0−1分布设随机变量X服从参数为p的0−1分布,求EX.解:X的分布律为X0 1P1−p p则:E(X)=0×P{X=0}+1×P{X=1}=P{X=1}=p概率是数学期望的特例(第五章)2.二项分布X 的分布律为P {X =k }=C n k p k (1−p )n−k ,k =0,1,…,n .解:设随机变量X ~b (n ,p ),求EX .0{}nk EX kP X k ==∑0(1)n k k n k n k kC p p −=−∑1!(1)!()!n k n kk n k p p k n k −=−−∑1(1)(1)1(1)!(1)(1)!()!nk n k k n np p p k n k −−−−=−−−−∑11(1)1(1)n l k l ln ln l np Cp p −=−−−−=−∑1[(1)]n np p p −=+−np=抛掷一枚均匀硬币100次,能期望得到多少次正面3.泊松分布则解:X 的分布律为设随机变量X ~π(λ),求EX .{},0,1,2,!kP X k e k k λλ−=== 00(){}!k k k e E X kP X k k k λλ−∞∞=====∑∑11(1)!k k ek λλλ−∞−==−∑1!ii k i e i λλλ∞=−−=∑=e e λλλλ−=1!k k e k k λλ−∞==∑泊松分布的参数是λ4.几何分布解:X 的分布律为P {X =k }=q k −1p ,k =1,2,….p+q =1设随机变量X 服从参数为p 的几何分布,求EX .111(){}k k k E X kP Xk k pq∞∞−=====⋅∑∑11k k p k q∞−=⋅∑1=()kk p q ∞=′∑1=()k k p q ∞=′∑()1q p q′=−211(1)p q p=−重复掷一颗骰子平均掷多少次才能第一次出现6点设X ~U (a , b ),求E (X ).解:X 的概率密度为:X 的数学期望为:数学期望位于区间(a ,b )的中点.5.均匀分布1()0a xb f x b a<<=− 其它()()2bax a b E X xf x dx dx b a +∞−∞+===−∫∫设X 服从指数分布,求E (X ).分部积分法6.指数分布当概率密度表示为:对应的数学期望为θ.,0()0,x e x f x x λλ− >=≤ 0xxedx λλ+∞−=∫()()E X xf x dx +∞−∞=∫1λ=1,0()0,0xe xf x x θθ− > = ≤解:X 的概率密度为:设X ~N (μ,σ2),求E (X ).解:X 的概率密度为被积函数为奇函数,故此项积分为0.7.正态分布22()21()2x f x eµσπσ−−=()()E X xf x dx +∞−∞=∫22()212x xedxµσπσ−+∞−−∞=∫221()2x t t t edtµσσµπ−=+∞−−∞+∫ 2222122t t tedt edt σµππ+∞+∞−−−∞−∞+∫∫µ=N (0,1)的密度函数积分为1.注意:不是所有的随机变量都有数学期望例如:Cauchy 分布的密度函数为但发散故其数学期望不存在.21(),(1)f x x x π=−∞<<+∞+2||||()(1)x x f x dx dx x π+∞+∞−∞−∞=+∫∫四随机变量函数的数学期望设已知随机变量X的分布,我们需要计算的不是X的期望,而是X的某个函数的期望,比如说g(X)的期望. 那么应该如何计算呢?一种方法是,因为g(X)也是随机变量,故应有概率分布,它的分布可以由已知的X的分布求出来. 一旦我们知道了g(X)的分布,就可以按照期望的定义把E[g(X)]计算出来.例4.某商店对某种家用电器的销售采用先使用后付款的方式,记该种电器的使用寿命为X (以年计),规定:X ≤1,一台付款1500元;1<X ≤2,一台付款2000元2<X ≤3,一台付款2500元;X >3,一台付款3000元设X 服从指数分布,且平均寿命为10年,求该商店一台电器的平均收费.解:设该商店一台电器的收费为Y .要求E (Y )X 的分布函数为:1101,()0,0x e x F x x − −>=≤设该商店一台电器的收费为YX ≤1,一台付款1500元1 <X ≤2,一台付款2000元2 <X ≤3,一台付款2500元X >3,一台付款3000元1101,0()0,0x ex F x x − −>=≤P {Y =1500}=P {X ≤1}=F (1)=1−e −0.1=0.0952P {Y =2000}=P {1<X ≤2}=F (2)−F (1)=0.0861P {Y =2500}=P {2<X ≤3}=F (3)−F (2)=0.0779P {Y =3000}=P {X >3}=1−F (3)=0.7408设X 服从指数分布,且平均寿命为10年.Y 的分布律为所以该商店一台电器的平均收费,即Y 的数学期望为Y 1500 2000 2500 3000P0.0952 0.0861 0.0779 0.7408()15000.095220000.086125000.0779 30000.74082732.15E Y =×+×+×+×=使用上述方法必须先求出g(X)的分布,有时这一步骤是比较复杂的.那么是否可以不先求g(X)的分布,而只根据X的分布求E[g(X)]呢?例5.设离散型随机变量X 的概率分布如下表所示,求:Z=X 2的期望.X−11P214141E (Z )= g (0)×0.5+g (-1)×0.25+g (1)×0.25解:=0.5注:这里的.)(2x x g =(1)当X 为离散型随机变量时,分布律为P {X = x k }=p k ,k =1,2,⋯(2)当X 为连续型随机变量时,概率密度函数为f (x ).定理:设Y 是随机变量X 的函数,Y =g (X )(g 是连续函数)若级数绝对收敛,则有若积分绝对收敛,则有1()[()]()kkk E Y E g X g x p∞===∑()[()]()()E Y E g X g x f x dx+∞==∫1()k k k g x p ∞=∑()()g x f x dx+∞−∞∫该公式的重要性在于:当求E [g (X )]时,不必知道g (X )的分布,而只需知道X 的分布就可以了,这给求随机变量函数的期望带来很大方便.k k k g x p X E Y E g X g x f x dx X 1(),()[()]()(),∞=+∞−∞== ∑∫离散型连续型例6.设随机变量X~b(n, p),Y=e aX,求E(Y).解:因为X的分布律为所以有{}(1), 0,1,...,k k n knP X k C p p k n−==−= ()E Y=(1)nak k k n knke C p p−=−∑()(1)nk a k n knkC e p p−=−∑[(1)]a npe p=+−={}nakke P X k==∑例7.设X ~U [0,π],Y=sinX ,求E (Y ).解:因为X 的概率密度为所以有1,0()0,x f x ππ≤≤ =其他()sin ()E Y xf x dx +∞−∞=∫01sin x dx ππ⋅∫2π=定理:设Z 是随机变量X 和Y 的函数,Z =g (X,Y )(g 是连续函数),Z 是一维随机变量(1)若(X,Y )是二维离散型随机变量,概率分布为(2)若(X,Y )是二维连续型随机变量,概率密度为f (x, y ),则有这里假定上两式右边的积分或级数都绝对收敛11()[(,)](,)ijijj i E Z E g X Y g x y p∞∞====∑∑()[(,)](,)(,)E Z E g X Y g x y f x y dxdy+∞+∞−∞−∞==∫∫{,},,1,2,i j ij P X x Y y p i j ====则有几个常用的公式()[(,)](,)(,)E Z E g X Y g x y f x y dxdy+∞+∞−∞−∞==∫∫(,)EX xf x y dxdy+∞+∞−∞−∞=∫∫(,)EY yf x y dxdy+∞+∞−∞−∞=∫∫22()(,)E Y y f x y dxdy+∞+∞−∞−∞=∫∫22()(,)E X x f x y dxdy+∞+∞−∞−∞=∫∫()(,)E XY xyf x y dxdy+∞+∞−∞−∞=∫∫例8.设二维随机变量(X ,Y )的密度函数为求E (X ),E (Y ),E (X +Y ),E (XY ).解:21(13),02,01,(,)40,x y x y f x y +<<<< =其它()(,)E X xf x y dxdy+∞+∞−∞−∞=∫∫212001(13)4x xdx y dy =⋅+∫∫43=()(,)E Y yf x y dxdy+∞+∞−∞−∞=∫∫212001(13)4xdx y y dy +∫∫58=数学期望的性质注意:X ,Y 相互独立()()(,)E X Y x y f x y dxdy+∞+∞−∞−∞+=+∫∫(,)(,)xf x y dxdy yf x y dxdy+∞+∞+∞+∞−∞−∞−∞−∞+∫∫∫∫()()E X E Y +45473824=+=()(,)E XY xyf x y dxdy +∞+∞−∞−∞=∫∫2120011(13)22x xdx y y dy=⋅⋅+∫∫455386=⋅=()()E X E Y ⋅设X =(X 1,…, X n )为离散型随机向量,概率分布为≥ 1nnj j j j n P X =x ,,x =p ,j ,,j .11{()}1Z = g (X 1,…, X n ),若级数绝对收敛,则.<∞∑ nnnj j j j j j g x ,,x p 111()=∑ nnnn j j j jj j E Z =E g X ,,X g x ,,x p 1111()(())()设X =(X 1,…, X n )为连续型随机向量,联合密度函数为 n f x x 1(,,)Z = g (X 1,…, X n ),若积分绝对收敛,则+∞+∞−∞−∞∫∫n n ng x x f x x x x 111(,,)(,,)d d n E Z E g X X 1()=((,,))+∞+∞−∞−∞=∫∫n n ng x x f x x x x 111(,,)(,,)d d五数学期望的性质1.设C 是常数,则E (C )=C 4.设X 、Y 相互独立,则E (XY )=E (X )E (Y );2.若k 是常数,则E (kX )=kE (X )3.E (X +Y )=E (X )+E (Y )注意:由E (XY )=E (X )E (Y )不一定能推出X ,Y 独立推广(诸X i 相互独立时)推广11[]()nni i i i i i E C X C E X ===∑∑11[]()n ni i i i E X E X ===∏∏性质4 的逆命题不成立,即若E (X Y ) = E (X )E (Y ),X ,Y 不一定相互独立.反例XY p ij -1 0 1-10181818181818181810p • j838382p i•838382X Y P-1 0 1828284EX EY ==0;E XY ()=0;=E XY EX EY ()但P X Y 1{=-1,=-1}=8≠=P X P Y 23{=-1}{=-1}8××=30+2103-3+5=92X XY Y X XY Y E(3+2-+5)=3E()+2E()-E()+E(5)性质2和3×××EX EY =310+2-3+5性质4例9.设X ~N (10,4),Y ~U [1,5],且X 与Y 相互独立,求E (3X +2XY -Y +5).解:由已知,有E (X )=10, E (Y )=3.例10: 设X 1 , X 2…,X n 相互独立且都服从B (1, p ),求Z = X 1 + X 2+…+X n 的数学期望E (Z ).解:注: 由二项分布的可加性易知Z = X 1 + X 2+…+X n ~B (n, p ).EZ = E (X 1 + X 2+…+X n )= E (X 1 ) +E ( X 2)+…+E (X n )= p +p +…+p =n p求二项分布的数学期望的又一种方法.例11.(超几何分布的数学期望)设一批同类型的产品共有N 件,其中次品有M 件.今从中任取n (假定n ≤N −M )件,记这n 件中所含的次品数为X ,求E (X ).则有所以解: 引入X =X 1+X 2+…+X n且易知抽签模型,概率与试验次数无关例10和例11:将X 分解成数个随机变量之和,然后利用随机变量和的期望等于期望的和这一性质,此方法具有一定的意义.1,,1,2,,0,i i X i n i ==第件是次品第件不是次品iMP X N{1}==1()ni i EX E X ==∑ni i P X 1{1}==∑1ni M N ==∑nM N =为普查某种疾病,N 个人需验血.有如下两种验血方案:(1)分别化验每个人的血,共需化验N 次;(2)分组化验.每k 个人分为1组,k 个人的血混在一起化验,若结果为阴性,则只需化验一次;若为阳性,则对k 个人的血逐个化验,找出有病者,此时k 个人的血需化验k+1次.设每个人血液化验呈阳性的概率为p ,且每个人化验结果是相互独立的.试说明选择哪一方案较经济.验血方案的选择例13.六、数学期望的应用解:只需计算方案(2)所需化验次数X 的期望.。
海南大学《概率论与数理统计》课件 第四章 随机变量及其分布
X 3 取出的n个产品中至多有3个次品;
X 3 取出的n个产品中有超过3个的次品.
8
关于随机变量的补充说明
• 引入随机变量之后, 可以更方便地表示事件。 • 随机变量的确定不仅与样本空间有关, 也与试验
的研究目的有关。 • 随机变量满足函数的单值对应关系。 • 随机变量不仅有取值的不同, 取到这些值的概率
②正则性: p( xi ) 1 . i 1
这两条性质也是随机变量分布列的充要条件。
由概率的意义和随机变量的完备性容易证明。
25
二、离散型随机变量的分布函数
由分布列可以写出其分布函数 F ( x) P( xi ) xi x
它的图形是有限(或无穷)级数的阶梯函数〔右连续 〕
F(x)
1
0
x
26
27
X的分布列为
X1 2 3 P 0.6 0.3 0.1
X的分布函数为
0, x 1; 0.6, 1 x 2; F ( x) 0.9, 2 x 3; 1 , x 3.
注意:由分布列求分布函数是概率累加的过程.
并且,总有: 当x xmin时,F ( x) 0; 当x xmax时,F ( x) 1.
解 (1) 根据分布函数的性质可知
F() 1, F() 0
依题意可得
18
F() A π B 1 2
F() A π B 0 2
联立上面两个方程可以解得 A 1,B 1 2π
(2) 随机变量 X 落在(-1,1)内的概率可以表示为
P{1 X 1} F (1 0) F (1)
P{a X b} F(b 0) F(a 0);
P{a X b} F(b 0) F(a).
概率论与数理统计第四章
)
(
)
(
)
,
(
Y
D
X
Dபைடு நூலகம்
Y
X
Cov
xy
=
r
=4[E(WV)]2-4E(W2)×E(V2)≤0
01
得到[E(WV)]2≤E(W2)×E(V2). →(8)式得到证明.
02
设W=X-E(X),V=Y-E(Y),那么
03
其判别式
由(9)式知, |ρ xy|=1 等价于 [E(WV)]2=E(W2)E(V2). 即 g(t)= E[tW-V)2] =t2E(W2)-2tE(WV)+E(V2) =0 (10) 由于 E[X-E(X)]=E(x)-E(X) =0, E[Y-E(Y)]=E(Y)-E(Y) =0.故 E(tW-V)=tE(W)-E(V)=tE[X-E(X)]-E[Y-E(Y)]=0 所以 D(tW-V)=E{[tW-V-E(tW-V)]2}=E[(tW-V)2]=0 (11) 由于数学期望为0,方差也为0,即(11)式成立的充分必要条件是 P{tW-V=0}=1
随机变量X的数学期望是随机变量的平均数.它是将随机变量 x及它所取的数和相应频率的乘积和.
=
(1)
)
2
3
(
)
(
-
=
ò
µ
µ
-
dx
x
x
E
j
x
可见均匀分布的数学期望为区间的中值.
例2 计算在区间[a,b]上服从均匀分布的随机变量 的数学期望
泊松分布的数学期望和方差都等于参数λ.
其他
02
f(x)=
01
(4-6)
03
(4)指数分布
北京理工大学《概率论与数理统计》课件-第4章
解:X 的分布函数为依题意,当x <0时,当0≤x ≤2时,当x >2时,F (x )=P (X ≤x )F (x )=P (X ≤x )=0F (x )=P (X ≤x )=P (X <0)+P (0≤X ≤x )=0+kx 2=kx 2F (x )=P (X ≤x )=1例1.一个靶子是半径为2米的圆盘,设击中靶上任一同心圆盘上的点的概率与该盘的面积成正比,并设射击都能中靶.以X 表示弹着点与圆心的距离,试求随机变量X 的分布函数.当0≤x ≤2时,F (x )=P (X ≤x )=kx 2另外依题意F (2)=P (X ≤2)=k.22=1所以k 14=x x F x x x 20,0(),0241,2<⎧⎪⎪=≤≤⎨⎪>⎪⎩10.80.60.40.2-0.2-2-101234解得说明,存在一个非负可积函数f (x ),使得下式成立易知x x F x x x 20,0(),0241,2<⎧⎪⎪=≤≤⎨⎪>⎪⎩x x F x f x ,02()()20⎧≤≤⎪'==⎨⎪⎩其他()()xF x f t dt-∞=⎰1.定义:设随机变量X 的分布函数为F (x ),如果存在一个非负可积函数f (x ),使对任意的实数x ,均有则称X 是连续型随机变量(Continuous Random Variable ),称f (x )是X 的概率密度函数,简称概率密度(Probability Density Function ).()()xF x f t dt-∞=⎰连续型随机变量X的分布函数F(x)和概率密度f(x)统称为X的概率分布,简称X的分布.易知此时分布函数F(x)是连续函数,即连续型随机变量的分布是连续函数.2.概率密度函数的性质(1)f (x ) ≥ 0(2)这两条性质是判定一个函数f (x )是否为某r.v.X 的概率密度函数的充要条件.f (x )xo 面积为1+()1f x dx ∞-∞=⎰(3)P (a <X ≤b )=F (b )-F (a )如 f (x )xo a b (4)()()GP X G f x dx∈=⎰()()b a f x dx f x dx -∞-∞=-⎰⎰()baf x dx =⎰()()a P X a f x dx+∞>=⎰(5)在f (x )的连续点x 处,有f (x )=F '(x )(6)设x 为f (x )的连续点,当∆x 较小,则有P (x< X ≤x+∆x )故X 的密度f (x )在x 这一点的值,恰好是X 落在区间(x ,x +∆x ]上的概率与区间长度∆x 之比.它反映了X 在x 附近单位长区间上取值的概率.x xx f t dt f x x()()+∆=≈⎰∆连续型随机变量密度函数的性质与离散型随机变量分布律的性质非常相似,但是,密度函数不是概率!(7)P (X =x 0)=F (x 0)-F (x 0-0)P (a <X ≤b )=P (a ≤X ≤b )=P (a <X <b )=P (a ≤X <b )密度函数f (x )在某点处a 的函数值f (a ),并不等于X 取值为a 的概率.但是,这个值f (a )越大,则X 在a 附近取值的概率f (a )∆x 就越大.也可以说,在某点密度曲线的函数值反映了概率集中在该点附近的程度,即X 在该点附近取值的密集程度.=0()ba f x dx=⎰=F (b )-F (a )若X 为连续型随机变量,概率密度f (x )唯一确定了分布函数F (x );若随机变量X 的分布函数F (x )满足:(1)F (x )连续;(2)存在x 1<x 2<…<x n (n ≥0),除这些点外,F (x )可导,且导函数F '(x )连续;令F x F x f x F x (),()()0,()''⎧=⎨'⎩当存在当不存在则f (x )必是X 的概率密度.例2.设随机变量X 的概率密度为求(1)常数k 的值;(2)X 的分布函数;(3)P (1<X <7/2).解:(1)由解得kx x f x x x ,03()2/2,340,≤<⎧⎪=-≤≤⎨⎪⎩其他+1()f x dx ∞-∞=⎰3403(2)2x kxdx dx =+-⎰⎰k 16=k 9124=+解:(2)当x <0时,当0≤x <3时,当3≤x <4时,020()()0612x x t x F x f t dt dt dt -∞-∞==+=⎰⎰⎰03203()()0(2)32624x xt t x F x f t dt dt dt dt x -∞-∞==++-=-+-⎰⎰⎰⎰()()0x F x f t dt -∞==⎰求(2)X 的分布函数;()()xF x f t dt-∞=⎰6,03()2/2,340,x x f x x x ≤<⎧⎪=-≤≤⎨⎪⎩其他当x ≥4时,所以()()1xF x f t dt -∞==⎰x x x F x x x x x 220,0/12,03()32/4,341,4<⎧⎪≤<⎪=⎨-+-≤<⎪⎪≥⎩求(2)X 的分布函数;6,03()2/2,340,x x f x x x ≤<⎧⎪=-≤≤⎨⎪⎩其他P X F F 7741(1)()(1)2248<<=-=72723113741(1)()(2)26248x x P X f x dx dx dx <<==+-=⎰⎰⎰求(3)P (1<X <7/2)解:(3)6,03()2/2,340,x x f x x x ≤<⎧⎪=-≤≤⎨⎪⎩其他在上例中,当x ∉[0,4]时,f (x )=0,所以P (X ∉[0,4])=0,为了方便,我们说X 只在[0,4]上取值.g x a x b f x ()0,()0,>≤≤⎧=⎨⎩其他我们就说X 只在[a , b ]上取值.一般地,若随机变量X 的概率密度f (x )是如下分段函数:6,03()2/2,340,x x f x x x ≤<⎧⎪=-≤≤⎨⎪⎩其他例3.设连续型随机变量X 的分布函数为求(1)常数C 值;(2)X 取值于(0.3,0.7)内的概率;(3)X 的密度函数.解:(1)应用连续型随机变量X 的分布函数的连续性,有所以C =1x F x Cx x x 20,0(),011,1<⎧⎪=≤<⎨⎪≥⎩x F F x C11(1)lim ()→-===x x f x F x 2,01()()0,<<⎧'==⎨⎩其他解:20,0(),011,1x F x x x x <⎧⎪=≤<⎨⎪≥⎩(2)P (0.3<X <0.7)=F (0.7)−F (0.3)=0.72−0.32=0.4求(2)P (0.3<X <0.7);(3)X 的密度函数.(3)随机变量的分类:离散型随机变量连续型随机变量.非离散型随机变量非连续非离散型随机变量.(1)若随机变量X 的概率密度为1.均匀分布(Uniform Distribution )则称X 在[a , b ]上服从均匀分布,记为X~U [a , b ]1,()0,a x b f x b a ⎧≤≤⎪=-⎨⎪⎩其他[,]1a b I b a =-[,][,]1,[,]()0,[,]a b a b x a b I I x x a b ∈⎧==⎨∉⎩区间[a ,b ]上的示性函数类似地,我们可以定义区间[a , b )、(a , b ]和(a , b )上的均匀分布一般地,设D 是数轴上一些不相交的区间之和,若X 的概率密度为x D f x D x D 1()0⎧∈⎪=⎨⎪∉⎩,的长度,则称X 在D 上服从均匀分布.若X ~U [a , b ],X 的分布函数为对于满足a ≤c <d ≤b 的任意的c 、d ,有0(),1,x a x a F x a x bb a<⎧⎪-⎪=≤≤⎨-⎪⎪⎩,其他()d c P c X d b a-<≤=-例1.设公共汽车站从上午7时起每隔15分钟来一班车,如果某乘客到达此站的时间是7:00到7:30之间的均匀随机变量.试求该乘客候车时间不超过5分钟的概率.解:设该乘客于7时X 到达此站,则X 服从[0, 30]上的均匀分布令B ={候车时间不超过5分钟}1530102511130303dx dx =+=⎰⎰()(1015)(2530)P B P X P X =≤≤+≤≤1030()300x f x ⎧≤≤⎪=⎨⎪⎩其它2.指数分布(Exponential Distribution )若随机变量X 的概率密度为其中常数λ>0,则称X 服从参数为λ的指数分布.,0()0,0x e x f x x λλ-⎧>=⎨≤⎩易求得X 的分布函数为1,0()0,0x e x F x x λ-⎧->=⎨≤⎩指数分布的另一种等价定义定义:设连续型随机变量X 的概率密度为1,0()0,0x e x f x x θθ-⎧>⎪=⎨⎪≤⎩其中θ>0为常数,则称X 服从参数为θ的指数分布.服从指数分布的随机变量X 具有以下性质:事实上无记忆性或无后效性(|)()P X s t X s P X t >+>=>(,)(|)()P X s t X s P X s t X s P X s >+>>+>=>()()P X s t P X s >+=>1()1()F s t F s -+=-()s t t s e e e λλλ-+--==1()()F t P X t =-=>1,0()0,0x e x F x x λ-⎧->=⎨≤⎩即对于任意s , t >0,有如果X 表示某仪器的工作寿命,无后效性的解释是:当仪器工作了s 小时后再能继续工作t 小时的概率等于该仪器刚开始就能工作t 小时的概率.说明该仪器的使用寿命不随使用时间的增加发生变化,或说仪器是“永葆青春”的.(|)()P X s t X s P X t >+>=>一般来说,电子元件等具备这种性质,它们本身的老化是可以忽略不计的,造成损坏的原因是意外的高电压等等.3.正态分布(Normal Distribution )若随机变量X 的概率密度为其中μ, σ均为常数,且σ>0,则称X 服从参数为μ和σ的正态分布.记作X ~N (μ, σ2)正态分布最初由高斯(Gauss )在研究偏差理论时发现,又叫高斯分布.22()21(),2x f x e x μσσπ--=-∞<<∞X 的分布函数为22()21()2t xF x e dtμσσπ---∞=⎰N (10, 32)0-50.10.20.30.40.50.60.70.80.910510152025正态分布N(μ,σ2)密度函数图形的特点f(x)μa.正态分布的密度曲线是一条关于μ对称的钟形曲线.f(μ+c)=f(μ−c )特点是“两头小,中间大,左右对称”.b .μ决定了图形的中心位置,称为位置参数;σ决定了图形中峰的陡峭程度,称为形状参数或者刻度参数μ2μ1μ3x f (x )f (x )0xc .在x =μ处达到最大值:1()2f μπσ=d .曲线f (x )向左右伸展时,越来越贴近x 轴,即f (x )以x 轴为渐近线.当x →±∞时,f (x )→0e .x=μ±σ为f (x )的两个拐点的横坐标.说明X 落在μ附件的概率最大,或者说X 的取值在μ附件最密集.22()21(),2x f x e x μσσπ--=-∞<<∞μf (x )年降雨量、同龄人身高、在正常条件下各种产品的质量指标——如零件的尺寸;纤维的强度和张力、农作物的产量,小麦的穗长、株高、测量误差、射击目标的水平或垂直偏差、信号噪声等等,都服从或近似服从正态分布.标准正态分布(Standard Normal Distribution )μ=0,σ=1的正态分布称为标准正态分布.其密度函数和分布函数常用φ(x )和Ф(x )表示:)(x Φ)(x ϕ221(),2x x e x ϕπ-=-∞<<∞221()2t x x e dt π--∞Φ=⎰注意:Φ(0)=0.5,Φ(-x )=1-Φ(x )若X ~N (0, 1),对任意的实数x 1,x 2(x 1< x 2),有人们已编制了Φ(x )的函数表,可供查用.P (X≤x 1)=Φ(x 1)P (X>x 1)=1-Φ(x 1)P (x 1≤X≤x 2)=Φ(x 2)-Φ(x 1)221()2x t x e dt π--∞Φ=⎰−x x Φ(x )x4-40.40.2正态分布的计算()x μσ-=Φ对任意的实数x 1,x 2(x 1< x 2),有211221()()()()()x x P x X x F x F x μμσσ--<≤=-=Φ-Φ222()()22()22x t xu F x e dt e du μσμσπσπ-----∞-∞==⎰⎰111()()()x P X x F x μσ-≤==Φ111()1()1()x P X x F x μσ->=-=-Φ例2.设X ~N (μ,σ2),求P (|X −μ|<k σ)的值,k =1, 2, 3.解:当k =1时当k =2时当k =3时(||)()P X k P k X k μσμσμσ-<=-<<+()()F k F k μσμσ=+--()()k k μσμμσμσσ+---=Φ-Φ()()k k =Φ-Φ-()[1()]2()1k k k =Φ--Φ=Φ-(||)2(1)10.6826P X μσ-<=Φ-=(||2)2(2)10.9544P X μσ-<=Φ-=(||3)2(3)10.9974P X μσ-<=Φ-=质量控制中的3σ原则设在正常生产的情况下,某零件的尺寸X服从正态分布N(μ,σ2),为了在生产过程中随时检查有无系统性误差出现,人们画了一个质量控制图.每隔一定时间,对产品尺寸进行检查,测量的产品的尺寸应落在上、下控制线之内.如果超出控制线,则很有可能是生产出现了异常情况,应该暂停生产进行检查.当然也可能虚报,但虚报的可能性比较小.214y x=π因此,需要求某些随机变量的函数的分布.在某些实际问题中,我们所关心的随机变量不能直接测量得到,而它却是某个能够直接测量的随机变量的函数.例如,考察一批圆轴的截面面积Y ,我们能够直接测量的是直径X ,且当直径X 取x 值时,截面面积Y 的取值为一般地,设X、Y是两个随机变量,y=g(x)是一个已知函数,如果当X取值x时,Y取值为g(x),则称Y是随机变量X的函数,记为Y=g(X).问题是:如何由已知的随机变量X的概率分布去求它的函数Y=g(X)的概率分布.解:求Y =(X –1)2的分布律.Y 所有可能的取值为0,1,4,而且(0)(1)0.1P Y P X ====(1)(0)(2)0.7P Y P X P X ===+==(4)(1)0.2P Y P X ===-=例1.设随机变量X 的分布律为X −10 1 2P0.20.3 0.1 0.4一、离散型随机变量X 的函数Y =g (X )的分布所以,Y 的分布律为Y0 1 4P0.10.7 0.2X−1 0 1 2 Y= (X–1)24101 P0.20.3 0.1 0.4所以,Y 的分布律为Y0 1 4P0.10.7 0.2一般地,若X 的分布律为则Y =g (X )的分布律为如果g (x k )中有一些值是相等的,则它们是Y 可能取的同一个值.此时,在Y 的分布律中,只需列出一个,然后把对应于这些相同值的概率相加,作为Y 取这个可能值的概率.X x 1 x 2 … x k …Pp 1 p 2 … p k…Y g (x 1) g (x 2)… g (x k ) …Pp 1 p 2 … p k…二、连续型随机变量X 的函数Y =g (X )的分布例2.设随机变量X 的概率密度为令求Y 的分布.解:2,01()0,x x f x <<⎧=⎨⎩其他1,1/20,1/2X Y X ≤⎧=⎨>⎩(1)P Y =(1/2)P X =≤1/2124xdx ==⎰所以Y 的分布为13(0)1(1)144P Y P Y ==-==-=Y0 1P 3/4 1/4例3.设连续型随机变量X 的概率密度函数为求Y =2X +8的概率密度.解:设X 和Y 的分布函数分别为F X (x )和F Y (y ).F Y (y )=P (Y≤y )=P (2X +8≤y )于是Y 的密度函数/8,04()0,X x x f x <<⎧=⎨⎩其它88()()22X y y P X F --=≤=()81()()22Y Y X dF y y f y f dy -==⋅故当8<y <16时,当y ≤8或y ≥16时,81()()22Y X y f y f -=⋅/8,04()0,X x x f x <<⎧=⎨⎩其它88()216X y y f --=8()02X y f -=8,816()320,Y y y f y -⎧<<⎪=⎨⎪⎩其它方法:1.先求Y=g(X)分布函数F(y);Y2.求分布函数F Y (y)的导数,即为密度函数f Y(y).关键步骤:F(y)=P(Y≤y)=P(g(X)≤y)=P(X∈D)Y。
概率论与数理统计 第4章 随机变量的数字特征
解:
1 (5 0.5x)( 3 x2 x)dx
0
2
4.65(元)
2021/7/22
21
4.1.2 随机变量函数的数学期望
将定理4.1推广到二维随机变量的情形.
定理4.2 设Z是随机变量X,Y的函数Z = g(X,Y), g是连续函数.
(1) 若(X,Y)是二维离散型随机变量,其分布律
为P{X xi ,Y yj } pij, i, j 1,2,, 则有
解:由于 P{ X k} k e ,k = 0,1,2,…,
k!
因而
E( X ) kP{ X k} k k e
k0
k0 k!
k e
k1 (k 1)!
e
k 1
k1 (k 1)!
e k ee k0 k!
2021/7/22
12
4.1.1 数学期望的概念
2. 连续型随机变量的数学期望
2021/7/22
18
4.1.2 随机变量函数的数学期望
定理4.1 设Y为随机变量X的函数:Y = g(X) (g是连续
函数).
(1) 设X是离散型随机变量,其分布律为
P{X xk } pk , k 1,2,
若级数 g( xk ) pk绝对收敛,则 E(Y ) E[g( X )] g( xk ) pk
f ( x) 25( x 4.2), 4 x 4.2,
0,
其 它.
求pH值X的数学期望E(X).
解:
E( X ) xf ( x)dx
4
4.2
x 25( x 3.8)dx x (25)(x 4.2)dx
3.8
4
4
2021/7/22
15
概率论与数理统计PPT课件第四章数学期望与方差
在回归分析中,数学期望和方差 等统计指标用于描述因变量和自 变量之间的关系,以及预测未来
的趋势。
假设检验
在假设检验中,数学期望和方差等 统计指标用于比较两组数据或样本 的差异,判断是否具有显著性。
方差分析
方差分析利用数学期望和方差等统 计指标,分析不同组别或处理之间 的差异,确定哪些因素对数据变化 有显著影响。
质量控制
统计分析
在统计分析中,方差分析是一种常用 的统计方法,通过比较不同组数据的 方差,可以判断它们是否存在显著差 异。
在生产过程中,方差用于度量产品质 量波动的程度,通过控制产品质量指 标的方差,可以提高产品质量稳定性。
03
期望与方差的关系
期望与方差的关系式
期望值是随机变量取值的平均数 ,表示随机变量的“中心趋势”
方差的性质
方差具有可加性
当两个随机变量相互独立时,它们组 合而成的随机变量的方差等于它们各 自方差的线性组合。
方差与期望值的关系
方差与期望值之间存在一定的关系, 如方差等于期望值减去偏差的平方和 再求平均值。
方差的应用
风险评估
在金融和经济学中,方差被用来度量 投资组合的风险,通过计算投资组合 中各个资产的方差和相关系数,可以 评估投资组合的整体风险。
期望与方差的拓展
期望与方差在金融中的应用
金融风险评估
利用数学期望和方差计算 金融资产的风险,评估投 资组合的风险和回报。
资产定价
利用数学期望和方差等统 计指标,对金融资产进行 定价,确定其内在价值。
保险精算
通过数学期望和方差等统 计方法,评估保险产品的 风险和回报,制定合理的 保费和赔付方案。
期望与方差在统计学中
期望与方差在其他领域的应用
概率论与数理统计第四章_几种重要的分布
ξ
0
1
2
3
4
p 0.0016 0.0256 0.1536 0.4096 0.4096
4.2超几何分布(了解)
主要内容: (一)了解超几何分布的概念 (二)了解超几何分布的期望和方差
4.2超几何分布
例1 某班有学生20名,其中有5名女同学,今从 班上任选4名学生去参观展览,被选到的女同学数ξ
k1 (k 1)!(n k)!
n
(k 11)n! pk (1 p)nk
k1 (k 1)!(n k)!
n
(k 1)n!
n
pk (1 p)nk
n!
pk (1 p)nk
k1 (k 1)!(n k)!
k1 (k 1)!(n k)!
n
n!
n
pk (1 p)nk
n!
pk (1 p)nk
k2 (k 2)!(n k)!
解 可以取0,1,2,3这4个值。
P(
=k)=
C3k
C4k 17
C420
(k=0,1,2,3,)
列成概率分布如下
ξ
0
1
2
3
p 0.4912 0.4211 0.0842 0.0035
定义42 设N个元素分为两类,有N1个属于第一类, N2个属于第二类(N1+N2=N)。从中按不重复抽 样取n个,令ξ表示这n个中第一(或二)类元素的个数,
k1 (k 1)!(n k)!
n2
n1
n(n 1)Cnl 2 pl2 (1 p)n2l nCnj1 p j1(1 p)n1 j
l0
j0
n2
n(n 1)Cnl 2 pl2 (1 p)n2l l0
浙大概率论与数理统计课件 第四章随机变量的数字特征
0
x
x y 1 0
EX=
xf
( x , y ) dxdy
0 0
1
dx
x 2 dy
1 3
1 x
E(-3 X+ 2Y)= dx
1
x 1
2 ( 3 x 2 y ) dy
0 0 1
1 3
1 12
EXY=
k
k 0
e
k
e
k!
( k 1)!
k 1
k 1
e
e
二、连续型随机变量的数学期望
定义2 设X是连续型随机变量,其密度函数为 f (x), 如果积分
xf ( x)dx
绝对收敛,则称此积分值为X的数学期望, 即
E( X ) x f ( x )dx
数学期望、方差、协方差和相关系数
第一节
数学期望
离散型随机变量的数学期望
连续型随机变量的数学期望
随机变量函数的数学期望
数学期望的性质
小结
一、离散型随机变量的数学期望
引例:某7人的数学成绩为90,85,85,80,80, 75,60,则他们的平均成绩为
90 85 2 80 2 75 60 1 7 7 2 7 2 7 1 7 1 7
第四章、随机变量的数字特征
第一节:数学期望 第二节:方差 第三节:协方差及相关系数 第四节:矩、协方差矩阵
在前面的课程中,我们讨论了随机变量及其分 布,如果知道了随机变量X的概率分布,那么X的 全部概率特征也就知道了.
概率论与数理统计ppt课件
称这种试验为等可能概型(或古典概型)。
*
例1:一袋中有8个球,其中3个为红球,5个为黄球,设摸到每一球的可能性相等,从袋中不放回摸两球, 记A={恰是一红一黄},求P(A). 解:
(注:当L>m或L<0时,记 )
例2:有N件产品,其中D件是次品,从中不放 回的取n件, 记Ak={恰有k件次品},求P(Ak). 解:
*
第四章 随机变量的数字特征 4.1 数学期望 4.2 方差 4.3 协方差及相关系数 4.4 矩、协方差矩阵 第五章 大数定律和中心极限定理 5.1 大数定律 5.2 中心极限定理 第六章 数理统计的基本概念 6.1 总体和样本 6.2 常用的分布
*
第七章 参数估计 7.1 参数的点估计 7.2 估计量的评选标准 7.3 区间估计 第八章 假设检验 8.1 假设检验 8.2 正态总体均值的假设检验 8.3 正态总体方差的假设检验 8.4 置信区间与假设检验之间的关系 8.5 样本容量的选取 8.6 分布拟合检验 8.7 秩和检验 第九章 方差分析及回归分析 9.1 单因素试验的方差分析 9.2 双因素试验的方差分析 9.3 一元线性回归 9.4 多元线性回归
解: 设 Ai={ 这人第i次通过考核 },i=1,2,3 A={ 这人通过考核 },
亦可:
*
例:从52张牌中任取2张,采用(1)放回抽样,(2)不放 回抽样,求恰是“一红一黑”的概率。
利用乘法公式
与 不相容
(1)若为放回抽样:
(2)若为不放回抽样:
解: 设 Ai={第i次取到红牌},i=1,2 B={取2张恰是一红一黑}
①
②
①
1 2 N
①
②
1 2 N
……
概率论与数理统计 第4章
dx 令t
t2 2
x
,得
E( X )
1 2
( t )e
dt
1-91
31
1 E( X ) x e 2
( x )2 2 2
dx 令t
t2 2
x
,得
E( X )
1 2
( t )e
t2 2
得
从而
的概率密度为:
1-91
21
故所求数学期望分别为
1-91
22
三.数学期望的性质
性质1: 设 C 为常数,则 性质2: 设 C 为常数,X 为随机变量, 则有 性质3: 设 X , Y 为任意两个随机变量, 则有 为 n 个随机变量,
推论1 设
为常数,则
1-91
23
性质4 设X 和Y 是相互独立的随机变量,则有
证: 因为 X 和 Y 相互独立,所以 于是
推广:
1-91 24
例7. 将 n只球随机放入M 只盒子中去,设每只球 落入各个盒子是等可能的,求有球的盒子数 X 的 均值 解 引入随机变量
显然有
1-91
25
例7. 将 n只球随机放入M 只盒子中去,设每只球 落入各个盒子是等可能的,求有球的盒子数 X 的 均值
1-91
18
例5. 设某公共汽车站于每小时的10分, 50分发车, 乘客在每小时内任一时刻到达车站是随机的。求 乘客到达车站等车时间的数学期望。
解: 设T 为乘客到达车站的时刻, 则
其概率密度为
设Y 为乘客等车时间,则
1-91
19
已知
1-91
概率论与数理统计第4章
随机变量的数学期望是概率论中最重要的 概念之一.它的定义来自习惯上的平均值概念.
5
一、离散型随机变量的数学期望
引例 某企业对自动流水线加工的产品实行质量 监测,每天抽检一次,每次抽取5件,检验产品是 否合格,在抽检的30天的记录中,无次品的有18天, 一件次品的有9天,两件次品的有3天,求日平均次 品数.
k
这启发我们引出如下连续型随机变量的数 学期望定义:
30
二、连续型随机变量的数学期望
设连续型随机变量 X 的概率密度为 f ( x ), 若积分
x f ( x ) d x
绝对收敛, 则称积分 x f ( x ) d x 的值为随机
变量 X 的数学期望, 记为 E ( X ) . 即 E ( X ) x f ( x )d x.
n
n 1
n( n 1)( n i ) i 1 n i 1 p q i! i 0
n 1
令i k 1
( n 1)( n i ) i ( n1) i np pq i! i 0
n 1
np C
i 0
n 1
i n 1
pq
i
( n 1 ) i
试问哪个射手技术较好?
12
解 设甲、乙射手击中的环 数分别为 X 1 , X 2 .
E ( X 1 ) 8 0.3 9 0.1 10 0.6 9.3(环), E ( X 2 ) 8 0.2 9 0.5 10 0.3 9.1(环),
故甲射手的技术比较好. 乙射手 甲射手
Y
1500
0.0952
2000
2500
3000
0.7408
华东理工大学概率论与数理统计课件第四章解读
注意 辛钦大数定理成立的条件中只需 X i的数学 期望存在;而当 X i 的方差存在时,其即为切比雪夫大 数定理的直接推论. 大数定理是参数估计和假设检验的重要理论基础.
返回
例1.
k 互相独立随机变量序列,且
证: 由切比雪夫不等式:P X EX 1
1 1 P X i EX i 1 n i 1 n i 1
n n
D( X )
n
2
得
D( 1 X i ) n i 1
n
2
1
D( X i )
n
i 1 2 2
1
3 k 1 2 3 k 1 2
i
k 的分布
(k=1,2, …),
试证大数定理成立. 解: k 互相独立,且
1
E k 0
2 3
D k k
1 0
3 2
n
2
D( i )
1
n
1
n
2
k
1
n
nn n2
2 3
n
1 3
(n )
14 100 14 86 30 100 30
70
20 20 20 20 P e e 14! 30! 0.0387 0.0083
14
30
返回
例5 某校有4900个学生,已知每天每个学生去阅览室自修 的概率为0.1,问阅览室要准备多少座位,才能以99%的概 率保证每个去阅览室自修的学生都有座位。
解 设Xi(i=1,2,…,n)为装运的第i箱的重量,n是所求的箱数.则 X1,X2,…,Xn独立同分布, EXi=50, DXi=52=25,令 Yn X i ,
概率论与数理统计(叶慈南 刘锡平 科学出版社)第4章 多维随机变量(r.v.)及其分布
fY
(
y
)
=
π2
1− y2, 0,
− 1 ≤ y ≤ 1. 其它
28
2. 二维正态分布 p97
(X,Y)的概率密度为
f (x, y) =
1
e 2(
−1 1− ρ
2
)
(
x
− µ1 σ2
1
)2
−2
ρ
(
x
−
µ1 )( σ 1σ
y
2
−
µ2
)
+
(
y
− µ2 σ2
2
)2
2πσ σ 1 − ρ 2 12
f ( x, y)dy
−∞
称为(X,Y)关于X的边缘概率密度。
∫ fY ( y) =
+∞
f ( x, y)dx
−∞
称为(X,Y)关于Y的边缘概率密度。
20
例p102 设 ( X ,Y )的概率密度是
f
(
x,
y)
=
cy(2 −
0,
x
),
0 ≤ x ≤ 1, 0 ≤ y ≤ x ,
其它
求 (1) c 的值; (2) 两个边缘密度; (3) P{X<1/2}.
…
pi j
…
p.j
… … … … ….. … …
∑
p1 . p2 .
…
pi . …
1
18
3
例 将一枚硬币掷 3 次, 以X表示前 2 次中出现 H的次数, 以Y表示 3 次中出现H的次数. 求X,Y 的联合分布律以及(X,Y)的边缘分布律.
19
三、连续型(X,Y)的边缘概率密度
概率论课件 第4章第3讲中心极限定理
n
n
E ( i pi ) (1 pi )3 pi pi3 (1 pi ) pi (1 pi )
3
1 lim 3 n B n
E(
i 1
n
i
pi ) lim
3
1 n pi (1 pi ) i 1
例2(正态随机数的产生) : 一般计算机 软件可产生在(0,1)区间上均匀分布的 随机数, 据此由中心极限定理产生来自 正态分布N ( , 2 )的随机数.
1 1 解: 设i ~ U (0,1)独立, 则E (i ) , D(i ) 2 12
由中心极限定理知 i 6
7 1 6 2 49 35 E ( X 1 ) , D( X 1 ) i 2 6 i 1 4 12
由中心极限定理
7 500 100 100 2 P{ X i 500 } 1 35 i 1 10 12
1 (8.78) 0
1 2
e
t2 2
dt
例3 : 某调查公司受委托, 调查某电视 节目在S 市的收视率p, 调查公司将所 有调查对象收看此节目的频率作为p ˆ .现在要求保证有90%的把握, 的估计p ˆ 与真实收视率p 使得调查所得收视率p 之间的差异不大于5%. 问至少要调查 多少对象 ?
解: 设共调查 n个对象
特殊情形
De Moivre--Laplace
定理(德莫佛-拉普拉斯极限定理):设随机变 量 n服从二项分布 n ~ B(n, p),(0 p 1) 则对于任意x,恒有
limP{
n
概率论与数理统计 第四章
矩,它们都是随机变量函数的数学期望。
河南理工大学精品课程
概率论与数理统计
【例3】[P.115:eg6]
〖解〗设X为随机取一球的标号,则r.v.X等可 能地取值1,2,3,4,5,6;
又Y=g(X),且
g(1)= g(2)= g(3)=1; g(4)= g(5)=2, g(6)=5. 故随机摸一球得分的期望为
河南理工大学精品课程 概率论与数理统计
显然, 方差D(X)就是随机变量X的函数 g ( X ) [ X E( X )]2 的数学期望.因此,当X的分布律 p 或概率密度 k 已知时,有
2 [ x E ( X )] pk , 离散型 k k 1 D ( X ) [ x E ( X )]2 f ( x)dx, 连续型
1500 (分) □
河南理工大学精品课程 概率论与数理统计
二、随机变量函数的数学期望 利用随机变量函数的分布可以证明下列两定理: 定理1 设Y=g(X)是随机变量X的连续函数,则 Y 也是随机变量,且其数学期望为
离散型 g ( xk ) pk , k 1 E (Y ) E[ g ( X )] g ( x) f ( x)dx, 连续型
X2 Pk 3X2+5 Pk 0 0.3 5 0.3 4 0.7 17 0.7
于是,
E(X)=(-2)×0.4+0×0.3+2×0.3=-0.2;
河南理工大学精品课程 概率论与数理统计
例6-续
E(X2)=0×0.3+4×0.7=2.8; E(3X2+5)=5×0.3+17×0.7=13.4.
方法2(定义+性质法) 因为 E(X)=(-2)×0.4+0×0.3+2×0.3=-0.2; E(X2)=(-2)2×0.4+02×0.3+22×0.3=2.8; 所以, E(3X2+5)=3E(X2)+5=3×2.8+5=13.4. □
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第4章随机变量的数字特征指联系于分布函数的某些数,如平均值,离散程度等.本章介绍随机变量的常用数字特征:数学期望、方差、相关系数、矩等4. 1随机变量的数学期望例4. 1甲、乙两射击手击中目标的环数用随机变量X、Y表示,它们的分布分别如下:试比较甲、乙两射击手射击技术的优劣解假设甲、乙两射击手分别射击N次,则射击手甲击中的总环数为N 0.3 8 N 0.1 9 N 0.6 10,N 0.3 8 N 0.1 9 N 0.6 10平均环数为9.3 ;N射击手乙击中的总环数为N 0.1 8 N 0.4 9 N 0.5 10,N 0.1 8 N 0.4 9 N 0.5 10平均环数为---------------------------------------- 9.4N上述平均环数可以告诉我们,射击手乙的射击技术优于射击手甲从例4.1可以看出,在大量次独立重复试验中,离散型随机变量的平均值总是稳定在一个常数附近,这个常数就是将分布列表中各组对应数据相乘所得乘积的总和,据此, 我们给出随机变量数学期望的定义.定义4.1设离散型随机变量X的分布律为P(X X j) p i,i 1,2 .如果X k P kk 1则称(4. 1)E(X)= X j P i .i 1为随机变量X的数学期望,或称为该分布的数学期望,简称期望或均值.若|x k | p k不收敛,则称X的数学期望不存在类似地给出连续型随机变量的数学期望的定义 定义4.2设连续型随机变量 X 的密度函数为f (X ).E(X)= xf (x)dx .为随机变量X 的数学期望,或称为该分布的数学期望,简称期望或均值•若| x | f (x)dx 不收敛,则称 X 的数学期望不存在•例4.2设在某一规定的时间间隔里,某电气设备用于最大负荷的时间求 E(X).4. 1.2随机变量函数的数学期望 按照随机变量 X 的数学期望的定义,E(X)由其分布唯一确定,如今若要求随机变量的一个函数 g(X)的数学期望,可以通过下面的一个定理来求得定理4. 1设Y 是随机变量 X 的函数:Y g(X)( g 为连续函数)(1)X 是离散型随机变量,它的分布律为 P(X X i ) P i ,i 1,2 ,若 g(X i )p ii 1绝对收敛,则有如果| x| f (x)dx则称计)是一个随机变量, 其密度函数为f(x)1 2x,15002J(x 1500 0,3000),1500其他1500 3000,(4. 2)X (以分种E(X) =xf (x)dx15001x------- xdx 0150030001 …x 15002 (x 15003000)dx500 1000 1500 ( min )4.3柯西分布的密度函数为f (x)丄 1 1 X 2' .求 E(X).因为|x|f(x)dx1 1|x|—厂严,故E(X)不存在.20 04.1的重要意义在于当求 E(Y)时,不必先算出 Y 的分布.类似于一维随机变量的数学期望,此定理还可以推广到多维随机变量函数的数学期(X ,Y )的函数:Z g(X,Y)( g 为连续函数)这里,假设(4.5),(4. 6)的右端都是绝对收敛的 例4. 4设随机变量X 的概率密度为求 E(e 3X )2 21e 2 dxdy22e rdr则有(2) E(Y) Eg(X) X 是连续型随机变量, E(Y) E g(X)g(xjP i(4. 3)它的密度函数为f (x).若 g(x)f (x)dx 绝对收敛,g(x) f (x)dx .(4. 4)定理 定理4.2设Z 是二维随机变量(1)若二维随机变量(X ,Y )的分布律P(X x i ,Y y j )Pij , i, j1,2,E(Z) E(g(X,Y))g(X i ,y j )P j .j 1 i 1(4. 5)(2)若二维随机变量(X ,丫 ) 的密度函数为 f (x, y),则有E(Z) E(g(X,Y)) g(x, y)f (x,y)dxdy(4. 6)f(x)xxe解 E(e 3X )e 3x f(x)dx o e 3x xe x dx o xe 4xdx_1 16例4.5设随机变量(X ,Y )服从二维正态分布,其密度函数为1f (x,y) e,求Z X 2 Y 2的数学期望E(Z).解 E(Z)x 2 y 2易知X i X 1 X 2 X 10.12 2r 2r 2 e 2 dr21e“r • 2 1 、 •22 Y 24.1.3数学期望的性质 以下假设所涉及的随机变量的数学期望存在性质1设C 是常数,则有E(C) C .性质2设X 是一个随机变量, C 是常数,则有 E(CX) CE(X). 性质3设X,Y 是两个随机变量,则有 E(X Y) E(X) E(Y).nn推论 设有随机变量 X ,,X 2, X n ,则有E( X i ) E(X i ).i 1i 1性质4设X,Y 是两个独立的随机变量,则有 E(XY) E(X)E(Y) 性质1和性质2可以自己证明.下面就连续情形给出性质3和性质4的证明,对于离散情形,读者只要将证明中的“积分”用“和式”代替,就能得到证明证明(性质3) 设二维随机变量(X,Y )的密度函数为 f (x, y),其边缘密度函 数为f X (x), f Y (x).由随机变量函数的数学期望知道,E(X Y) (x y)f(x, y)dxdy xf(x, y)dxdyyf (x, y)dxdyE(X) E(Y).证明(性质4)因X,Y 是两个独立的随机变量,于是xf x (x) f Y (y)dxdy=[Xf x (x)dx][yf Y (y)dy]=E(X)E(Y).例4.6机场大巴载有 20位旅客自起点站开出,途经 10个站点•设每位旅客在各个解引入随机变量X i °,在第i站没有人下车,i 1,2, ,10.i1, 在第i 站有人下车。
E(XY)xy f (x, y)dxdy 站点下车是等可能的,且各旅客是否下车相互独立.以X 表示停车的次数,求 E(X).209,因此20位旅客都不在第i 站下车的概率10E(X 1) E(X 2) E(X 10)20910 18.784.10本题是将X 分解成若干个随机变量之和,然后利用数学期望的性质来求数学期望, 这种处理方法具有一定的普遍意义4. 2随机变量的方差4. 2. 1方差的定义例4.1曾用平均环数来评判甲、乙两个射击手射击技术的优劣,如果二者平均环数相同,那么仅用平均环数就无法科学地评判两个射击手射击技术的优劣,如下例例4.7甲、乙两射击手击中目标的环数用随机变量 X 、Y 表示,它们的分布分别如下:试比较甲、乙两射击手射击技术的优劣解 假设甲、乙两射击手分别射击N 次,则射击手甲击中的平均环数为N 0.3 8 N 0.1 9 N 0.6 10N射击手乙击中的平均环数为N 0.2 8 N 0.3 9 N 0.5 109.3.N其实,还可以进一步考察射击手环数与平均环数的偏离程度,若偏离程度较小,则表示 成绩比较稳定.从这个意义上说,我们认为甲射击手相对于乙射击手较稳定.由此可见,按题意, 任一旅客在第i 站不下车的概率是为110,在第i 站有人下车的概率为 120P(X i 0)10, p (X i1)20,也就是209-9 ,i 1,2, ,10. 10进而,有E(X) E(X 1 X 2X®)讨论随机变量与其均值的偏离程度是十分有必要的.那么用怎样的量去度量这个偏离程20度呢?因为X E(X)可能为正,也可能为负,为了避免正负偏离相互抵消,自然而然会考虑取X E(X),但是绝对值运算不方便•为了便于运算方便,通常是取2 2X E(X),然后求其均值E((X E(X))2)就可以作为刻画随机变量X的“波动”程度,这个量被称作为随机变量X的方差•定义4.3设X是一个随机变量,若E[(X E(X)]2存在,则称E[(X E(X)]2为随机变量X的方差,记为D(X)或Var(X),即D(X) Var(X) E[(X E(X)]2. ( 4.7)称方差的算术平方根..D(X)为随机变量X的标准差或均方差,记为(X).方差和标准差的功能相似,它们都是用来描述随机变量取值的集中与分散程度的两个特征数,若X的取值比较集中,则D(X)较小,若X的取值比较分散,则D(X)较大.方差与标准差的区别主要在量纲上,由于标准差与所讨论的随机变量的数学期望有相同的量纲,所以在实际中,人们比较喜欢选用标准差,但标准差的计算必须通过方差才能计算•由定义4.3知道,方差实际上就是随机变量X的函数g(X) (X E(X))2的数学期望,于是,对于离散型随机变量,按( 4. 7)式有D(X)iX i1E(X) P i,(4.8)其中P(X X i) P i,i1,2为X的分布律•对于连续型随机变量,按( 4. 7)式有D(X)X E(X) 2f (x)dx,(4.9) 其中f(x)为X的密度函数.随机变量X的方差可按下面公式计算:2 2D(X) E(X2) E(X) . ( 4.10)事实上,由数学期望的性质1、性质2、性质3得D(X) E[X E(X)]2 E(X2 2XE(X) [E(X)]2)2E(X2) 2E(X)E(X) E(X)E(X2) E(X)4.2. 2 方差的性质下面给出数学期望的几个常用性质,以下假设随机变量的数学期望是存在的性质 1 D(X) 0.性质2设C是常数,则有D(C) 0.性质 3 X 是一个随机变量,C 是常数,则有D(CX d) C2D(X) .性质 4 设X,Y 是两个随机变量,则有D(X Y) D(X ) D(Y)2E[X E(X)][Y E(Y)].特别地, 若X,Y 相互独立,则有D(X Y)D(X)D(Y).证明D(X Y) E[( X Y) E(X Y)]2E[( X E(X)2(Y E(Y)]22E[X E(X)][Y E(Y)]E[X2E(X)]2E[Y2E(Y)]2D(X)D(Y)2E[X E(X)][Y E(Y)]E[X E(X )][Y E(Y)]E[XY YE(X) XE(Y) E(X)E(Y)]E(XY) E(X)E(Y) E(Y)E(X) E(X)E(Y)E(XY) E(X)E(Y).若X,Y 相互独立,由数学期望的性质4知道E(XY) E(X)E(Y) 0 ,于是有D(X Y) D(X) D(Y).同理可证明D(X Y) D(X) D(Y) .这一性质可推广到任意有限多个相互独立的随机变量之和的情况.例如,若X j~N( i, i2),i 1,2, ,n,且它们相互独立,则它们的线性组合:C1X1 C2X2 C n X n( C i,C2, ,C n是不全为0的常数)仍服从正态分布,于是由数学期望和方差的性质知道:n nk 0 k 0这是一个重要的结果Z 2X 4Y 的分布.故 Z ~ N( 8,676).4.3常见随机变量的数学期望和方差1. 两点分布的数学期望和方差证明 E(X) 0 q 12. 二项分布的数学期望和方差所以nk _ k. n kk C n p qK 0n■ /1\1 /k k n kk(k 1) k C np q~ B(n, p),0 p 1,则 E(X) np , D(X) npq证明 由于随机变量 X ~ B(n, p),C :p k q n k , (k0,1,2, , n;qp),n (n 1)! (k k1)!(n k)! pnpk 1(n 1)! (k 1)!(n k)!np(p \ n 1q) np .C n X nN( C ii 12 2c 2 2) iii例 4.8 若 X ~ N(2,52),Y ~ N(3,62)们相互独立,求随机变量函数解 E(Z) 2 24 3 8,D(Z)22 52 42 62 676,设随机变量X ~ 01,q p1,q 1p ,则 E(X) p ,D(X) pqE(X 2)02 (1 P) 12由公式(4. 10)知D(X)E(X 2)E(X)p 2P(1 p) pq .E(X)E(X 2)n2 k k n kk C n pqnnk 0k 0n(n 1)p 2(p q)n 2 np n(n 1) p 2 np .D(X) E(X 2) E(X)2 npq .3. 泊松分布的数学期望和方差 设 X ~ P(),贝U E(X) , D(X) 证明由于随机变量X 的分布律为即 E(X)2所以随机变量X 的方差为D(X) E(X 2) E(X)2由此,泊松分布的数学期望与方差相等,都等于 只要知道它的数学期望或方差就能完全确定它的分布了k k n kk(k 1)C n Pqk k n kC np qk(kk 0k k n k1)C np qnpk(k 1)n!k 2k!(nnp n(nn1)p 2 k 2(n 2)! (k 2)!(nk)!2q (n 2) (k 2)np于是所以随机变量P(X k)k^,k0,1,2L , 0.X 的数学期望为ke E(X) ko kFk1(k 1)!2E(X ) E X(X1)E X(X1) E(X)k(kk 1k 22 2ee ek 2(k 2)!.又泊松分布只含有一个参数2所以随机变量X 的方差为D(X) E(X 2) [E(X)]25.均匀分布的数学期望和方差证明 由于随机变量 X 的密度函数为所以X 的数学期望为4.几何分布的数学期望和方差1设 X ~G(p),则 E(X )—,D(X)P1 p T~p证明 由于随机变量 X 的分布律为kP(X k) pq则称随机变量X 的数学期望为kE(X) kpqk 1kq k12 2E(X ) k pqk 1k 2qp[ k(kk 1k 11)qkq k 1]2 pq(1 q)3 p2q 2p设 X ~ U(a,b),则 E(X)--2D(X)(b a)2 12f(x)b a 0,其他。