工程数学(三)概率统计 离散数学

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第3章 随机变量及其分布
如果我们关心事件A={没有次品}, B={至少有2件次品}, C={不多于k件次品},则A, B, C可以分别用随机变量Y表示为
A={e|Y(e)=0}, B={e|Y(e)≥2}, C={e|Y(e)≤k}.
为方便起见,一般在事件表示中可省去e,因此也可表示为A={Y=0}, B={Y≥2}, C={Y≤k}. 随机变量的取值随试验的结果而定,在试验之前不能预知它取什么值,且它的取值有一定的概率,因此随机变量与普通函数有本质的差别.
随机变量的引入,使我们能用随机变量来描述各种随机现象,因此有可能用微积分的方法对随机试验的结果进行深入的研究.
2. 随机变量的分布函数
定义3.2 设X是一个随机变量,x是任意实数,函数值在[0, 1]上的函数
F(x)=P (X≤x) , -∞称为随机变量X的分布函数.
对于任意实数x1,x2(x1P (x1因此,若已知X的分布函数,就知道X落在任一区间(x1,x2]上的概率,在这种意义上讲,分布函数完整地描述了随机变量的统计规律.
分布函数是一个普通函数,通过它就能用微积分的方法研究随机变量.
如果将X看成是数轴上随机点的坐标,那么,分布函数F (x)在x处的函数值就表示X落在区间(-∞, x]上的概率.
例3.3 设随机变量X所有可能取值为x1=-1,x2=2,x3=3.事件{X=xi} (i=1,2,3)的概率为P (X=-1) =p1=14,
P (X=2) =p2=12,
P (X=3) =p3=14, 求X的分布函数,并求PX≤12, P32解 X仅在X=-1, 2, 3三点处概率不等于0,而F (x)的值是X≤x的累积概率值,由概率的有限可加性知,它即为小于或等于x的那些xk处的概率pk之和.因此有
F(x)=0, x<-1,
P (X=-1) , -1≤x<2,
P (X=-1) +P (X=2) , 2≤x<3,
1, x≥3,

图 3.1F(x)=0, x<-1,
14, -1≤x<2,
34, 2≤x<3,
1, x≥3.
F(x)的图形如图3.1所示,它是一条阶梯形曲线,在x=-1,2,3处有跳跃点,跳跃值分别为14,12,14.

PX≤12=F12=14,
P32P2≤X≤3=F(3)-F(2)+P (X=2) =1-34+12=34.
从例3.3的分布函数及其图形可看到分布函数具有右连续、单调不减等性质,我们指出分布函数F (x)具有以下基本性质:
(1) 0≤F (x) ≤1 (-∞(2) F(x)是单调不减函数,即对于任意两点x1,x2,当x1(3) limx→-∞F(x)=0, limx→+∞F (x) =1;
(4) limx→x+0F (x) =F(x0) (-∞证明 (1) 由于F (x) =P(X≤x),由概率的性质知0≤F (x) ≤1.
(2) 对于任意两点x1,x2,当x1对于(3)我

们仅从几何上加以说明.在图3.2中将区间端点x沿数轴无限向左移动(即x→-∞),则{随机点X落在点x左边}这一事件趋于不可能事件,从而其概率趋于0,即有F (-∞) =0;又若将点x无限向右(即x→+∞),则{随机点X落在x左边}这一事件趋于必然事件,于是其概率趋于1,即有F (+∞) =1.
(4)的证明从略.
3.2 离散型随机变量
有一些随机变量,它全部可能取到的不相同的值是有限个或可列无限多个,这样的随机变量称为离散型随机变量,它的分布称为离散型分布.
例如某市的120急救电话台一昼夜收到的呼唤次数是离散型随机变量.若以T记某元件的寿命,它所可能取的值充满一个区间,是无法一一列举出来的,因此它是非离散型随机变量.
要掌握一个离散型随机变量X的统计规律必须而且只须知道X的所有可能取的值以及取每一个可能值的概率.
1. 离散型随机变量的分布律
一般用以下定义的分布律来表达离散型分布.
设离散型随机变量X所有可能取的值为xk(k=1,2,…),事件{X=xi}的概率为pi (i=1,2,…),即
P (X=xi) =pi, i=1,2,…,(3.2)
我们称式(3.2)为离散型随机变量X的分布律.分布律也可以用表格的形式来表示(见表3.1) : 表 3.1Xx1x2…xn…pip1p2…pn… 以上表格直观地表达了随机变量X取各个值的概率规律.X取各个值各占一些概率,这些概率之和为1.我们把它想象成概率1以一定的规律分布在各个可能值上,这就是其称为分布律的原因.由概率的定义,pi满足以下两个条件:
(1) pi≥0 (i=1,2,…) .
(2) ∑∞i=1pi=1.
(2)是因为{X=xi}∪{X=x2}∪…是必然事件,且{X=xi}∩{X=xj}=, i≠j,故 1=P∪∞i=1{X=xi}=∑∞i=1P(X=xi),即∑∞i=1pi=1.
例3.4 设一汽车在开往目的地的路上需要经过四组信号灯,每组信号灯以12的概率允许或禁止汽车通过.以X表示汽车首次停下时,它已通过的信号灯的组数(设各组信号灯的工作相互独立),求X的分布律.
解 以p表示每组信号灯禁止汽车通过的概率,易知X的分布律如下表所示:X01234pip(1-p)p(1-p)2p(1-p)3p(1-p)4也可写成:
P(X=i)=(1-p)ip, i=0,1,2,3,
P(X=4)=(1-p)4.
以p=12代入得X01234pi0.50.250.1250.06250.0625 例3.5 袋中有5个球,分别编号1, 2, 3, 4, 5,从中同时取出3个球,以X表示取出的球的最小号码,求X的分布律与分布函数.
解 由于X表示取出的3个球中的最小号码,因此X的所有可能取值为1, 2, 3, {X=1}表示3个球中的最小号码为1,那么另外两个球可在2, 3, 4, 5中任取2个,这样的可能取法有C24种;{X=2}表示3个球中的最小号码为2,那么另外两个球可在3, 4, 5中任取2个,这样的可能取法有C23种;{

X=3}表示3个球中的最小号码为3,那么另外两个球只能是4与5,即此时只有一种取法,而在5个球中任取3个的所有可能取法共有C35种.由古典概率定义得 P (X=1) =C24C35=35, P (X=2) =C23C35=310, P (X=3) =1C35=110.
因此,所求的分布律如下表所示:X123pi0.60.30.1 再求X的分布函数F (x) .
当x<1时,{X≤x}为不可能事件,因此F (x) =0;
当1≤x<2时,{X≤x}={X=1},因此F (x) =P (X=1) =0.6.
当2≤x<3时,{X≤x}={X=1或X=2},因此
F (x) =P (X=1) +P (X=2) =0.6+0.3=0.9.
当x≥3时,{X≤x}为必然事件,因此F (x) =1.
综合得
F (x) =0,x<1,
0.6, 1≤x<2,
0.9, 2≤x<3,
1, x≥3.
由例3.5可知,如果知道了离散型随机变量的分布律,就可以求得其分布函数;反之是否可行呢?即如果知道了离散型随机变量的分布函数,是否可得到随机变量的分布律呢?我们还是以例3.5为例来说明.
设X的分布函数为例3.5所求得的F (x) ,从而
P (X=1) =P (x≤1) =F(1)=0.6;
P (X=2) =P (1P (X=3) =P (2因此X的分布律是: X123pi0.60.30.1 我们从以上分析中看到分布律与分布函数对于描述离散型变量的取值规律而言是等价的.当然,对于离散型随机变量,使用分布律来刻画其取值规律比用分布函数方便、直观.
2. 常用离散型分布
下面介绍三种重要的离散型随机变量.
1) (0-1)分布
设随机变量X只可能取0与1两个值,它的分布律是
P(X=k)=pk(1-p)1-k, k=0,1, 0则称X的分布为 (0-1)分布或两点分布.
(0-1)分布的分布律见表3.2. 表 3.2X01概率1-pp 一般在随机试验中虽然结果可以很多,但是如果我们只关注具有某种性质的结果,则可将样本空间重新划分为 A与,而A出现时,定义X=1; 出现时,定义X=0,这时X的分布即为(0-1)分布.
例如,对新生婴儿的性别进行登记,检查产品是否合格,某工厂的电力消耗是否超负荷以及前面多次讨论过的“掷硬币”试验都可以用(0-1)分布的随机变量来描述.(0-1)分布是经常遇到的一种分布.
2) 二项分布
设试验E只有两个可能结果: A与,则称E为伯努利试验.
设P (A) =p(0这里“重复”是指每次试验中P (A) =p保持不变;“独立”是指各次试验的结果互不影响,即若以Ci记第i次试验的结果,Ci为A或, i=1,2,…,n.“独立”是指:
P (C1C2…Cn) =P(C1)P(C2)…P(Cn).(3.3)
在n重伯努利试验中,如果以随机变量X表示n次试验中事件A发生的次数,则X可能取的值为0, 1, 2, …, n,且由二项概率得到X取k值的概率为P(X=k)=Cknpk(1-p)n-k, k=

0,1,2,…,n. (3.4)  因此,X的分布律见表3.3. 表 3.3X01…k…npi(1-p)nC1np(1-p)n-1…Cknpk(1-p)n-k…pn称这个离散型分布为参数n,p的二项分布,记为X~B (n,p) ,这里0在概率论中,二项分布是一个非常重要的分布,很多随机现象都可以用二项分布来描述.例如在次品率为p的一批产品中有放回地任取n件产品,以X表示取出的n件产品中的次品数,则X服从参数n, p的二项分布B (n,p) ;如果这批产品的批量很大,则采用无放回方式抽取n件产品时,也可以认为X服从参数n, p的二项分布B (n,p) .
例3.6 按规定,某型号电子元件的使用寿命超过1500h为一级品,已知某一大批产品的一级品率为0.2,现从中随机地抽查20只,问20只元件中恰有k只(k=0,1,2,…,20)为一级品的概率是多少?
解 这是不放回抽样,但由于这批元件总数很大,且抽查的元件数量相对元件总数来说又很小,因而可当作放回抽样来处理,这样会有误差但误差不大.我们把检查一只元件看它是否为一级品看成是一次试验,检查20只元件相当于做20重伯努利试验.以X记20只元件中一级品的只数,则X是一个随机变量,且X~B (20, 0.2) .
因此由式(3.4)立即得到所求概率为
P (X=k) =Ck20(0.2)k(0.8)20-k, k=0,1,2,…,20.
将计算结果列表如下: P (X=0) =0.012
P (X=1) =0.058
P (X=2) =0.137
P (X=3) =0.205P (X=4) =0.218
P (X=5) =0.175
P (X=6) =0.109
P (X=7) =0.055P (X=8) =0.022
P (X=9) =0.007
P (X=10) =0.002
当k≥11时,P (X=k) <0.001图 3.3
为了对本题的结果有直观的了解,我们作出上表的图形(图3.3) .
从图中可看以到,当k增加时,概率P(X=k)先是随之增加直至达到最大值(本例中当k=4时取到最大值),随后单调减少.我们指出,一般对于固定的n及p,二项分布B (n,p)都有这一性质.
例3.7 设有80台同类型的机器,各台工作相互独立,发生故障的概率都是0.01,且一台机器的故障能由一人处理.考虑两种配备维修工人的方法.其一是由4人维护,每人负责20台;其二是由3人共同维护80台.试比较这两种方法在机器发生故障时不能及时维修的概率的大小.
解 按第一种方法.以X记“第1人维护的20台中同一时刻发生故障的台数”,以Ai (i=1,2,3,4)表示事件“第i人维护的20台中发生故障不能及时维修”,于是80台中发生故障而不能及时维修的概率为
P (A1∪A2∪A3∪A4) ≥P (A1) =P (X≥2) .
而X~B (20, 0.01) ,故有P(X≥2)=1-∑1k=0P(X=k)=1-∑1k=0Ck20(0.01)k(0.99)20-k=0.0169.即有 P (A1∪A2∪A3∪A4) ≥0.0169.
按第二种方法,以Y记80台中同一时刻发生故障的台数.此时,Y~B (80,0.01) ,故80台中发生故障而不能及时维修的概

率为P(Y≥4)=1-∑3k=0Ck80(0.01)k(0.99)80-k=0.0087. 我们看到后一种情形尽管任务重了(每人平均维护约27台),但工作效率不仅没有降低反而提高了.
3) 泊松分布(Poisson’s distribution)
设随机变量X所有可能取的值为0,1,2,…,而取各值的概率为
P (X=k) =λkk!e-λ, k=0,1,2,…,
其中λ>0是常数,则称X服从参数λ的泊松分布,并记泊松分布为P (λ).
易知P (X=k) =λke-λk!≥0, k=0,1,2,…,且有∑∞k=0P (X=k) =∑∞k=0λke-λk!=e-λ∑∞k=0λkk!=e-λ·eλ=1. 泊松分布在历史上是作为二项分布的近似而引入的.经过多年研究,发现许多随机现象都服从泊松分布,例如,电话交换台中每一瞬时接到的电话呼叫数,高速公路上每天发生的车祸数,放射性物质分裂后落在某一区域内的质点数等,都可以用泊松分布来刻画.泊松分布是研究随机过程的重要分布,有人认为“泊松分布”是构造随机现象的“基本粒子”之一,它是概率中三个重要分布之一,具有良好的性质(例如可列可加性).对于泊松分布的不同λ,已有专用数表可供查阅其相关概率.
例3.8(泊松分布与马踏死人数据) Borthiewicz(1898)给出一个应用泊松分布的经典例子,观察10个骑兵队在20年中被马踏死的人数一共得到200个记录,以下是频数分布表(X表示一个骑兵队一年中被马踏死的人数): 死亡人数X频 数相对频数拟合频数理论频率01090.545108.80.5441650.32566.20.3312220.11020.20.101330.0154.20.021≥410.0050.60.003 从数据中可得到一个骑兵队一年中被踏死的平均人数为0.61,如将X拟合成λ=0.61的泊松分布,就可由
pk=P(X=k)=(0.61)kk!e-0.61, k=0,1,2, …
算出最后一行的理论频率,然后再用200乘pk得到泊松分布的拟合频数,即表中倒数第2行的数据;从中可以看出拟合数据与实际数据较吻合.事实上,一个骑兵一年中不是被踏死就是未被踏死,一般可以假定每个骑兵被马踏死的概率p都一样,而且每个骑兵是否被马踏死相互独立,因此一年中被马踏死的骑兵数服从二项分布,但p很小,而骑兵人数很大,作为二项分布的极限,泊松分布是这组数据的很好的描述.
3.3 连续型随机变量
前面讨论的离散型随机变量只可能取有限多个或可列多个值,但是有些实际问题,随机变量可能取的值可以充满某个区间(或几个区间的并),我们定义这类随机变量为连续型随机变量.例如飞机降落机场的时间及某产品的使用寿命都是这种随机变量,连续型随机变量可能的取值不能一一列出,因此就不能用离散型随机变量的分布律来描述它们的统计规律.
1. 概率密度函数及其性质
我们

通过一个例子给出连续型随机变量及其分布形式.
例3.9 一个靶子是半径为2m的圆盘,设击中靶上任一同心圆盘上的点的概率与该圆盘的面积成正比,并设射击都能中靶,以X表示弹着点与圆心的距离,试求随机变量X的分布函数.
解 若x<0,则{X≤x}是不可能事件,于是
F (x) =P(X≤x)=0.
若0≤x≤2,由题意,P(0≤X≤x)=kx2,k是某一常数.为了确定k的值,取x=2,有P(0≤X≤2)=22k,但已知P(0≤X≤2)=1,故得k=14 ,即P(0≤X≤x)=x24.
于是
F (x) =P(X≤x)=P(X<0)+P(0≤X≤x)=x24.
若x>2,由题意{X≤x}是必然事件,于是
F (x) =P(X≤x)=1.
图 3.4综上所述,即得X的分布函数为
F (x) =0,x<0,
x24,0≤x≤2,
1,x>2.
它的图形是一条连续曲线,如图3.4所示.
另外,可以看到此例中的分布函数F (x) ,对任意x可以写成形式F(x)=∫x-∞f(t)dt,其中f(t)=t2,0≤t≤2,
0,其他,这就是说F(x)可以表示为非负函数f(t)的关于变上限x的积分.
一般地,如果对于随机变量X的分布函数F (x),存在非负函数f(x),对任意实数x可表示为F(x)=∫x-∞f(t)dt,则称X为连续型随机变量,其中f(x)称为X的概率密度函数,简称概率密度或密度函数,并且称X的分布为连续型分布.密度函数f(x)具有以下性质:
(1) f(x)≥0;
(2) ∫+∞-∞f(x)dx=1;
(3) 对任意实数x1,x2(x1≤x2),P(x1(5) 若f(x)定义在实数轴上,除了有限个点处处连续,且满足(1),(2),则∫x-∞f(t)dt是一个分布函数,即f(x)是一个密度函数.
直观上,以x轴上的区间(x1,x2]为底,曲线y=f(x)为顶的曲边梯形的面积就是

相关文档
最新文档