概率论与数理统计PPT课件第二章随机向量及其分布小结
概率论与数理统计ch2随机变量及其概率分布精品PPT课件
10
X0
1
2
3
p p p(1-p) (1-p)2p (1-p)3
11
例:若随机变量X的概率分布律为
P( X k ) c k ,k 0,1, 2,, 0
k!
求常数c.
12
解:
1 P{X k}
k 0
k
c
ce
k0 k !
求(1)随机观察1个单位时间,至少有3人候车 的概率; (2)随机独立观察5个单位时间,恰有4个单 位时间至少有3人候车的概率。
29
解:1 P(X 3) 1 P( X 0) P( X 1) P(X 2)
1 e 4.8 (1 4.8 4.82 ) 0.8580 2!
2 设5个单位时间内有Y个单位时间是
15
对于一个随机试验,如果它的样本空间只
包含两个元素,即 S {e1, e2} ,我们总能
在S上定义一个服从(0-1)分布的随机
变量。
0, X X (e) 1,
当e e1, 当e e2.
来描述这个随机试验的结果。
检查产品的质量是否合格,对新生婴儿 的性别进行登记,检验种子是否发芽以 及前面多次讨论过的“抛硬币”试验都 可以用(0-1)分布的随机变量来描述 。
P A 1 2
如果是不放回抽样呢?
21
设A在n重贝努利试验中发生X次,则
P( X k) Cnk pk (1 p)nk,k 0,1,,n
并称X服从参数为p的二项分布,记
X ~ B(n,p)
n
注:1 ( p q)n Cnk pk qnk 其中q 1 p k 0
22
推导:以n=3为例,设Ai={ 第i次A发生 }
概率论与数理统计图文课件最新版-第2章-随机变量及其分布
函数 f ( x),使得对于任意实数 x 有:
x
F ( x) f (t)dt ( P( X x))
则称 X 为连续型变量,f ( x)为 X 的概率密度函数 注 ▲ 连续型随机变量与离散型随机变量的区别
离散型: P( X xk ) 0 连续型:P( X xk ) 0
机
多,而且还不能一 一列
变 连续型随机变量 量
举,而是充满一个区间
例如,“电视机的寿命”,实际中
常 遇到的“测量误差”等等.
概率统计
第二章知识结构图
随机变量
离散型随 机变量
连续型随 机变量
分布律
分布 函数
函数的 分布
概率 密度
分布 函数
函数的 分布
定义 常用分布
概率统计
定义 常用分布
第四节 连续型随机变量及其概率密度
0 x 0
则称 X 为服从参数 的指数分布.
概率统计
二 . 连续型随机变量的分布函数
定义: 若定义在 (, )上的可积函数 f ( x)
满足: (1). f ( x) 0
(2). f ( x)dx 1
f (x)确定了 分布函数F(x),
则称 F ( x)
x
f ( x)dx
f (x)是F(x)的 导函数, F(x)是f (x)的一
(2) 某段时间内候车室的旅客数目为 X , 则它也是一个随机变量,它可以取 0 及一切 自然数。X 是定义在样本空间,则:
S e {人数 人数 0}
X X (e)的值域RX [0, )
概率统计
二. 随机变量的分类 离散型随机变量
概率论与数理统计第2章ppt课件
1 3x
0
1
2
3X
处的离跳散跃型高随度机恰变为量P{的X=分x布i}.函数为跳跃函数,在xi
§4. 连续型随机变量的概率密度
1. 定义:对于随机变量X的分布函F(x), 如果存在非负函数f(x),使对于任意实数x有:
F(x)xf(t)dt
则称X为连续型随机变量;称f(x)为X的概率 密度函数。简称密度函数。
精选课件
21
例4. 3个人抓阄数。
解:X的概率分布: P{X=1}=1/3
P{X=2}=2/3×1/2=1/3
P{X=3}=2/3×1/2×1/1=1/3
X的分布函数:
Y
0 x <1
1
1/3 1 x <2
2/ 3
F(x)=
2/3 2 x <3 1/ 3
则:P{X=k} Cnk pnkqnnk 其中:qn=1-pn
(令=μV; pn=μ△V=μV/n= /n):
考虑当 n +时
P{X=k} =nl imCnkpnkqnnk
limn! ()k(1)nk
nl n i m k1 k !!n(nn (n n k1)) !n (n n kn 1)k((11 n))kn
k
k!
k=0、1、2、3、……
n
Poissn定理:n为正整数,pn=/n, >0。 则对任一非负整数k有:
nl im Cnkpnkqnnk
k
k!
其中:= npn.
例3. 某人打靶命中率为0.001, 重复射击 5000次,求至少命中2次的概率。
解:设X为至命中次数。
P(X2) =1-P(X<2) =1-P(X=0)-P(X=1)
概率论与数理统计--第二章PPT课件
F(x) pk xk x
分布函数F(x)在x xk , 其跳跃值为pk P{X
对k 所1,有2,满足处x有k 跳 x跃的,k求和。
xk }
第26页/共57页
第四节 连续型随机变量及其概率密度
定义 对于随机变量X的分布函数F(x),如果存在非 负函数f (x),使对于任意实数有
售量服从参数为 10的泊松分布.为了以95%以上的
概率保证该商品不脱销,问商店在月底至少应进该商 品多少件? 解 设商店每月销售该种商品X件,月底的进货量为n件,
按题意要求为 PX n 0.95
由X服附从录的泊1松0的分泊布松表分知布k,140 1则k0!k有e1k0n01k00!k.9e1160 6
可以用泊松分布作近似,即
n
k
pk
1
p
nk
np k
k!
enp , k
0,1, 2,
.
例 4 为保证设备正常工作,需要配备一些维修工.如果各台设备
发生故障是相互独立的,且每台设备发生故障的概率都是 0.01.
试求在以下情况下,求设备发生故障而不能及时修理的概率.
(1) 一名维修工负责 20 台设备.
于是PX I P(B) Pw X (w) I.
随机变量的取值随试验的结果而定,而试验的各个 结果出现有一定的概率,因而随机变量的取值有一 定的概率.
按照随机变量可能取值的情况,可以把它们分为两 类:离散型随机变量和非离散型随机变量,而非离 散型随机变量中最重要的是连续型随机变量.因此, 本章主要研究离散型及连续型随机变量.
x
x
4. F(x 0) F(x) 即F(x)是右连续的
第23页/共57页
随机向量及其分布【概率论及数理统计PPT】
n 维随机向量及其分布 由于从二维推广到n 维一般无实质性的 困难,我们重点讨论二维随机变量 .
二、二维随机向量及其分布函数
设随机试验E的样本空间是Ω。 X=X()和Y=Y()是定义在Ω上的随机变 量,由它们构成的向量(X,Y),称为二维随机向 量。 二维随机向量(X,Y)的性质不仅与X及Y的 性质有关,而且还依赖于X和Y的相互关系,因 此必须把(X,Y)作为一个整体加以研究。 为此,首先引入二维随机向量(X,Y)的分 布函数的概念。
说明
由上面的几何解释,易见: 随机点(X,Y)落在矩形区域:
x1<x≤x2,y1<y≤y2 内的概率为:
P{x1<X≤x2 ,y1<Y≤y2} =F(x2,y2)-F(x2,y1)F(x1,y2)+F(x1,y1)
其中:
这里我们介绍了二维随机向量的概念、 二维随机向量的分布函数及其性质。
二维随机向量也分为离散型和连续型, 下面我们分别讨论它们。
求:(1)X,Y的边缘分布;
(2)X+Y的概率分布.
解:(1)由分析得:
X -1
0
1
P 0.25 0.4 0.35
Y
0
1
2
P 0.25 0.5 0.25
(2)X+Y的取值为-1,0,1,2,3,
X+Y -1 0 1 2 3
P(X+Y=-1)=P(X=-1,Y=0)=0.05
P 0.05 0.2 0.4 0.3 0.05
=1
称(X,Y)服从区域D上的均匀分布。
例6. 若(X,Y)~
试求:(1)常数 A;(2) P{ X<2, Y<1}; (3) P(X≤x,Y≤y); (4)P{(X,Y)∈D},其中D为 2x+3y≤6.
概率论与数理统计第二章随机变量课件
第二章随机变量第一节随机变量及其分布函数上一章中我们讨论的随机事件中有些是直接用数量来标识的,例如,抽样检验灯泡质量试验中灯泡的寿命;而有些则不是直接用数量来标识的,如性别抽查试验中所抽到的性别.为了更深入地研究各种与随机现象有关的理论和应用问题,我们有必要将样本空间的元素与实数对应起来.即将随机试验的每个可能的结果e都用一个实数X来表示.例如,在性别抽查试验中用实数“1”表示“出现男性”,用“0”表示“出现女性”.显然,一般来讲此处的实数X值将随e的不同而变化,它的值因e的随机性而具有随机性,我们称这种取值具有随机性的变量为随机变量.定义2.1设随机试验的样本空间为Ω,如果对Ω中每一个元素e,有一个实数X(e)与之对应,这样就得到一个定义在Ω上的实值单值函数X=X(e),称之为随机变量(Random variable).随机变量的取值随试验结果而定,在试验之前不能预知它取什么值,只有在试验之后才知道它的确切值;而试验的各个结果出现有一定的概率,故随机变量取各值有一定的概率.这些性质显示了随机变量与普通函数之间有着本质的差异.再者,普通函数是定义在实数集或实数集的一个子集上的,而随机变量是定义在样本空间上的(样本空间的元素不一定是实数),这也是二者的差别.本书中,我们一般以大写字母如X,Y,Z,W,…表示随机变量,而以小写字母如x,y,z,w,…表示实数.为了研究随机变量的概率规律,并由于随机变量X的可能取值不一定能逐个列出,因此我们在一般情况下需研究随机变量落在某区间(x1,x2]中的概率,即求P{x1<X≤x2},但由于P{x1<X≤x2}=P{X≤x2}-P{X≤x1},由此可见要研究P{x1<X≤x2}就归结为研究形如P{X≤x}的概率问题了.不难看出,P{X≤x}的值常随不同的x而变化,它是x的函数,我们称这函数为分布函数.定义2.2设X是随机变量,x为任意实数,函数F(x)=P{X≤x}称为X的分布函数(Distribution function).对于任意实数x1,x2(x1<x2),有P{x1<X≤x2}=P{X≤x2}-P{X≤x1}=F(x2)-F(x1),(2.1)因此,若已知X的分布函数,我们就能知道X落在任一区间(x1,x2]上的概率.在这个意义上说,分布函数完整地描述了随机变量的统计规律性.如果将X看成是数轴上的随机点的坐标,那么,分布函数F(x)在x处的函数值就表示X落在区间(-∞,x]上的概率.分布函数具有如下基本性质:1°F(x)为单调不减的函数.事实上,由(2.1)式,对于任意实数x1,x2(x1<x2),有F(x2)-F(x1)=P{x1<X≤x2}≥0.2°0≤F (x )≤1,且)(lim x F x +∞→=1,常记为F (+∞)=1.)(lim x F x -∞→=0,常记为F (-∞)=0.我们从几何上说明这两个式子.当区间端点x 沿数轴无限向左移动(x →-∞)时,则“X 落在x 左边”这一事件趋于不可能事件,故其概率P {X ≤x }=F (x )趋于0;又若x 无限向右移动(x →+∞)时,事件“X 落在x 左边”趋于必然事件,从而其概率P {X ≤x }=F (x )趋于1.3°F (x +0)=F (x ),即F (x )为右连续. 证略.反过来可以证明,任一满足这三个性质的函数,一定可以作为某个随机变量的分布函数. 概率论主要是利用随机变量来描述和研究随机现象,而利用分布函数就能很好地表示各事件的概率.例如,P {X >a }=1-P {X ≤a }=1-F (a ),P {X <a }=F (a -0),P {X =a }=F (a )-F (a -0)等等.在引进了随机变量和分布函数后我们就能利用高等数学的许多结果和方法来研究各种随机现象了,它们是概率论的两个重要而基本的概念.下面我们从离散和连续两种类别来更深入地研究随机变量及其分布函数,另有一种奇异型随机变量超出本书范围,就不作介绍了.第二节离散型随机变量及其分布如果随机变量所有可能的取值为有限个或可列无穷多个,则称这种随机变量为离散型随机变量.容易知道,要掌握一个离散型随机变量X 的统计规律,必须且只须知道X 的所有可能取的值以及取每一个可能值的概率.设离散型随机变量X 所有可能的取值为x k (k =1,2,…),X 取各个可能值的概率,即事件{X =x k }的概率P {X =x k }=p k , k =1,2,… (2.2)我们称(2.2)式为离散型随机变量X 的概率分布或分布律.分布律也常用表格来表示(表2-1):表2-1由概率的性质容易推得,任一离散型随机变量的分布律{pk},都具有下述两个基本性质: 1°p k ≥0,k =1,2,…; (2.3) 2°11=∑∞=k kp. (2.4)反过来,任意一个具有以上两个性质的数列{Pk},一定可以作为某一个离散型随机变量的分布律.为了直观地表达分布律,我们还可以作类似图2-1的分布律图.图2-1图2-1中x i 处垂直于x 轴的线段高度为p i ,它表示X 取x i 的概率值.例2.1 设一汽车在开往目的地的道路上需通过4盏信号灯,每盏灯以0.6的概率允许汽车通过,以0.4的概率禁止汽车通过(设各盏信号灯的工作相互独立).以X 表示汽车首次停下时已经通过的信号灯盏数,求X 的分布律.解 以p 表示每盏灯禁止汽车通过的概率,显然X 的可能取值为0,1,2,3,4,易知X 的分布律为或写成P {X =k }=(1-p )p ,k =0,1,2,3.P {X=4}=(1-p )4.将p =0.4,1-p =0.6代入上式,所得结果如表2-3所示.下面介绍几种常见的离散型随机变量的概率分布: (1)两点分布若随机变量X 只可能取x 1与x 2两值,它的分布律是P {X =x 1}=1-p (0<p <1),P {X =x 2}=p ,则称X 服从参数为p 的两点分布.特别,当x 1=0,x 2=1时两点分布也叫(0-1)分布,记作X ~(0-1)分布.写成分布律表形式见表2-4.表2-4对于一个随机试验,若它的样本空间只包含两个元素,即Ω={e 1,e 2},我们总能在Ω上定义一个服从(0-1)分布的随机变量,,,1,0)(21e e e e e X X ==⎩⎨⎧==当当用它来描述这个试验结果.因此,两点分布可以作为描述试验只包含两个基本事件的数学模型.如,在打靶中“命中”与“不中”的概率分布;产品抽验中“合格品”与“不合格品”的概率分布等等.总之,一个随机试验如果我们只关心某事件A 出现与否,则可用一个服从(0-1)分布的随机变量来描述.(2)二项分布若随机变量X 的分布律为P {X =k }=k n C p k (1-p )n -k, k =0,1,…,n , (2.5)则称X 服从参数为n ,p 的二项分布(Binomial distribution ),记作X ~b (n ,p ).易知(2.5)满足(2.3)、(2.4)两式.事实上,P (X =k )≥0是显然的;再由二项展开式知n k n k nk k nn k p p p p k X P )]1([)1(C}{0-+=-==-==∑∑=1.我们知道,P {X =k }=kn k k n p p --)1(C 恰好是[p +(1-p )]n 二项展开式中出现p k 的那一项,这就是二项分布名称的由来.回忆n 重贝努里试验中事件A 出现k 次的概率计算公式P n (k )=k n C p k (1-p )n-k, k =0,1,…,n ,可知,若X ~b (n ,p ),X 就可以用来表示n 重贝努里试验中事件A 出现的次数.因此,二项分布可以作为描述n 重贝努里试验中事件A 出现次数的数学模型.比如,射手射击n 次中,“中的”次数的概率分布;随机抛掷硬币n 次,落地时出现“正面”次数的概率分布;从一批足够多的产品中任意抽取n 件,其中“废品”件数的概率分布等等.不难看出,(0-1)分布就是二项分布在n =1时的特殊情形,故(0-1)分布的分布律也可写成P {X =k }=p k q 1-k (k =0,1)(q =1-p ).例2.2 某大学的校乒乓球队与数学系乒乓球队举行对抗赛.校队的实力较系队为强,当一个校队运动员与一个系队运动员比赛时,校队运动员获胜的概率为0.6.现在校、系双方商量对抗赛的方式,提了三种方案: (1)双方各出3人;(2)双方各出5人;(3)双方各出7人.三种方案中均以比赛中得胜人数多的一方为胜利.问:对系队来说,哪一种方案有利?解 设系队得胜人数为X ,则在上述三种方案中,系队胜利的概率为(1) P {X ≥2}=kkk k -=∑3323)6.0()4.0(C ≈0.352;(2) P {X ≥3}=kkk k -=∑5535)6.0()4.0(C ≈0.317;(3) P {X ≥4}=kkk k -=∑7747)6.0()4.0(C ≈0.290.因此第一种方案对系队最为有利.这在直觉上是容易理解的,因为参赛人数越少,系队侥幸获胜的可能性也就越大.例2.3 某一大批产品的合格品率为98%,现随机地从这批产品中抽样20次,每次抽一个产品,问抽得的20个产品中恰好有k 个(k =1,2,…,20)为合格品的概率是多少?解 这是不放回抽样.由于这批产品的总数很大,而抽出的产品的数量相对于产品总数来说又很小,那么取出少许几件可以认为并不影响剩下部分的合格品率,因而可以当作放回抽样来处理,这样做会有一些误差,但误差不大.我们将抽检一个产品看其是否为合格品看成一次试验,显然,抽检20个产品就相当于做20次贝努里试验,以X 记20个产品中合格品的个数,那么X ~b (20,0.98),即P {X =k }=k k k -2020)02.0()98.0(C ,k =1,2,…,20. 若在上例中将参数20改为200或更大,显然此时直接计算该概率就显得相当麻烦.为此我们给出一个当n 很大而p (或1-p )很小时的近似计算公式.定理2.1(泊松(Poisson)定理) 设np n =λ(λ>0是一常数,n 是任意正整数),则对任意一固定的非负整数k ,有e lim (1)!k k k n knn n n C p p k λλ-→∞-=-.证 由p n =λ/n ,有().111121111!)1()(!)1()1(1C kn k kn k kn n kn k n n n n k n n k nn k k n n n p p ---⎪⎭⎫⎝⎛-⎪⎭⎫ ⎝⎛-⋅⎥⎦⎤⎢⎣⎡⎪⎭⎫ ⎝⎛--⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛-⋅=-+--=-λλλλλ对任意固定的k ,当n →∞时,11121111→⎥⎦⎤⎢⎣⎡⎪⎭⎫ ⎝⎛--⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛-⋅n k n n ,11,e 1→⎪⎭⎫ ⎝⎛-→⎪⎭⎫ ⎝⎛---kn n n λλλ故e lim (1).!k kk n knn n n C p p k λλ--→∞-=由于λ=np n 是常数,所以当n 很大时p n 必定很小,因此,上述定理表明当n 很大p 很小时,有以下近似公式,!e )1(C k p p k kn k k nλλ--≈- (2.6)其中λ=np .从表2-5可以直观地看出(2.6)式两端的近似程度.表2-5颇佳,而当n ≥100,np ≤10时效果更好.!e k k λλ-的值有表可查(见本书附表3)二项分布的泊松近似,常常被应用于研究稀有事件(即每次试验中事件A 出现的概率p 很小),当贝努里试验的次数n 很大时,事件A 发生的次数的分布.例2.4 某十字路口有大量汽车通过,假设每辆汽车在这里发生交通事故的概率为0.001,如果每天有5000辆汽车通过这个十字路口,求发生交通事故的汽车数不少于2的概率.解 设X 表示发生交通事故的汽车数,则X ~b (n,p ),此处n =5000,p =0.001,令λ=np =5, P {X ≥2}=1-P {X <2}=1-{}∑==1k k X P=1-(0.999)5000-5(0.999)4999≈1!e 50!e 51550----. 查表可得P {X ≥2}=1-0.00674-0.03369=0.95957.例2.5 某人进行射击,设每次射击的命中率为0.02,独立射击400次,试求至少击中两次的概率.解 将一次射击看成是一次试验.设击中次数为X ,则X ~b (400,0.02),即X 的分布律为P {X =k }=k 400C (0.02)k (0.98)400-k, k =0,1,…,400. 故所求概率为P {X ≥2}=1-p {X =0}-p {X =1}=1-(0.98)400-400(0.02)(0.98)399 =0.9972.这个概率很接近1,我们从两方面来讨论这一结果的实际意义.其一,虽然每次射击的命中率很小(为0.02),但如果射击400次,则击中目标至少两次是几乎可以肯定的.这一事实说明,一个事件尽管在一次试验中发生的概率很小,但只要试验次数很多,而且试验是独立地进行的,那么这一事件的发生几乎是肯定的.这也告诉人们决不能轻视小概率事件.其二,如果在400次射击中,击中目标的次数竟不到两次,由于P {X <2}≈0.003很小,根据实际推断原理,我们将怀疑“每次射击的命中率为0.02”这一假设,即认为该射手射击的命中率达不到0.02.(3)泊松分布若随机变量X 的分布律为P {X =k } =e !k k λλ-,k =0,1,2,…, (2.7)其中λ>0是常数,则称X 服从参数为λ的泊松分布(Poisson distribution ),记为X ~P (λ). 易知(2.7)满足(2.3)、(2.4)两式,事实上,P {X =k }≥0显然;再由∑∞=-0!e k k k λλ=e -λ²e λ=1,可知∑∞==0}{k k X P =1.由泊松定理可知,泊松分布可以作为描述大量试验中稀有事件出现的次数k =0,1,…的概率分布情况的一个数学模型.比如:大量产品中抽样检查时得到的不合格品数;一个集团中生日是元旦的人数;一页中印刷错误出现的数目;数字通讯中传输数字时发生误码的个数等等,都近似服从泊松分布.除此之外,理论与实践都说明,一般说来它也可作为下列随机变量的概率分布的数学模型:在任给一段固定的时间间隔内,① 由某块放射性物质放射出的α质点,到达某个计数器的质点数;② 某地区发生交通事故的次数;③ 来到某公共设施要求给予服务的顾客数(这里的公共设施的意义可以是极为广泛的,诸如售货员、机场跑道、电话交换台、医院等,在机场跑道的例子中,顾客可以相应地想象为飞机).泊松分布是概率论中一种很重要的分布.例2.6 由某商店过去的销售记录知道,某种商品每月的销售数可以用参数λ=5的泊松分布来描述.为了以95%以上的把握保证不脱销,问商店在月底至少应进某种商品多少件?解 设该商店每月销售这种商品数为X ,月底进货为a 件,则当X ≤a 时不脱销,故有P {X ≤a }≥0.95.由于X ~P (5),上式即为∑=-ak kk 05!5e ≥0.95. 查表可知∑=-95!5e k kk ≈0.9319<0.95, ∑=-105!10e k kk ≈0.9682>0.95 于是,这家商店只要在月底进货这种商品10件(假定上个月没有存货),就可以95%以上的把握保证这种商品在下个月不会脱销.下面我们就一般的离散型随机变量讨论其分布函数.设离散型随机变量X 的分布律如表2-1所示.由分布函数的定义可知F (x )=P {X ≤x }=∑∑≤≤==xx kxx kk k px X P }{,此处的∑≤xx k 和式表示对所有满足x k ≤x 的k 求和,形象地讲就是对那些满足x k ≤x 所对应的p k 的累加.例2.7 求例2.1中X 的分布函数F (x ). 解 由例2.1的分布律知 当x <0时,F (x )=P {X ≤x }=0;当0≤x <1时,F (x )=P {X ≤x }=P {X =0}=0.4;当1≤x <2时,F (x )=P {X ≤x }=P ({X =0}∪{X =1})=P {X =0}+P {X =1}=0.4+0.24=0.64; 当2≤x <3时F (x )=P {X ≤x }=P ({X =0}∪{X =1}∪{X =2})=P {X =0}+P {X =1}+P {X =2} =0.4+0.24+0.144 =0.784;当3≤x <4时F (x )=P {X ≤x }=P ({X =0}∪{X =1}∪{X =2}∪{X =3})=0.4+0.24+0.144+0.0864=0.8704;当x ≥4时F (x )=P {X ≤x }=P ({X =0}∪{X =1}∪{X =2}∪{X =3}∪{X =4}) =0.4+0.24+0.144+0.0864+0.1296=1.综上所述F (x )=P {X ≤x }=⎪⎪⎪⎩⎪⎪⎪⎨⎧≥<≤<≤<≤<≤<.4,1,43,8704.0,32,784.0,21,64.0,10,4.0,0,0x x x x x x F (x )的图形是一条阶梯状右连续曲线,在x =0,1,2,3,4处有跳跃,其跳跃高度分别为0.4,0.24,0.144,0.0864,0.1296,这条曲线从左至右依次从F (x )=0逐步升级到F (x )=1.对表2-1所示的一般的分布律,其分布函数F (x )表示一条阶梯状右连续曲线,在X =x k (k =1,2,…)处有跳跃,跳跃的高度恰为p k =P {X =x k },从左至右,由水平直线F (x )=0,分别按阶高p 1,p 2,…升至水平直线F (x )=1.以上是已知分布律求分布函数.反过来,若已知离散型随机变量X 的分布函数F (x ),则X 的分布律也可由分布函数所确定:p k =P {X =x k }=F (x k )-F (x k -0).第三节 连续型随机变量及其分布上一节我们研究了离散型随机变量,这类随机变量的特点是它的可能取值及其相对应的概率能被逐个地列出.这一节我们将要研究的连续型随机变量就不具有这样的性质了.连续型随机变量的特点是它的可能取值连续地充满某个区间甚至整个数轴.例如,测量一个工件长度,因为在理论上说这个长度的值X 可以取区间(0,+∞)上的任何一个值.此外,连续型随机变量取某特定值的概率总是零(关于这点将在以后说明).例如,抽检一个工件其长度X丝毫不差刚好是其固定值(如 1.824cm )的事件{X =1.824}几乎是不可能的,应认为P{X =1.824}=0.因此讨论连续型随机变量在某点的概率是毫无意义的.于是,对于连续型随机变量就不能用对离散型随机变量那样的方法进行研究了.为了说明方便我们先来看一个例子.例2.8 一个半径为2米的圆盘靶,设击中靶上任一同心圆盘上的点的概率与该圆盘的面积成正比,并设射击都能中靶,以X 表示弹着点与圆心的距离,试求随机变量X 的分布函数.解 1°若x <0,因为事件{X ≤x }是不可能事件,所以F (x )=P {X ≤x }=0.2°若0≤x ≤2,由题意P {0≤X ≤x }=kx 2,k 是常数,为了确定k 的值,取x =2,有P {0≤X ≤2}=22k ,但事件{0≤X ≤2}是必然事件,故P {0≤X ≤2}=1,即22k =1,所以k =1/4,即P {0≤X ≤x }=x 2/4.于是F (x )=P {X ≤x }=P {X <0}+P {0≤X ≤x }= x 2/4.3°若x ≥2,由于{X ≤2}是必然事件,于是F (x )=P {X ≤x }=1.综上所述F (x )=⎪⎩⎪⎨⎧≥<≤<,2,1,20,41,0,02x x x x 它的图形是一条连续曲线如图2-2所示.图2-2另外,容易看到本例中X 的分布函数F (x )还可写成如下形式:F (x )=t t f xd )(⎰∞-,其中 f (t )=⎪⎩⎪⎨⎧<<.,0,20,21其他t t这就是说F (x )恰好是非负函数f (t )在区间(-∞,x ]上的积分,这种随机变量X 我们称为连续型随机变量.一般地有如下定义.定义2.3 若对随机变量X 的分布函数F (x ),存在非负函数f (x ),使对于任意实数x 有F (x )=⎰∞-xx t f d )(, (2.8)则称X 为连续型随机变量,其中f (x )称为X 的概率密度函数,简称概率密度或密度函数(Density function).由(2.8)式知道连续型随机变量X 的分布函数F (x )是连续函数.由分布函数的性质F (-∞)=0,F (+∞)=1及F (x )单调不减,知F (x )是一条位于直线y =0与y =1之间的单调不减的连续(但不一定光滑)曲线. 由定义2.3知道,f (x )具有以下性质:1°f (x )≥0;2°⎰+∞∞-x x f d )(=1;3°P {x 1<X ≤x 2}=F (x 2)-F (x 1)=⎰21d )(x x x x f (x 1≤x 2);4°若f (x )在x 点处连续,则有F ′(x )=f (x ).由2°知道,介于曲线y =f (x )与y =0之间的面积为1.由3°知道,X 落在区间(x 1,x 2]的概率P {x 1<X ≤x 2}等于区间(x 1,x 2]上曲线y =f (x )之下的曲边梯形面积.由4°知道,f (x )的连续点x 处有f (x )=.}{)()(lim lim00x x x X x P x x F x x F x x ∆∆+≤<=∆-∆+++→∆→∆这种形式恰与物理学中线密度定义相类似,这也正是为什么称f (x )为概率密度的原因.同样我们也指出,反过来,任一满足以上1°、2°两个性质的函数f (x ),一定可以作为某个连续型随机变量的密度函数.前面我们曾指出对连续型随机变量X 而言它取任一特定值a 的概率为零,即P {X =a }=0,事实上,令Δx >0,设X 的分布函数为F (x ),则由{X =a }⊂{a -Δx <X ≤a },得 0≤P {X =a }≤P {a -Δx <X ≤a }=F (a )-F (a -Δx ). 由于F (x )连续,所以)(lim 0x a F x ∆-→∆=F (a ).当Δx →0时,由夹逼定理得P {X =a }=0,由此很容易推导出P {a ≤X <b }=P {a <X ≤b }=P {a ≤X ≤b }=P {a <X <b }.即在计算连续型随机变量落在某区间上的概率时,可不必区分该区间端点的情况.此外还要说明的是,事件{X =a }“几乎不可能发生”,但并不保证绝不会发生,它是“零概率事件”而不是不可能事件.例2.9 设连续型随机变量X 的分布函数为F (x )=⎪⎩⎪⎨⎧≥<≤<.1,1,10,,0,02x x Ax x 试求:(1)系数A ;(2)X 落在区间(0.3,0.7)内的概率; (3)X 的密度函数.解 (1)由于X 为连续型随机变量,故F (x )是连续函数,因此有1=F (1)=20101lim lim)(Ax x F x x -→-→= =A ,即A =1,于是有F (x )=⎪⎩⎪⎨⎧≥<≤<.1,1,10,,0,02x x x x (2) P {0.3<X <0.7}=F (0.7)-F (0.3)=(0.7)2-(0.3)2=0.4; (3) X 的密度函数为f (x )=F ′(x )=⎩⎨⎧<≤.,0;10,2其他x x由定义2.3知,改变密度函数f (x )在个别点的函数值,不影响分布函数F (x )的取值,因此,并不在乎改变密度函数在个别点上的值(比如在x =0或x =1上f (x )的值).例2.10 设随机变量X 具有密度函数f (x )=⎪⎩⎪⎨⎧≤≤-<≤.,0,43,22,30,其他x x x kx (1) 确定常数k ;(2) 求X 的分布函数F (x );(3) 求P {1<X ≤72}. 解 (1)由⎰∞∞-x x f d )(=1,得x xx kx d )22(d 4330⎰⎰-+=1, 解得k =1/6,故X 的密度函数为f (x )=⎪⎪⎪⎩⎪⎪⎪⎨⎧≤≤-<≤.,0,43,22,30,6其他x x x x(2) 当x <0时,F (x )=P {X ≤x }=⎰∞-xt t f d )( =0; 当0≤x <3时,F (x )=P {X ≤x }=⎰∞-xt t f d )(=⎰⎰∞-+00d )(d )(xt t f t t f =12d 620x t t x=⎰;当3≤x <4时,F (x )=P {X ≤x }=⎰∞-xt t f d )(=0303()()()xf t dt f t dt f t dt -∞++⎰⎰⎰=233(2)23;624x t t x dt dt x +-=-+-⎰⎰当x ≥4时,F (x )=P {X ≤x }=⎰∞-xt t f d )(=⎰⎰⎰⎰∞-+++030434d )(d )(d )(d )(xt t f t t f t t f t t f=t tt t d )22(d 64330⎰⎰-+ =1.即F (x )=⎪⎪⎪⎩⎪⎪⎪⎨⎧≥<≤-+-<≤<.4,1,43,324,30,12,0,022x x x x x x x(3) P {1<X ≤7/2}=F (7/2)-F (1)=41/48.下面介绍三种常见的连续型随机变量. (1)均匀分布若连续型随机变量X 具有概率密度f (x )=⎪⎩⎪⎨⎧<<-.,0,,1其他b x a ab (2.9)则称X 在区间(a ,b )上服从均匀分布(Uniform distribution ),记为X ~U (a ,b ).易知f (x )≥0且⎰⎰∞∞--=ba x ab x x f d 1d )(=1.由(2.9)可得 1°P {X ≥b }=⎰∞bx d 0 =0,P {X ≤a }=⎰∞-ax d 0=0,即 P {a <X <b }=1-P {X ≥b }-P {X ≤a }=1;2°若a ≤c <d ≤b ,则P {c <X <d }=ab c d x a b dc--=-⎰d 1. 因此,在区间(a ,b )上服从均匀分布的随机变量X 的物理意义是:X 以概率1在区间(a ,b )内取值,而以概率0在区间(a ,b )以外取值,并且X 值落入(a ,b )中任一子区间(c ,d )中的概率与子区间的长度成正比,而与子区间的位置无关. 由(2.8)易得X 的分布函数为F (x )=⎪⎩⎪⎨⎧≥<≤--<.,1,,,,0b x b x a a b ax a x (2.10) 密度函数f (x )和分布函数F (x )的图形分别如图2-3和图2-4所示.图2-3 图2-4在数值计算中,由于四舍五入,小数点后第一位小数所引起的误差X ,一般可以看作是一个服从在[-0.5,0.5]上的均匀分布的随机变量;又如在(a ,b )中随机掷质点,则该质点的坐标X 一般也可看作是一个服从在(a ,b )上的均匀分布的随机变量.例2.11 某公共汽车站从上午7时开始,每15分钟来一辆车,如某乘客到达此站的时间是7时到7时30分之间的均匀分布的随机变量,试求他等车少于5分钟的概率.解 设乘客于7时过X 分钟到达车站,由于X 在[0,30]上服从均匀分布,即有f (x )=⎪⎩⎪⎨⎧≤≤.,0,300,301其他x显然,只有乘客在7∶10到7∶15之间或7∶25到7∶30之间到达车站时,他(或她)等车的时间才少于5分钟,因此所求概率为 P {10<X ≤15}+P {25<X ≤30}=⎰⎰+15103025d 301d 301x x =1/3. (2)指数分布若随机变量X 的密度函数为f (x )=⎩⎨⎧≤>-.00,,0,e x x x λλ (2.11) 其中λ>0为常数,则称X 服从参数为λ的指数分布(Exponentially distribution ),记作X ~E (λ).显然f (x )≥0,且x x x f x d e d )(0⎰⎰∞∞-∞-=λλ=1.容易得到X 的分布函数为F (x )=⎩⎨⎧≤>--.00,,0,e 1x x x λ指数分布最常见的一个场合是寿命分布.指数分布具有“无记忆性”,即对于任意s ,t >0,有P {X >s +t |X >s }=P {X >t }. (2.12)如果用X 表示某一元件的寿命,那么上式表明,在已知元件已使用了s 小时的条件下,它还能再使用至少t 小时的概率,与从开始使用时算起它至少能使用t 小时的概率相等.这就是说元件对它已使用过s 小时没有记忆.当然,指数分布描述的是无老化时的寿命分布,但“无老化”是不可能的,因而只是一种近似.对一些寿命长的元件,在初期阶段老化现象很小,在这一阶段,指数分布比较确切地描述了其寿命分布情况.(2.12)式是容易证明的.事实上,(){,}{}{}{}{}1()e e {}.1()es t t λs P X s X s t P X s t P X s t X s P X s P X s F s t P X t F s λλ-+->>+>+>+>==>>-+====>--(3)正态分布若连续型随机变量X 的概率密度为f (x )=222)(e π21σμσ--x , -∞<x <+∞, (2.13)其中μ,σ(σ>0)为常数,则称X 服从参数为μ,σ的正态分布(Normal distribution ),记为X ~N (μ,σ2).显然f (x )≥0,下面来证明⎰∞∞-x x f d )(=1.令σux -=t ,得到.d eπ21d e π2122)(222t x t x ⎰⎰∞∞--∞∞---=σμσ记I =t t d e22⎰∞∞--,则有I 2=⎰⎰∞∞-∞∞-+-ds d e222t s t .作极坐标变换:s =r cos θ,t =r sin θ,得到I 2=22π22r redrd πθ∞--∞=⎰⎰,而I >0,故有I,即有.π2d e 22=⎰∞∞--t t于是.1π2π21d e 21222)(=⋅=--∞∞-⎰x x σμσπ 正态分布是概率论和数理统计中最重要的分布之一.在实际问题中大量的随机变量服从或近似服从正态分布.只要某一个随机变量受到许多相互独立随机因素的影响,而每个个别因素的影响都不能起决定性作用,那么就可以断定随机变量服从或近似服从正态分布.例如,因人的身高、体重受到种族、饮食习惯、地域、运动等等因素影响,但这些因素又不能对身高、体重起决定性作用,所以我们可以认为身高、体重服从或近似服从正态分布.参数μ,σ的意义将在第四章中说明.f (x )的图形如图2-5所示,它具有如下性质:图2-5 图2-61°曲线关于x =μ对称;2°曲线在x =μ处取到最大值,x 离μ越远,f (x )值越小.这表明对于同样长度的区间,当区间离μ越远,X 落在这个区间上的概率越小;3°曲线在μ±σ处有拐点; 4°曲线以x 轴为渐近线;5°若固定μ,当σ越小时图形越尖陡(图2-6),因而X 落在μ附近的概率越大;若固定σ,μ值改变,则图形沿x 轴平移,而不改变其形状.故称σ为精度参数,μ为位置参数. 由(2.13)式得X 的分布函数F (x )=t xt d eπ21-2)(22⎰∞--σμσ. (2.14)特别地,当μ=0,σ=1时,称X 服从标准正态分布N (0,1),其概率密度和分布函数分别用)(x ϕ,Φ(x )表示,即有22e π21)(x x -=ϕ, (2.15)Φ(x )=t x t d e π2122⎰∞--. (2.16) 易知,Φ(-x )=1-Φ(x ).人们已事先编制了Φ(x )的函数值表(见本书附录).一般地,若X ~N (μ,σ2),则有σμ-X ~N (0,1).事实上,Z =σμ-X 的分布函数为 P {Z ≤x }=}{x X P ≤-σμ=P {X ≤μ+σx }=t t xd e π21222)(σμσμσ--+∞-⎰,令σμ-t =s ,得P {Z ≤x }=s xs d e π2122⎰∞--=Φ(x ),由此知Z =σμ-X ~N (0,1).因此,若X ~N (μ,σ2),则可利用标准正态分布函数Φ(x ),通过查表求得X 落在任一区间(x 1,x 2]内的概率,即P {x 1<X ≤x 2}=⎭⎬⎫⎩⎨⎧-≤-<-σμσμσμ21x X x P=⎭⎬⎫⎩⎨⎧-≤--⎭⎬⎫⎩⎨⎧-≤-σμσμσμσμ12x X P x X P =⎪⎭⎫⎝⎛-Φ-⎪⎭⎫⎝⎛-Φσμσμ12x x .例如,设X ~N (1.5,4),可得P {-1≤X ≤2}=⎭⎬⎫⎩⎨⎧-≤-≤--25.1225.125.11X P =Φ(0.25)-Φ(-1.25)=Φ(0.25)-[1-Φ(1.25)]=0.5987-1+0.8944=0.4931.设X ~N (μ,σ2),由Φ(x )函数表可得P {μ-σ<X <μ+σ}=Φ(1)-Φ(-1)=2Φ(1)-1=0.6826,P {μ-2σ<X <μ+2σ}=Φ(2)-Φ(-2)=0.9544, P {μ-3σ<X <μ+3σ}=Φ(3)-Φ(-3)=0.9974.我们看到,尽管正态变量的取值范围是(-∞,∞),但它的值落在(μ-3σ,μ+3σ)内几乎是肯定的事,因此在实际问题中,基本上可以认为有|X -μ|<3σ.这就是人们所说的“3σ原则”.例2.12 公共汽车车门的高度是按成年男子与车门顶碰头的机会在1%以下来设计的.设男子身高X 服从μ=170(cm),σ=6(cm)的正态分布,即X ~N (170,62),问车门高度应如何确定?解 设车门高度为h (cm),按设计要求P {X ≥h }≤0.01或P {X <h }≥0.99,因为X ~N (170,62),故P {X <h }=⎪⎭⎫⎝⎛-Φ=⎭⎬⎫⎩⎨⎧-<-617061706170h h X P ≥0.99, 查表得 Φ(2.33)=0.9901>0.99.故取6170-h =2.33,即h =184.设计车门高度为184(cm )时,可使成年男子与车门碰头的机会不超过1%.例2.13 测量到某一目标的距离时发生的随机误差X (单位:米)具有密度函数f (x )=3200)20(2eπ2401--x .试求在三次测量中至少有一次误差的绝对值不超过30米的概率.解 X 的密度函数为f (x )=22402)20(3200)20(eπ2401eπ2401⨯----⨯=x x ,即X ~N (20,402),故一次测量中随机误差的绝对值不超过30米的概率为P {|X |≤30}=P {-30≤X ≤30}=⎪⎭⎫⎝⎛--Φ-⎪⎭⎫⎝⎛-Φ402030402030=Φ(0.25)-Φ(-1.25)=0.5981-(1-0.8944)=0.4931.设Y 为三次测量中误差的绝对值不超过30米的次数,则Y 服从二项分布b (3,0.4931),故P {Y ≥1}=1-P {Y =0}=1-(0.5069)3=0.8698.为了便于今后应用,对于标准正态变量,我们引入了α分位点的定义. 设X ~N (0,1),若z α满足条件P {X >z α}=α,0<α<1, (2.17)则称点z α为标准正态分布的上α分位点,例如,由查表可得z 0.05=1.645,z 0.001=3.16.故1.645与3.16分别是标准正态分布的上0.05分位点与上0.001分位点.第四节 随机变量函数的分布我们常常遇到一些随机变量,它们的分布往往难于直接得到(如测量轴承滚珠体积值Y 等),但是与它们有函数关系的另一些随机变量,其分布却是容易知道的(如滚珠直径测量值X ).因此,要研究随机变量之间的函数关系,从而通过这种关系由已知的随机变量的分布求出与其有函数关系的另一个随机变量的分布.例2.14 设随机变量X 具有表2-6所示的分布律,试求X 2的分布律.表2-6“X 2=2.25”,“X 2=9”等价,所以P {X 2=0}=P {X =0}=0.1, P {X 2=2.25}=P {X =1.5}=0.3, P {X 2=9}=P {X=3}=0.1.事件“X 2=1”是两个互斥事件“X =-1”及“X =1”的和,其概率为这两事件概率和,即P {X 2=1}=P {X =-1}+P {X =+1}=0.2+0.3=0.5.于是得X 2的分布律如表2-7所示.表2-7 例2.15 设连续型随机变量X 具有概率密度f X (x ),-∞<x <+∞,求Y =g (X )=X 的概率密度.解 先求Y 的分布函数F Y (y ),由于Y =g (X )=X 2≥0,故当y ≤0时事件“Y ≤y ”的概率为0,即F Y (y )=P {Y ≤y }=0,当y >0时,有F Y (y )=P {Y ≤y }=P {X 2≤y }=P {-y ≤X ≤y }=x x f yyX d )(⎰-.将F Y (y )关于y 求导,即得Y 的概率密度为f Y (y )=()()[]⎪⎩⎪⎨⎧≤>-+.0,0,0,21y y y f y f yXX例如,当X ~N (0,1),其概率密度为(2.15)式,则Y =X 2的概率密度为f Y (y )=⎪⎩⎪⎨⎧≤>--.0,0,0,e π21221y y y y此时称Y 服从自由度为1的χ2分布.上例中关键的一步在于将事件“Y ≤y ”由其等价事件“-y ≤X ≤y ”代替,即将事件“Y ≤y ”转换为有关X 的范围所表示的等价事件,下面我们仅对Y =g (X ),其中g (x )为严格单调函数,写出一般结论.定理2.2 设随机变量X 具有概率密度f X (x ),-∞<x <+∞,又设函数g (x )处处可导且g ′(x )>0(或g ′(x )<0),则Y =g (X )是连续型随机变量,其概率密度为f Y (y )=⎩⎨⎧<<'.,0,)()]([其他βαx y h y h f X (2.18)其中α=min (g (-∞),g (+∞)),β=max (g (-∞),g (+∞)),h (y )是g (x )的反函数.我们只证g ′(x )>0的情况.由于g ′(x )>0,故g (x )在(-∞,+∞)上严格单调递增,它的反函数h (y )存在,且在(α,β)严格单调递增且可导.我们先求Y 的分布函数F Y (y ),并通过对F Y (y )求导求出f Y (y ).由于Y =g (X )在(α,β)上取值,故 当y ≤α时,F Y (y )=P {Y ≤y }=0; 当y ≥β时,F Y (y )=P {Y ≤y }=1; 当α<y <β时,F Y (y )=P {Y ≤y }=P {g (X )≤y }=P {X ≤h (y )}=⎰∞-)(d )(x h X x x f .于是得概率密度f Y (y )=[()](),,0,X f h y h y x .αβ'<<⎧⎨⎩其他对于g ′(x )<0的情况可以同样证明,即f Y (y )=[()][()],,0,fX h y h y x .αβ'<<⎧⎨⎩其他将上面两种情况合并得f Y (y )=(())(),,0,fX h y h y x .αβ'⎧<<⎨⎩其他注:若f (x )在[a ,b ]之外为零,则只需假设在(a ,b )上恒有g ′(x )>0(或恒有g ′(x )<0),此时α=min{g (a ),g (b )},β=max{g (a ),g (b )}.例2.16 设随机变量X ~N (μ,σ2).试证明X 的线性函数Y =aX +b (a ≠0)也服从正态分布.证 设X 的概率密度f X (x )=,21222)(σμ--x e π-∞<x <+∞.再令y =g (x )=ax +b ,得g (x )的反函数x =h (y )=y ba-. 所以h ′(y )=1/a .由(2.18)式Y =g (X )=aX +b 的概率密度为f Y (y )=⎪⎭⎫ ⎝⎛-a b y f a X 1, -∞<y <+∞, 即。
概率论与数理统计-第二章-随机变量及其分布函数ppt课件
表格: X
x1 x2
pk
p1 p2
概率分布图:
1P
xn
pn
0.5
x4 x3
x1
x2
X
.
由概率的性质易知离散型随机变量的分布列
pk
满足下列特征性质:
k 1
① pk 0(k 1,2,) [非负性]
②
pk 1 [规范性]用于确定待定参数
k 1
③ F( x) P( X x) P(X xi ). xi x
1. 2
.
【例2】设随机变量X的分布函数为
aex b, x 0
F(x)
0,
x0
解: 因为 F(x) 在 x=0 点右连续
求: 常数 a 和 b。
所以 lim F ( x) lim (ae x b) a b 0
x0
x0
又因为 F () lim (ae x b) b 1 x
1、两点分布 或(0 - 1)分布
two-point distribution
定义1 设离散型随机变量X的分布列为
X0 1 pk 1 p p
其中 0<p<1
则称 X 服从(0 - 1)分布,记作 X ~(0 - 1)分布
F(x)
(0 - 1)分布的分布函数
0 , x0 F ( x) 1 p, 0 x 1
X = “三次试验中 A 发生的次数”,
{ X 2} A1A2 A3 A1A2 A3 A1A2 A3 P{X 2} P(A1A2 A3 A1A2 A3 A1A2 A3 )
P(A1A2 A3 ) P(A1A2 A3 ) P(A1A2A3 ) P(A1)P(A2)P(A3) P(A1)P(A2)P(A3) P(A1)P(A2 )P(A3 ) C32 p2(1 p)32
第2章 随机向量(概率论与数理统计(东南大学))PPT课件
解 由联合概率分布表得: (1)所求事件的概率为:
3
3
P(X1)P(X0,Yi) P(X1,Yi)
i0
i0
0.0 20.0 60.0 80.1 10.0 30.0 50.0 70.10
0.52
(2)所求事件的概率为:
2
P (X Y ) P (X i,Y i) 0 .0 2 0 .0 5 0 .1 6 0 .23
(二) 二维连续型随机向量
(1)定义: 若二维随机(X向 ,Y量 )的分布函数
y
F(x,y)
x f(u,v)dudv则 , 称 (X,
Y为) 连续型的
- -
维随机向, 其 量中非负f函 (x,数 y)称为 (X,Y)的概率
密度 , 或称X 为和Y的联合概率密度。
10
(2) f(x, y)的 性 质 :
解:易知X与 ,Y的可能取值 1,2分 3, 4,别 。为 故(XY, 所 ) 有可能取值 (最 是多 1有 对 6 )限 ,由对 乘法 公式, : 得
5
P{X i,Y j}
P{X
i}P{Y
j| X
i}
1 4
1 i
,
i j,
0,
i j.
于是(X,Y)的联合概率分布为:
YX 1
1 1/4
pij 1.
i1 j1
4
则 称 P{Xxi,Yy, 向 Y 的)量 联 合 概 率 分 布 或 联 合(律 分)。布 列
例1. 设随机变量 X在1, 2, 3, 4四个整数中等可能地 取值,而随机变量 Y在1~X中等可能地取一整数, 试 求(X, Y)的联合概率分布。
图1 y
(x,y)
y2 y y1
《概率论与数理统计》第二章基础知识小结
《概率论与数理统计》第二章基础知识小结第二章、基础知识小结一、 离散型分布变量分布函数及其分布律 1. 定义:),3,2,1(}{ ===i p x X P i iX1x 2x 3x … k x …P1p 2p 3p … k p …2.分布律}{k p 的性质: (1);,2,1,0 =≥k p k (2)11=∑∞=k k p3.离散型随机变量的分布函数:∑≤=≤=xx kk px X P x F }{)(4.分布函数F (X )的性质: (1)1)(0≤≤x F(2))(x F 是不减函数,0)()(}{1221≥-=≤<x F x F x X x P(3)1)(,0)(=+∞=-∞F F ,即1)(lim ,0)(lim ==+∞→-∞→x f x f x x (4))(x F 右连续,即)()(lim )0(0x F x x F x F x =∆+=+→∆(5))()(}{}{}{a F b F a X P b X P b X a P -=≤-≤=≤<)(1}{1}{a F a X P a X P -=≤-=>5.三种常见的离散型随机变量的概率分布(1)0-1分布(),1(~p B X )X 0 1 Pp q(2)二项分布(),(~p n B X )n k q p C k X P p kn k k n k ,,2,1,0,}{ ====-(3)泊松分布()(~λP X ),,,2,1,0,!}{n k e k k X P p kk ====-λλ二、连续型随机变量分布函数及其概率密度 1.连续型随机变量的分布函数即概率密度定义:dt t f x X P x F x⎰∞-=<=)(}{)(其中,)(x F 为X 的分布函数,)(x f 为X 的概率密度。
2.概率密度的性质 (1)0)(≥x f (2)1)(=⎰+∞∞-dx x f(3)dx x f a F b F b X a P ba ⎰=-=≤<)()()(}{ (4))()(x f x F ='3.三种常见的连续型随机变量 (1)均匀分布(),(~b a U X )⎪⎩⎪⎨⎧≤≤-=其他,0,1)(b x a a b x f(2)指数分布()(~λE X )⎩⎨⎧≤>=-0,00,)(x x e x f x λλ(3)正态分布(),(~2σμN X )+∞<<-∞=--x ex f x ,21)(222)(σμσπ(4)标准正态分布()1,0(~N X )及其性质+∞<<-∞=-x ex f x ,21)(22π性质:A.)(1)(x x ΦΦ-=-B.21)0(=Φ(5)非标准正态分布标准化 设),(~2σμN X ,则z =x −μσ~N(0,1)三、随机变量函数的概率分布 1.离散型随机变量函数的概率分布 设离散型随机变量X 的分布律为:X1x 2x 3x …k x …P1p 2p 3p …k p …则X 的函数)(X g Y =的分布律为:X)(1x g )(2x g )(3x g … )(k x g …P1p 2p 3p …k p …2.连续型随机变量函数的分布设X 的连续型随机变量,其概率密度为)(x f X 。
概率论与数理统计第二章课件PPT
例2 某类灯泡使用时数在1000小时以上 的概率是0.2,求三个灯泡在使用1000 小时以后最多只有一个坏了的概率.
解: 设X为三个灯泡在使用1000小时已坏的灯泡数 .
X ~ B (3, 0.8),
P( X k)C (0.8) (0.2) , k 0,1,2,3
k 3 k
3k
P{X 1} =P{X=0}+P{X=1} =(0.2)3+3(0.8)(0.2)2
X
p
1
0
1
2
3 0.1
a b 0.2 0.3
求a,b满足什么条件。
a b 0.4, a 0, b 0
一旦知道一个离散型随机变量X的分布律后,我们便可求得X
所生成的任何事件的概率。特别地,对任意 a ,有 b
P a X b P X x P X x i i a x b a x b 1 1 pk
解
用泊松定理 取 =np=(400)(0.02)=8, 故 近似地有 P{X2}=1- P{X=0}-P {X=1}
=1-(1+8)e-8=0.996981.
泊松分布(Poisson distribution)
定义2 设随机变量X的可能取值为0,1,2,…,n,…,而X 的分布律为
pk P X k
路口1
路口2
路口3
X表示该汽车首次遇到红灯前已通过的路口的个数
路口1
路口2
路口3
1 1 1 P(X=3)= P( A1 A2 A3 ) =1/8 2 2 2
即
X
p
0
1
2
3
1 2
1 4
《概率论与数理统计》教学课件(共8章)第2章 随机变量及其概率分布
显然,p1+p2+p3+p4=1。
2.1 离散型随机变量
2.1.2 离散型随机变量的分布律
(2) X为直到取得白球时的取球次数。因为每次取出的黑球仍放回去,所以X的所有可能取值是一
切正整数1, 2, …,n, ….由于是放回抽样,故每次抽球的试验是独立的。由独立事件的概率乘法公式,得
X的分布律:
p1=P{X=1}=25, p2=P{X=2}=35×25=265,
概率论与数理统计
第2章 随机变量及其概率分布
2.1 离散型随机变量 2.2 连续型随机变量 2.3 分布函数 2.4 随机变量函数的分布
2.1 离散型随机变量
2.1.1 随机变量的概念
在第1章中,我们讨论了随机事件及其概率.为了全面研究随机试验的结果,我们引入随机变量这 一十分重要的概念。我们所讨论的随机事件几乎无一例外地可用随机变量来描述,用随机变量描述随 机现象是概率论中最重要的方法。
P{X>6}=P{X=7}+P{X=8}+P{X=9} =C97(0.2)7(0.8)2+C98(0.2)8(0.8)+(0.2)9 ≈0.0003.
这一结果表明,供应6个人的需电量,超负荷的可能性仅为0.03%。也就是说,平均在大约55.6h 中,可能有一分钟超负荷。
2.1 离散型随机变量
2.1.3 几种常见的概率分布律
称X=X(ω)为该试验的一个随机变量。
本书中,用大写字母X, Y, Z, W等表示随机变量,用小写字母x, y, z, w等表示实数。
随机变量的取值随着试验的结果而定,因而在试验之前,只能知道它可能取值的范围,而不能预
知它取哪一个值。且试验的所有结果的出现都有一定的概率,因而随机变量的取值也有一定的概率。
概率论与数理统计第二章_PPT课件
3,4,5
1.随机变量的定义
设E是一个随机试验,S是其样本空间.我们称样本空
间上的函数 X X e e S
为一个随机变量,如果对于任意的实数 x,集合
e : X e x X x
X (e)
e
都是随机事件.
随机变量的特点:
R
S
1). X的全部可能取值是互斥且完备的
2). X的部分可能取值描述随机事件
实例2 若随机变量 X 记为 “连续射击, 直至命 中时的射击次数”, 则 X 的可能值是:
1 , 2 , 3 , . 实例3 设某射手每次射击打中目标的概率是0.8, 现该射手射了30次,则随机变量 X 记为“击中目标 的次数”,则 X 的所有可能取值为:
0 ,1 ,2 ,3 , ,3 . 0
( 5 ) 对 于 随 机 变 量 , 我 们 常 常 关 心 的 是 它 的 取 值 .
( 6 )我 们 设 立 随 机 变 量 ,是 要 用 随 机 变 量 的 取 值 来 描 述 随 机 事 件 .
实例2 掷一个硬币, 观察出现的面 , 共有两个 结果: e1(反面朝 ), 上
e2 (正面朝 ), 上 若用 X 表示掷一个硬币出现正面的次数, 则有
1 ,2 ,3 , . 注意 X(e) 的取值是可列无穷个!
实例7 某公共汽车站每隔 5 分钟有一辆汽车通 过, 如果某人到达该车站的时刻是随机的, 则
X(e) 此人的等车,时间
是一个随机变量. 且 X(e) 的所有可 能取值为: [0,5].
实例8 设某射手对目标进行射击,如果我们以目标 中心为坐标原点,考查射击点的平面位置(坐标), 为了便于研究,我们引入两个变量X,Y,其中
若用 X 表示该家女孩子的个数时 , 则有
概率论与数理统计 第二章随机变量及其分布剖析PPT课件
射手射击击中目标.
这种对应关系在数学上表现为一种实值函数.
w.
X(w) R
对于试验的每一个样本点w,都对应着一个实数 X(w),而X(w)是随着实验结果不同而变化的一个 变量。
机
随机变量的定义
设 随 机 实 验 E的 样 本 空 间 , 若 对 每 一 个 样 本 点
, 都 有 唯 一 的 实 数 X()与 之 对 应 ,则 称 X()为 随 机 变 量 , 简 记 为 X.
P (X k ) ( 1 p )k 1 p , (k 1 ,2 , )
则称随机变量X服从以p为参数的几何分布,
记作
X ~G(p) 。
超几何分布
设N个元素分为两类,有M个属于第一类,N-M
个属于第二类。现在从中不重复抽取n个,其 中包含的第一类元素的个数X的分布律为
P(Xk)CM kC C N n N n kM, (k0,1, ,l) 其中l=min{M,n}, 则称随机变量X服从参数为 的超几何分布,记作 X~H(N,M,n)
由泊松定理,n重贝努里试验中稀有事件 出现的次数近似地服从泊松分布.
例5. 某车间有5台车床,由于种种原因(由 于装、卸工作等),时常需要停车.设各 台车床的停车或开车是相互独立的. 若车床在任一时刻处于停车状态的 概率是1/3,求车间中恰有一台车床处 于停车状态的概率。
解:X:处于停车状态的车床数
密度函数 f (x)在某点处a的高度,并不反映 X取值的概率. 但是,这个高度越大,则X 取a附近的值的概率就越大. 也可以说,在 某点密度曲线的高度反映了概率集中在该 点附近的程度.
f (x)
o
x
例1 :某型号电子管的寿命X(小时)的概率密度为
概率论与数理统计教程茆诗松版第二章ppt课件
4/22/2020
华东师范大学
第二章 随机变量及其分布
第8页
2.1.3 离散随机变量的分布列
➢ 设离散随机变量 X 的可能取值为: x1,x2,……,xn,……
称 pi=P(X=xi), i =1, 2, …… 为 X 的分布列.
➢ 分布列也可用表格形式表示:
X x1 P p1
x2 …… xn …… p2 …… pn ……
4/22/2020
华东师范大学
第二章 随机变量及其分布
注 意 点 (2)
第11页
对离散随机变量的分布函数应注意: (1) F(x)是递增的阶梯函数; (2) 其间断点均为右连续的; (3) 其间断点即为X的可能取值点; (4) 其间断点的跳跃高度是对应的概率值.
4/22/2020
华东师范大学
第二章 随机变量及其分布
第二章 随机变量及其分布
第1页
第二章 随机变量及其分布
§2.1 随机变量及其分布 §2.2 随机变量的数学期望 §2.3 随机变量的方差与标准差 §2.4 常用离散分布 §2.5 常用连续分布 §2.6 随机变量函数的分布 §2.7 分布的其他特征数
4/22/2020
华东师范大学
第二章 随机变量及其分布
(2) F(x) 是 (∞, +∞) 上的连续函数; (3) P(X=x) = F(x)F(x0) = 0;
4/22/2020
华东师范大学
第二章 随机变量及其分布
注意点(2)
第18页
(4) P{a<X≤b} = P{a<X<b} = P{a≤X<b} = P{a≤X≤b} = F(b)F(a).
(5) 当F(x) 在x点可导时, p(x) = F ( x )
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
若 X~N0,1 ,则其分布函数为
x
(x)
1 t2 e 2 dt
2π
若 X~N(μ, σ2),其概率密度 f(x)的图形关于直线 x=μ
对称
P( X )
1
e
(
x )2 2 2
d
x
1
e
(
x )2 2 2
dx
P(X
)
0.5
2
x
对任 x∈R
0≤F(x)≤1
上述性质是 F(x)的性质,即若 F(x)是分布函数则必有性质
1°,2°,3°,反之一个函数必满足这三条性质才能是某随机变
量的分布函数。
F(x) P(X xk ) xk x
注:F(x)是阶梯形函数,在 X=xk 处 有跳跃,其跳跃值为 P(X = xk)= pk k=1,2,…
x2
已知随机变量 X~f(x),P(x1<X≤x2)=
f ( x)dx
x1
已知随机变量X~P (X=xk)=pk,k=1,2,… P (x1<X≤x2)=在(x1, x2]上(X=xi)概率和
3.重要概率分布 (1) 两点分布
如果X只取值0或 1,概率分布是
P X 0 q , P X 1 p ,p q 1
0,
F(x)
x b
a, a
1,
x a, a x b, x b.
指数分布
若 X~E ,则其分布函数为
1ex , x0 F(x)
0 , x0
正态分布
若 X~N,2,则其分布函数为
F(x) 1 e dt x (t2σμ2)2 2πσ 标准正态分布
X
0
1
P
q
p
则称随机变量X服从参数为p的两点分布
记为 X~B1,p 其 中 0p1
(2).二项分布 B n, p
如果随机变量X 有如下的概率分布
P Xk Cnkpkqnk
k0,1,,n p,q0, pq1
则称X 服从参数为n和p的二项分布,
记为 X~Bn, p
的函数,是变上限的定积分
x
f
(t)dt,
x
(
,
),
f
(x)
是分段
函数时,要讨论x 在不同范围的积分问题。
3°对所求出的F(x)要检查一下是否满足分布函数的性 质,以利用检查计算是否正确。
2.已知随机变量X的概率分布,求P (X∈A)
<X≤x2)= F(x2)-F(x1)
第二章 随机变量及其分布 一.基本概念要清楚
随机变量,分布列,概率密度函数, 分布函数等概念与性质。
为便于记忆,对照,特制表一,表二。
表一
X 是离散型随机变量 分布列 P(X=xk)=pk, k=1,2,… 分布列
X x1 x2…xn… pk p1 p2…pn…
X 是连续型随机变量 概率密度 f(x) -∞<x<+∞ 定义:f(x)非负且对任何 a<b 满 足
表二 随机变量的分布函数F(x)
定义:F(x) = P(X≤x) (-∞<x<+∞)
几何表示
性质:1°F(x1)≤F(x2) (任 x1<x2 时) 单调不减函数
x
2°右连续性 即 F(x+0)=F(x)
3° lim F ( x) F () 0 x
lim F( x) F() 1
(x )2 2 2
.
xR
则称 X 服从参数为(μ, σ2)的正态分布,
记为 X~N(μ, σ2 ),特别地,当 μ=0,σ =1 时,称 N(0,1)
为标准正态分布,其概率密度为
(x)
1
x2
e2
2
几种常用的连续型随机变量的分布函数 均匀分布
若 X~Ua,b,则其分布函数为
对正常数 ,若随机变量 X 的概率密度为
ex , x 0,
f (x)
0,
x 0.
则称 X 服从参数为 的指数分布,
记为 X : E()
(8).正态分布(Normal 分布)
设 μ 是常数,σ 是正常数,如果 X 的概率密度为
f (x)
1
2
exp
x
F(x) P(X x) f (t)dt
F(x)是连续函数
F (x)
1
p2
p1
x
x1 x2
xk
o
注:
1°判断一个函数是否是概率密度函数,只能用概率密 度函数的二条特征性质,若满足二条性质,则此函 数是概率密度函数,否则就不是概率密度函数。
2°连续型随机变量的分布函数 F(x)是定义在(, ) 上
(3).泊松分布(Poisson 分布) P
如果随机变量X有如下的概率分布
PXk k e
k! k 0, 1,
则称X 服从参数是 的Poisson分布,
其中 0 是常数. 记为 X~P
(4).超几何分布(Hypergeometric分布)H(n, M, N) 如果随机变量X 有如下的概率分布
2
若随机变量X~N(0,1),分布函数Φ(x)性质: Φ(-x)=1-Φ(x) Φ(0)=0.5 Φ(x)是偶函数,关于直线x=0(即纵轴)对称
P
a
X
b
b
a
f
x dx
性质 1°pk≥0,k=1,2,…
2° pk 1 k 1
1° f (x) 0
2° f ( x)dx 1
3°F'(x)=f(x),x 是 f(x)的连续点 4°P(X=a)=0
5° P X A A f x dx
P Xm CM mCCN nN nmM
m0,1,, M
则称X 服从超几何分布
记为X~H n,M ,N
(5).几何分布(Geometric分布) 如果随机变量X有如下的概率分布
P X k qk1 p
k 1, 2 , pq 0 , p q 1
则称X 服从参数是 p 的几何分布.
(6) 均匀分布(Uniform 分布)
对 a<b,如果 X 的概率密度函数为
1 f (x) b a
a x b;
0, 其它 .
则称 X 服从(a, b)上的均匀分布,记为 X ~U (a, b).
(7).指数分布(Exponential分布)