概率论与数理统计(浙大版)第二章随机变量及其分布课件
浙大概率论与数理统计课件 第二章随机变量及其分布
P( X 2)C (0.05) (0.95) 0.007125
2 3 2
请注意:
1、若将本例中的“有放回”改为”无放回”, 那么 各次试验条件就不同了, 此试验就不是伯努利试验 . 此时, 只能用古典概型求解.
P( X 2)
C C C
1 95
2 5
3 100
0.00618
这种对应关系在数学上理解为定义了一种实值 单值函数.定义域为样本空间S,取值为实数.
e.
s
这即为所谓的随机变量
X(e)
R
定义 设随机试验的样本空间为S={e}. X= X(e)是 定义在样本空间S上的实值单值函数.称X= X(e)为 随机变量. 简记为 r.v. 说明 (1)它是一个变量, 它的取值随试验结果而改变 (2)由于试验结果的出现具有一定的概率,故 随机变量取每个值和每个确定范围内的值也有一 定的概率. (3)随机变量通常用大写字母X,Y,Z,W,N 等表 示,而表示随机变量所取的值时,一般采用小写 字母 x, y, z, w, n等.
解:按第一种方法。 以 X 记 “ 第 一 人 维 护 的 20台 中 同 一 时 刻 发 生 故 障 的 台 数 ” 。 以 Ai i 1, 2, 3, 4 表 示 事 件 “ 第 i 人 维 护 的 2 0台 中 发 生 故 障 不 能 及 时 维 修 ” , 则 知 80台 中 发 生 故 障 不 能 及 时 维 修 的 概 率 为 :
k k nk
, 0, , n k 1,
P 易证:(1) ( X k ) 0
(2) P ( X k ) 1
k 0
n
称 r.v X 服从参数为n和p的二项分布,记作 X~b(n,p) 显然,当 n=1 时 X ~ B 1, p 此时有 PX k p k 1 p 1 k , k 0,1 0 p 1
《概率论与数理统计》课件-第2章随机变量及其分布 (1)
HAINAN UNIVERSITY
概率论与数理统计
第二五章 基随本机极变限量定及理其分布
泊松分布的应用
“稠密性”问题(一段时间内,电话交换中心接到的呼叫次 数,公共汽车车站候车的乘客数,售票窗口买票的人数, 原子放射的粒子数,保险公司在一定时期内被索赔的次 数等)都服从泊松分布.
随机变量的分布函数
1.定义: 设X为一随机变量, x为任意实数, 称函数 F(x)=P{X≤x}为X的分布函数.
注: ① F(x)是一普通函数, 其定义域为 ,; ② F x的值为事件X x的概率; ③ F x可以完全地描述随机变量取值的规律性.
例如: Pa X b PX b PX a
连续型随机变量及概率密度函数
1.定义: 设X ~ F(x), 若存在一个非负可积的函数 f (x),
使 x R, 有
F ( x)
PX
x
x
f
(t)dt
,
则称X为连续型随机变量, f (x) 称为X的概率密度函数或
分布密度函数.
2.几何意义:
HAINAN UNIVERSITY
概率论与数理统计
第二五章 基随本机极变限量定及理其分布
二、随机变量的概念
定义: 设试验E的样本空间为 , 若对于每个样本
点 , 均有一个实数 X ()与之对应, 这样就得
到一个定义在 上的单值函数 X X () , 称X为随
机变量.
X
样本空间
实数
注: ① 随机变量是一个定义在样本空间上的实函数, 它取值的随机性是由样本点的随机性引起的;
x 1
x0
0 x x
不是 (不满足规范性)
概率论与数理统计浙江大学第四版盛骤概率论部分ppt精选课件
1 P(A)1P(A)
P(A)0不能A; P(A)1不能AS;
A AS P(A)P(A)1 P()0
2 若 A B , 则 有 P ( B A ) P ( B ) P ( A ) P ( B ) P ( A )
BA AB P (B )P (A )P (A B )
P ( B ) P ( A ) P ( A B ) P ( B A ) 0P(B)P(A)
例:
向上抛出的物体会掉落到地上 ——确定
明天天气状况
——不确定
买了彩票会中奖 ——不确定
8
•篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
概率统计中研究的对象:随机现象的数量规律
对随机现象的观察、记录、试验统称为随机试验。 它具有以下特性:
3 概 率 的 加 法 公 式 : P ( A B ) P ( A ) P ( B ) P ( A B )
A B A ( B A B ) P ( A B ) P ( A ) P ( B A B ) 又 B A B , 由 2 。 知 P ( B A B ) P ( B ) P ( A B )
✓ A B A B { x |x A 且 x B }
S AB
✓ A 的 逆 事 件 记 为 A , A A A A S , 若 A A B B S , 称 A ,B 互 逆 、 互 斥
S
✓ “和”、“交”关系式
AA
n
n
Ai Ai A1 A2
n
n
An; Ai Ai=A1A2 An;
• 7.1 参数的点估计 • 7.2 估计量的评选标准 • 7.3 区间估计
概率论与数理统计 第二章 随机变量及其分布
6 6 X ~ ( ), 且 P X 0 e 即 e e 6
P { X 2 } 1 P { X 2 } 1 P { X 0 } P { X 1 }
6 6 1 e 6 e 0 . 9826
A={X=1},B={X=2},C={X=0}
② 设Y为进行5次试验中成功的次数,则 D={Y=1},F={Y1},G={Y3}
随机变量的分类
离散型随机变量 随机变量 连续型 非离散型 奇异型(混合型)
§2 离散型随机变量的分布律(P27)
定义 若随机变量X取值x1, x2, …, xn, … ,且取这些 值的概率依次为p1, p2, …, pn, …, 则称 P{X=xk}=pk, (k=1, 2, … ) 为X的分布律。 可表为 X~ P{X=xk}=pk, (k=1, 2, … ), 或…
k k n
k 0 , 1 , , n
若以X表示n重贝努里试验中事件A发生的次数, P(A)=p, 则称X服从参数为n,p的二项分布。 记作X~b(n,p), 其分布律为:
P { X k } p ( 1 p ), ( k 0 , 1 ... n ) C n
kk
n k
例2 掷一颗骰子10次,求(1)双数点出现6次的概率? (2)“3”点出现两次的概率? 解:(1)设X表出现双数点的次数,则X~b(10,1/2) 6 6 10 6 6 10 1 1 1 所求概率: P ( X 6 ) C ( ) ( ) C ( ) 10 10 2 2 2 (2) 设Y表出现“3”点的次数,则Y~b(10,1/6) 2 1258 所求概率为: P ( Y 2 ) C () () 10
概率论与数理统计第二章 随机变量及其分布第1 5节课件PPT教案
P{ X
k}
C
k n
0.02k
0.98nk
k 0,1,2,,n.
P{X 1} 0.9 1 P{X 0} 0.9
1
C
0 n
0.020
0.98n0
0.9
0.98n 0.1
nln(0.98) ln(0.1)
n ln(0.1) 114 ln(0.98)
非离散型随机变量的情况比较复杂,在实用 中, 常遇到的是它的一个特殊情形----连续型随机 变量。这类随机变量的主要特征是它们可能的取 值充满了某个有限或无限的区间。
第15页/共110页
第二节 离散型随机变量及其分布律
离散型随机变量只可能取有限个或无限可列个 值。为了全面地描述离散型随机变量,我们不仅要 知道它可能取的值是哪一些,而且还要知道它取这 些值的概率是多少。只有这样,才能确切地掌握离 散型随机变量的统计规律性。 设离散型随机变量X所有可能的取值为 xk (k 1,2,), X取各个可能值的概率,即事件 { X xk } 的概率为
解: X 可能取的值为 3,4,5.
C 且
1, 10
5
CC P{X 5}
2
4 3
6. 10
5
CC P{X 4}
2
3 3
3, 10
5
列成表格,得 X pk
3
4
1/10 3/10
5 6 / 10
第19页/共110页
几个常用的离散型随机变量的分布
(一) 两点分布(贝努利分布) 如果一个试验 E 只有两个可能结果:A及 A,
第22页/共110页
如果离散型随机变量X可能取的值为0, 1, 2, …, n。 且其分布律为
概率论与数理统计(浙大四版)课件 第二章++随机变量及其分布
0.01k
0.99
80k
0.0087 < 0.0169
第二种方法优于第一种方法
计算 休息 结束
街头赌博 高尔顿钉板试验
休息 结束
Poission分布
例 单位时间内某电话总机收 到的呼叫次数用X表示,它是一 个离散型随机变量。
X= 0, 1, …
P{ X k } e k k 1,2,L
请 P(a X b ) F(b ) F(a 0 ) 填 P(a X b ) F(b 0 ) F(a) 空 P(a X b ) F(b 0 ) F(a 0 )
休息 结束
例1 求例2中的分布函数 F( x ) 并作图.
解 :X 的分布律为
X
0
1
2
p 7/15 7/15 1/15
我们来求X的概率分布。
休息 结束
X表示随机抽查的4个婴儿中男孩的个 数,生男孩的概率为 p.
X=0 X =1 X =2 X =3 X =4
p0 ( 1 p )4
p4 ( 1 p )44
p1( 1 p )41
p3 ( 1 p )43
p2 ( 1 p )42
C
0 4
C
1 4
休息 结束
7 15
x
x
0
1
1
x 15
x
2
x
分布函数为
0
7
x0 0x1
15
F( x ) P{ X x } 14
15
1 x2
1
x2
休息 结束
F(x) 的图形为:
F(x)
概率论与数理统计浙大版第二章 ppt课件
E1: 将一枚硬币连掷两次,观察正反面出现的情况。
概率论与数理统计浙大版第二章
2
精品资料
你怎么称呼老师? 如果老师最后没有总结一节课的重点的难点,你是
否会认为老师的教学方法需要改进? 你所经历的课堂,是讲座式还是讨论式?
教师的教鞭 “不怕太阳晒,也不怕那风雨狂,只怕先生骂我笨,
概率论与数理统计浙大版第二章
12
§2 离散型随机变量及其分布
概率论与数理统计浙大版第二章
13
一、离散型随机变量的定义及其分布律
1.离散型随机变量的定义 如果随机变量X所有可能的取值是有限个或无 穷可列个,则称X为离散型随机变量。
2.离散型随机变量的分布律
要掌握一个离散型随机变量的分布律,必须
且只需知道以下两点:
设e是一个随机试验其样本空间为se在e上引入一个变量x如果对s中每一个样本点e都有一个x的取值xe与之对应我们就称x为定义在随机试验e的一个随机变量
第二章 随机变量及其分布
随机变量 概率分布函数 离散型随机变量 连续型随机变量
随机变量的函数
概率论与数理统计浙大版第二章
1
第一节 随 机 变 量
在上一章中,我们把随机事件看作样本空间 的子集;这一章里我们将引入随机变量的概念, 用随机变量的取值来描述随机事件。
令X=“报童每天卖出的报纸份数” 试将“报童赔钱”这一事件用X的取值表 示出来。
解:分析
{报童赔钱}
{卖出报纸的钱不够成本}
当 0.50 X<1000× 0.3时,报童赔钱.
故{报童赔钱}{X 600}
概率论与数理统计浙大版第二章
10
3、随机变量的概率分布 对于一个随机试验,我们关心下列两件事情: (1)试验会发生一些什么事件? (2)每个事件发生的概率是多大?
概率论与数理统计第二章随机变量课件
第二章随机变量第一节随机变量及其分布函数上一章中我们讨论的随机事件中有些是直接用数量来标识的,例如,抽样检验灯泡质量试验中灯泡的寿命;而有些则不是直接用数量来标识的,如性别抽查试验中所抽到的性别.为了更深入地研究各种与随机现象有关的理论和应用问题,我们有必要将样本空间的元素与实数对应起来.即将随机试验的每个可能的结果e都用一个实数X来表示.例如,在性别抽查试验中用实数“1”表示“出现男性”,用“0”表示“出现女性”.显然,一般来讲此处的实数X值将随e的不同而变化,它的值因e的随机性而具有随机性,我们称这种取值具有随机性的变量为随机变量.定义2.1设随机试验的样本空间为Ω,如果对Ω中每一个元素e,有一个实数X(e)与之对应,这样就得到一个定义在Ω上的实值单值函数X=X(e),称之为随机变量(Random variable).随机变量的取值随试验结果而定,在试验之前不能预知它取什么值,只有在试验之后才知道它的确切值;而试验的各个结果出现有一定的概率,故随机变量取各值有一定的概率.这些性质显示了随机变量与普通函数之间有着本质的差异.再者,普通函数是定义在实数集或实数集的一个子集上的,而随机变量是定义在样本空间上的(样本空间的元素不一定是实数),这也是二者的差别.本书中,我们一般以大写字母如X,Y,Z,W,…表示随机变量,而以小写字母如x,y,z,w,…表示实数.为了研究随机变量的概率规律,并由于随机变量X的可能取值不一定能逐个列出,因此我们在一般情况下需研究随机变量落在某区间(x1,x2]中的概率,即求P{x1<X≤x2},但由于P{x1<X≤x2}=P{X≤x2}-P{X≤x1},由此可见要研究P{x1<X≤x2}就归结为研究形如P{X≤x}的概率问题了.不难看出,P{X≤x}的值常随不同的x而变化,它是x的函数,我们称这函数为分布函数.定义2.2设X是随机变量,x为任意实数,函数F(x)=P{X≤x}称为X的分布函数(Distribution function).对于任意实数x1,x2(x1<x2),有P{x1<X≤x2}=P{X≤x2}-P{X≤x1}=F(x2)-F(x1),(2.1)因此,若已知X的分布函数,我们就能知道X落在任一区间(x1,x2]上的概率.在这个意义上说,分布函数完整地描述了随机变量的统计规律性.如果将X看成是数轴上的随机点的坐标,那么,分布函数F(x)在x处的函数值就表示X落在区间(-∞,x]上的概率.分布函数具有如下基本性质:1°F(x)为单调不减的函数.事实上,由(2.1)式,对于任意实数x1,x2(x1<x2),有F(x2)-F(x1)=P{x1<X≤x2}≥0.2°0≤F (x )≤1,且)(lim x F x +∞→=1,常记为F (+∞)=1.)(lim x F x -∞→=0,常记为F (-∞)=0.我们从几何上说明这两个式子.当区间端点x 沿数轴无限向左移动(x →-∞)时,则“X 落在x 左边”这一事件趋于不可能事件,故其概率P {X ≤x }=F (x )趋于0;又若x 无限向右移动(x →+∞)时,事件“X 落在x 左边”趋于必然事件,从而其概率P {X ≤x }=F (x )趋于1.3°F (x +0)=F (x ),即F (x )为右连续. 证略.反过来可以证明,任一满足这三个性质的函数,一定可以作为某个随机变量的分布函数. 概率论主要是利用随机变量来描述和研究随机现象,而利用分布函数就能很好地表示各事件的概率.例如,P {X >a }=1-P {X ≤a }=1-F (a ),P {X <a }=F (a -0),P {X =a }=F (a )-F (a -0)等等.在引进了随机变量和分布函数后我们就能利用高等数学的许多结果和方法来研究各种随机现象了,它们是概率论的两个重要而基本的概念.下面我们从离散和连续两种类别来更深入地研究随机变量及其分布函数,另有一种奇异型随机变量超出本书范围,就不作介绍了.第二节离散型随机变量及其分布如果随机变量所有可能的取值为有限个或可列无穷多个,则称这种随机变量为离散型随机变量.容易知道,要掌握一个离散型随机变量X 的统计规律,必须且只须知道X 的所有可能取的值以及取每一个可能值的概率.设离散型随机变量X 所有可能的取值为x k (k =1,2,…),X 取各个可能值的概率,即事件{X =x k }的概率P {X =x k }=p k , k =1,2,… (2.2)我们称(2.2)式为离散型随机变量X 的概率分布或分布律.分布律也常用表格来表示(表2-1):表2-1由概率的性质容易推得,任一离散型随机变量的分布律{pk},都具有下述两个基本性质: 1°p k ≥0,k =1,2,…; (2.3) 2°11=∑∞=k kp. (2.4)反过来,任意一个具有以上两个性质的数列{Pk},一定可以作为某一个离散型随机变量的分布律.为了直观地表达分布律,我们还可以作类似图2-1的分布律图.图2-1图2-1中x i 处垂直于x 轴的线段高度为p i ,它表示X 取x i 的概率值.例2.1 设一汽车在开往目的地的道路上需通过4盏信号灯,每盏灯以0.6的概率允许汽车通过,以0.4的概率禁止汽车通过(设各盏信号灯的工作相互独立).以X 表示汽车首次停下时已经通过的信号灯盏数,求X 的分布律.解 以p 表示每盏灯禁止汽车通过的概率,显然X 的可能取值为0,1,2,3,4,易知X 的分布律为或写成P {X =k }=(1-p )p ,k =0,1,2,3.P {X=4}=(1-p )4.将p =0.4,1-p =0.6代入上式,所得结果如表2-3所示.下面介绍几种常见的离散型随机变量的概率分布: (1)两点分布若随机变量X 只可能取x 1与x 2两值,它的分布律是P {X =x 1}=1-p (0<p <1),P {X =x 2}=p ,则称X 服从参数为p 的两点分布.特别,当x 1=0,x 2=1时两点分布也叫(0-1)分布,记作X ~(0-1)分布.写成分布律表形式见表2-4.表2-4对于一个随机试验,若它的样本空间只包含两个元素,即Ω={e 1,e 2},我们总能在Ω上定义一个服从(0-1)分布的随机变量,,,1,0)(21e e e e e X X ==⎩⎨⎧==当当用它来描述这个试验结果.因此,两点分布可以作为描述试验只包含两个基本事件的数学模型.如,在打靶中“命中”与“不中”的概率分布;产品抽验中“合格品”与“不合格品”的概率分布等等.总之,一个随机试验如果我们只关心某事件A 出现与否,则可用一个服从(0-1)分布的随机变量来描述.(2)二项分布若随机变量X 的分布律为P {X =k }=k n C p k (1-p )n -k, k =0,1,…,n , (2.5)则称X 服从参数为n ,p 的二项分布(Binomial distribution ),记作X ~b (n ,p ).易知(2.5)满足(2.3)、(2.4)两式.事实上,P (X =k )≥0是显然的;再由二项展开式知n k n k nk k nn k p p p p k X P )]1([)1(C}{0-+=-==-==∑∑=1.我们知道,P {X =k }=kn k k n p p --)1(C 恰好是[p +(1-p )]n 二项展开式中出现p k 的那一项,这就是二项分布名称的由来.回忆n 重贝努里试验中事件A 出现k 次的概率计算公式P n (k )=k n C p k (1-p )n-k, k =0,1,…,n ,可知,若X ~b (n ,p ),X 就可以用来表示n 重贝努里试验中事件A 出现的次数.因此,二项分布可以作为描述n 重贝努里试验中事件A 出现次数的数学模型.比如,射手射击n 次中,“中的”次数的概率分布;随机抛掷硬币n 次,落地时出现“正面”次数的概率分布;从一批足够多的产品中任意抽取n 件,其中“废品”件数的概率分布等等.不难看出,(0-1)分布就是二项分布在n =1时的特殊情形,故(0-1)分布的分布律也可写成P {X =k }=p k q 1-k (k =0,1)(q =1-p ).例2.2 某大学的校乒乓球队与数学系乒乓球队举行对抗赛.校队的实力较系队为强,当一个校队运动员与一个系队运动员比赛时,校队运动员获胜的概率为0.6.现在校、系双方商量对抗赛的方式,提了三种方案: (1)双方各出3人;(2)双方各出5人;(3)双方各出7人.三种方案中均以比赛中得胜人数多的一方为胜利.问:对系队来说,哪一种方案有利?解 设系队得胜人数为X ,则在上述三种方案中,系队胜利的概率为(1) P {X ≥2}=kkk k -=∑3323)6.0()4.0(C ≈0.352;(2) P {X ≥3}=kkk k -=∑5535)6.0()4.0(C ≈0.317;(3) P {X ≥4}=kkk k -=∑7747)6.0()4.0(C ≈0.290.因此第一种方案对系队最为有利.这在直觉上是容易理解的,因为参赛人数越少,系队侥幸获胜的可能性也就越大.例2.3 某一大批产品的合格品率为98%,现随机地从这批产品中抽样20次,每次抽一个产品,问抽得的20个产品中恰好有k 个(k =1,2,…,20)为合格品的概率是多少?解 这是不放回抽样.由于这批产品的总数很大,而抽出的产品的数量相对于产品总数来说又很小,那么取出少许几件可以认为并不影响剩下部分的合格品率,因而可以当作放回抽样来处理,这样做会有一些误差,但误差不大.我们将抽检一个产品看其是否为合格品看成一次试验,显然,抽检20个产品就相当于做20次贝努里试验,以X 记20个产品中合格品的个数,那么X ~b (20,0.98),即P {X =k }=k k k -2020)02.0()98.0(C ,k =1,2,…,20. 若在上例中将参数20改为200或更大,显然此时直接计算该概率就显得相当麻烦.为此我们给出一个当n 很大而p (或1-p )很小时的近似计算公式.定理2.1(泊松(Poisson)定理) 设np n =λ(λ>0是一常数,n 是任意正整数),则对任意一固定的非负整数k ,有e lim (1)!k k k n knn n n C p p k λλ-→∞-=-.证 由p n =λ/n ,有().111121111!)1()(!)1()1(1C kn k kn k kn n kn k n n n n k n n k nn k k n n n p p ---⎪⎭⎫⎝⎛-⎪⎭⎫ ⎝⎛-⋅⎥⎦⎤⎢⎣⎡⎪⎭⎫ ⎝⎛--⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛-⋅=-+--=-λλλλλ对任意固定的k ,当n →∞时,11121111→⎥⎦⎤⎢⎣⎡⎪⎭⎫ ⎝⎛--⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛-⋅n k n n ,11,e 1→⎪⎭⎫ ⎝⎛-→⎪⎭⎫ ⎝⎛---kn n n λλλ故e lim (1).!k kk n knn n n C p p k λλ--→∞-=由于λ=np n 是常数,所以当n 很大时p n 必定很小,因此,上述定理表明当n 很大p 很小时,有以下近似公式,!e )1(C k p p k kn k k nλλ--≈- (2.6)其中λ=np .从表2-5可以直观地看出(2.6)式两端的近似程度.表2-5颇佳,而当n ≥100,np ≤10时效果更好.!e k k λλ-的值有表可查(见本书附表3)二项分布的泊松近似,常常被应用于研究稀有事件(即每次试验中事件A 出现的概率p 很小),当贝努里试验的次数n 很大时,事件A 发生的次数的分布.例2.4 某十字路口有大量汽车通过,假设每辆汽车在这里发生交通事故的概率为0.001,如果每天有5000辆汽车通过这个十字路口,求发生交通事故的汽车数不少于2的概率.解 设X 表示发生交通事故的汽车数,则X ~b (n,p ),此处n =5000,p =0.001,令λ=np =5, P {X ≥2}=1-P {X <2}=1-{}∑==1k k X P=1-(0.999)5000-5(0.999)4999≈1!e 50!e 51550----. 查表可得P {X ≥2}=1-0.00674-0.03369=0.95957.例2.5 某人进行射击,设每次射击的命中率为0.02,独立射击400次,试求至少击中两次的概率.解 将一次射击看成是一次试验.设击中次数为X ,则X ~b (400,0.02),即X 的分布律为P {X =k }=k 400C (0.02)k (0.98)400-k, k =0,1,…,400. 故所求概率为P {X ≥2}=1-p {X =0}-p {X =1}=1-(0.98)400-400(0.02)(0.98)399 =0.9972.这个概率很接近1,我们从两方面来讨论这一结果的实际意义.其一,虽然每次射击的命中率很小(为0.02),但如果射击400次,则击中目标至少两次是几乎可以肯定的.这一事实说明,一个事件尽管在一次试验中发生的概率很小,但只要试验次数很多,而且试验是独立地进行的,那么这一事件的发生几乎是肯定的.这也告诉人们决不能轻视小概率事件.其二,如果在400次射击中,击中目标的次数竟不到两次,由于P {X <2}≈0.003很小,根据实际推断原理,我们将怀疑“每次射击的命中率为0.02”这一假设,即认为该射手射击的命中率达不到0.02.(3)泊松分布若随机变量X 的分布律为P {X =k } =e !k k λλ-,k =0,1,2,…, (2.7)其中λ>0是常数,则称X 服从参数为λ的泊松分布(Poisson distribution ),记为X ~P (λ). 易知(2.7)满足(2.3)、(2.4)两式,事实上,P {X =k }≥0显然;再由∑∞=-0!e k k k λλ=e -λ²e λ=1,可知∑∞==0}{k k X P =1.由泊松定理可知,泊松分布可以作为描述大量试验中稀有事件出现的次数k =0,1,…的概率分布情况的一个数学模型.比如:大量产品中抽样检查时得到的不合格品数;一个集团中生日是元旦的人数;一页中印刷错误出现的数目;数字通讯中传输数字时发生误码的个数等等,都近似服从泊松分布.除此之外,理论与实践都说明,一般说来它也可作为下列随机变量的概率分布的数学模型:在任给一段固定的时间间隔内,① 由某块放射性物质放射出的α质点,到达某个计数器的质点数;② 某地区发生交通事故的次数;③ 来到某公共设施要求给予服务的顾客数(这里的公共设施的意义可以是极为广泛的,诸如售货员、机场跑道、电话交换台、医院等,在机场跑道的例子中,顾客可以相应地想象为飞机).泊松分布是概率论中一种很重要的分布.例2.6 由某商店过去的销售记录知道,某种商品每月的销售数可以用参数λ=5的泊松分布来描述.为了以95%以上的把握保证不脱销,问商店在月底至少应进某种商品多少件?解 设该商店每月销售这种商品数为X ,月底进货为a 件,则当X ≤a 时不脱销,故有P {X ≤a }≥0.95.由于X ~P (5),上式即为∑=-ak kk 05!5e ≥0.95. 查表可知∑=-95!5e k kk ≈0.9319<0.95, ∑=-105!10e k kk ≈0.9682>0.95 于是,这家商店只要在月底进货这种商品10件(假定上个月没有存货),就可以95%以上的把握保证这种商品在下个月不会脱销.下面我们就一般的离散型随机变量讨论其分布函数.设离散型随机变量X 的分布律如表2-1所示.由分布函数的定义可知F (x )=P {X ≤x }=∑∑≤≤==xx kxx kk k px X P }{,此处的∑≤xx k 和式表示对所有满足x k ≤x 的k 求和,形象地讲就是对那些满足x k ≤x 所对应的p k 的累加.例2.7 求例2.1中X 的分布函数F (x ). 解 由例2.1的分布律知 当x <0时,F (x )=P {X ≤x }=0;当0≤x <1时,F (x )=P {X ≤x }=P {X =0}=0.4;当1≤x <2时,F (x )=P {X ≤x }=P ({X =0}∪{X =1})=P {X =0}+P {X =1}=0.4+0.24=0.64; 当2≤x <3时F (x )=P {X ≤x }=P ({X =0}∪{X =1}∪{X =2})=P {X =0}+P {X =1}+P {X =2} =0.4+0.24+0.144 =0.784;当3≤x <4时F (x )=P {X ≤x }=P ({X =0}∪{X =1}∪{X =2}∪{X =3})=0.4+0.24+0.144+0.0864=0.8704;当x ≥4时F (x )=P {X ≤x }=P ({X =0}∪{X =1}∪{X =2}∪{X =3}∪{X =4}) =0.4+0.24+0.144+0.0864+0.1296=1.综上所述F (x )=P {X ≤x }=⎪⎪⎪⎩⎪⎪⎪⎨⎧≥<≤<≤<≤<≤<.4,1,43,8704.0,32,784.0,21,64.0,10,4.0,0,0x x x x x x F (x )的图形是一条阶梯状右连续曲线,在x =0,1,2,3,4处有跳跃,其跳跃高度分别为0.4,0.24,0.144,0.0864,0.1296,这条曲线从左至右依次从F (x )=0逐步升级到F (x )=1.对表2-1所示的一般的分布律,其分布函数F (x )表示一条阶梯状右连续曲线,在X =x k (k =1,2,…)处有跳跃,跳跃的高度恰为p k =P {X =x k },从左至右,由水平直线F (x )=0,分别按阶高p 1,p 2,…升至水平直线F (x )=1.以上是已知分布律求分布函数.反过来,若已知离散型随机变量X 的分布函数F (x ),则X 的分布律也可由分布函数所确定:p k =P {X =x k }=F (x k )-F (x k -0).第三节 连续型随机变量及其分布上一节我们研究了离散型随机变量,这类随机变量的特点是它的可能取值及其相对应的概率能被逐个地列出.这一节我们将要研究的连续型随机变量就不具有这样的性质了.连续型随机变量的特点是它的可能取值连续地充满某个区间甚至整个数轴.例如,测量一个工件长度,因为在理论上说这个长度的值X 可以取区间(0,+∞)上的任何一个值.此外,连续型随机变量取某特定值的概率总是零(关于这点将在以后说明).例如,抽检一个工件其长度X丝毫不差刚好是其固定值(如 1.824cm )的事件{X =1.824}几乎是不可能的,应认为P{X =1.824}=0.因此讨论连续型随机变量在某点的概率是毫无意义的.于是,对于连续型随机变量就不能用对离散型随机变量那样的方法进行研究了.为了说明方便我们先来看一个例子.例2.8 一个半径为2米的圆盘靶,设击中靶上任一同心圆盘上的点的概率与该圆盘的面积成正比,并设射击都能中靶,以X 表示弹着点与圆心的距离,试求随机变量X 的分布函数.解 1°若x <0,因为事件{X ≤x }是不可能事件,所以F (x )=P {X ≤x }=0.2°若0≤x ≤2,由题意P {0≤X ≤x }=kx 2,k 是常数,为了确定k 的值,取x =2,有P {0≤X ≤2}=22k ,但事件{0≤X ≤2}是必然事件,故P {0≤X ≤2}=1,即22k =1,所以k =1/4,即P {0≤X ≤x }=x 2/4.于是F (x )=P {X ≤x }=P {X <0}+P {0≤X ≤x }= x 2/4.3°若x ≥2,由于{X ≤2}是必然事件,于是F (x )=P {X ≤x }=1.综上所述F (x )=⎪⎩⎪⎨⎧≥<≤<,2,1,20,41,0,02x x x x 它的图形是一条连续曲线如图2-2所示.图2-2另外,容易看到本例中X 的分布函数F (x )还可写成如下形式:F (x )=t t f xd )(⎰∞-,其中 f (t )=⎪⎩⎪⎨⎧<<.,0,20,21其他t t这就是说F (x )恰好是非负函数f (t )在区间(-∞,x ]上的积分,这种随机变量X 我们称为连续型随机变量.一般地有如下定义.定义2.3 若对随机变量X 的分布函数F (x ),存在非负函数f (x ),使对于任意实数x 有F (x )=⎰∞-xx t f d )(, (2.8)则称X 为连续型随机变量,其中f (x )称为X 的概率密度函数,简称概率密度或密度函数(Density function).由(2.8)式知道连续型随机变量X 的分布函数F (x )是连续函数.由分布函数的性质F (-∞)=0,F (+∞)=1及F (x )单调不减,知F (x )是一条位于直线y =0与y =1之间的单调不减的连续(但不一定光滑)曲线. 由定义2.3知道,f (x )具有以下性质:1°f (x )≥0;2°⎰+∞∞-x x f d )(=1;3°P {x 1<X ≤x 2}=F (x 2)-F (x 1)=⎰21d )(x x x x f (x 1≤x 2);4°若f (x )在x 点处连续,则有F ′(x )=f (x ).由2°知道,介于曲线y =f (x )与y =0之间的面积为1.由3°知道,X 落在区间(x 1,x 2]的概率P {x 1<X ≤x 2}等于区间(x 1,x 2]上曲线y =f (x )之下的曲边梯形面积.由4°知道,f (x )的连续点x 处有f (x )=.}{)()(lim lim00x x x X x P x x F x x F x x ∆∆+≤<=∆-∆+++→∆→∆这种形式恰与物理学中线密度定义相类似,这也正是为什么称f (x )为概率密度的原因.同样我们也指出,反过来,任一满足以上1°、2°两个性质的函数f (x ),一定可以作为某个连续型随机变量的密度函数.前面我们曾指出对连续型随机变量X 而言它取任一特定值a 的概率为零,即P {X =a }=0,事实上,令Δx >0,设X 的分布函数为F (x ),则由{X =a }⊂{a -Δx <X ≤a },得 0≤P {X =a }≤P {a -Δx <X ≤a }=F (a )-F (a -Δx ). 由于F (x )连续,所以)(lim 0x a F x ∆-→∆=F (a ).当Δx →0时,由夹逼定理得P {X =a }=0,由此很容易推导出P {a ≤X <b }=P {a <X ≤b }=P {a ≤X ≤b }=P {a <X <b }.即在计算连续型随机变量落在某区间上的概率时,可不必区分该区间端点的情况.此外还要说明的是,事件{X =a }“几乎不可能发生”,但并不保证绝不会发生,它是“零概率事件”而不是不可能事件.例2.9 设连续型随机变量X 的分布函数为F (x )=⎪⎩⎪⎨⎧≥<≤<.1,1,10,,0,02x x Ax x 试求:(1)系数A ;(2)X 落在区间(0.3,0.7)内的概率; (3)X 的密度函数.解 (1)由于X 为连续型随机变量,故F (x )是连续函数,因此有1=F (1)=20101lim lim)(Ax x F x x -→-→= =A ,即A =1,于是有F (x )=⎪⎩⎪⎨⎧≥<≤<.1,1,10,,0,02x x x x (2) P {0.3<X <0.7}=F (0.7)-F (0.3)=(0.7)2-(0.3)2=0.4; (3) X 的密度函数为f (x )=F ′(x )=⎩⎨⎧<≤.,0;10,2其他x x由定义2.3知,改变密度函数f (x )在个别点的函数值,不影响分布函数F (x )的取值,因此,并不在乎改变密度函数在个别点上的值(比如在x =0或x =1上f (x )的值).例2.10 设随机变量X 具有密度函数f (x )=⎪⎩⎪⎨⎧≤≤-<≤.,0,43,22,30,其他x x x kx (1) 确定常数k ;(2) 求X 的分布函数F (x );(3) 求P {1<X ≤72}. 解 (1)由⎰∞∞-x x f d )(=1,得x xx kx d )22(d 4330⎰⎰-+=1, 解得k =1/6,故X 的密度函数为f (x )=⎪⎪⎪⎩⎪⎪⎪⎨⎧≤≤-<≤.,0,43,22,30,6其他x x x x(2) 当x <0时,F (x )=P {X ≤x }=⎰∞-xt t f d )( =0; 当0≤x <3时,F (x )=P {X ≤x }=⎰∞-xt t f d )(=⎰⎰∞-+00d )(d )(xt t f t t f =12d 620x t t x=⎰;当3≤x <4时,F (x )=P {X ≤x }=⎰∞-xt t f d )(=0303()()()xf t dt f t dt f t dt -∞++⎰⎰⎰=233(2)23;624x t t x dt dt x +-=-+-⎰⎰当x ≥4时,F (x )=P {X ≤x }=⎰∞-xt t f d )(=⎰⎰⎰⎰∞-+++030434d )(d )(d )(d )(xt t f t t f t t f t t f=t tt t d )22(d 64330⎰⎰-+ =1.即F (x )=⎪⎪⎪⎩⎪⎪⎪⎨⎧≥<≤-+-<≤<.4,1,43,324,30,12,0,022x x x x x x x(3) P {1<X ≤7/2}=F (7/2)-F (1)=41/48.下面介绍三种常见的连续型随机变量. (1)均匀分布若连续型随机变量X 具有概率密度f (x )=⎪⎩⎪⎨⎧<<-.,0,,1其他b x a ab (2.9)则称X 在区间(a ,b )上服从均匀分布(Uniform distribution ),记为X ~U (a ,b ).易知f (x )≥0且⎰⎰∞∞--=ba x ab x x f d 1d )(=1.由(2.9)可得 1°P {X ≥b }=⎰∞bx d 0 =0,P {X ≤a }=⎰∞-ax d 0=0,即 P {a <X <b }=1-P {X ≥b }-P {X ≤a }=1;2°若a ≤c <d ≤b ,则P {c <X <d }=ab c d x a b dc--=-⎰d 1. 因此,在区间(a ,b )上服从均匀分布的随机变量X 的物理意义是:X 以概率1在区间(a ,b )内取值,而以概率0在区间(a ,b )以外取值,并且X 值落入(a ,b )中任一子区间(c ,d )中的概率与子区间的长度成正比,而与子区间的位置无关. 由(2.8)易得X 的分布函数为F (x )=⎪⎩⎪⎨⎧≥<≤--<.,1,,,,0b x b x a a b ax a x (2.10) 密度函数f (x )和分布函数F (x )的图形分别如图2-3和图2-4所示.图2-3 图2-4在数值计算中,由于四舍五入,小数点后第一位小数所引起的误差X ,一般可以看作是一个服从在[-0.5,0.5]上的均匀分布的随机变量;又如在(a ,b )中随机掷质点,则该质点的坐标X 一般也可看作是一个服从在(a ,b )上的均匀分布的随机变量.例2.11 某公共汽车站从上午7时开始,每15分钟来一辆车,如某乘客到达此站的时间是7时到7时30分之间的均匀分布的随机变量,试求他等车少于5分钟的概率.解 设乘客于7时过X 分钟到达车站,由于X 在[0,30]上服从均匀分布,即有f (x )=⎪⎩⎪⎨⎧≤≤.,0,300,301其他x显然,只有乘客在7∶10到7∶15之间或7∶25到7∶30之间到达车站时,他(或她)等车的时间才少于5分钟,因此所求概率为 P {10<X ≤15}+P {25<X ≤30}=⎰⎰+15103025d 301d 301x x =1/3. (2)指数分布若随机变量X 的密度函数为f (x )=⎩⎨⎧≤>-.00,,0,e x x x λλ (2.11) 其中λ>0为常数,则称X 服从参数为λ的指数分布(Exponentially distribution ),记作X ~E (λ).显然f (x )≥0,且x x x f x d e d )(0⎰⎰∞∞-∞-=λλ=1.容易得到X 的分布函数为F (x )=⎩⎨⎧≤>--.00,,0,e 1x x x λ指数分布最常见的一个场合是寿命分布.指数分布具有“无记忆性”,即对于任意s ,t >0,有P {X >s +t |X >s }=P {X >t }. (2.12)如果用X 表示某一元件的寿命,那么上式表明,在已知元件已使用了s 小时的条件下,它还能再使用至少t 小时的概率,与从开始使用时算起它至少能使用t 小时的概率相等.这就是说元件对它已使用过s 小时没有记忆.当然,指数分布描述的是无老化时的寿命分布,但“无老化”是不可能的,因而只是一种近似.对一些寿命长的元件,在初期阶段老化现象很小,在这一阶段,指数分布比较确切地描述了其寿命分布情况.(2.12)式是容易证明的.事实上,(){,}{}{}{}{}1()e e {}.1()es t t λs P X s X s t P X s t P X s t X s P X s P X s F s t P X t F s λλ-+->>+>+>+>==>>-+====>--(3)正态分布若连续型随机变量X 的概率密度为f (x )=222)(e π21σμσ--x , -∞<x <+∞, (2.13)其中μ,σ(σ>0)为常数,则称X 服从参数为μ,σ的正态分布(Normal distribution ),记为X ~N (μ,σ2).显然f (x )≥0,下面来证明⎰∞∞-x x f d )(=1.令σux -=t ,得到.d eπ21d e π2122)(222t x t x ⎰⎰∞∞--∞∞---=σμσ记I =t t d e22⎰∞∞--,则有I 2=⎰⎰∞∞-∞∞-+-ds d e222t s t .作极坐标变换:s =r cos θ,t =r sin θ,得到I 2=22π22r redrd πθ∞--∞=⎰⎰,而I >0,故有I,即有.π2d e 22=⎰∞∞--t t于是.1π2π21d e 21222)(=⋅=--∞∞-⎰x x σμσπ 正态分布是概率论和数理统计中最重要的分布之一.在实际问题中大量的随机变量服从或近似服从正态分布.只要某一个随机变量受到许多相互独立随机因素的影响,而每个个别因素的影响都不能起决定性作用,那么就可以断定随机变量服从或近似服从正态分布.例如,因人的身高、体重受到种族、饮食习惯、地域、运动等等因素影响,但这些因素又不能对身高、体重起决定性作用,所以我们可以认为身高、体重服从或近似服从正态分布.参数μ,σ的意义将在第四章中说明.f (x )的图形如图2-5所示,它具有如下性质:图2-5 图2-61°曲线关于x =μ对称;2°曲线在x =μ处取到最大值,x 离μ越远,f (x )值越小.这表明对于同样长度的区间,当区间离μ越远,X 落在这个区间上的概率越小;3°曲线在μ±σ处有拐点; 4°曲线以x 轴为渐近线;5°若固定μ,当σ越小时图形越尖陡(图2-6),因而X 落在μ附近的概率越大;若固定σ,μ值改变,则图形沿x 轴平移,而不改变其形状.故称σ为精度参数,μ为位置参数. 由(2.13)式得X 的分布函数F (x )=t xt d eπ21-2)(22⎰∞--σμσ. (2.14)特别地,当μ=0,σ=1时,称X 服从标准正态分布N (0,1),其概率密度和分布函数分别用)(x ϕ,Φ(x )表示,即有22e π21)(x x -=ϕ, (2.15)Φ(x )=t x t d e π2122⎰∞--. (2.16) 易知,Φ(-x )=1-Φ(x ).人们已事先编制了Φ(x )的函数值表(见本书附录).一般地,若X ~N (μ,σ2),则有σμ-X ~N (0,1).事实上,Z =σμ-X 的分布函数为 P {Z ≤x }=}{x X P ≤-σμ=P {X ≤μ+σx }=t t xd e π21222)(σμσμσ--+∞-⎰,令σμ-t =s ,得P {Z ≤x }=s xs d e π2122⎰∞--=Φ(x ),由此知Z =σμ-X ~N (0,1).因此,若X ~N (μ,σ2),则可利用标准正态分布函数Φ(x ),通过查表求得X 落在任一区间(x 1,x 2]内的概率,即P {x 1<X ≤x 2}=⎭⎬⎫⎩⎨⎧-≤-<-σμσμσμ21x X x P=⎭⎬⎫⎩⎨⎧-≤--⎭⎬⎫⎩⎨⎧-≤-σμσμσμσμ12x X P x X P =⎪⎭⎫⎝⎛-Φ-⎪⎭⎫⎝⎛-Φσμσμ12x x .例如,设X ~N (1.5,4),可得P {-1≤X ≤2}=⎭⎬⎫⎩⎨⎧-≤-≤--25.1225.125.11X P =Φ(0.25)-Φ(-1.25)=Φ(0.25)-[1-Φ(1.25)]=0.5987-1+0.8944=0.4931.设X ~N (μ,σ2),由Φ(x )函数表可得P {μ-σ<X <μ+σ}=Φ(1)-Φ(-1)=2Φ(1)-1=0.6826,P {μ-2σ<X <μ+2σ}=Φ(2)-Φ(-2)=0.9544, P {μ-3σ<X <μ+3σ}=Φ(3)-Φ(-3)=0.9974.我们看到,尽管正态变量的取值范围是(-∞,∞),但它的值落在(μ-3σ,μ+3σ)内几乎是肯定的事,因此在实际问题中,基本上可以认为有|X -μ|<3σ.这就是人们所说的“3σ原则”.例2.12 公共汽车车门的高度是按成年男子与车门顶碰头的机会在1%以下来设计的.设男子身高X 服从μ=170(cm),σ=6(cm)的正态分布,即X ~N (170,62),问车门高度应如何确定?解 设车门高度为h (cm),按设计要求P {X ≥h }≤0.01或P {X <h }≥0.99,因为X ~N (170,62),故P {X <h }=⎪⎭⎫⎝⎛-Φ=⎭⎬⎫⎩⎨⎧-<-617061706170h h X P ≥0.99, 查表得 Φ(2.33)=0.9901>0.99.故取6170-h =2.33,即h =184.设计车门高度为184(cm )时,可使成年男子与车门碰头的机会不超过1%.例2.13 测量到某一目标的距离时发生的随机误差X (单位:米)具有密度函数f (x )=3200)20(2eπ2401--x .试求在三次测量中至少有一次误差的绝对值不超过30米的概率.解 X 的密度函数为f (x )=22402)20(3200)20(eπ2401eπ2401⨯----⨯=x x ,即X ~N (20,402),故一次测量中随机误差的绝对值不超过30米的概率为P {|X |≤30}=P {-30≤X ≤30}=⎪⎭⎫⎝⎛--Φ-⎪⎭⎫⎝⎛-Φ402030402030=Φ(0.25)-Φ(-1.25)=0.5981-(1-0.8944)=0.4931.设Y 为三次测量中误差的绝对值不超过30米的次数,则Y 服从二项分布b (3,0.4931),故P {Y ≥1}=1-P {Y =0}=1-(0.5069)3=0.8698.为了便于今后应用,对于标准正态变量,我们引入了α分位点的定义. 设X ~N (0,1),若z α满足条件P {X >z α}=α,0<α<1, (2.17)则称点z α为标准正态分布的上α分位点,例如,由查表可得z 0.05=1.645,z 0.001=3.16.故1.645与3.16分别是标准正态分布的上0.05分位点与上0.001分位点.第四节 随机变量函数的分布我们常常遇到一些随机变量,它们的分布往往难于直接得到(如测量轴承滚珠体积值Y 等),但是与它们有函数关系的另一些随机变量,其分布却是容易知道的(如滚珠直径测量值X ).因此,要研究随机变量之间的函数关系,从而通过这种关系由已知的随机变量的分布求出与其有函数关系的另一个随机变量的分布.例2.14 设随机变量X 具有表2-6所示的分布律,试求X 2的分布律.表2-6“X 2=2.25”,“X 2=9”等价,所以P {X 2=0}=P {X =0}=0.1, P {X 2=2.25}=P {X =1.5}=0.3, P {X 2=9}=P {X=3}=0.1.事件“X 2=1”是两个互斥事件“X =-1”及“X =1”的和,其概率为这两事件概率和,即P {X 2=1}=P {X =-1}+P {X =+1}=0.2+0.3=0.5.于是得X 2的分布律如表2-7所示.表2-7 例2.15 设连续型随机变量X 具有概率密度f X (x ),-∞<x <+∞,求Y =g (X )=X 的概率密度.解 先求Y 的分布函数F Y (y ),由于Y =g (X )=X 2≥0,故当y ≤0时事件“Y ≤y ”的概率为0,即F Y (y )=P {Y ≤y }=0,当y >0时,有F Y (y )=P {Y ≤y }=P {X 2≤y }=P {-y ≤X ≤y }=x x f yyX d )(⎰-.将F Y (y )关于y 求导,即得Y 的概率密度为f Y (y )=()()[]⎪⎩⎪⎨⎧≤>-+.0,0,0,21y y y f y f yXX例如,当X ~N (0,1),其概率密度为(2.15)式,则Y =X 2的概率密度为f Y (y )=⎪⎩⎪⎨⎧≤>--.0,0,0,e π21221y y y y此时称Y 服从自由度为1的χ2分布.上例中关键的一步在于将事件“Y ≤y ”由其等价事件“-y ≤X ≤y ”代替,即将事件“Y ≤y ”转换为有关X 的范围所表示的等价事件,下面我们仅对Y =g (X ),其中g (x )为严格单调函数,写出一般结论.定理2.2 设随机变量X 具有概率密度f X (x ),-∞<x <+∞,又设函数g (x )处处可导且g ′(x )>0(或g ′(x )<0),则Y =g (X )是连续型随机变量,其概率密度为f Y (y )=⎩⎨⎧<<'.,0,)()]([其他βαx y h y h f X (2.18)其中α=min (g (-∞),g (+∞)),β=max (g (-∞),g (+∞)),h (y )是g (x )的反函数.我们只证g ′(x )>0的情况.由于g ′(x )>0,故g (x )在(-∞,+∞)上严格单调递增,它的反函数h (y )存在,且在(α,β)严格单调递增且可导.我们先求Y 的分布函数F Y (y ),并通过对F Y (y )求导求出f Y (y ).由于Y =g (X )在(α,β)上取值,故 当y ≤α时,F Y (y )=P {Y ≤y }=0; 当y ≥β时,F Y (y )=P {Y ≤y }=1; 当α<y <β时,F Y (y )=P {Y ≤y }=P {g (X )≤y }=P {X ≤h (y )}=⎰∞-)(d )(x h X x x f .于是得概率密度f Y (y )=[()](),,0,X f h y h y x .αβ'<<⎧⎨⎩其他对于g ′(x )<0的情况可以同样证明,即f Y (y )=[()][()],,0,fX h y h y x .αβ'<<⎧⎨⎩其他将上面两种情况合并得f Y (y )=(())(),,0,fX h y h y x .αβ'⎧<<⎨⎩其他注:若f (x )在[a ,b ]之外为零,则只需假设在(a ,b )上恒有g ′(x )>0(或恒有g ′(x )<0),此时α=min{g (a ),g (b )},β=max{g (a ),g (b )}.例2.16 设随机变量X ~N (μ,σ2).试证明X 的线性函数Y =aX +b (a ≠0)也服从正态分布.证 设X 的概率密度f X (x )=,21222)(σμ--x e π-∞<x <+∞.再令y =g (x )=ax +b ,得g (x )的反函数x =h (y )=y ba-. 所以h ′(y )=1/a .由(2.18)式Y =g (X )=aX +b 的概率密度为f Y (y )=⎪⎭⎫ ⎝⎛-a b y f a X 1, -∞<y <+∞, 即。
概率论与数理统计-第二章-随机变量及其分布函数ppt课件
表格: X
x1 x2
pk
p1 p2
概率分布图:
1P
xn
pn
0.5
x4 x3
x1
x2
X
.
由概率的性质易知离散型随机变量的分布列
pk
满足下列特征性质:
k 1
① pk 0(k 1,2,) [非负性]
②
pk 1 [规范性]用于确定待定参数
k 1
③ F( x) P( X x) P(X xi ). xi x
1. 2
.
【例2】设随机变量X的分布函数为
aex b, x 0
F(x)
0,
x0
解: 因为 F(x) 在 x=0 点右连续
求: 常数 a 和 b。
所以 lim F ( x) lim (ae x b) a b 0
x0
x0
又因为 F () lim (ae x b) b 1 x
1、两点分布 或(0 - 1)分布
two-point distribution
定义1 设离散型随机变量X的分布列为
X0 1 pk 1 p p
其中 0<p<1
则称 X 服从(0 - 1)分布,记作 X ~(0 - 1)分布
F(x)
(0 - 1)分布的分布函数
0 , x0 F ( x) 1 p, 0 x 1
X = “三次试验中 A 发生的次数”,
{ X 2} A1A2 A3 A1A2 A3 A1A2 A3 P{X 2} P(A1A2 A3 A1A2 A3 A1A2 A3 )
P(A1A2 A3 ) P(A1A2 A3 ) P(A1A2A3 ) P(A1)P(A2)P(A3) P(A1)P(A2)P(A3) P(A1)P(A2 )P(A3 ) C32 p2(1 p)32
【精品】概率论与数理统计PPT课件第二章 随机变量及其分布
离散型随机变量的定义 定义 2.1
如果随机变量 X 只取有限个值
x1 , x2 , , xn
或可列个值
x1 , x2 ,
则称 X 是离散型随机变量,简称为离散随机 变量
22
离散型随机变量的概率分布 定义 2.2
设X 是离散型随机变量,称
为X 的概率分布; 称 pk 是概率分布列,
34 16 16
7 16
P0.5 X 3 PX 1 PX 2
31 16 16
4
16
29
例4 设随机变量 X 的分布列为
PX
n
c
1 4
n
试求常数c
n 1, 2, L
解: 由分布列的性质,得
该级数为等比级数,故有
1
32
例5 (续) 以 p = 1/2 代入,得
X0
1
2
3
4
pk 0.5 0.25 0.125 0.0625 0.0625
33
二. 几种常用的离散型随机变量
1.两点分布 (Bernoulli分布) 如果X 只取 0或 1,概率分布是
或
则称随机变量 X 服从参数为 p的两点分布
记作
34
两点分布的概率背景 任何一次试验,当只考虑两个互逆的结果
即
对于实数的集合A,我们用 X A
表示事件
X A
即
12
说明 4、 在许多实际问题中, 一个随机变量X 的 含义是十分清楚的, 所以一般不再关心随机变 量X 在样本空间上是如何定义的. 可以认为X 的所有取值就是我们的样本空间. 只是在必要
浙江大学《概率论与数理统计》第2章
6
概率分布
写出所有可能取值 写出取每个可能取值相应的概率
例:若随机变量X的概率分布律为
P(X k) ck ,k 0,1, 2,, 0
k!
求常数c.
8
解:
1 P{X k}
k 0
k
c
ce
k0 k !
c e
例:某人骑自行车从学校到火车站, 一路上要经过3个独立的交通灯,设各 灯工作独立,且设各灯为红灯的概率 为p,0<p<1,以X表示首次停车时所通 过的交通灯数,求X的概率分布律。
P(X 3) 1 P(X 2) 0.875347981
37
超几何分布
若随机变量X的概率分布律为
P( X
k)
Cak
C nk b
CNn
,k
l1, l1
1, ..., l2 ,
其中,l1 max(0, n b), l2 min(a, n).
称X服从超几何分布
例:一袋中有a个白球,b个红球,a+b=N, 从中不放回地取n个球,设每次取到各球的 概率相等,以X表示取到的白球数,则X服从 超几何分布。
39
几何分布
若随机变量X的概率分布律为
P( X k) p(1 p)k1, k 1, 2,3,..., 0 p 1.
称X服从参数p的几何分布
例:从生产线上随机抽产品进行检测,设 产品的次品率为p,0<p<1,若查到一只次 品就得停机检修,设停机时已检测到X只产 品,则X服从参数p的几何分布。
np
事实上,Cnk pk
1 p
nk
k
n! !(n
k)!
n
k
1
n
nk
k
概率论与数理统计第二章课件PPT
例2 某类灯泡使用时数在1000小时以上 的概率是0.2,求三个灯泡在使用1000 小时以后最多只有一个坏了的概率.
解: 设X为三个灯泡在使用1000小时已坏的灯泡数 .
X ~ B (3, 0.8),
P( X k)C (0.8) (0.2) , k 0,1,2,3
k 3 k
3k
P{X 1} =P{X=0}+P{X=1} =(0.2)3+3(0.8)(0.2)2
X
p
1
0
1
2
3 0.1
a b 0.2 0.3
求a,b满足什么条件。
a b 0.4, a 0, b 0
一旦知道一个离散型随机变量X的分布律后,我们便可求得X
所生成的任何事件的概率。特别地,对任意 a ,有 b
P a X b P X x P X x i i a x b a x b 1 1 pk
解
用泊松定理 取 =np=(400)(0.02)=8, 故 近似地有 P{X2}=1- P{X=0}-P {X=1}
=1-(1+8)e-8=0.996981.
泊松分布(Poisson distribution)
定义2 设随机变量X的可能取值为0,1,2,…,n,…,而X 的分布律为
pk P X k
路口1
路口2
路口3
X表示该汽车首次遇到红灯前已通过的路口的个数
路口1
路口2
路口3
1 1 1 P(X=3)= P( A1 A2 A3 ) =1/8 2 2 2
即
X
p
0
1
2
3
1 2
1 4
概率论与数理统计 第二章随机变量及其分布剖析PPT课件
射手射击击中目标.
这种对应关系在数学上表现为一种实值函数.
w.
X(w) R
对于试验的每一个样本点w,都对应着一个实数 X(w),而X(w)是随着实验结果不同而变化的一个 变量。
机
随机变量的定义
设 随 机 实 验 E的 样 本 空 间 , 若 对 每 一 个 样 本 点
, 都 有 唯 一 的 实 数 X()与 之 对 应 ,则 称 X()为 随 机 变 量 , 简 记 为 X.
P (X k ) ( 1 p )k 1 p , (k 1 ,2 , )
则称随机变量X服从以p为参数的几何分布,
记作
X ~G(p) 。
超几何分布
设N个元素分为两类,有M个属于第一类,N-M
个属于第二类。现在从中不重复抽取n个,其 中包含的第一类元素的个数X的分布律为
P(Xk)CM kC C N n N n kM, (k0,1, ,l) 其中l=min{M,n}, 则称随机变量X服从参数为 的超几何分布,记作 X~H(N,M,n)
由泊松定理,n重贝努里试验中稀有事件 出现的次数近似地服从泊松分布.
例5. 某车间有5台车床,由于种种原因(由 于装、卸工作等),时常需要停车.设各 台车床的停车或开车是相互独立的. 若车床在任一时刻处于停车状态的 概率是1/3,求车间中恰有一台车床处 于停车状态的概率。
解:X:处于停车状态的车床数
密度函数 f (x)在某点处a的高度,并不反映 X取值的概率. 但是,这个高度越大,则X 取a附近的值的概率就越大. 也可以说,在 某点密度曲线的高度反映了概率集中在该 点附近的程度.
f (x)
o
x
例1 :某型号电子管的寿命X(小时)的概率密度为
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对一个随机变量X,若给出了以上两条,我们 就说给出了随机变量X的概率分布(也称分布律)。
这一章我们的中心任务是学习离散型随机变量 与连续型随机变量的概率分布.
§2 离散型随机变量及其分布
例如:上例中,事件“正面出现两次”可表示为:“X=2” ;
事件“正面至少出现一次”可表示为:“X≥1”; “0<X≤2”表示事件“正面至少出现一次”。
(3)随机变量的特点: 具有随机性:在一次试验之前不知道它取哪一个 值,但事先知道它全部可能的取值。
随机变量的取值具有一定的概率:
例如:上例中P(X=2)=1/4; P(X≥1)=3/4;
解:在此试验中,所有可能的结果有: e1=(正,正);e2=(正,反); e3=(反,正) ;e4=(反,反)。
于是,正面出现的次数X ”的分布律:
X0 1 2
pk 1/4 2/4 1/4
图形表示
程序
x=[0, 1, 2];
pk=[1/4,2/4,1/4];
figure('color','w')
P(0<X ≤2)=3/4;
(4)随机变量的类型: 离散型与连续型随机变量。 这两种类型的随机变量因其取值方式的不同各
有特点,学习时注意它们各自的特点及描述方式 的不同。
例1(用随机变量的取值表示随机事件)一报童 卖报,每份报0.50元, 其成本为0.30元。 报馆每天给 报童1000份报纸,并规定卖不出的报纸不得退回。
令X=“正面出现的次数”,则X是一个随着试 验结果不同而取值不同的量,其对应关系如下:
基本结果(e) 正面出现的次数X(e)
e1=(正,正)
2
e2=(正,反)
1
e3=(反,正)
1
e4=(反,反)
0
由上可知,对每一个样本点e,都有一个X的取值X(e)
与之对应。我们把X称为定义在这个试验上的随机变量。
text(x(1),pk(1), num2str(pk(1)),'FontSize',21); text(x(3),pk(3), num2str(pk(3)),'FontSize',21);
text(x(2),pk(2), num2str(pk(2)),'FontSize',21);
text(x(3),pk(3), num2str(pk(3)),'FontSize',21); ቤተ መጻሕፍቲ ባይዱigure('color','w')
figure('color','w')
stem(x,pk,'r.','MarkerSize',31)
plot(x,pk,'r.','MarkerSize',31) hold on plot(x,pk,'r-.') ylim([0 0.6]) hold off
ylim([0 0.6]) xlim([0,2.3]) text(x(1),pk(1), num2str(pk(1)),'FontSize',21); text(x(2),pk(2), num2str(pk(2)),'FontSize',21); text(x(3),pk(3), num2str(pk(3)),'FontSize',21);
第二章 随机变量及其分布
关键词: 随机变量 概率分布函数 离散型随机变量 连续型随机变量 随机变量的函数
第一节 随 机 变 量
在上一章中,我们把随机事件看作样本空间 的子集;这一章里我们将引入随机变量的概念, 用随机变量的取值来描述随机事件。
一、随机变量 引例:
E1: 将一枚硬币连掷两次,观察正反面出现的情况。
figure('color','w')
bar(x,pk,0.1,'r')
plot(x,pk,'r.','MarkerSize',31) ylim([0 0.6]) xlim([0,2.3])
ylim([0 0.6]) text(x(1),pk(1), num2str(pk(1)),'FontSize',21); xlim([0,2.3]) text(x(2),pk(2), num2str(pk(2)),'FontSize',21);
令X=“报童每天卖出的报纸份数” 试将“报童赔钱”这一事件用X的取值表 示出来。
解:分析
{报童赔钱}
{卖出报纸的钱不够成本}
当 0.50 X<1000× 0.3时,报童赔钱.
故{报童赔钱} {X 600}
3、随机变量的概率分布 对于一个随机试验,我们关心下列两件事情: (1)试验会发生一些什么事件? (2)每个事件发生的概率是多大?
E2:掷一枚骰子,观察出现的点数. 令X=“正面出现的点数”
E3:某产品的使用寿命X,X>=0.
E4:掷一枚质地均匀的硬币,观察正反面出现的 情况.
令X
1, 0,
正面 反面
一般地,对每一个随机试验,我们都可以引入 一个变量X,使得试验的每一个样本点都有一个X 的取值X(e)与之对应,这样就得到随机变量的概念.
1、随机变量的定义:
设E是一个随机试验,其样本空间为S={e},在E 上引入一个变量X,如果对S中每一个样本点e,都 有一个X的取值X(e)与之对应,我们就称X为定义 在随机试验E的一个随机变量.
2、随机变量的说明 (1)随机变量的表示:常用字母X,Y,Z,….表示; (2)引入随机变量的目的: 用随机变量的取值范围表示随机事件,利用高等数 学的工具研究随机现象。
P( X xk ) pk k 1,2,3, (1)
称 (1) 式为离散型随机变量X的分布律. 注:离散型随机变量X的分布律可用公式法和表格 法描述。
1)公式法: P( X xk ) pk k 1,2,3,
2) 表格法:
X x1 x2 pk p1 p2
例1:将一枚硬币连掷两次,求“正面出现的次 数X ”的分布律。
一、离散型随机变量的定义及其分布律
1.离散型随机变量的定义 如果随机变量X所有可能的取值是有限个或无 穷可列个,则称X为离散型随机变量。
2.离散型随机变量的分布律
要掌握一个离散型随机变量的分布律,必须 且只需知道以下两点:
(1) X所有可能的取值: X x1, x2 ,, xk , (2)X取每个值时的概率: P( X xk ) pk , k 1,2,3,