第2章随机变量及其分布【概率统计精品讲义】

合集下载

概率论与数理统计ch2随机变量及其概率分布精品PPT课件

概率论与数理统计ch2随机变量及其概率分布精品PPT课件
P( X 3) P( A1A2 A 3) (1 p)3 ;
10
X0
1
2
3
p p p(1-p) (1-p)2p (1-p)3
11
例:若随机变量X的概率分布律为
P( X k ) c k ,k 0,1, 2,, 0
k!
求常数c.
12
解:
1 P{X k}
k 0
k
c
ce
k0 k !
求(1)随机观察1个单位时间,至少有3人候车 的概率; (2)随机独立观察5个单位时间,恰有4个单 位时间至少有3人候车的概率。
29
解:1 P(X 3) 1 P( X 0) P( X 1) P(X 2)
1 e 4.8 (1 4.8 4.82 ) 0.8580 2!
2 设5个单位时间内有Y个单位时间是
15
对于一个随机试验,如果它的样本空间只
包含两个元素,即 S {e1, e2} ,我们总能
在S上定义一个服从(0-1)分布的随机
变量。
0, X X (e) 1,
当e e1, 当e e2.
来描述这个随机试验的结果。
检查产品的质量是否合格,对新生婴儿 的性别进行登记,检验种子是否发芽以 及前面多次讨论过的“抛硬币”试验都 可以用(0-1)分布的随机变量来描述 。
P A 1 2
如果是不放回抽样呢?
21
设A在n重贝努利试验中发生X次,则
P( X k) Cnk pk (1 p)nk,k 0,1,,n
并称X服从参数为p的二项分布,记
X ~ B(n,p)
n
注:1 ( p q)n Cnk pk qnk 其中q 1 p k 0
22
推导:以n=3为例,设Ai={ 第i次A发生 }

概率论与数理统计 第二章 随机变量及其分布

概率论与数理统计 第二章 随机变量及其分布
X~P{X=k}= k e ,
其中 (0) k!
k=0, 1, 2,···
则称r.v.X服从参数为的泊松分布。记为: X ~ ()
例4: 某信息服务台在一分钟内接到的问讯次数X服从 参数为的泊松分布,已知任一分钟内无问讯的概率为 e-6,求在指定的一分钟内至少有2次问讯的概率。
解: X ~ ( ),且PX 0 e6 即 e e6 6
件{X=5年}的概率为多少呢?
描述非离散随机变量统计特征,我们讨论它落在 某区间的概率。
这相当于,只要知道,对任意实数x,事件{Xx}的概率.
Q {a X b} {X b}{X a}
§3 随机变量的分布函数(P31)
定义
(P31) 设X是随机变量,x是任意实数,函数 F(x)=P{Xx}称为随机变量X的分布函数。
P{c X d}= d f (x)dx= d 1 dx=d c
c
c ba ba
这说明X落在(a, b)中任一区间的概率只与该区间的长度成正 比,而与该区间的位置无关,这就是均匀分布的概率意义。
例2.长途汽车起点站于每时的10分、25分、55分发车
,设乘客不知发车时间,于每小时的任意时刻随机地到
0
0, x 0 F (x)=P( X x)=x, 0 x 1
1, x 1
§4 连续型随机变量及其概率密度(P34)
一、概率密度(P34)
1. 定义 对于随机变量X,若存在非负函数 f(x),(-<x<+),使对任意实数x,都有
F (x)=P( X x)= x f (u)du
则称X为连续型随机变量, f(x)为X的概率密度 函数,简称概率密度或密度函数. 常记为:
X
x
R

高中数学 第2章 概率 2.1 随机变量及其概率分布讲义 苏教版选修2-3-苏教版高二选修2-3数学

高中数学 第2章 概率 2.1 随机变量及其概率分布讲义 苏教版选修2-3-苏教版高二选修2-3数学

2.1 随机变量及其概率分布学习目标核心素养1.了解取有限值的离散型随机变量及其分布列的概念,了解分布列刻画随机现象的重要性,会求某些简单离散型随机变量的分布列.(重点、难点)2.掌握离散型随机变量分布列的性质,掌握两点分布的特征.(重点)1.通过对离散型随机变量的学习,提升数学抽象素养.2.借助随机变量的分布列,提升逻辑推理素养.1.随机变量如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量.通常用大写拉丁字母X,Y,Z(或小写希腊字母ξ,η,ζ)等表示.思考1:随机变量是自变量吗?[提示] 不是,它是随试验结果变化而变化的,不是主动变化的.思考2:离散型随机变量的取值必须是有限个吗?[提示] 不一定.离散型随机变量的取值可以一一列举出来,所取值可以是有限个,也可以是无限个.2.概率分布列假定随机变量X有n个不同的取值,它们分别是x1,x2,…,x n,且P(X=x i)=p i,i=1,2,…,n,①则称①为随机变量X的概率分布列,简称为X的分布列.称表X x1x2…x nP p1p2…p np i(i =1,2,…,n)满足条件:①p i≥0(i=1,2,…,n);②p1+p2+…+p n=1.思考3:在离散型随机变量分布列中,每一个可能值对应的概率可以为任意的实数吗?[提示] 错误.每一个可能值对应的概率为[0,1]中的实数.思考4:离散型随机变量的分布列中,各个概率之和可以小于1吗?[提示] 不可以.由离散型随机变量的含义与分布列的性质可知不可以.思考5:离散型随机变量的各个可能值表示的事件是彼此互斥的吗?[提示] 是.离散型随机变量的各个可能值表示的事件不会同时发生,是彼此互斥的.3.两点分布如果随机变量X的分布表为X 10P p q其中0<p<1,q=1-p,这一类分布称为0­1分布或两点分布,并记为X~0­1分布或X~两点分布.1.掷均匀硬币一次,随机变量为( )A.掷硬币的次数B.出现正面向上的次数C.出现正面向上的次数或反面向上的次数D.出现正面向上的次数与反面向上的次数之和B[掷一枚硬币,可能出现的结果是正面向上或反面向上,以一个标准如正面向上的次数来描述这一随机试验,那么正面向上的次数就是随机变量ξ,ξ的取值是0,1.A项中,掷硬币的次数就是1,不是随机变量;C项中的标准模糊不清;D项中,出现正面向上的次数和反面向上的次数的概率的和必是1,对应的是必然事件,所以不是随机变量.] 2.设离散型随机变量ξ的分布列如下:ξ-1012 3P 0.100.200.100.200.40 Pξ0.40 [P(ξ<1.5)=P(ξ=-1)+P(ξ=0)+P(ξ=1)=0.10+0.20+0.10=0.40.] 3.设某项试验的成功率是失败率的2倍,用随机变量X描述一次试验成功与否(记X=0为试验失败,记X=1为试验成功),则P(X=0)等于________.1 3[设试验失败的概率为p,则2p+p=1,∴p=13.]随机变量的概念【例1】(1)国际机场候机厅中2019年5月1日的旅客数量;(2)2019年1月1日至5月1日期间所查酒驾的人数;(3)2019年6月1日某某到的某次列车到站的时间;(4)体积为1 000 cm3的球的半径长.[思路探究] 利用随机变量的定义判断.[解] (1)旅客人数可能是0,1,2,…,出现哪一个结果是随机的,因此是随机变量.(2)所查酒驾的人数可能是0,1,2,…,出现哪一个结果是随机的,因此是随机变量.(3)列车到达的时间可在某一区间内任取一值,是随机的,因此是随机变量.(4)球的体积为1 000 cm3时,球的半径为定值,不是随机变量.随机变量的辨析方法(1)随机试验的结果具有可变性,即每次试验对应的结果不尽相同.(2)随机试验的结果具有确定性,即每次试验总是恰好出现这些结果中的一个,但在一次试验之前却不能肯定这次试验会出现哪一个结果.如果一个随机试验的结果对应的变量具有以上两点,则该变量即为随机变量.1.(1)下列变量中,是随机变量的是________.(填上所有正确的序号)①某人掷硬币1次,正面向上的次数;②某音乐歌曲《小苹果》每天被点播的次数;③标准大气压下冰水混合物的温度;④你每天早晨起床的时间.(2)一个口袋中装有10个红球,5个白球,从中任取4个球,其中所含红球的个数为X,则X的可能取值构成集合________.事件{X=k}表示取出________个红球,________个白球,k=0,1,2,3,4.(1)①②④(2){0,1,2,3,4} k4-k[(1)①②④中每个事件的发生是随机的,具有可变性,故①②④是随机变量;标准大气压下冰水混合物的温度为0 ℃,是必然的,不具有随机性.(2)由题意可知,X的可能取值为0,1,2,3,4.{X=k}表示取出的4个球中含k个红球,4-k个白球.]随机变量的分布列及应用【例2】ξ表示取出的3只球中的最大,写出随机变量ξ的概率分布.[思路探究] 由本例中的取球方式可知,随机变量ξ与球的顺序无关,其中球上的最大只有可能是3,4,5,可以利用组合的方法计算其概率.[解] 随机变量ξ的可能取值为3,4,5.当ξ=3时,即取出的三只球中最大为3,则其他两只球的编号只能是1,2,故有P(ξ=3)=C22C35=110;当ξ=4时,即取出的三只球中最大为4,则其他两只球只能在编号为1,2,3的3只球中取2只,故有P(ξ=4)=C23C35=310;当ξ=5时,即取出的三只球中最大为5,则其他两只球只能在编号为1,2,3,4的4只球中取2只,故有P(ξ=5)=C24C35=610=35.因此,ξ的分布列为ξ34 5P11031035利用分布列及其性质解题时要注意以下两个问题:(1)X的各个取值表示的事件是互斥的.(2)不仅要注意∑i=1np i=1,而且要注意p i≥0,i=1,2,…,n.2.设随机变量ξ的概率分布为P⎝⎛⎭⎪⎫ξ=k5=ak(k=1,2,3,4,5).求:(1)常数a的值;(2)P ⎝ ⎛⎭⎪⎫ξ≥35; (3)P ⎝ ⎛⎭⎪⎫110<ξ<710.[解] 题目所给的ξ的概率分布表为ξ 15 25 35 45 55 Pa2a3a4a5a(1)由a +2a +3a +4a +5a =1,得a =15.(2)P ⎝ ⎛⎭⎪⎫ξ≥35=P ⎝ ⎛⎭⎪⎫ξ=35+P ⎝ ⎛⎭⎪⎫ξ=45+P ⎝ ⎛⎭⎪⎫ξ=55=315+415+515=45或P ⎝⎛⎭⎪⎫ξ≥35=1-P ⎝⎛⎭⎪⎫ξ≤25=1-⎝ ⎛⎭⎪⎫115+215=45.(3)因为110<ξ<710,所以ξ=15,25,35.故P ⎝ ⎛⎭⎪⎫110<ξ<710=P ⎝ ⎛⎭⎪⎫ξ=15+P ⎝ ⎛⎭⎪⎫ξ=25+P ⎝ ⎛⎭⎪⎫ξ=35=a +2a +3a =6a =6×115=25.随机变量的可能取值及试验结果[1.抛掷一枚质地均匀的硬币,可能出现正面向上、反面向上两种结果.这种试验结果能用数字表示吗?[提示] 可以.用数字1和0分别表示正面向上和反面向上.2.在一块地里种10棵树苗,设成活的树苗数为X ,则X 可取哪些数字? [提示] X =0,1,2,3,4,5,6,7,8,9,10.3.抛掷一枚质地均匀的骰子,出现向上的点数为ξ,则“ξ≥4”表示的随机事件是什么?[提示] “ξ≥4”表示出现的点数为4点,5点,6点.【例3】 写出下列随机变量可能取的值,并说明随机变量所取的值和所表示的随机试验的结果.(1)袋中有大小相同的红球10个,白球5个,从袋中每次任取1个球,直到取出的球是白球为止,所需要的取球次数;(2)从标有1,2,3,4,5,6的6X卡片中任取2X,所取卡片上的数字之和.[思路探究] 分析题意→写出X可能取的值→分别写出取值所表示的结果[解] (1)设所需的取球次数为X,则X=1,2,3,4,…,10,11,X=i表示前i-1次取到红球,第i次取到白球,这里i=1,2, (11)(2)设所取卡片上的数字和为X,则X=3,4,5, (11)X=3,表示“取出标有1,2的两X卡片”;X=4,表示“取出标有1,3的两X卡片”;X=5,表示“取出标有2,3或标有1,4的两X卡片”;X=6,表示“取出标有2,4或1,5的两X卡片”;X=7,表示“取出标有3,4或2,5或1,6的两X卡片”;X=8,表示“取出标有2,6或3,5的两X卡片”;X=9,表示“取出标有3,6或4,5的两X卡片”;X=10,表示“取出标有4,6的两X卡片”;X=11,表示“取出标有5,6的两X卡片”.用随机变量表示随机试验的结果问题的关键点和注意点(1)关键点:解决此类问题的关键是明确随机变量的所有可能取值,以及取每一个值时对应的意义,即一个随机变量的取值可能对应一个或多个随机试验的结果.(2)注意点:解答过程中不要漏掉某些试验结果.3.写出下列各随机变量可能取的值,并说明随机变量所取的值表示的随机试验的结果.(1)在2018年大学的自主招生中,参与面试的5名考生中,通过面试的考生人数X;(2)射手对目标进行射击,击中目标得1分,未击中目标得0分,该射手在一次射击中的得分用ξ表示.[解] (1)X可能取值0,1,2,3,4,5,X=i表示面试通过的有i人,其中i=0,1,2,3,4,5.(2)ξ可能取值为0,1,当ξ=0时,表明该射手在本次射击中没有击中目标;当ξ=1时,表明该射手在本次射击中击中目标.1.本节课重点是随机变量的概念及随机变量的分布列及其性质,以及两点分布,难点是随机变量的取值及概率.2.判断一个试验是否为随机试验,依据是这个试验是否满足以下三个条件:(1)试验在相同条件下是否可以重复;(2)试验的所有可能结果是否是明确的,并且试验的结果不止一个;(3)每次试验的结果恰好是一个,而且在一次试验前无法预知出现哪个结果.3.本节课的易错点:在利用分布列的性质解题时要注意:①X=xi的各个取值所表示的事件是互斥的;②不仅要注意i=1np i=1,而且要注意0≤p i≤1,i=1,2,…,n.1.判断(正确的打“√”,错误的打“×”)(1)随机变量的取值可以是有限个,也可以是无限个.( )(2)在概率分布列中,每一个可能值对应的概率可以为任意的实数.( )(3)概率分布列中每个随机变量的取值对应的概率都相等.( )(4)在概率分布列中,所有概率之和为1.( )[解析] (1)√因为随机变量的每一个取值,均代表一个试验结果,试验结果有限个,随机变量的取值就有有限个,试验结果有无限个,随机变量的取值就有无限个.(2)×因为在概率分布列中每一个可能值对应随机事件的概率均在[0,1]X围内.(3)×因为分布列中的每个随机变量能代表的随机事件,并非都是等可能发生的事件.(4)√由分布列的性质可知,该说法正确.[答案] (1)√(2)×(3)×(4)√2.下列叙述中,是随机变量的为( )A.某人早晨在车站等出租车的时间B.把一杯开水置于空气中,让它自然冷却,每一时刻它的温度C.射击十次,命中目标的次数D .袋中有2个黑球,6个红球,任取2个,取得1个红球的可能性 C [根据随机变量的含义可知,选C.] 3.随机变量η的分布列如下:则x 0 0.55 [由分布列的性质得 0.2+x +0.35+0.1+0.15+0.2=1,解得x =0.故P (η≤3)=P (η=1)+P (η=2)+P (η=3)=0.2+0.35=0.55.] 4.袋中有相同的5个球,其中3个红球,2个黄球,现从中随机且不放回地摸球,每次摸1个,当两种颜色的球都被摸到时,即停止摸球,记随机变量X 为此时已摸球的次数,求随机变量X 的概率分布列.[解] 随机变量X 可取的值为2,3,4, P (X =2)=C 12C 13C 12C 15C 14=35;P (X =3)=A 22C 13+A 23C 12C 15C 14C 13=310;P (X =4)=A 33C 12C 15C 14C 13C 12=110;所以随机变量X 的概率分布列为:。

原创2: 第二章 随机变量及其分布

原创2: 第二章 随机变量及其分布

n(A)

= .
n(Ω)
(2)因为n(AB)=24
n(AB) 2
=12,所以P(AB)=
= .
n(Ω) 7
(3) 在第1次拿出绿皮鸭蛋的条件下,第2次拿出绿皮鸭蛋的概率为
n(AB)
P(B|A)=
= .
n(A)
题型二、利用互斥(对立)事件、相互独立事件求概率
例2.有甲、乙、丙3批罐头,每批100个,其中各有1个是不合格的.从三
2)≈0.03.
ҧ
ҧ

P1=P(BC)+P(A
C)+P(AB
)=3×(0.01×0.99
题型三、四种常见的分布

例3.袋中装有黑球和白球共7个,从中任取2个球都是白球的概率为 ,现

在甲、乙两人从袋中轮流摸取1个球,甲先取,乙后取,然后甲再取,…,
取后不放回,直到两人中有一人取到白球时即终止,每个球在每一次被取
(3)在第1次拿出绿皮鸭蛋的条件下,第2次拿出绿皮鸭蛋的概率.
解:设“第1次拿出绿皮鸭蛋”为事件A,“第2次拿出绿皮鸭蛋”为事件B,
则“第1次和第2次都拿出绿皮鸭蛋”为事件AB.
(1)从7个鸭蛋中不放回地依次拿出2个的事件数为
n(Ω)=27 =42.根据分步乘法计数原理,n(A)= × =24.于是P(A)
例4.某大学毕业生参加某单位的应聘考试,考核依次分为笔试、面试、
实际操作三轮进行,规定只有通过前一轮考核才能进入下一轮考核,否
则被淘汰.三轮考核都通过才能被正式录用.设该大学毕业生通过一、
2 3 4
二、三轮考核的概率分别为 、 、 ,且各轮考核通过与否相互独立.
3 4 5
(1)求该大学毕业生进入第三轮考核的概率;

【精品】概率论与数理统计PPT课件第二章 随机变量及其分布

【精品】概率论与数理统计PPT课件第二章 随机变量及其分布
21
离散型随机变量的定义 定义 2.1
如果随机变量 X 只取有限个值
x1 , x2 , , xn
或可列个值
x1 , x2 ,
则称 X 是离散型随机变量,简称为离散随机 变量
22
离散型随机变量的概率分布 定义 2.2
设X 是离散型随机变量,称
为X 的概率分布; 称 pk 是概率分布列,
34 16 16
7 16
P0.5 X 3 PX 1 PX 2
31 16 16
4

16
29
例4 设随机变量 X 的分布列为
PX

n

c

1 4
n

试求常数c
n 1, 2, L
解: 由分布列的性质,得
该级数为等比级数,故有
1
32
例5 (续) 以 p = 1/2 代入,得
X0
1
2
3
4
pk 0.5 0.25 0.125 0.0625 0.0625
33
二. 几种常用的离散型随机变量
1.两点分布 (Bernoulli分布) 如果X 只取 0或 1,概率分布是

则称随机变量 X 服从参数为 p的两点分布
记作
34
两点分布的概率背景 任何一次试验,当只考虑两个互逆的结果

对于实数的集合A,我们用 X A
表示事件
X A

12
说明 4、 在许多实际问题中, 一个随机变量X 的 含义是十分清楚的, 所以一般不再关心随机变 量X 在样本空间上是如何定义的. 可以认为X 的所有取值就是我们的样本空间. 只是在必要

2014年自考 概率论与数理统计串讲讲义 第二章 随机变量及其概率分布

2014年自考 概率论与数理统计串讲讲义 第二章  随机变量及其概率分布

p = P ( A) = P ( X = 1) = EX
例2
设某射手的命中率为 p,X 为其一次射击中击中目标的次数,则 X~ B(1, p )
ห้องสมุดไป่ตู้
(2)二项分布:设 X~ B(n, p ) ,则 P ( X = k ) = Cn
k
p k (1 − p) n −k , k = 0,1, 2," , n
应用背景:n 次独立重复抽样中某事件 A 发生的次数 X~ B(n, p ) ,其中 概率。
第二章
随机变量及其概率分布
1. 离散型随机变量 P ( X = xk ) = pK ≥ 0 p =1 ∑ K K
例1 设 ,则 c = 1 − 0.5 − 0.2 = 0.3
2.常见离散型随机变量
(1)0—1 分布:设 X ~ B(1, p ) ,则 应用背景:一次抽样中,某事件 A 发生的次数 X ~ B(1, p ) ,其中
5k −5 (2) P ( X ≤ 5) ≈ ∑ e k =0 k !
5
3.随机变量的分布函数:X 的分布函数为
F ( X ) = P ( X ≤ x) , − ∞ < x < +∞ F ( x) 的性质:① 0 ≤ F ( x) ≤ 1
②若 x1 <
x2 ,则 F ( x2 ) − F ( x1 ) ≥ 0
∫a
b
f ( x)dx ,其中 a < b 任意,则称 X 为连续型随机变量。

x
−∞
f (u )du ; f ( x) = F ′( x)
其中
f ( x) 为 X 的概率密度,满足
f ( x) ≥ 0 PK ≥ 0 (注意与分布律的性质: +∞ PK = 1 相对照) ∑ f ( x ) dx 1 = ∫−∞ K

概率论与数理统计第2章 随机变量及其分布

概率论与数理统计第2章  随机变量及其分布

12
2.二项分布 如果随机变量X的分布律为
13
14
例2.5 某种药物对某种疾病的治愈率为0.8,若5人 服用此药,写出治愈人数的分布律.至少有2 人治愈的概 率是多少? 解 设X表示5人中治愈的人数,将每一个人服用药 物后是否治愈看成一次试验,各次试验是相互独立的, 则X~B(5,0.8).于是
36
图2.4
37
图2.5
38
正态分布是概率论中最重要的分布,在自然现象和 社会现象中,大量的随机变量都服从正态分布.例如,测 量误差、人的身高和体重、股票价格、农作物的产量、 海洋波浪的高度等都服从或近似服从正态分布. 许多其他分布常用正态分布来作为近似分布,另外, 在数理统计中可以看到,许多重要的分布,都由正态分 布随机变量的函数导出.
5
2.2 离散型随机变量及其概率分布
2.2.1 离散型随机变量的概率分布 离散型随机变量X的所有可能取值为有限个或可列 无限个.为了描述离散型随机变量X,我们不仅要知道X 有哪些可能取值,还需要知道它取每个可能值的概率. 定义2.2 设离散型随机变量X的所有可能取值为 x1,x2,…,xk,…,
6
24
25
图2.1
26
27
28
2.3.2 常用的连续型概率分布 1.均匀分布 如果随机变量X的概率密度函数为
29
2.指数分布 若连续型随机变量X的概率密度为
30
31
图2.2
32
33
3.正态分布 若连续型随机变量X的概率密度为
34
图2.3
35
(2)图形关于直线x=μ对称.这表明,μ是正态分布 的中心.如果固定σ,改变μ的值,则正态分布曲线沿着x 轴平行移动而不改变其形状(图2.4).可见,正态分布 的密度曲线的位置完全由参数决定.因此μ称为位置参数; (3)如果固定μ,改变σ的值,当σ增大时,曲线的 峰值降低,曲线变得平坦;反之,若σ减小,则峰值变 大,曲线变得陡峭(图2.5),故σ称为形状参数;

第2章随机变量及其分布【概率统计精品讲义】

第2章随机变量及其分布【概率统计精品讲义】

按不放回抽样方式,
随机抽取n件样品(0≤n≤M)
求取出的n样品C中Mk CCNn恰NnkM有k件次品A的概率?
P(X k) P( A)
(设随机变量X表示取出的次品数k ) 此X的概率分布称为超几何分布H(n, M, N).
(k 0,1,2,, n)
2020/8/7
5
二项分布
1.(0–1)分布
k e e k ee 1
k0 k!
k0 k!
2020/8/7
9
泊松分布的应用
泊松分布在公共事业、生物、医学及工业等领域
有着广泛的应用.
例如:
1) 某服务设施在一定时间内到达的人数;
2)某电话交换台在单位时间内收到的呼唤次数;
3) 汽车站台一天的侯客人数;
4)某医院在一天内的急诊病人数;

CMk
C nk N M
C
n N
Cnk pk qnk ,
其中 p M , q 1 M .
N
N
2020/8/7
11
泊松分布与二项分布的关系
泊松定理:
设 X ~ B(n, p), 若当n→∞时,
np ( 0 常数), 则有
lim
n
Cnk
p
k
q
nk
k e , k
k!
0,1,2,
注: 当n充分大, p很小 (p<0.1),
……
2020/8/7
22
二维随机变量的联合分布函数 1)定义
设(X ,Y )是二维随机变量,对任意实数x,y ,则称
Fx, y PX x, Y y 是二维随机变量X, Y 的联合分布函数.
2)几何意义
y
Fx, y表示平面上的随机点X,Y

概率论讲义第二章随机变量及其分布[统计学经典理论]

概率论讲义第二章随机变量及其分布[统计学经典理论]

第二章随机变量及其分布第一节随机变量1. 为什么引入随机变量?概率论是从数量上来研究随机现象统计规律性的,为了更方便有力的研究随机现象,就要用数学分析的方法来研究,因此为了便于数学上的推导和计算,就需将任意的随机事件数量化.当把一些非数量表示的随机事件用数字来表示时,就建立起了随机变量的概念.2. 随机变量的引入实例1 在一装有红球、白球的袋中任摸一个球,观察摸出球的颜色.实例2 抛掷骰子,观察出现的点数.二、随机变量的概念定义设随机试验E的样本空间是S = {e}, X = X (e)是定义在样本空间S 上的实值单值函数, 则我们称X = X (e)为随机变量.2.说明(1)随机变量与普通的函数不同随机变量是一个函数 , 但它与普通的函数有着本质的差别 ,普通函数是定义在实数轴上的,而随机变量是定义在样本空间上的 (样本空间的元素不一定是实数).(2)随机变量的取值具有一定的概率规律随机变量随着试验的结果不同而取不同的值, 由于试验的各个结果的出现具有一定的概率, 因此随机变量的取值也有一定的概率规律.(3)随机变量与随机事件的关系随机事件包容在随机变量这个范围更广的概念之内.或者说 : 随机事件是从静态的观点来研究随机现象,而随机变量则是从动态的观点来研究随机现象.下面我们举几个随机变量的例子:(1) n次射击命中目标的次数X (或随意抽验n件产品, 其中不合格品的件数), 它有n + 1个可能取值: 0, 1, 2, …, n.(2) 灯泡寿命X, 可以取[0, +∞)上的任意值.(3) 测量误差X, 可以取(-∞, +∞)上的任意值.有了随机变量, 随机试验中的各种事件, 就可以通过随机变量的关系式表达出来.例如, 从一批产品中任意取出10件, 若用X表示其中的废品数, 这时, {少于2件废品}、{恰有1件废品}两个事件, 就可以分别用{X < 2}、{X = 1}来表示.又如单位时间内电话交换台接到的呼唤次数用X 表示, 此时{接到不少于1次呼唤}、{没有接到呼唤}两个事件, 可以分别用{X ≥ 1}、{X = 0}来表示.再如, 上面(2)中事件{寿命不少于200小时而不超过1000小时}的事件, 就可用{200 ≤ X ≤ 1000}来表示.例1 “掷一颗骰子”是随机现象, 用随机变量X 表示出现的点数, 求(1) X 的取值范围; (2) 概率P{X ≤ 4}及P{X < 4}; (3) 概率P{X > 4}及P{2 ≤ X < 4}.引进了随机变量, 就可以通过随机变量来描述随机试验中各种事件, 全面反映试验的情况. 因此, 我们对随机现象统计规律性的研究, 就可以由对事件与事件的概率的研究扩大为对随机变量的研究.-∞第二节 离散型随机变量极其分布律如果随机变量它所有可能取的值是有限个或可列个值, 则我们就称之为离散型随机变量.设离散型随机变量X 的所有可能取值为x k (k = 0, 1, 2, ...), X 取各个可能值的概率, 即事件{X = x k }概率为 P{X = x k }= p k , k = 0, 1, 2, (1)则我们称(1)式为离散型随机变量X 的分布律或概率分布. 分布律也可以用表格的形式来表示:k 1︒ 0 ≤ p k ≤ 1, k = 0, 1, 2, …; 2︒ 11=∑∞=k k p .(2) 注: 凡满足(2)的函数p k 一定是某个离散型随机变量的分布律. 例1 (1) 设随机变量X 的分布律为k c k X P ⎪⎭⎫ ⎝⎛⋅==32}{, k = 1, 2, 3, 求常数c 的值. 3827 (2) 设随机变量X 的分布律为!}{k c k X P k λ⋅==, k = 0, 1, 2, …, λ > 0, 求常数c 的值. 1)1(--λe下面介绍三种重要的离散型随机变量.一、(0 - 1)分布(或两点分布)设随机变量X 只可能取0或1两个值, 它的分布律为k k p p k X P --==1)1(}{, k = 0, 1, (0 < p < 1), 或则称X 服从(0 - 1)分布 凡是只有两个结果的试验都可以用(0 - 1)分布来描述.二、伯努利试验、二项分布在实践中, 我们经常遇到下列类型的重复试验:(1) 每次试验的条件都相同, 且试验结果; 只有两个: A 及A , 且P(A) = p, P(A ) = q = 1 - p (0 < p < 1),(2) 每次试验的结果(即基本事件)是相互独立的.我们称之为n 重伯努利(Bernoulli)试验, 或伯努利概型.由于它是一个常见的、十分有用的概型, 所以在这里着重对它进行讨论.对于伯努利概型, 可以得到如下结果: 在n 次试验中事件A 出现k 次的概率为()(,,)k k n k n n P k b k n p C p q-==, k = 0, 1, 2, …, n. (3)事实上, 如将“第i 次试验中A 出现”的事件记为A i (i = 1, 2, …, n), 则由伯努利概型知, 在n 次试验中事件A 在指定的k 次试验中出现(如在前k 次出现), 其余n - k 次试验中不出现的概率为=+)(11n k k A A A A P =+)()()()(11n k k A P A P A P A P k k k k q p p p --=-11)1(.由于n 次试验中A 出现k 次的方式很多(在前k 次出现只是其中一种方式), 其总数相当于k 个相同的质点安排在n 个位置(每个位置只能安排一个质点)上的所有可能方式, 易知共应有k n C 种方式, 而它所对应的这k n C 个事件(即“n 次试验中A 出现k 次”这一事件)是不相容的, 故由概率的可加性得()(,,)k k n k n n P k b k n p C p q-==, k = 0, 1, 2, …, n.例3 设由四门高射炮同时独立地向一架敌机各发射一发炮弹, 若低机被不少于两发炮弹击中时, 就被击落. 设每门高射炮击中敌机地概率为0.6, 球敌机被击落地概率.解: 所求概率为 P = 1 - P 4(0) - P 4(1) = 0.8208.例4 甲、乙两乒乓球运动员实力相等, 连赛数局, 问哪一种结果的可能性大: 赛3局甲胜2局; 赛5局甲胜3局.解: 赛3局甲胜2局 83)2(3=P ; 赛5局甲胜3局 165)3(5=P .例5 某人有两盒火柴, 用时从任一盒中取一根火柴, 经过若干时间以后发现一盒火柴已经用完, 如果最初两盒中各有n 根火柴, 求这时另一盒中还有r 根火柴的概率.解: 发现一盒火柴已经用完, 而另一盒中还有r 根火柴, 这种情况一定是在第n + (n - r) + 1= 2n - r + 1次用时发现的. 设在前2n - r 次中此人恰有n 次取了第一盒, n - r 次取了第二盒, 而在第2n - r + 1次又取了第一盒, 发现它是空的, 这一事件的概率为 21)(21⋅=-n P p r n =2121212⋅⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛--r n n n r n C =12221+--⎪⎭⎫ ⎝⎛r n n r n C 同理, 设在前2n - r 次中此人恰有n 次取了第二盒, n - r 次取了第一盒, 而在第2n - r + 1次又取了第二盒, 发现它是空的, 这一事件的概率为 122221+--⎪⎭⎫ ⎝⎛=r n n r n C p . 因此, 所求事件的概率为 r n n r n C p p P --⎪⎭⎫ ⎝⎛=+=222121.设X 表示n 重伯努利试验中事件A 发生的次数, 则X 是一个随机变量, 它的可能取值为0、1、2、…、n, 由前面的讨论, 我们有 {}k k n k n P X k C p q -==, k = 0, 1,2, …, n. (4) 显然, P{X = k} ≥ 0, k = 0, 1, 2, …, n; 0()1n k k n k n n k C p q p q -==+=∑即P{X = k}满足条件(2), 注意到k k n k n C p q -刚好是二项式n q p )(+的展开式中出现p k 的项,故我们称随机变量X 服从参数为n 、p 的二项分布, 记为X ~b (n, p).特别地, 当n = 1时, 二项分布即为(0 - 1)分布.例6 设有12台独立运转的机器, 在一小时内每台机器停机的概率为0.1, 试求在一小时内停机台数不超过2的概率.解: 设X 表示一小时内停机台数, 则X ~b (12, 0.1). 从而所求概率为P{X ≤ 2} = P{X= 0} + P{X= 1} + P{X= 2} = 0.2824 + 0.3766 + 0.2301 = 0.8891.例7 某车间有10台电机各为7.5千瓦的机床, 如果每台机床的工作情况是相互独立的, 且每台机床平均每小时开动12分钟, 问全部机床用电超过48千瓦的可能性有多少?解: 设X 表示正在工作的机床台数, 则)51,10(~b X , 用电超过48千瓦即有7台或7台以上的机床在工作, 则所求概率为377105451}7{⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛=≥C X p +288105451⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛C +⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛54519910C +10101051⎪⎭⎫ ⎝⎛C 11571≈. 从此例可看出, 当n 很大时, 计算k k k n q p C k X P -==1}{是十分麻烦的.为此, 我们有泊松(Poisson)定理 设λ > 0是一个常数, n 是任意正整数, 设np n = λ , 则对于任一固定的非负整数k, 有 !)1(lim k e p p C k k n n k n k n n λλ--∞→=-. 证: 由n p n λ=, 有 k n k k n n k n k n n n k n n n k p p C --⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛+--=-λλ1)1()1(!1)1( k n k n n n k n n k -⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛----⋅-⋅=λλλ11)]11()21()11(1[! . 对于任意固定的k, 当n →∞时, 有 1)]11()21()11(1[→---⋅-⋅n k n n , λλ-→⎪⎭⎫ ⎝⎛-e n n 1, 11→⎪⎭⎫ ⎝⎛--k n λ. 故有 !)1(lim k e p p C k k n n k n k n n λλ--∞→=-. 可见, 当n 很大, p 很小时, 二项分布就可以用下列公式来近似计算: !)1(1k e p p C k k k k n λλ--≈- (λ = np) (5) 这就是著名的二项分布的泊松逼近公式.例8 某人进行射击, 每次命中率为0.02, 独立射击400次, 求命中次数X ≥ 2的概率.解: 显然, X ~ b(400, 0.02), 则P{X ≥2} = 1 - P{X = 0} - P{X =1}9970.091)98.0()02.0()98.0()02.0(183991140040000400≈-≈--=-e C C .这个概率接近于1, 它说明, 一个事件尽管它在一次试验中发生的概率很小, 但只要试验次数很多, 而且试验是独立进行的, 那么这一事件的发生几乎是肯定的, 所以不能轻视小概率事件. 另外, 如果在400次射击中, 击中目标的次数竟不到2次, 根据实际推断原理, 我们将怀疑“每次命中率为0.02”这一假设.例9 为保证设备正常工作, 需要配备适量的维修工人(工人配备多了就浪费, 配备少了要影响生产). 现有同类型设备300台, 各台工作与否是相互独立的, 发生故障的概率都是0.01, 在通常情况下, 一台设备的故障可由一人来处理(我们也只考虑这种情况), 问至少需配备多少工人, 才能保证当设备发生故障但不能维修的概率小于0.01?解: 设需要配备N 人, 记同一时刻发生故障的设备台数为X, 则X ~ b(300, 0.01), 所要解决的问题是确定N, 使得 P{X > N} < 0.01. 由泊松定理, λ = np = 3, }{1}{N X P N X P ≤-=>=∑=-⋅-N k k k k C 0300300)99.0()01.0(1∑∑∞+=-=-=-≈1303!3!31N k k N k k k e k e < 0.01. 查表知, 满足上式的最小的N 是8, 因此需配备8个维修工人.例10 在上例中, 若由一人负责维修20台设备, 求设备发生故障而不能及时处理的概率. 若由3人共同负责维修80台呢?解: 在前一种情况, 设备发生故障而不能及时处理, 说明在同一时刻设备有2台以上发生故障. 设X 为发生故障设备的台数, 则X ~ b(20, 0.01)且n = 20, λ = 0.2, 于是, 设备发生故障而不能及时处理的概率为 }2{1)99.0()01.0(}2{2020220<-==≥-=∑X P C X P k k k k ∑=--=102020)99.0()01.0(1k k k k C 0175.0!)2.0(1102.0=-≈∑=-k k k e . 若由3人共同负责维修80台, 设同一时刻发生故障的设备台数为X, 则X ~ b(80, 0.01), λ = 0.8, 故同一时刻至少有4台设备发生故障的概率为 k k k k C X P -=∑=≥8080480)99.0()01.0(}4{0091.0!)8.0(8048.0≈≈∑=-k k k e . 计算结果表明, 后一种情况尽管任务重了(平均每人维修27台), 但工作质量不仅没有降低, 相反还提高了, 不能维修的概率变小了, 这说明, 由3人共同负责维修80台, 比由一人单独维修20台更好, 既节约了人力又提高了工作效率, 所以, 可用概率论的方法进行国民经济管理, 以便达到更有效地使用人力、物力资源的目的. 因此, 概率方法成为运筹学的一个有力工具.三、泊松分布设随机变量X 的所有可能取值为0, 1, 2, …, 而取各个值的概率为 !}{k e k X P k λλ-==, k = 0, 1, 2, … 其中λ > 0是常数, 则称X 服从参数为λ的泊松分布, 记为X ~ π (λ).易验证, P{X = k}满足条件(2).例11 有一汽车站, 每天都有大量汽车通过. 设每辆汽车在一天中的某段时间内发生事故的概率为0.0001, 而在某天的该段时间内有1000辆汽车通过, 试求发生事故的次数X < 2的概率.解: 显然X ~ b(1000, 0.0001). 因n = 1000较大, p = 0.0001较小, 故可用泊松分布来计算, λ = np = 0.1, 从而 }1{}0{}2{=+==<X P X P X P 1.01.00!11.0!0)1.0(--+=e e 9953.01.11.0≈=-e . 泊松定理指明了以n 、p(np = λ)为参数的二项分布, 当n →∞时趋于以λ为参数的泊松分布, 这一事实也显示了泊松分布在理论上的重要性.具有泊松分布的随机变量在实际中存在相当广泛. 例如, 纺纱车间大量纱锭上的纺线在一个时间间隔内被扯断的次数; 纺织厂生产的一批布匹上的疵点个数; 电话总机在一段时间内收到的呼唤次数; 种子中杂草种子的个数; 一本书某页(或某几页)上印刷错误的个数; 在一个固定时间内从某块放射物质中发射出的α粒子的数目等都服从泊松分布.泊松分布通常适用于描绘大量重复试验中稀有事件(即每次试验中出现的概率很小的事件, 例如不幸事件、意外事故、非常见病、自然灾害等)出现的次数的概率分布.第三节 随机变量的分布函数对于非离散型随机变量X, 由于其取值不能一个个列举出来, 因此在一般情况下, 需研究随机变量取值落在任意区间(x 1, x 2)中的概率, 即求 P{x 1< X ≤ x 2}. 由于事件{x 1< X ≤ x 2}与事件{X ≤ x 1}互不相容, 且{x 1< X ≤ x 2}∪{X ≤ x 1}= {X ≤ x 2}, 因此有P{x 1< X ≤ x 2} = P{X ≤ x 2} - P{X ≤ x 1}.由此可见, 若对任何给定的实数x, 事件{X ≤ x}的概率P{X ≤ x}确定的话, 概率P{x 1< X ≤ x 2}也就确定了, 但概率P{X ≤ x}随着不同的x 而变化, 这个概率是x 的函数, 于是引进下面的分布函数的概念.定义 设X 是一个随机变量, x 是任意实数, 函数 F(x) = P{X ≤ x}(1)称为分布函数.注: 1︒ F(x)是一个普通实函数, 它的定义域是整个数轴, 故求分布函数时要就x 落在整个数轴上讨论, F(x)的值域是区间[0, 1]. 如果将X 看成是数轴上的随机点的坐标, 则分布函数F(x)在x 处的函数值就表示X 落在(-∞, x ]上的概率.2︒ 由上面的讨论, 有P{x 1< X ≤ x 2}= F(x 2) - F(x 1).例1 接连进行两次射击, 以X 表示命中目标的次数, 假设已知每次射击命中目标的概率为0.4, 求X 的分布律与分布函数.解: XX 的分布函数为 ⎪⎪⎩⎨≥<≤=.2,1,21,84.0)(x x x F 一般地, 设离散型随机变量X 的分布律为 P{X = x k }= p k , k = 1, 2, …, 则X 的分布函数为∑∑≤≤===≤=x x k x x k k k p x X P x X P x F }{}{)( (2)这里和式是对所有满足x k ≤ x 的k 求和. 此外, 分布函数F(x)在x = x k (k = 1, 2, …)处有跳跃, 其跳跃值为p k = P{X = x k }.例2求X 的分布函数}2{≤X P }21{≤<X P }21{≤≤X P 例3 向区间[a, b]上均匀地投掷一随机点, 以X 表示随机点的落点坐标, 求X 的分布函数. 解: ⎪⎩⎪⎨⎧≥<≤--<=.,1,,,,0)(b x b x a a b a x a x x F 分布函数F(x)具有以下一些性质:1︒ 0 ≤ F(x) ≤ 1 (-∞ < x < +∞);2︒ F(x)是单调不减函数, 即若x 1 < x 2, 则F(x 1) ≤ F(x 2);3︒ 0)(lim )(==-∞-∞→x F F x , 1)(lim )(==+∞+∞→x F F x ; 4︒ )()(lim )0(0000x F x F x F x x ==++→ (-∞ < x 0 < +∞), 即F(x)是右连续的.第四节 连续型随机变量极其概率密度在实际问题中, 除了离散型随机变量以外, 还有非离散型随机变量, 其中常用的是连续型随机变量. 如炮弹落地点和目标之间的距离. 尽管分布函数是描述各种类型随机变量变化规律的最一般的共同形式, 但由于它不够直观, 往往不常用. 如对于离散型随机变量, 用分布律来描述既简单又直观. 对于连续型随机变量我们也希望有一种比分布函数更直观的描述方式.定义 如果对于随机变量X 的分布函数F(x), 存在非负函数f (x), 使对任意实数x, 有 ⎰∞-=x dt t f x F )()( (1) 则称X 为连续型随机变量, 其中函数f (x)称为X 的概率密度函数, 简称概率密度.概率密度f (x)在几何上表示一条曲线, 称之为分布曲线. 分布函数F(x)的几何意义是分布曲线f (x)下从-∞到x 的一块面积, 这块面积随x 而改变.可以证明: 连续型随机变量的分布函数F(x)是连续函数.易知, 概率密度f (x)具有下列性质:1︒ f (x) ≥ 0; 2︒ 1)(=⎰∞+∞-dx x f ; 3︒ P{x 1< X ≤ x 2}= F(x 2) - F(x 1) =⎰21)(x x dx x f (x 1 ≤ x 2); 4︒ 若f (x)在点x 处连续, 则有)()(x f x F ='.注: (1) 若函数f (x)满足性质1︒、2︒, 则f (x)一定是某个连续型随机变量的概率密度.(2) 对于连续型随机变量X 来说, 它取任一指定实数a 的概率为0, 即P{X = a}= 0.事实上, 设X 的分布函数为F(X), ∆x > 0, 则由{X = a}⊂ {a - ∆x < X ≤ a}得 ⎰∆+=∆--=≤<∆-≤=≤x a a dx x f x a F a F a X x a P a X P )()()(}{}{0. 又0)(lim 0=⎰∆+→∆x a a x dx x f , 所以, P{X = a}= 0. 因此 P{a < X ≤ b} = P{a < X < b} = P{a ≤ X < b} = P{a ≤ X ≤ b} = F(b) - F(a).(3) 概率为0的事件不一定是不可能事件, 同样, 概率为1的事件也不一定是必然事件.(4) 连续型随机变量X 落在小区间(x, x + ∆x) (∆x > 0)上的概率为 =∆+≤<}{x x X x P dx x f dx x f x x x )()(≈⎰∆+. 乘积f (x)dx 称为概率微分, 上式表明, 连续型随机变量X 落在小区间(x, x + ∆x)上的概率近似地等于概率微分. f (x)dx 在连续型随机变量理论中所起的作用与概率P{X = x k } = p k 在离散型随机变量理论中所起的作用是类似的. 如果把x 看成质点的坐标, f (x)看成在x 处的线密度, 则P{x 1< X ≤ x 2}=⎰21)(x x dx x f 就可看成是分布在线段x 1x 2上的质量, 这就是称f (x)为概率密度的理由.例1 确定常数A, 使x Ae x f -=)((-∞ < x < +∞)为某一随机变量的概率密度. 21 例2 设随机变量X 的概率密度为 ⎪⎩⎪⎨⎧<≤-<≤=,,0,21,2,10,)(其它x x x x x f ⎪⎪⎪⎩⎪⎪⎪⎨⎧><≤-+-<≤<=.2,1,21,122,10,2,0,0)(22x x x x x x x x F 求X 的分布函数F(x). 例3 设随机变量X 的概率密度x x e e A x f -+=)( (-∞ < x < +∞). 求 (1) 常数A; (2) 概率}3ln 210{<<X P ; (3) X 的分布函数F(x). 解: (1) 由12arctan )(===+∞∞-∞+∞-⎰A e A dx x f x π, 得 π2=A . (2) }3ln 210{<<X P =61arctan 23ln 0=x e π. (3) X 的分布函数F(x)为 x e x F arctan 2)(π= (-∞ < x < +∞). 例4 设连续型随机变量X 的分布函数为⎪⎩⎪⎨⎧><≤-+-<=,,1,,arcsin ,,0)(a x a x a a x B A a x x F 其中a > 0, 求 (1) 常数A 、B; (2) 概率}2{a X P <; (3) X 的概率密度f (x). 注: 若已知X 的概率密度f (x), 要求分布函数F(x), 用积分方法⎰∞-=x dt t f x F )()(, 当f (x)是分段函数时, 积分要分段讨论; 若已知X 的分布函数F(x), 要求概率密度f (x), 则用微分方法)()(x f x F =', 当F(x)是分段函数时, 在分段点处用导数定义求导, 当)(x F '不存在(个别点), 则可任意规定)(x F '的值(个别点的值不影响积分结果).下面介绍几个重要的连续型随机变量.一、均匀分布如果随机变量X 的取值范围是有限区间(a, b), 并且落在[a, b]中的任一小区间的概率只与这个区间的长度成正比, 而与该小区间的位置无关, 则称X 在(a, b)上服从均匀分布, 它的概率密度为 ⎪⎩⎪⎨⎧<<-=.,0,,1)(其它b x a a b x f 分布函数为⎪⎩⎪⎨⎧≥<≤--<=.,1,,,,0)(b x b x a a b a x a x x F 记为X ~ U (a, b). 例5 设随机变量X ~ U (0, 10), 求方程012=++Xx x 有实根的概率.解: ∆=042≥-X , X ≤ -2或X ≥ 2, 所以 P{X ≤ -2} + P{X ≥ 2} = 0.8.二、指数分布 如果连续型随机变量X 的概率密度为⎪⎩⎪⎨⎧>=-.,0,0,1)(其它x e x f xθθ 其中θ > 0是常数, 则称X 服从参数为θ 指数分布, 其分布函数为⎪⎩⎪⎨⎧>-=-.,0,0,1)(其它x e x F x θ 指数分布有重要应用, 常用它来作为各种“寿命”分布的近似. 例如无线电元件的寿命、动物的寿命、电话问题中的通话时间、随机服务系统中的服务时间等都常假定服从指数分布.服从指数分布的随机变量X 具有以下有趣的性质:对于任意的s 、t > 0, 有P{X > s + t ∣X > s} = P{X > t}. 事实上 P{X > s + t ∣X > s} =}{}{}{)}(){(s X P t s X P s X P s X t s X P >+>=>>+> =}{)(1)(1t X P e e e s F t s F t s t s >===-+---+-θθθ. 此性质称为无记忆性. 如果X 是某一元件的寿命, 那么上式表明: 已知元件已使用了s 小时, 它总共能使用至少s + t 小时的条件概率, 与从开始使用时算起它至少能使用t 小时的概率相等. 这就是说, 元件对它已使用过s 小时没有记忆. 具有这一性质是指数分布有广泛应用的原因.三、正态分布 设连续型随机变量X 的概率密度为 222)(21)(σμσπ--=x e x f , (-∞ < x < +∞). 其中μ、σ (σ > 0)为常数, 则称X 服从参数为μ、σ 的正态分布或高斯(Gauss)分布, 记为X ~ N (μ、2σ). 其分布函数为 ⎰∞---=x t dt e x F 222)(21)(σμσπ (-∞ < x < +∞).可以证明, f (x)满足概率密度的两个性质. 事实上 ⎰∞+∞---dx e x 222)(21σμσπ(令σμ-=x t )= I dt e t =⎰∞+∞--2221π. 而=2I 22221⎪⎪⎪⎭⎫ ⎝⎛⎰∞+∞--dt e t π=⎰⎰∞+∞-∞+∞---⋅dy e dx e y x 22222121ππ=⎰⎰∞+∞-∞+∞-+-dxdy e y x )(212221π. 利用极坐标, 令x = rcos θ, y = rsin θ, 则 =2I ⎰⎰∞+-02021221πθπrdrd e r =1022=⎰∞+-dr re r , 由于I ≥ 0, 故有 1)(=⎰∞+∞-dx x f .正态分布的概率密度f (x)的图形称为正态曲线, 它具有以下性质:1︒ 曲线位于x 轴的上方, 以直线x = μ为对称轴, 即f (μ + x) = f (μ - x). 这表明对于任意的h > 0, 有P{μ - h < X ≤ μ}= P{μ < X ≤ μ + h}. 2︒ 当x = μ 时, 曲线处于最高点(σπμ21)(=f ), 当x < μ 时, f (x)单调增加; 当x > μ 时, f (x)单调减少, 即当x 向左右远离μ 时, 曲线逐渐降低, 整条曲线呈现“中间高, 两边低”的形状. 这表明对于同样长度的区间, 当区间离μ 越远, X 落在这个区间上的概率越小. 3︒ 在x = μ ±σ 处曲线有拐点, 并以x 轴为渐近线.4︒ 参数μ 确定了曲线的位置, σ 确定了曲线的形状. σ 越大, 曲线越平坦; σ 越小, 曲线越集中.特别地, 当μ = 0, σ = 1时, 称X 服从标准正态分布, 其概率密度和分布函数分别用ϕ(x)和Φ(x)表示, 即 2221)(x e x -=πϕ, ⎰∞--=Φx t dt e x 2221)(π.我们知道, 利用分布函数F(x)可以计算事件“X ≤ x ”的概率. 但当X ~ N (0, 1)时, 就无法用初等方法计算, 因此, 为计算方便, 人们编制了Φ(x)的函数表, 从表中可查出服从N (0, 1)的随机变量小于指定值x(x > 0)的概率P{X ≤ x} = Φ(x).因⎰⎰-∞--∞----==-Φx x t d t dt t x )()()()(ϕϕ=)(1)(1)(x dt t dt t x x Φ-=-=⎰⎰∞-∞+ϕϕ(ϕ(x)是偶函数), 所以, 当x < 0时, 只要查得Φ(-x), 即可求得Φ(x)的值.对一般的正态分布, 可利用变换σμ-=x t , 将其化成标准正态分布, 即有(){}x F x P X x μσ-⎛⎫=≤=Φ ⎪⎝⎭. 事实上, }{)(x X P x F ≤==⎰∞---x t dt e 222)(21σμσπ(令σμ-=t y )=⎰-∞--⎪⎭⎫ ⎝⎛-Φ=σμσμπx y x dy e 2221.对任意区间[x 1, x 2], 有 ⎪⎭⎫ ⎝⎛-Φ-⎪⎭⎫ ⎝⎛-Φ=≤-≤=≤<σμσμ121221}{}{}{x x x X P x X P x X x P .例6 设X ~ N (0, 1), 求:(1) P{X ≤ 1.15}; 0.8749 (2) P{X ≤ -2.35}; 0.0094(3) P{0.02 < X ≤ 1.15}; 0.4821 (4) P{-1.85 < X ≤ 0.04}; 0.4838例7 设X ~ N (108, 9), 求: (1) P{101.1 < X < 117.6}; 0.9886(2) 求常数a, 使P{X < a} = 0.90; 111.84 (3) 求常数a, 使P{∣X - a ∣> a} = 0.01. 57.50例8 设),(~2σμN X , 求:(1) P{μ - σ < X < μ + σ}; 0.6826 (2) P{μ - 2σ < X < μ + 2σ}; 0.9544 (3) P{μ - 3σ < X < μ + 3σ}. 0.9974此例表明, 当时, X 以99.74%的概率落入区间(μ - 3σ , μ + 3σ)内, 即X 的可取值几乎全部在(μ - 3σ , μ + 3σ)内, 这就是统计中的3σ 原则.例9 公共汽车车门的高度是按男子与车门顶碰头的机会在0.01以下来设计的. 设男子身长X 服从μ = 170cm, σ = 6cm 的正态分布, 即)6,170(~2N X , 问车门高度应如何确定?解: 设车门高度为hcm. 按设计要求, P{X ≥ h} ≤ 0.10或P{X < h} ≥ 0.99. 因)6,170(~2N X , 故99.06170)(}{≈⎪⎭⎫ ⎝⎛-Φ==<h h F h X P , 查表得 Φ(2.33) = 0.9901 > 0.99, 所以, 33.26170=-h , h = 184cm.为了便于今后应用, 对于标准正态随机变量, 我们引入α分位点的概念.设X ~ N (0, 1), 对给定的数α, 0 < α < 1, 称满足条件 αϕαα==>⎰∞+z dx x z X P )(}{ 的数z α为标准正态分布的上(侧) α分位点(如图).对于给定的α, z α的值可这样求得; P{X > z α} = 1 - Φ( z α) = α , 从而, Φ( z α) = 1 - α , 查表可得. 如, z 0.05 = 1.645, z 0.3 = 0.52.一般地, 对随机变量X, 若对给定的数α, 0 < α < 1, 称满足条件P{X ≥ z α}= 1 - F(z α)的数z α为此概率分布的上(侧) α分位点(数).在自然现象和社会现象中, 大量随机变量服从或近似服从正态分布. 一般地, 只要某个随机变量是由大量相互独立、微小的偶然因素的总和所构成, 而且每一个别偶然因素对总和的影响都均匀地微小, 则可断定这个随机变量必近似服从正态分布.第五节 随机变量的函数的分布在微积分中, 函数y = g(x)是一个最基本的概念, 同样, 在概率论与数理统计中, 也常遇到随机变量的函数. 例如, 在测量圆轴截面面积的试验中, 所关心的随机变量−圆轴截面面积A 不能直接测量得到, 只能直接测量圆轴截面的直径d 这个随机变量, 再根据关系式 得到A, 这里随机变量A 是随机变量d 的函数.一般地, 设g(x)是定义在随机变量X 的一切可能取值x 的集合上的函数, 如果当X 取值为x 时, 随机变量Y 的取值为y = g(x), 则称Y 是随机变量X 的函数, 记为Y = g(X). 下面我们讨论如何由已知的随机变量X 的分布去求得它的函数的分布.一、X 是离散型随机变量设求 当X 取得它的某一可能值x i 时, 随机变量Y = g(X)取值y i = g(x i ) (i = 1, 2, …).如果诸i i i , 则把那些相等的值分别合并起来, 并根据概率可加性把对应的概率相加,就得到函数Y = g(X)的分布律.例求)2(-X 例求⎪⎭ ⎝=X Y 2sin 解: 因⎪⎩⎪⎨⎧-==-=-=⎪⎭⎫ ⎝⎛.34,1,2,0,14,12sin k n k n k n n π 所以, ⎪⎭⎫ ⎝⎛=X Y 2sin π只有三个可能取值: -1, 0, 1. 而取得这些值的概率分别是 152********}1{141173=+++++=-=- k Y P , 3121212121}0{2642=+++++== k Y P , 158********}1{3495=+++++==- k Y P . 所以, Y二、X 是连续型随机变量若X 是连续型随机变量. Y = g(X)是X 的函数, 则Y 也是随机变量, 这时如何求出Y = g(X)的分布呢? 先看一个例子.例3 已知),(~2σμN X , 求σμ-=X Y 的概率密度. 解: 设Y 的分布函数为F Y (y), 于是 F Y (y) = P{Y = y}=}{y X P ≤-σμ= P{X ≤ σ y + μ} = F X (σ y + μ). 其中F X (x)为X 的分布函数. 将上式两边对y 求导, 并利用概率密度是分布函数的导数的关系得 []σμσμσ⋅+='+==')()()()(y f y F y f y F y X Y Y . 再将222)(21)(σμσπ--=x e x f 代入, 有 22])[(2222121)(y y Y e e y f --+-=⋅=πσσπσμμσ, 这表明Y ~ N(0, 1).在以上推导过程中, 除去用到分布函数的定义以及分布函数和概率密度的关系之外, 还用到这样一个等式}{y X P ≤-σμ= P{X ≤ σ y + μ}. 表面上看, 只是把不等式“y X ≤-σμ”变形为“X ≤ σ y + μ”, 它们是同一个随机事件, 因而概率相等. 实质上关键在于把σμ-=X Y 的分布函数在y 的值F Y (y)转化为X 的分布函数在σ y + μ 的值F X (σ y + μ). 这样就建立了分布函数之间的关系, 然后通过求导得到Y 的概率密度. 这种方法叫做“分布函数法”, 按照上例的解题思路, 可得到下面的定理:定理 设随机变量X 具有概率密度f X (x), -∞ < x < +∞, 又设函数g (x)处处可导且有)(x g '> 0 (或恒有)(x g '< 0), 则Y = g(X)是连续型随机变量, 其概率密度为 ⎩⎨⎧<<'⋅=.,0,,)()]([)(其它βαy y h y h f y f XY 其中α = min{g(-∞), g(+∞)}, β =max{g(-∞), g(+∞)}, h(y)是g(x)的反函数.证: 对于任意x 有)(x g '> 0 (或)(x g '< 0). 因而g(x)单调增加(或单调减少), 它的反函数h(y)存在, 并且h(y)在(α,.β)内单调增加(或单调减少)且可导.设g(x)单调增加, Y 的分布函数为 ⎰∞-=≤=≤=≤=)()()}({})({}{)(y h X Y dx x f y h X P y X g P y Y P y F , 于是Y 的概率密度为 )()]([)()(y h y h f y F y f X Y Y '='=, g(-∞) < g(+∞), )0)((>'y h 设g(x)单调减少, Y 的分布函数为 ⎰∞+=≥=≤=≤=)()()}({})({}{)(y h X Y dx x f y h X P y X g P y Y P y F . 于是Y 的概率密度为 )()]([)()(y h y h f y F y f X Y Y '-='=, g(+∞) < g(-∞), )0)((<'y h 综合以上两种情形, 即得所要结论.注: 若f X (x)在有限区间[a, b]以外等于零, 则只需设在[a, b]上有> 0 (或< 0)., 此时α = min{g(a), g(b)}, β =max{g(a), g(b)}.例4 设随机变量X 具有概率密度f X (x), -∞ < x < +∞, 求线性函数Y = a + bX (a 、b 为常数, 且b ≠ 0)的概率密度.解: 因y = g(x) = bx + a, 故b a y y h x -==)(. 而b y h 1)(=', 由定理得⎪⎭⎫ ⎝⎛-=b a y f b y f Y 1)(,-∞ < y < +∞. 若),(~2σμN X , 则=)(x f X 222)(21σμσπ--x e (-∞ < x < +∞), 故Y 的概率密度为 ⎪⎭⎫ ⎝⎛-=b a y f b y f Y 1)(2222)(21σμσπb b a y e b ---. 因而),(~22σμb b a N Y +, 这就是说正态随机变量X 的线性函数仍服从正态分布, 只是参数不同而已.例5 设X 具有概率密度f X (x), -∞ < x < +∞, 求2X Y =的概率密度.解: 2x y =不是单调函数, 故不能用定理来求. 但可划分为两个单调区间(-∞, 0)和(0, +∞), 在这两个单调区间上它的反函数分别为y x -=与y x =. 对于y > 0, Y 的分布函数为 ⎰-=≤≤-=≤=y y X Y dx x f y X y P y Y P y F )(}{}{)( 由于02≥=X Y , 且P{Y = 0} = 0, 所以当y ≤ 0时, 其分布函数F Y (y) = 0, 于是Y 的概率密度为 ⎪⎩⎪⎨⎧≤>-+='=.0,0,0)],()([21)()(y y y f y f y y F y f X X Y Y 例如, 设X ~ N (0, 1), 其概率密度为2221)(x e x -=πϕ(-∞ < x < +∞), 则的概率密度为 ⎪⎩⎪⎨⎧≤>=⎪⎩⎪⎨⎧≤>+=----.0,0,0,21.0,0,0),2121(21)(22122y y e y y y e e y y f y y y Y πππ 称Y 服从自由度为1的分布.习 题 课一、要点与要求本章主要内容是把随机事件数量化, 使得随机事件极其概率能够用随机变量极其分布函数来表示, 以便使用微积分等数学工具研究随机现象. 这一章是本课程的重点.1︒ 求离散型随机变量X 的分布律时, 首先要确定X 的取值, 然后求出对应于各取值的事件的概率, 要注意验证∑∞===11}{n k x X P , 否则不正确.两点分布、二项分布、泊松分布是三种常用离散型随机变量的概率分布.2︒ 使用概率密度f (x)描述连续型随机变量X, f (x)满足f (x) ≥ 0, ⎰∞+∞-=1)(dx x f . 对于任意(a, b), 有 ⎰=<<b a dx x f b X a P )(}{. 均匀分布、正态分布、指数分布是三种常用连续型随机变量的分布.3︒ 可以使用分布函数统一描述离散型随机变量和连续型随机变量. 当分布函数F(x)中含有待定常数时, 常利用0)(lim =-∞→x F x , 1)(lim =+∞→x F x 或F(x + 0) = F(x)来确定该常数. 而当概率密度f (x)及分布律中含有待定常数时, 常利用⎰∞+∞-=1)(dx x f 或∑∞===11}{n k x X P 来确定该常数. 有概率密度f (x)求分布函数F(x), 要在相应的区间段把F(x)写成f (x)的变上限积分, 利用公式)()(x f x F =', 可由分布函数F(x)求概率密度f (x).离散型随机变量的分布函数为分段函数, 若随机变量X 的取值为n 个, 则要分为n + 1段, 其图形是右连续的阶梯曲线.4︒ 对正态随机变量, 我们有Φ(-x) = 1 - Φ(x). 若),(~2σμN X , 则⎪⎭⎫ ⎝⎛-Φ-⎪⎭⎫ ⎝⎛-Φ=<<σμσμa b b X a P }{. 5︒ 随机变量的函数是一个重要概念. 对连续型随机变量X 的函数Y = g(X), 要了解求Y 的分布的原理和方法, 当g(x)是严格单调函数时, Y 的概率密度可使用公式计算出来.本章中的概念比第一章少, 并且多数概念容易理解, 重点是计算问题. 对离散型随机变量, 求它的分布律实质上是第一章内容的继续, 要用到第一章中的许多内容; 对连续型随机变量, 在进行各种计算时, 涉及到高等数学中的知识, 主要是定积分的计算(其中包括无穷限的广义积分), 要牢记积分的基本公式, 掌握简单的换元积分法和分部积分法, 同时要掌握简单的极限计算.二、典型例题例1 选择题1. 设F 1(x)与F 2(x)分别为随机变量X 1与X 2的分布函数, 为使F(x) = a F 1(x) - b F 2(x)是某一随机变量的分布函数, 在下列给定的各组数值中应取(98数三)( ) A (A) 52,53-==b a ; (B) 32,32==b a ; (C) 23,21=-=b a ; (D) 23,21-==b a . 2.设X 1与X 2是任意两个相互独立的连续型随机变量, 它们的概率密度分别为f 1 (x)与f 2 (x), 分布函数分别为F 1(x)与F 2(x), 则(2002数一)( ) D(A) f 1 (x) + f 2 (x)必为某一随机变量的概率密度; (B) f 1 (x) f 2 (x)必为某一随机变量的概率密度;(C) F 1(x) + F 2(x)必为某一随机变量的分布函数; (D) F 1(x) F 2(x)必为某一随机变量的分布函数.3. 设随机变量X 服从正态分布),(2σμN , 则随σ 的增大, 概率P{|X - μ| < σ}(95)( ) C(A) 单调增大; (B) 单调减小; (C) 保持不变; (D) 增减不定.4. 设随机变量X 与Y 均服从正态分布, )4,(~2μN X , )5,(~2μN Y . 记p 1 = P{X ≤ μ - 4}, p 2 = P{Y ≥ μ + 5}, 则(93)。

随机变量及其概率分布讲义

随机变量及其概率分布讲义

第二章随机变量及其概率分布内容简介1.本章引入随机变量及其分布函数概念,讨论了离散型和连续型两种随机变量,介绍了几种常用的随机变量。

2.本章重点内容包括:离散型随机变量及其分布律,连续型随机变量及其概率密度,二项分布与正态分布。

内容讲解§2.1离散型随机变量1.随机变量的概念(1)引入随机变量的理由:① “常量”到“变量”;② 全面研究随机试验的需要。

(2)如何引入:一类:随机试验的结果用数量表示的,直接数量化。

如:掷骰子,设出现的点数为随机变量X,则X=1,2,3,4,5,6分别表示事件“出现一点”,“出现二点”,…,“出现六点”。

另一类:试验结果不是用数量表示的,如:掷硬币,双方比赛的结果等,可以人为赋值,如掷硬币,设结果为随机变量Y,“出现正面”用“Y=1”表示,“出现反面”用“Y=0”表示。

如果双方比赛结果使用记分法,可以用分数表示,“Z=3”表示“胜”,“Z=1”表示“平”,“Z=0”表示“负”,等等。

(3)定义:设E是随机试验,样本空间为Ω,如果对于每一个样本点ω∈Ω,有一个实数X(ω)与之对应,则称X=X(ω)为随机变量,记做X, Y, Z,…。

(4)解释:① 随机变量不是普通变量,它的取值不是任意的,它是以一定的可能性(概率)取某一个值的,即具有随机性,因此称为“随机变量”;② 在一次随机试验中,可以根据不同的需要来定义不同的随机变量。

③ 引入随机变量后,可用随机变量来描述事件,如掷骰子,设出现的点数为随机变量X,则“出现4点”可表示为{X=4},“不少于4点”可表示为{X≥4},等等。

所以,其概率可表示为P{X=4}=1/6, P{X≥4}=1/2。

2.离散型随机变量及其分布律(1)离散型随机变量定义:若随机变量X只取有限多个或可列无限多个值,则称X为离散型随机变量。

如掷骰子出现的点数,医院门诊一天接待的患者数,某停车场内停放的车辆数,等等,都是离散型随机变量。

(2)离散型随机变量的分布律:设X为离散型随机变量,可能取值为x1,x2,…,x k,…,且P{X =x k }=p k,k=1,2,…,则称{ p k }为X的分布律(或分布列,概率分布)。

《概率论与数理统计》第二章随机变量及其分布

《概率论与数理统计》第二章随机变量及其分布

第二章随机变量及其分布 ....................................................................................................... - 1 - 第一节随机变量及其分布函数 ..................................................................................... - 2 - 一随机变量概念 ....................................................................................................... - 2 -二随机变量的分布函数 ........................................................................................... - 3 -基础训练2.1 ............................................................................................................... - 6 - 第二节离散型随机变量及其概率分布............................................................................ - 6 - 一离散型随机变量及其概率分布............................................................................ - 6 -二常见的几种离散型随机变量及其分布................................................................ - 8 -基础训练2.2 ............................................................................................................. - 13 - 第三节连续型随机变量及其概率分布.......................................................................... - 13 - 一连续型随机变量及其分布的概念与性质.......................................................... - 14 -二常见的几种连续型随机变量及其分布.............................................................. - 16 -基础训练2.3 ............................................................................................................ - 21 - 第四节随机变量函数的分布 ......................................................................................... - 21 - 一离散型随机变量函数的分布.............................................................................. - 21 -二连续型随机变量的函数分布.............................................................................. - 22 -基础训练2.4 ............................................................................................................ - 25 - 综合训练二 ....................................................................................................................... - 25 - 内容小结及题型分析二 ................................................................................................... - 25 - 拓展提高二 ....................................................................................................................... - 25 - 阅读材料二 ....................................................................................................................... - 25 - 数学实验二 ....................................................................................................................... - 25 -第二章随机变量及其分布【本章导读】本章主要讲述随机变量与分布函数,一维离散型随机变量、连续型随机变量的概率分布,常见分布及函数的分布.【本章用到的先修知识】级数的运算,变限积分,分段函数的积分,无穷积分.【本章要点】随机变量的概念,分布函数,分布律,概率密度,常见随机变量的分布,函数的分布.在上一章中,我们用样本空间的子集,即基本事件的集合来表示随机试验的各种结果.这种表示的方式对全面讨论随机试验的统计规律性及数学工具的运用都有较大的局限. 在本章中,我们将介绍概率论中另一个重要的概念:随机变量. 随机变量的引入,使概率论的研究由个别随机事件扩大为随机变量所表征的随机现象的研究. 这样,不仅可更全面揭示随机试验的客观存在的统计规律性,而且可使我们用高等数学的方法来讨论随机试验.第一节 随机变量及其分布函数一 随机变量概念在第一章里,我们主要研究了随机事件及其概率,读者可能会注意到在随机现象中,有很大一部分问题与实数之间存在着某种客观的了解. 例如,在产品检验问题中,我们关心的是抽样中出现的废品数;在车间供电问题中,我们关心的是某时间段正在工作的车床数;在电话问题中关心的是某一段时间内的话务量等. 对于这类随机现象,其试验结果显然可以用数值来描述,并且随着试验的结果不同而取不同的数值。

概率统计和随机过程课件第二章随机变量及其分布

概率统计和随机过程课件第二章随机变量及其分布

= {儿童的发育情况 } X ( ) — 身高
Y ( ) — 体重
Z ( ) — 头围 各随机变量之间可能有一定的关系,也可能 没有关系—— 即 相互独立
课件
16
随机变量的分类 离散型随机变量
非离散型随机变量 — 其中一种重要的类型为 连续性随机变量
引入随机变 量重要意义
◇ 任何随机现象可 被 随机变量描述
P(0 X 1/ 3) F(1/ 3) F(0) 2 / 3 1/ 3 1/ 3
P(0 X 1/ 3) P(X 0) P(0 X 1/ 3) 1/31/3 2/3.
பைடு நூலகம்
课件
22
§2.3 离散型随机变量及其概率分布
离散型随机变量的概念
定义 若随机变量 X 的可能取值是有限多个或 无穷可列多个,则称 X 为离散型随机变量
课件
14
再如,用随机变量
X
(
)

1, 0,
正面向上 反面向上
描述抛掷一枚硬币可能出现的结果, 则
( X () 1) — 正面向上
也可以用
Y
(
)

0, 1,
正面向上 反面向上
描述这个随机试验的结果
课件
15
例如,要研究某地区儿童的发育情况,往往 需要多个指标,例如,身高、体重、头围等
解 P(1 X 3) P(X 2) P(X 3)
0.42 0.6 0.43 0.6 0.1344
或 P(1 X 3) F (3) F (1)
0.42 0.6 0.43 0.6 0.1344
课件
30
P(X 2) 1 P(X 2)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


CMk
C nk N M
C
n N
Cnk pk qnk ,
其中 p M , q 1 M .
Nቤተ መጻሕፍቲ ባይዱ
N
2020/8/7
11
泊松分布与二项分布的关系
泊松定理:
设 X ~ B(n, p), 若当n→∞时,
np ( 0 常数), 则有
lim
n
Cnk
p
k
q
nk
k e , k
k!
0,1,2,
注: 当n充分大, p很小 (p<0.1),
2020/8/7
7
实例:在n重伯努利概型中
设X表示事件A恰好出现的次数,
X=k的概率为
Pn ( X k) Cnk pk qnk , k 0,1,2,, n
则X服从二项分布B (n, p) .
例如
设一批产品共N件,其中有M件次品,
按放回抽样方式,
随机抽取n件样品(0≤n≤M).
设随机变量X表示取出的次品数(X=0,1,2,…,n), 则
P(X
k)
C C k nk M NM
C
n N
,
k 0,1, 2,
其中n, M, N 都是正整数,
且n ≤N, M≤N;
, n;
则称
随机变量X服从超几何分布, 其中n, M, N是分布的参数.
记作X~H (n, M, N),
2020/8/7
4
实例:产品检验模型
一批产品共N件, 其中M件次品, N-M件正品,
随机变量的定义
定义: 设随机试验E的样本空间为
{}, 若对于每
一个样本点
, 变量X 都有确定实数值与之对应,
则X是定义在
上的实值函数,
即 X X (),我们称
这样的变量X为随机变量.
随机变量的分类
(1) 离散随机变量:取值只有有限个或可列无穷多个;
(2) 非离散随机变量 连续随机变量: 取值是在某个实数区间
x
x
事件“X≤x”当x→-∞时是不可能事件;
事件“X≤x”当x→+∞时是必然事件.
(3)离散随机变量X,F (x)是右连续函数,

lim F(x) F(a)
xa
连续随机变量X,F(x)在(-∞,+ ∞)处处连续.
2020/8/7
14
连续随机变量和概率密度
定义.若随机变量X的取值范围是某个实数区间I
P( X
k
)
Cnk
(
M N
)k
(1
M N
)nk
(k 0,1,2,, n)
故X~B (n, M/N).
2020/8/7
8
泊松分布
定义. 设随机变量X的概率分布为
p( X k) k e , k 0, 1, 2, ; (其中 0)
k!
X ~ P(),
则称随机变量X服从泊松分布,
记作
参数
是分布的参数.
5) 某公路段上在单位时间内发生交通事故的次数;
……
2020/8/7
10
二项分布与超几何分布的关系
定理: 注:
若X~H (n, M, N),
则当N→∞时,有
lim
N
CMk
C nk N M
C
n N
Cnk pk qnk
当N充分大时,
超几何分布H (n, M, N)的
概率函数近似等于二项分布B(n,p)的概率函数,
即np比较适中时,
二项分布B( n, p)的概率函数近似等于泊松分布
P( )的概率函数:
Cnk pk qnk
k
k!
e , 其中
np
2020/8/7
12
随机变量X的分布函数
定义:设X为一随机变量,
x R, 则事件“X ≤x”
的概率P(X≤x)称为随机变量X的分布函数,
记作
F(x)=P (X≤x).
注:
当x1 x2时,
P(x1 X x2 ) F(x2 ) F(x1).
2020/8/7
13
分布函数F (x)的性质
(1) F(x)是非减函数,
(2) 0 F(x) 1;且
即若x1 <x2, 则
F(x1) F(x2 );
F() lim F(x) 0; F () lim F(x) 1;
Pn ( X k) Cnk pk qnk , k 0,1,2,, n
其中n为正整数,
0 p 1, p q 1;
则称随机变量X服从二项分布,
记作X~B (n, p),
n
n
10
Pn ( X k) Cnk pk qnk ( p q)n 1
其中n,p为分布的参数. k0
k 0
注:
20 当n=1时,X~B(1, p),即为(0-1)分布.
2020/8/7
2
(2)性质
显然,概率分布p(xi) 有下面的性质:
10 p(xi ) 0, i 1, 2,;
20 p(xi ) 1.
i
注:当X取得有限i 个可能值时,
当X取得可列无穷多个可能值时,
表示有限项的和;
表示收敛级数和.
i
2020/8/7
3
超几何分布
定义.设随机变量X的概率分布为
设随机变量X只可能取0,1两个值 ,

P( X k) pk q1k , k 0, 1
且概率分布
(0 p 1)
则称X服从(0 - 1)分布或两点分布.
(0 - 1)分布的概率分布也可写成
X 01 pk 1-p p
2020/8/7
6
2.二项分布 B (n, p)
定义. 设随机变量X的概率分布为
2020/8/7
1
2. 离散随机变量的概率分布
(1)定义
定义: 设X为离散随机变量,
其所有可能取值为
x1, x2,, xn , (),且 P( X xi ) p(xi ) (i 1,2,)
或记为
X
x1
x2
xi
xn
p(xi ) p(x1) p(x2) p(xi )
p(xn )
则称 p(xi) (i=1,2,…) 为 X 的概率分布或概率函数.
按不放回抽样方式,
随机抽取n件样品(0≤n≤M)
求取出的n样品C中Mk CCNn恰NnkM有k件次品A的概率?
P(X k) P( A)
(设随机变量X表示取出的次品数k ) 此X的概率分布称为超几何分布H(n, M, N).
(k 0,1,2,, n)
2020/8/7
5
二项分布
1.(0–1)分布
(有界或无界),
且存在非负函数f (x),
使得对于任意
区间 (a, b] I 有
b
P(a X b) a f ( x)dx ,
则称X为连续随机变量;
函数f (x)称为连续随机变量
X的概率密度函数(probability density function), 概率密度.
k e e k ee 1
k0 k!
k0 k!
2020/8/7
9
泊松分布的应用
泊松分布在公共事业、生物、医学及工业等领域
有着广泛的应用.
例如:
1) 某服务设施在一定时间内到达的人数;
2)某电话交换台在单位时间内收到的呼唤次数;
3) 汽车站台一天的侯客人数;
4)某医院在一天内的急诊病人数;
相关文档
最新文档