概率论与数理统计B教案第二章
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章随机变量及其分布
在随机试验中,人们除对某些特定事件发生的概率感兴趣外,往往还关心某个与随机试验的结果相联系的变量. 由于这一变量的取值依赖于随机试验结果,因而被称为随机变量. 与普通的变量不同,对于随机变量,人们无法事先预知其确切取值,但可以研究其取值的统计规律性. 本章将介绍两类随机变量及描述随机变量统计规律性的分布.
第一节随机变量的概念
内容要点:
一、随机变量概念的引入
为全面研究随机试验的结果, 揭示随机现象的统计规律性, 需将随机试验的结果数量化,即把随机试验的结果与实数对应起来.
1. 在有些随机试验中, 试验的结果本身就由数量来表示.
2. 在另一些随机试验中, 试验结果看起来与数量无关,但可以指定一个数量来表示之.
二、随机变量的定义
定义设随机试验的样本空间为S, 称定义在样本空间S上的实值单值函数)
X=
(e
X
为随机变量.
随机变量与高等数学中函数的比较:
(1) 它们都是实值函数,但前者在试验前只知道它可能取值的范围,而不能预先肯定它将取哪个值;
(2) 因试验结果的出现具有一定的概率,故前者取每个值和每个确定范围内的值也有一定的概率.
三、引入随机变量的意义
随机变量的引入,使得随机试验中的各种事件可通过随机变量的关系式表达出来.
由此可见,随机事件这个概念实际上是包容在随机变量这个更广的概念内.也可以说,随机事件是从静态的观点来研究随机现象,而随机变量则以动态的观点来研究之.其关系类似高等数学中常量与变量的关系.
随机变量概念的产生是概率论发展史上的重大事件. 引入随机变量后,对随机现象统计规律的研究,就由对事件及事件概率的研究转化为随机变量及其取值规律的研究,使人们可利用数学分析的方法对随机试验的结果进行广泛而深入的研究.
随机变量因其取值方式不同, 通常分为离散型和非离散型两类. 而非非离散型随机变量中最重要的是连续型随机变量. 今后,我们主要讨论离散型随机变量和连续型随机变量.
例题选讲:
例1(讲义例1)在抛掷一枚硬币进行打赌时, 若规定出现正面时抛掷者赢1元钱, 出现反面时输1元钱, 则其样本空间为
S{正面, 反面},
=
记赢钱数为随机变量X, 则X作为样本空间S的实值函数定义为
⎩
⎨⎧=-==.,1,,1)(反面正面e e e X
例2 (讲义例2) 在将一枚硬币抛掷三次, 观察正面H 、反面T 出现情况的试验中, 其样
本空间
};,,,,,,,{TTT TTH THT HTT THH HTH HHT HHH S = 记每次试验出现正面H 的总次数为随机变量X , 则X 作为样本空间S 上的函数定义为
1112223X TTT
TTH THT HTT THH HTH HHT HHH e
易见, 使X 取值为})2({2=X 的样本点构成的子集为
},,,{THH HTH HHT A = 故 ,8/3)(}2{===A P X P 类似地,有
.8/4},,,{}1{==≤TTT TTH THT HTT P X P
例3 (讲义例3) 在测试灯泡寿命的试验中, 每一个灯泡的实际使用寿命可能是),0[+∞中任何一个实数, 若用X 表示灯泡的寿命(小时),则X 是定义在样本空间}0|{≥=t t S 上的函数,即t t X X ==)(,是随机变量.
课堂练习
1. 一报童卖报, 每份0.15元,其成本为0.10元. 报馆每天给报童1000份报, 并规定他不得把卖不出的报纸退回. 设X 为报童每天卖出的报纸份数, 试将报童赔钱这一事件用随机变量的表达式表示.
第二节 离散型随机变量及其分布函数
内容要点:
一、离散型随机变量及其概率分布
定义 设离散型随机变量X 的所有可能取值为),2,1( =i x i , 称
,2,1,}{===i p x X P i i
为X 的概率分布或分布律, 也称概率函数.
常用表格形式来表示X 的概率分布:
n i n p p p p x x x X 2121
二、常用离散分布
退化分布 两点分布 n 个点上的均匀分布 二项分布 几何分布 超几何分布
泊松分布:泊松分布是概率论中最重要的几个分布之一. 实际问题中许多随机现象都服从或近似服从泊松分布.
三、二项分布的泊松近似
定理1 (泊松定理) 在n 重伯努利试验中, 事件A 在每次试验中发生的概率为n p (注意
这与试验的次数n 有关), 如果∞→n 时, λ→n np (0>λ为常数), 则对任意给定的k , 有
λλ-∞
→=
e k p n k b k
n n !
),,(lim .
例题选讲:
离散型随机变量及其概率分布
例1 (讲义例1) 某篮球运动员投中篮圈的概率是0.9, 求他两次独立投篮投中次数X 的概率分布.
例2 (讲义例2) 设随机变量X 的概率分布为:
0,,2,1,0,!
}{>===λλ k k a
K X P k
.
试确定常数a .
二项分布
例3 (讲义例3) 已知100个产品中有5个次品, 现从中有放回地取3次, 每次任取1个, 求在所取的3个中恰有2个次品的概率.
例4 (讲义例4) 某人进行射击, 设每次射击的命中率为0.02, 独立射击400次, 试求至少击中两次的概率.
例5 (讲义例5) 设有80台同类型设备, 各台工作是相互独立的,发生故障的概率都是0.01, 且一台设备的故障能由一个人处理. 考虑两种配备维修工人的方法, 其一是由4人维护, 每人负责20台; 其二是由3人共同维护80台. 试比较这两种方法在设备发生故障时不能及时维修的概率的大小. 几何分布
例6 (讲义例6) 某射手连续向一目标射击, 直到命中为止, 已知他每发命中的概率是p , 求所需射击发数X 的概率分布. 泊松分布
例7 (讲义例7) 某一城市每天发生火灾的次数X 服从参数8.0=λ的泊松分布, 求该城市一天内发生3次或3次以上火灾的概率. 二项分布的泊松近似
例8 (讲义例8) 某公司生产的一种产品300件. 根据历史生产记录知废品率为0.01. 问现在这300件产品经检验废品数大于5的概率是多少?
例9 (讲义例9) 一家商店采用科学管理,由该商店过去的销售记录知道, 某种商品每月的销售数可以用参数5=λ的泊松分布来描述, 为了以95%以上的把握保证不脱销, 问商店在月底至少应进某种商品多少件?
例10 (讲义例10) 自1875年至1955年中的某63年间, 上海市夏季(5—9月)共发生大暴雨180次, 试建立上海市夏季暴雨发生次数的概率分布模型.
课堂练习
1.某类灯泡使用时数在1000小时以上的概率是0.2, 求三个灯泡在使用1000小时以后最多只有一个坏了的概率.
2.一汽车沿一街道行驶, 需要通过三个均设有红绿信号灯的路口, 每个信号灯为红或绿与其它信号灯为红或绿相互独立, 且红绿两种信号灯显示的时间相等. 以X 表示该汽车首次遇到红灯前已通过的路口的个数, 求X 的概率分布.
第三节 随机变量的分布函数
当我们要描述一个随机变量时,不仅要说明它能够取哪些值,而且还要指出它取这些值的概率. 只有这样,才能真正完整地刻画一个随机变量, 为此,我们引入随机变量的分布函数的概念.
内容要点:
一. 随机变量的分布函数
定义 设X 是一个随机变量, 称
)()()(+∞<<-∞≤=x x X P x F
为X 的分布函数.有时记作)(~x F X 或)(x F X .
分布函数的性质
1. 单调非减. 若21x x <, 则)()(21x F x F ≤;
2. ;1)(lim )(,0)(lim )(==+∞==-∞+∞
→-∞
→x F F x F F x x
3. 右连续性. 即).()(lim 00
x F x F x x =+→
二、离散型随机变量的分布函数
设离散型随机变量X 的概率分布为
n i n p p p p x x x X 2121
则X 的分布函数为
∑∑≤≤===≤=x
x i x
x i i i p x X P x X P x F )()()(.
例题选讲:
随机变量的分布函数
例1(讲义例1)等可能地在数轴上的有界区间],[b a 上投点, 记X 为落点的位置(数轴上的坐标) , 求随机变量X 的分布函数.
例2(讲义例2)判别下列函数是否为某随机变量的分布函数?
⎪⎩
⎪
⎨⎧≥<≤+<=⎪⎩
⎪
⎨⎧≥<≤<=⎪⎩⎪
⎨⎧≥<≤--<=.2/1,1,
2/10,2/1,0,0)()3(;,1,0,sin ,0,0)()2(;0,1,
02,2/1,2,0)()1(x x x x x F x x x x x F x x x x F ππ
离散型随机变量的分布函数
例3(讲义例3)设
,2
/16/13/12
10i p X 求)(x F .
例4 X 具有离散均匀分布, 即
,,,2,1,/1)(n i n x X P i ===
求X 的分布函数.
例5(讲义例4)设随机变量X 的分布函数为
⎪⎪⎩⎪⎪⎨⎧≥<≤<≤<=.3,
1,32,19/15,21,19/9,1,
0)(x x x x x F
求X 的概率分布.
课堂练习
1.设随机变量X 的概率分布为
4
/12/14/14
21i p X -,
求X 的的分布函数,并求
{},2/1≤X P {},2/52/3≤<X P {}
.32≤≤X P
第四节 连续型随机变量及其概率密度
内容要点:
一、 连续型随机变量及其概率密度
定义 如果对随机变量X 的分布函数)(x F ,存在非负可积函数)(x f ,使得对于任意实数x 有
.)(}{)(⎰
∞
-=
≤=x
dt t f x X P x F
则称X 为连续型随机变量, 称)(x f 为X 的概率密度函数,简称为概率密度或密度函数. 关于概率密度的说明
1. 对一个连续型随机变量X ,若已知其密度函数)(x f ,则根据定义,可求得其分布函数)(x F , 同时, 还可求得X 的取值落在任意区间],(b a 上的概率:
⎰=-=≤<b
a dx x f a F
b F b X a P )()()(}{
2. 连续型随机变量X 取任一指定值)(R a a ∈的概率为0.
3. 若)(x f 在点x 处连续, 则
)()(x f x F =' (1)
二、常用连续型分布 均匀分布
定义 若连续型随机变量X 的概率密度为
⎪⎩
⎪
⎨⎧<<-=其它,0,1
)(b x a a
b x f 则称X 在区间),(b a 上服从均匀分布, 记为),(~b a U X .
指数分布
定义 若随机变量X 的概率密度为
0.,0,0,)(>⎩
⎨⎧>=-λλλ其它x e x f x
则称X 服从参数为λ的指数分布.简记为).(~λe X
正态分布
定义 若随机变量X 的概率密度为
.,21)(2
22)(∞<<∞-=
--x e x f x σμσ
π
其中μ和)0(>σσ都是常数, 则称X 服从参数为μ和2σ的正态分布. 记为).,(~2σμN X 注: 正态分布是概率论中最重要的连续型分布, 在十九世纪前叶由高斯加以推广, 故又常称为高斯分布. 一般来说,一个随机变量如果受到许多随机因素的影响,而其中每一个因素都不起主导作用(作用微小),则它服从正态分布. 这是正态分布在实践中得以广泛应用的原因. 例如, 产品的质量指标, 元件的尺寸, 某地区成年男子的身高、体重, 测量误差, 射击目标的水平或垂直偏差, 信号噪声、农作物的产量等等, 都服从或近似服从正态分布.
标准正态分布
正态分布当1,0==σμ时称为标准正态分布, 此时, 其密度函数和分布函数常用)(x ϕ和)(x Φ表示:
,21)(2
2
x e x -=
π
ϕ ⎰
∞
--
=Φx
t dt e x 2
221)(π
标准正态分布的重要性在于, 任何一个一般的正态分布都可以通过线性变换转化为标准正态分布.
定理 设),,(~2σμN X 则).1,0(~N X Y σ
μ
-=
标准正态分布表的使用:
(1)表中给出了0>x 时)(x Φ的数值, 当0<x 时, 利用正态分布的对称性, 易见有
);(1)(x x Φ-=-Φ
(2) 若),1,0(~N X 则
);()(}{a b b X a P Φ-Φ=≤< (3)若),(~2σμN X , 则),1,0(~N X Y σ
μ
-=
故X 的分布函数
;}{)(⎪⎭
⎫
⎝⎛-Φ=⎭⎬⎫⎩⎨⎧-≤-=≤=σμσμσμx x X P x X P x F
⎭⎬⎫⎩⎨⎧-≤<-=≤<σμσμb Y a P b X a P }{.⎪⎭
⎫
⎝⎛-Φ-⎪⎭⎫
⎝⎛-Φ=σμσμa b
例题选讲:
连续型随机变量及其概率密度
例1 设随机变量X 的密度函数为
⎪⎩
⎪
⎨⎧≤≤--=其它,011,12
)(2x x x f π
求其分布函数)(x F .
例2(讲义例1)设随机变量X 具有概率密度
⎪⎪⎩⎪
⎪⎨⎧≤≤-<≤=.,
0,43,22,30,
)(其它x x x kx x f
}.2/71{)3();()2(;)1(≤<X P x F X k 求的分布函数求确定常数
例3(讲义例2)设随机变量X 的分布函数为
⎪⎩
⎪
⎨⎧<≤<≤=x x x x x F 1,110,0,
0)(2
求 (1) 概率}7.03.0{<<X P ; (2) X 的密度函数.
常用连续型分布 均匀分布
例4 (讲义例3)某公共汽车站从上午7时起, 每15分钟来一班车, 即7:00, 7:15, 7:30, 7:45等时刻有汽车到达此站, 如果乘客到达此站时间X 是7:00到7:30之间的均匀随机变量,试求他候车时间少于5分钟的概率. 指数分布
例5(讲义例4)某元件的寿命X 服从指数分布, 已知其平均寿命为1000小时,求3个这样的元件使用1000小时, 至少已有一个损坏的概率. 正态分布
例6(讲义例5)设)4,1(~N X , 求 .}2|1{|},6.10{),5(≤-≤<X P X P F 例7 设某项竞赛成绩N X ~(65, 100),若按参赛人数的10%发奖,问获奖分数线应 定为多少?
例8(讲义例6)将一温度调节器放置在贮存着某种液体的容器内,调节器整定在d ℃,液体的温度X (以℃计)是一个随机变量,且 )5.0,(~2d N X
(1) 若 09=d ℃,求X 小于89℃ 的概率;
(2) 若要求保持液体的温度至少为80℃的概率不低于0.99,问d 至少为多少?
例9(讲义例7)某企业准备通过招聘考试招收300名职工,其中正式工280人, 临时工20人; 报考的人数是1657人, 考试满分是400分. 考试后得知, 考试总平均成绩, 即166=μ分, 360分以上的高分考生31人. 某考生B 得256分, 问他能否被录取? 能否被聘为正式工? 例10(讲义例8)在电源电压不超过200伏,在200~240伏和超过240伏三种情形下,某种电子元件损坏的概率分别为0.1,0.001和0.2. 假设电源电压X 服从正态分布N (220,252
),试求:
(1) 该电子元件损坏的概率α;
(2) 该电子元件损坏时,电源电压在200~240伏的概率β.
课堂练习
1.已知)5.0,8(~2N X ,求 (1) );7(),9(F F (2) }105.7{≤≤X P ;
(3) };1|8{|≤-X P
(4) }.5.0|9{|<-X P
2.某种型号电池的寿命X 近似服从正态分布),(2σμN , 已知其寿命在250小时以上的概率和寿命不超过350小时的概率均为92.36%, 为使其寿命在x -μ和x +μ之间的概率不小于0.9, x 至少为多少?
第五节 随机变量函数的分布
讲解注意:
一、 随机变量的函数
定义 如果存在一个函数)(X g , 使得随机变量Y X ,满足:
)(X g Y =,
则称随机变量Y 是随机变量X 的函数.
注: 在微积分中,我们讨论变量间的函数关系时, 主要研究函数关系的确定性特征, 例如:导数、积分等.而在概率论中, 我们主要研究是随机变量函数的随机性特征, 即由自变量X 的统计规律性出发研究因变量Y 的统计性规律.
一般地, 对任意区间I , 令})(|{I x g x C ∈=, 则
},{})({}{C X I x g I Y ∈=∈=∈ }.{})({}{C X P I x g P I Y P ∈=∈=∈
注: 随机变量Y 与X 的函数关系确定,为从X 的分布出发导出Y 的分布提供了可能.
二、离散型随机变量函数的分布 设离散型随机变量X 的概率分布为
,2,1,}{===i p x X P i i
易见, X 的函数)(X g Y =显然还是离散型随机变量.
如何由X 的概率分布出发导出Y 的概率分布? 其一般方法是:先根据自变量X 的可能取值确定因变量Y 的所有可能取值, 然后对Y 的每一个可能取值,,2,1, =i y i 确定相应的},)(|{i j j i y x g x C ==于是
},{})({}{i i i i C X y x g y Y ∈==== .}{}{}{∑∈==
∈==i
j C x j
i i x X P C X P y Y P
从而求得Y 的概率分布.
三、 连续型随机变量函数的分布
一般地, 连续型随机变量的函数不一定是连续型随机变量, 但我们主要讨论连续型随机变量的函数还是连续型随机变量的情形, 此时我们不仅希望求出随机变量函数的分布函数, 而且还希望求出其概率密度函数.
设已知X 的分布函数)(x F X 或概率密度函数)(x f X , 则随机变量函数)(X g Y =的分布函数可按如下方法求得:
}.{})({}{)(y Y C X P y X g P y Y P y F ∈=≤=≤=
其中}.)(|{y x g x C y ≤=
而}{y C X P ∈常常可由X 的分布函数)(x F X 来表达或用其概率密度函数)(x f X 的积分来表达:
⎰
=∈y
C X y dx x f C X P )(}{
进而可通过Y 的分布函数)(x F Y , 求出Y 的密度函数.
定理1 设随机变量X 具有概率密度),(),(+∞-∞∈x x f X ,又设)(x g y =处处可导且恒有0)(>'x g (或恒有0)(<'x g ), 则)(X g Y =是一个连续型随机变量,其概率密度为
⎩
⎨⎧<<'=其它,0|,)(|)([)(βαy y h y h f y f Y
其中)(y h x =是)(x g y =的反函数, 且
)).(),(max()),(),(min(+∞-∞=+∞-∞=g g g g βα
例题选讲:
离散型随机变量函数的分布
例1(讲义例1)设随机变量X 具有以下的分布律, 试求2)1(-=X Y 的分布律.
4
.01.03.02.02
101i p X -
连续型随机变量函数的分布
例2(讲义例2)对一圆片直径进行测量, 其值在[5, 6]上均匀分布, 求圆片面积的概率分布密度.
例3(讲义例3)设⎩
⎨⎧<<=其它,04
0,8/)(~x x x f X X , 求82+=X Y 的概率密度.
例4 设)1,0(~N X , 求2X Y =的密度函数.
例5(讲义例4)已知随机变量X 的分布函数)(x F 是严格单调的连续函数, 证明)(X F Y =服从]1,0[上的均匀分布.
例6(讲义例5)的线性函数试证明设随机变量X N X ).,(~2σμb aX Y +=)0(≠a 也服从正态分布.
例7 (讲义例6) 设随机变量X 在)1,0(上服从均匀分布, 求X Y ln 2-=的概率密度.
例8 (讲义例8) (对数正态分布) 随机变量X 称为服从参数为2,σμ的对数正态分布, 如果X Y ln =服从正态分布),(2σμN . 试求对数正态分布的密度函数.
注: 在实际中, 通常用对数正态分布来描述价格的分布, 特别是在金融市场的理论研究中, 如著名的期权定价公式(Black —Scholes 公式), 以及许多实证研究都用对数正态分布来描述金融资产的价格. 设某种资产当前价格为0P , 考虑单期投资问题, 到期时该资产的价
格为一个随机变量, 记作1P , 设投资于该资产的连续复合收益率为r , 则有
r
e P P 01=
从而
010
1
ln ln ln
P P P P r -== 注意到0P 为当前价格, 是已知常数,因而假设价格1P 服从对数正态分布实际上等价于假设连续复合收益率r 服从正态分布.
例9(讲义例7)设随机变量X 服从参数为λ的指数分布, 求}2,min{X Y =的分布函数.
课堂练习
1. 设X 的分布列为
10
/310/110/110/15/12
/52101i p X -
试求: (1) 2X 的分布列; (2) 2X 的分布列.
2. 设随机变量X 的概率密度为
⎩
⎨⎧<<=.,0,
0,/2)(2其它ππx x x f
求X Y sin =的概率密度.。