2014年自考 概率论与数理统计串讲讲义 第二章 随机变量及其概率分布
第二章 随机变量及其分布 概率论与数理统计 教学课件
面,T 表示反面。在试验前,X 将取什么值是不确定的, 一旦有了试验结果后 X 的值就完全确定,即
X (H ) 1 ,X ( T ) 0 故随机变量由试验结果确定,因而其取值是随机的
202200年201/11月/1111日
例2.2 将一颗均匀骰子掷一次,观察出现的点 数.此处观察对象有一个明显的量化指标,即 观察出现的点数.我们记之为X ,则X 的可能 值为:1,2,3,4,5,6
0
.75,
0 x 1, 1 x 2,
1, x 2.
2020/11/11
2.2.2 常用离散型分布
1. (0-1)分布
设随机变量X只可能取0与1这两个值,它的分布 律是:
P { X k } p k ( 1 p ) 1 k , k 0 , 1( 0 p 1 )
则称X 服从(0-1)分布或两点分布. (0-1)分布的分布律也可以写为
x k x
ቤተ መጻሕፍቲ ባይዱ
x k x
这里和式是对所有满足 xk x 的k求和。
反之,若已知离散型随即变量X的分布函数F(x),
则其分布律为:
p 1 F ( x 1 ) , p k F ( x k ) F ( x k 1 ) , k 1
2020/11/11
例2.4 设离散型随机变量 X的分布律如下,求a的值。
20142014年年22月月1414日星期五日星期五分布函数概率密度常见连续型随机变量的分布均匀分布正态分布或高斯分布指数分布标准正态分布20142014年年22月月1414日星期五日星期五2424随机变量函数的分布随机变量函数的分布242连续型随机变量函数的分布243小结241离散型随机变量函数的分布20142014年年22月月1414日星期五日星期五2014年2月14日241离散型随机变量函数的分布记作的函数变量为随机则称随机变量取值随着若随机变量的集合上的函数的一切可能值是定义在随机变量的分布分布求得随机变量20142014年年22月月1414日星期五日星期五的分布律为也是离散型随机变量其函数是离散型随机变量如果合并应将相应的中有值相同的20142014年年22月月1414日星期五日星期五20142014年年22月月1414日星期五日星期五242连续型随机变量的函数的分布的密度函数求导得到的概率密度求随机变量其他的概率密度为设随机变量20142014年年22月月1414日星期五日星期五第一步先求y2x8的分布函数第二步由分布函数求概率密度
概率论讲义第二章随机变量及其分布[统计学经典理论]
第二章随机变量及其分布第一节随机变量1. 为什么引入随机变量?概率论是从数量上来研究随机现象统计规律性的,为了更方便有力的研究随机现象,就要用数学分析的方法来研究,因此为了便于数学上的推导和计算,就需将任意的随机事件数量化.当把一些非数量表示的随机事件用数字来表示时,就建立起了随机变量的概念.2. 随机变量的引入实例1 在一装有红球、白球的袋中任摸一个球,观察摸出球的颜色.实例2 抛掷骰子,观察出现的点数.二、随机变量的概念定义设随机试验E的样本空间是S = {e}, X = X (e)是定义在样本空间S 上的实值单值函数, 则我们称X = X (e)为随机变量.2.说明(1)随机变量与普通的函数不同随机变量是一个函数 , 但它与普通的函数有着本质的差别 ,普通函数是定义在实数轴上的,而随机变量是定义在样本空间上的 (样本空间的元素不一定是实数).(2)随机变量的取值具有一定的概率规律随机变量随着试验的结果不同而取不同的值, 由于试验的各个结果的出现具有一定的概率, 因此随机变量的取值也有一定的概率规律.(3)随机变量与随机事件的关系随机事件包容在随机变量这个范围更广的概念之内.或者说 : 随机事件是从静态的观点来研究随机现象,而随机变量则是从动态的观点来研究随机现象.下面我们举几个随机变量的例子:(1) n次射击命中目标的次数X (或随意抽验n件产品, 其中不合格品的件数), 它有n + 1个可能取值: 0, 1, 2, …, n.(2) 灯泡寿命X, 可以取[0, +∞)上的任意值.(3) 测量误差X, 可以取(-∞, +∞)上的任意值.有了随机变量, 随机试验中的各种事件, 就可以通过随机变量的关系式表达出来.例如, 从一批产品中任意取出10件, 若用X表示其中的废品数, 这时, {少于2件废品}、{恰有1件废品}两个事件, 就可以分别用{X < 2}、{X = 1}来表示.又如单位时间内电话交换台接到的呼唤次数用X 表示, 此时{接到不少于1次呼唤}、{没有接到呼唤}两个事件, 可以分别用{X ≥ 1}、{X = 0}来表示.再如, 上面(2)中事件{寿命不少于200小时而不超过1000小时}的事件, 就可用{200 ≤ X ≤ 1000}来表示.例1 “掷一颗骰子”是随机现象, 用随机变量X 表示出现的点数, 求(1) X 的取值范围; (2) 概率P{X ≤ 4}及P{X < 4}; (3) 概率P{X > 4}及P{2 ≤ X < 4}.引进了随机变量, 就可以通过随机变量来描述随机试验中各种事件, 全面反映试验的情况. 因此, 我们对随机现象统计规律性的研究, 就可以由对事件与事件的概率的研究扩大为对随机变量的研究.-∞第二节 离散型随机变量极其分布律如果随机变量它所有可能取的值是有限个或可列个值, 则我们就称之为离散型随机变量.设离散型随机变量X 的所有可能取值为x k (k = 0, 1, 2, ...), X 取各个可能值的概率, 即事件{X = x k }概率为 P{X = x k }= p k , k = 0, 1, 2, (1)则我们称(1)式为离散型随机变量X 的分布律或概率分布. 分布律也可以用表格的形式来表示:k 1︒ 0 ≤ p k ≤ 1, k = 0, 1, 2, …; 2︒ 11=∑∞=k k p .(2) 注: 凡满足(2)的函数p k 一定是某个离散型随机变量的分布律. 例1 (1) 设随机变量X 的分布律为k c k X P ⎪⎭⎫ ⎝⎛⋅==32}{, k = 1, 2, 3, 求常数c 的值. 3827 (2) 设随机变量X 的分布律为!}{k c k X P k λ⋅==, k = 0, 1, 2, …, λ > 0, 求常数c 的值. 1)1(--λe下面介绍三种重要的离散型随机变量.一、(0 - 1)分布(或两点分布)设随机变量X 只可能取0或1两个值, 它的分布律为k k p p k X P --==1)1(}{, k = 0, 1, (0 < p < 1), 或则称X 服从(0 - 1)分布 凡是只有两个结果的试验都可以用(0 - 1)分布来描述.二、伯努利试验、二项分布在实践中, 我们经常遇到下列类型的重复试验:(1) 每次试验的条件都相同, 且试验结果; 只有两个: A 及A , 且P(A) = p, P(A ) = q = 1 - p (0 < p < 1),(2) 每次试验的结果(即基本事件)是相互独立的.我们称之为n 重伯努利(Bernoulli)试验, 或伯努利概型.由于它是一个常见的、十分有用的概型, 所以在这里着重对它进行讨论.对于伯努利概型, 可以得到如下结果: 在n 次试验中事件A 出现k 次的概率为()(,,)k k n k n n P k b k n p C p q-==, k = 0, 1, 2, …, n. (3)事实上, 如将“第i 次试验中A 出现”的事件记为A i (i = 1, 2, …, n), 则由伯努利概型知, 在n 次试验中事件A 在指定的k 次试验中出现(如在前k 次出现), 其余n - k 次试验中不出现的概率为=+)(11n k k A A A A P =+)()()()(11n k k A P A P A P A P k k k k q p p p --=-11)1(.由于n 次试验中A 出现k 次的方式很多(在前k 次出现只是其中一种方式), 其总数相当于k 个相同的质点安排在n 个位置(每个位置只能安排一个质点)上的所有可能方式, 易知共应有k n C 种方式, 而它所对应的这k n C 个事件(即“n 次试验中A 出现k 次”这一事件)是不相容的, 故由概率的可加性得()(,,)k k n k n n P k b k n p C p q-==, k = 0, 1, 2, …, n.例3 设由四门高射炮同时独立地向一架敌机各发射一发炮弹, 若低机被不少于两发炮弹击中时, 就被击落. 设每门高射炮击中敌机地概率为0.6, 球敌机被击落地概率.解: 所求概率为 P = 1 - P 4(0) - P 4(1) = 0.8208.例4 甲、乙两乒乓球运动员实力相等, 连赛数局, 问哪一种结果的可能性大: 赛3局甲胜2局; 赛5局甲胜3局.解: 赛3局甲胜2局 83)2(3=P ; 赛5局甲胜3局 165)3(5=P .例5 某人有两盒火柴, 用时从任一盒中取一根火柴, 经过若干时间以后发现一盒火柴已经用完, 如果最初两盒中各有n 根火柴, 求这时另一盒中还有r 根火柴的概率.解: 发现一盒火柴已经用完, 而另一盒中还有r 根火柴, 这种情况一定是在第n + (n - r) + 1= 2n - r + 1次用时发现的. 设在前2n - r 次中此人恰有n 次取了第一盒, n - r 次取了第二盒, 而在第2n - r + 1次又取了第一盒, 发现它是空的, 这一事件的概率为 21)(21⋅=-n P p r n =2121212⋅⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛--r n n n r n C =12221+--⎪⎭⎫ ⎝⎛r n n r n C 同理, 设在前2n - r 次中此人恰有n 次取了第二盒, n - r 次取了第一盒, 而在第2n - r + 1次又取了第二盒, 发现它是空的, 这一事件的概率为 122221+--⎪⎭⎫ ⎝⎛=r n n r n C p . 因此, 所求事件的概率为 r n n r n C p p P --⎪⎭⎫ ⎝⎛=+=222121.设X 表示n 重伯努利试验中事件A 发生的次数, 则X 是一个随机变量, 它的可能取值为0、1、2、…、n, 由前面的讨论, 我们有 {}k k n k n P X k C p q -==, k = 0, 1,2, …, n. (4) 显然, P{X = k} ≥ 0, k = 0, 1, 2, …, n; 0()1n k k n k n n k C p q p q -==+=∑即P{X = k}满足条件(2), 注意到k k n k n C p q -刚好是二项式n q p )(+的展开式中出现p k 的项,故我们称随机变量X 服从参数为n 、p 的二项分布, 记为X ~b (n, p).特别地, 当n = 1时, 二项分布即为(0 - 1)分布.例6 设有12台独立运转的机器, 在一小时内每台机器停机的概率为0.1, 试求在一小时内停机台数不超过2的概率.解: 设X 表示一小时内停机台数, 则X ~b (12, 0.1). 从而所求概率为P{X ≤ 2} = P{X= 0} + P{X= 1} + P{X= 2} = 0.2824 + 0.3766 + 0.2301 = 0.8891.例7 某车间有10台电机各为7.5千瓦的机床, 如果每台机床的工作情况是相互独立的, 且每台机床平均每小时开动12分钟, 问全部机床用电超过48千瓦的可能性有多少?解: 设X 表示正在工作的机床台数, 则)51,10(~b X , 用电超过48千瓦即有7台或7台以上的机床在工作, 则所求概率为377105451}7{⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛=≥C X p +288105451⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛C +⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛54519910C +10101051⎪⎭⎫ ⎝⎛C 11571≈. 从此例可看出, 当n 很大时, 计算k k k n q p C k X P -==1}{是十分麻烦的.为此, 我们有泊松(Poisson)定理 设λ > 0是一个常数, n 是任意正整数, 设np n = λ , 则对于任一固定的非负整数k, 有 !)1(lim k e p p C k k n n k n k n n λλ--∞→=-. 证: 由n p n λ=, 有 k n k k n n k n k n n n k n n n k p p C --⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛+--=-λλ1)1()1(!1)1( k n k n n n k n n k -⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛----⋅-⋅=λλλ11)]11()21()11(1[! . 对于任意固定的k, 当n →∞时, 有 1)]11()21()11(1[→---⋅-⋅n k n n , λλ-→⎪⎭⎫ ⎝⎛-e n n 1, 11→⎪⎭⎫ ⎝⎛--k n λ. 故有 !)1(lim k e p p C k k n n k n k n n λλ--∞→=-. 可见, 当n 很大, p 很小时, 二项分布就可以用下列公式来近似计算: !)1(1k e p p C k k k k n λλ--≈- (λ = np) (5) 这就是著名的二项分布的泊松逼近公式.例8 某人进行射击, 每次命中率为0.02, 独立射击400次, 求命中次数X ≥ 2的概率.解: 显然, X ~ b(400, 0.02), 则P{X ≥2} = 1 - P{X = 0} - P{X =1}9970.091)98.0()02.0()98.0()02.0(183991140040000400≈-≈--=-e C C .这个概率接近于1, 它说明, 一个事件尽管它在一次试验中发生的概率很小, 但只要试验次数很多, 而且试验是独立进行的, 那么这一事件的发生几乎是肯定的, 所以不能轻视小概率事件. 另外, 如果在400次射击中, 击中目标的次数竟不到2次, 根据实际推断原理, 我们将怀疑“每次命中率为0.02”这一假设.例9 为保证设备正常工作, 需要配备适量的维修工人(工人配备多了就浪费, 配备少了要影响生产). 现有同类型设备300台, 各台工作与否是相互独立的, 发生故障的概率都是0.01, 在通常情况下, 一台设备的故障可由一人来处理(我们也只考虑这种情况), 问至少需配备多少工人, 才能保证当设备发生故障但不能维修的概率小于0.01?解: 设需要配备N 人, 记同一时刻发生故障的设备台数为X, 则X ~ b(300, 0.01), 所要解决的问题是确定N, 使得 P{X > N} < 0.01. 由泊松定理, λ = np = 3, }{1}{N X P N X P ≤-=>=∑=-⋅-N k k k k C 0300300)99.0()01.0(1∑∑∞+=-=-=-≈1303!3!31N k k N k k k e k e < 0.01. 查表知, 满足上式的最小的N 是8, 因此需配备8个维修工人.例10 在上例中, 若由一人负责维修20台设备, 求设备发生故障而不能及时处理的概率. 若由3人共同负责维修80台呢?解: 在前一种情况, 设备发生故障而不能及时处理, 说明在同一时刻设备有2台以上发生故障. 设X 为发生故障设备的台数, 则X ~ b(20, 0.01)且n = 20, λ = 0.2, 于是, 设备发生故障而不能及时处理的概率为 }2{1)99.0()01.0(}2{2020220<-==≥-=∑X P C X P k k k k ∑=--=102020)99.0()01.0(1k k k k C 0175.0!)2.0(1102.0=-≈∑=-k k k e . 若由3人共同负责维修80台, 设同一时刻发生故障的设备台数为X, 则X ~ b(80, 0.01), λ = 0.8, 故同一时刻至少有4台设备发生故障的概率为 k k k k C X P -=∑=≥8080480)99.0()01.0(}4{0091.0!)8.0(8048.0≈≈∑=-k k k e . 计算结果表明, 后一种情况尽管任务重了(平均每人维修27台), 但工作质量不仅没有降低, 相反还提高了, 不能维修的概率变小了, 这说明, 由3人共同负责维修80台, 比由一人单独维修20台更好, 既节约了人力又提高了工作效率, 所以, 可用概率论的方法进行国民经济管理, 以便达到更有效地使用人力、物力资源的目的. 因此, 概率方法成为运筹学的一个有力工具.三、泊松分布设随机变量X 的所有可能取值为0, 1, 2, …, 而取各个值的概率为 !}{k e k X P k λλ-==, k = 0, 1, 2, … 其中λ > 0是常数, 则称X 服从参数为λ的泊松分布, 记为X ~ π (λ).易验证, P{X = k}满足条件(2).例11 有一汽车站, 每天都有大量汽车通过. 设每辆汽车在一天中的某段时间内发生事故的概率为0.0001, 而在某天的该段时间内有1000辆汽车通过, 试求发生事故的次数X < 2的概率.解: 显然X ~ b(1000, 0.0001). 因n = 1000较大, p = 0.0001较小, 故可用泊松分布来计算, λ = np = 0.1, 从而 }1{}0{}2{=+==<X P X P X P 1.01.00!11.0!0)1.0(--+=e e 9953.01.11.0≈=-e . 泊松定理指明了以n 、p(np = λ)为参数的二项分布, 当n →∞时趋于以λ为参数的泊松分布, 这一事实也显示了泊松分布在理论上的重要性.具有泊松分布的随机变量在实际中存在相当广泛. 例如, 纺纱车间大量纱锭上的纺线在一个时间间隔内被扯断的次数; 纺织厂生产的一批布匹上的疵点个数; 电话总机在一段时间内收到的呼唤次数; 种子中杂草种子的个数; 一本书某页(或某几页)上印刷错误的个数; 在一个固定时间内从某块放射物质中发射出的α粒子的数目等都服从泊松分布.泊松分布通常适用于描绘大量重复试验中稀有事件(即每次试验中出现的概率很小的事件, 例如不幸事件、意外事故、非常见病、自然灾害等)出现的次数的概率分布.第三节 随机变量的分布函数对于非离散型随机变量X, 由于其取值不能一个个列举出来, 因此在一般情况下, 需研究随机变量取值落在任意区间(x 1, x 2)中的概率, 即求 P{x 1< X ≤ x 2}. 由于事件{x 1< X ≤ x 2}与事件{X ≤ x 1}互不相容, 且{x 1< X ≤ x 2}∪{X ≤ x 1}= {X ≤ x 2}, 因此有P{x 1< X ≤ x 2} = P{X ≤ x 2} - P{X ≤ x 1}.由此可见, 若对任何给定的实数x, 事件{X ≤ x}的概率P{X ≤ x}确定的话, 概率P{x 1< X ≤ x 2}也就确定了, 但概率P{X ≤ x}随着不同的x 而变化, 这个概率是x 的函数, 于是引进下面的分布函数的概念.定义 设X 是一个随机变量, x 是任意实数, 函数 F(x) = P{X ≤ x}(1)称为分布函数.注: 1︒ F(x)是一个普通实函数, 它的定义域是整个数轴, 故求分布函数时要就x 落在整个数轴上讨论, F(x)的值域是区间[0, 1]. 如果将X 看成是数轴上的随机点的坐标, 则分布函数F(x)在x 处的函数值就表示X 落在(-∞, x ]上的概率.2︒ 由上面的讨论, 有P{x 1< X ≤ x 2}= F(x 2) - F(x 1).例1 接连进行两次射击, 以X 表示命中目标的次数, 假设已知每次射击命中目标的概率为0.4, 求X 的分布律与分布函数.解: XX 的分布函数为 ⎪⎪⎩⎨≥<≤=.2,1,21,84.0)(x x x F 一般地, 设离散型随机变量X 的分布律为 P{X = x k }= p k , k = 1, 2, …, 则X 的分布函数为∑∑≤≤===≤=x x k x x k k k p x X P x X P x F }{}{)( (2)这里和式是对所有满足x k ≤ x 的k 求和. 此外, 分布函数F(x)在x = x k (k = 1, 2, …)处有跳跃, 其跳跃值为p k = P{X = x k }.例2求X 的分布函数}2{≤X P }21{≤<X P }21{≤≤X P 例3 向区间[a, b]上均匀地投掷一随机点, 以X 表示随机点的落点坐标, 求X 的分布函数. 解: ⎪⎩⎪⎨⎧≥<≤--<=.,1,,,,0)(b x b x a a b a x a x x F 分布函数F(x)具有以下一些性质:1︒ 0 ≤ F(x) ≤ 1 (-∞ < x < +∞);2︒ F(x)是单调不减函数, 即若x 1 < x 2, 则F(x 1) ≤ F(x 2);3︒ 0)(lim )(==-∞-∞→x F F x , 1)(lim )(==+∞+∞→x F F x ; 4︒ )()(lim )0(0000x F x F x F x x ==++→ (-∞ < x 0 < +∞), 即F(x)是右连续的.第四节 连续型随机变量极其概率密度在实际问题中, 除了离散型随机变量以外, 还有非离散型随机变量, 其中常用的是连续型随机变量. 如炮弹落地点和目标之间的距离. 尽管分布函数是描述各种类型随机变量变化规律的最一般的共同形式, 但由于它不够直观, 往往不常用. 如对于离散型随机变量, 用分布律来描述既简单又直观. 对于连续型随机变量我们也希望有一种比分布函数更直观的描述方式.定义 如果对于随机变量X 的分布函数F(x), 存在非负函数f (x), 使对任意实数x, 有 ⎰∞-=x dt t f x F )()( (1) 则称X 为连续型随机变量, 其中函数f (x)称为X 的概率密度函数, 简称概率密度.概率密度f (x)在几何上表示一条曲线, 称之为分布曲线. 分布函数F(x)的几何意义是分布曲线f (x)下从-∞到x 的一块面积, 这块面积随x 而改变.可以证明: 连续型随机变量的分布函数F(x)是连续函数.易知, 概率密度f (x)具有下列性质:1︒ f (x) ≥ 0; 2︒ 1)(=⎰∞+∞-dx x f ; 3︒ P{x 1< X ≤ x 2}= F(x 2) - F(x 1) =⎰21)(x x dx x f (x 1 ≤ x 2); 4︒ 若f (x)在点x 处连续, 则有)()(x f x F ='.注: (1) 若函数f (x)满足性质1︒、2︒, 则f (x)一定是某个连续型随机变量的概率密度.(2) 对于连续型随机变量X 来说, 它取任一指定实数a 的概率为0, 即P{X = a}= 0.事实上, 设X 的分布函数为F(X), ∆x > 0, 则由{X = a}⊂ {a - ∆x < X ≤ a}得 ⎰∆+=∆--=≤<∆-≤=≤x a a dx x f x a F a F a X x a P a X P )()()(}{}{0. 又0)(lim 0=⎰∆+→∆x a a x dx x f , 所以, P{X = a}= 0. 因此 P{a < X ≤ b} = P{a < X < b} = P{a ≤ X < b} = P{a ≤ X ≤ b} = F(b) - F(a).(3) 概率为0的事件不一定是不可能事件, 同样, 概率为1的事件也不一定是必然事件.(4) 连续型随机变量X 落在小区间(x, x + ∆x) (∆x > 0)上的概率为 =∆+≤<}{x x X x P dx x f dx x f x x x )()(≈⎰∆+. 乘积f (x)dx 称为概率微分, 上式表明, 连续型随机变量X 落在小区间(x, x + ∆x)上的概率近似地等于概率微分. f (x)dx 在连续型随机变量理论中所起的作用与概率P{X = x k } = p k 在离散型随机变量理论中所起的作用是类似的. 如果把x 看成质点的坐标, f (x)看成在x 处的线密度, 则P{x 1< X ≤ x 2}=⎰21)(x x dx x f 就可看成是分布在线段x 1x 2上的质量, 这就是称f (x)为概率密度的理由.例1 确定常数A, 使x Ae x f -=)((-∞ < x < +∞)为某一随机变量的概率密度. 21 例2 设随机变量X 的概率密度为 ⎪⎩⎪⎨⎧<≤-<≤=,,0,21,2,10,)(其它x x x x x f ⎪⎪⎪⎩⎪⎪⎪⎨⎧><≤-+-<≤<=.2,1,21,122,10,2,0,0)(22x x x x x x x x F 求X 的分布函数F(x). 例3 设随机变量X 的概率密度x x e e A x f -+=)( (-∞ < x < +∞). 求 (1) 常数A; (2) 概率}3ln 210{<<X P ; (3) X 的分布函数F(x). 解: (1) 由12arctan )(===+∞∞-∞+∞-⎰A e A dx x f x π, 得 π2=A . (2) }3ln 210{<<X P =61arctan 23ln 0=x e π. (3) X 的分布函数F(x)为 x e x F arctan 2)(π= (-∞ < x < +∞). 例4 设连续型随机变量X 的分布函数为⎪⎩⎪⎨⎧><≤-+-<=,,1,,arcsin ,,0)(a x a x a a x B A a x x F 其中a > 0, 求 (1) 常数A 、B; (2) 概率}2{a X P <; (3) X 的概率密度f (x). 注: 若已知X 的概率密度f (x), 要求分布函数F(x), 用积分方法⎰∞-=x dt t f x F )()(, 当f (x)是分段函数时, 积分要分段讨论; 若已知X 的分布函数F(x), 要求概率密度f (x), 则用微分方法)()(x f x F =', 当F(x)是分段函数时, 在分段点处用导数定义求导, 当)(x F '不存在(个别点), 则可任意规定)(x F '的值(个别点的值不影响积分结果).下面介绍几个重要的连续型随机变量.一、均匀分布如果随机变量X 的取值范围是有限区间(a, b), 并且落在[a, b]中的任一小区间的概率只与这个区间的长度成正比, 而与该小区间的位置无关, 则称X 在(a, b)上服从均匀分布, 它的概率密度为 ⎪⎩⎪⎨⎧<<-=.,0,,1)(其它b x a a b x f 分布函数为⎪⎩⎪⎨⎧≥<≤--<=.,1,,,,0)(b x b x a a b a x a x x F 记为X ~ U (a, b). 例5 设随机变量X ~ U (0, 10), 求方程012=++Xx x 有实根的概率.解: ∆=042≥-X , X ≤ -2或X ≥ 2, 所以 P{X ≤ -2} + P{X ≥ 2} = 0.8.二、指数分布 如果连续型随机变量X 的概率密度为⎪⎩⎪⎨⎧>=-.,0,0,1)(其它x e x f xθθ 其中θ > 0是常数, 则称X 服从参数为θ 指数分布, 其分布函数为⎪⎩⎪⎨⎧>-=-.,0,0,1)(其它x e x F x θ 指数分布有重要应用, 常用它来作为各种“寿命”分布的近似. 例如无线电元件的寿命、动物的寿命、电话问题中的通话时间、随机服务系统中的服务时间等都常假定服从指数分布.服从指数分布的随机变量X 具有以下有趣的性质:对于任意的s 、t > 0, 有P{X > s + t ∣X > s} = P{X > t}. 事实上 P{X > s + t ∣X > s} =}{}{}{)}(){(s X P t s X P s X P s X t s X P >+>=>>+> =}{)(1)(1t X P e e e s F t s F t s t s >===-+---+-θθθ. 此性质称为无记忆性. 如果X 是某一元件的寿命, 那么上式表明: 已知元件已使用了s 小时, 它总共能使用至少s + t 小时的条件概率, 与从开始使用时算起它至少能使用t 小时的概率相等. 这就是说, 元件对它已使用过s 小时没有记忆. 具有这一性质是指数分布有广泛应用的原因.三、正态分布 设连续型随机变量X 的概率密度为 222)(21)(σμσπ--=x e x f , (-∞ < x < +∞). 其中μ、σ (σ > 0)为常数, 则称X 服从参数为μ、σ 的正态分布或高斯(Gauss)分布, 记为X ~ N (μ、2σ). 其分布函数为 ⎰∞---=x t dt e x F 222)(21)(σμσπ (-∞ < x < +∞).可以证明, f (x)满足概率密度的两个性质. 事实上 ⎰∞+∞---dx e x 222)(21σμσπ(令σμ-=x t )= I dt e t =⎰∞+∞--2221π. 而=2I 22221⎪⎪⎪⎭⎫ ⎝⎛⎰∞+∞--dt e t π=⎰⎰∞+∞-∞+∞---⋅dy e dx e y x 22222121ππ=⎰⎰∞+∞-∞+∞-+-dxdy e y x )(212221π. 利用极坐标, 令x = rcos θ, y = rsin θ, 则 =2I ⎰⎰∞+-02021221πθπrdrd e r =1022=⎰∞+-dr re r , 由于I ≥ 0, 故有 1)(=⎰∞+∞-dx x f .正态分布的概率密度f (x)的图形称为正态曲线, 它具有以下性质:1︒ 曲线位于x 轴的上方, 以直线x = μ为对称轴, 即f (μ + x) = f (μ - x). 这表明对于任意的h > 0, 有P{μ - h < X ≤ μ}= P{μ < X ≤ μ + h}. 2︒ 当x = μ 时, 曲线处于最高点(σπμ21)(=f ), 当x < μ 时, f (x)单调增加; 当x > μ 时, f (x)单调减少, 即当x 向左右远离μ 时, 曲线逐渐降低, 整条曲线呈现“中间高, 两边低”的形状. 这表明对于同样长度的区间, 当区间离μ 越远, X 落在这个区间上的概率越小. 3︒ 在x = μ ±σ 处曲线有拐点, 并以x 轴为渐近线.4︒ 参数μ 确定了曲线的位置, σ 确定了曲线的形状. σ 越大, 曲线越平坦; σ 越小, 曲线越集中.特别地, 当μ = 0, σ = 1时, 称X 服从标准正态分布, 其概率密度和分布函数分别用ϕ(x)和Φ(x)表示, 即 2221)(x e x -=πϕ, ⎰∞--=Φx t dt e x 2221)(π.我们知道, 利用分布函数F(x)可以计算事件“X ≤ x ”的概率. 但当X ~ N (0, 1)时, 就无法用初等方法计算, 因此, 为计算方便, 人们编制了Φ(x)的函数表, 从表中可查出服从N (0, 1)的随机变量小于指定值x(x > 0)的概率P{X ≤ x} = Φ(x).因⎰⎰-∞--∞----==-Φx x t d t dt t x )()()()(ϕϕ=)(1)(1)(x dt t dt t x x Φ-=-=⎰⎰∞-∞+ϕϕ(ϕ(x)是偶函数), 所以, 当x < 0时, 只要查得Φ(-x), 即可求得Φ(x)的值.对一般的正态分布, 可利用变换σμ-=x t , 将其化成标准正态分布, 即有(){}x F x P X x μσ-⎛⎫=≤=Φ ⎪⎝⎭. 事实上, }{)(x X P x F ≤==⎰∞---x t dt e 222)(21σμσπ(令σμ-=t y )=⎰-∞--⎪⎭⎫ ⎝⎛-Φ=σμσμπx y x dy e 2221.对任意区间[x 1, x 2], 有 ⎪⎭⎫ ⎝⎛-Φ-⎪⎭⎫ ⎝⎛-Φ=≤-≤=≤<σμσμ121221}{}{}{x x x X P x X P x X x P .例6 设X ~ N (0, 1), 求:(1) P{X ≤ 1.15}; 0.8749 (2) P{X ≤ -2.35}; 0.0094(3) P{0.02 < X ≤ 1.15}; 0.4821 (4) P{-1.85 < X ≤ 0.04}; 0.4838例7 设X ~ N (108, 9), 求: (1) P{101.1 < X < 117.6}; 0.9886(2) 求常数a, 使P{X < a} = 0.90; 111.84 (3) 求常数a, 使P{∣X - a ∣> a} = 0.01. 57.50例8 设),(~2σμN X , 求:(1) P{μ - σ < X < μ + σ}; 0.6826 (2) P{μ - 2σ < X < μ + 2σ}; 0.9544 (3) P{μ - 3σ < X < μ + 3σ}. 0.9974此例表明, 当时, X 以99.74%的概率落入区间(μ - 3σ , μ + 3σ)内, 即X 的可取值几乎全部在(μ - 3σ , μ + 3σ)内, 这就是统计中的3σ 原则.例9 公共汽车车门的高度是按男子与车门顶碰头的机会在0.01以下来设计的. 设男子身长X 服从μ = 170cm, σ = 6cm 的正态分布, 即)6,170(~2N X , 问车门高度应如何确定?解: 设车门高度为hcm. 按设计要求, P{X ≥ h} ≤ 0.10或P{X < h} ≥ 0.99. 因)6,170(~2N X , 故99.06170)(}{≈⎪⎭⎫ ⎝⎛-Φ==<h h F h X P , 查表得 Φ(2.33) = 0.9901 > 0.99, 所以, 33.26170=-h , h = 184cm.为了便于今后应用, 对于标准正态随机变量, 我们引入α分位点的概念.设X ~ N (0, 1), 对给定的数α, 0 < α < 1, 称满足条件 αϕαα==>⎰∞+z dx x z X P )(}{ 的数z α为标准正态分布的上(侧) α分位点(如图).对于给定的α, z α的值可这样求得; P{X > z α} = 1 - Φ( z α) = α , 从而, Φ( z α) = 1 - α , 查表可得. 如, z 0.05 = 1.645, z 0.3 = 0.52.一般地, 对随机变量X, 若对给定的数α, 0 < α < 1, 称满足条件P{X ≥ z α}= 1 - F(z α)的数z α为此概率分布的上(侧) α分位点(数).在自然现象和社会现象中, 大量随机变量服从或近似服从正态分布. 一般地, 只要某个随机变量是由大量相互独立、微小的偶然因素的总和所构成, 而且每一个别偶然因素对总和的影响都均匀地微小, 则可断定这个随机变量必近似服从正态分布.第五节 随机变量的函数的分布在微积分中, 函数y = g(x)是一个最基本的概念, 同样, 在概率论与数理统计中, 也常遇到随机变量的函数. 例如, 在测量圆轴截面面积的试验中, 所关心的随机变量−圆轴截面面积A 不能直接测量得到, 只能直接测量圆轴截面的直径d 这个随机变量, 再根据关系式 得到A, 这里随机变量A 是随机变量d 的函数.一般地, 设g(x)是定义在随机变量X 的一切可能取值x 的集合上的函数, 如果当X 取值为x 时, 随机变量Y 的取值为y = g(x), 则称Y 是随机变量X 的函数, 记为Y = g(X). 下面我们讨论如何由已知的随机变量X 的分布去求得它的函数的分布.一、X 是离散型随机变量设求 当X 取得它的某一可能值x i 时, 随机变量Y = g(X)取值y i = g(x i ) (i = 1, 2, …).如果诸i i i , 则把那些相等的值分别合并起来, 并根据概率可加性把对应的概率相加,就得到函数Y = g(X)的分布律.例求)2(-X 例求⎪⎭ ⎝=X Y 2sin 解: 因⎪⎩⎪⎨⎧-==-=-=⎪⎭⎫ ⎝⎛.34,1,2,0,14,12sin k n k n k n n π 所以, ⎪⎭⎫ ⎝⎛=X Y 2sin π只有三个可能取值: -1, 0, 1. 而取得这些值的概率分别是 152********}1{141173=+++++=-=- k Y P , 3121212121}0{2642=+++++== k Y P , 158********}1{3495=+++++==- k Y P . 所以, Y二、X 是连续型随机变量若X 是连续型随机变量. Y = g(X)是X 的函数, 则Y 也是随机变量, 这时如何求出Y = g(X)的分布呢? 先看一个例子.例3 已知),(~2σμN X , 求σμ-=X Y 的概率密度. 解: 设Y 的分布函数为F Y (y), 于是 F Y (y) = P{Y = y}=}{y X P ≤-σμ= P{X ≤ σ y + μ} = F X (σ y + μ). 其中F X (x)为X 的分布函数. 将上式两边对y 求导, 并利用概率密度是分布函数的导数的关系得 []σμσμσ⋅+='+==')()()()(y f y F y f y F y X Y Y . 再将222)(21)(σμσπ--=x e x f 代入, 有 22])[(2222121)(y y Y e e y f --+-=⋅=πσσπσμμσ, 这表明Y ~ N(0, 1).在以上推导过程中, 除去用到分布函数的定义以及分布函数和概率密度的关系之外, 还用到这样一个等式}{y X P ≤-σμ= P{X ≤ σ y + μ}. 表面上看, 只是把不等式“y X ≤-σμ”变形为“X ≤ σ y + μ”, 它们是同一个随机事件, 因而概率相等. 实质上关键在于把σμ-=X Y 的分布函数在y 的值F Y (y)转化为X 的分布函数在σ y + μ 的值F X (σ y + μ). 这样就建立了分布函数之间的关系, 然后通过求导得到Y 的概率密度. 这种方法叫做“分布函数法”, 按照上例的解题思路, 可得到下面的定理:定理 设随机变量X 具有概率密度f X (x), -∞ < x < +∞, 又设函数g (x)处处可导且有)(x g '> 0 (或恒有)(x g '< 0), 则Y = g(X)是连续型随机变量, 其概率密度为 ⎩⎨⎧<<'⋅=.,0,,)()]([)(其它βαy y h y h f y f XY 其中α = min{g(-∞), g(+∞)}, β =max{g(-∞), g(+∞)}, h(y)是g(x)的反函数.证: 对于任意x 有)(x g '> 0 (或)(x g '< 0). 因而g(x)单调增加(或单调减少), 它的反函数h(y)存在, 并且h(y)在(α,.β)内单调增加(或单调减少)且可导.设g(x)单调增加, Y 的分布函数为 ⎰∞-=≤=≤=≤=)()()}({})({}{)(y h X Y dx x f y h X P y X g P y Y P y F , 于是Y 的概率密度为 )()]([)()(y h y h f y F y f X Y Y '='=, g(-∞) < g(+∞), )0)((>'y h 设g(x)单调减少, Y 的分布函数为 ⎰∞+=≥=≤=≤=)()()}({})({}{)(y h X Y dx x f y h X P y X g P y Y P y F . 于是Y 的概率密度为 )()]([)()(y h y h f y F y f X Y Y '-='=, g(+∞) < g(-∞), )0)((<'y h 综合以上两种情形, 即得所要结论.注: 若f X (x)在有限区间[a, b]以外等于零, 则只需设在[a, b]上有> 0 (或< 0)., 此时α = min{g(a), g(b)}, β =max{g(a), g(b)}.例4 设随机变量X 具有概率密度f X (x), -∞ < x < +∞, 求线性函数Y = a + bX (a 、b 为常数, 且b ≠ 0)的概率密度.解: 因y = g(x) = bx + a, 故b a y y h x -==)(. 而b y h 1)(=', 由定理得⎪⎭⎫ ⎝⎛-=b a y f b y f Y 1)(,-∞ < y < +∞. 若),(~2σμN X , 则=)(x f X 222)(21σμσπ--x e (-∞ < x < +∞), 故Y 的概率密度为 ⎪⎭⎫ ⎝⎛-=b a y f b y f Y 1)(2222)(21σμσπb b a y e b ---. 因而),(~22σμb b a N Y +, 这就是说正态随机变量X 的线性函数仍服从正态分布, 只是参数不同而已.例5 设X 具有概率密度f X (x), -∞ < x < +∞, 求2X Y =的概率密度.解: 2x y =不是单调函数, 故不能用定理来求. 但可划分为两个单调区间(-∞, 0)和(0, +∞), 在这两个单调区间上它的反函数分别为y x -=与y x =. 对于y > 0, Y 的分布函数为 ⎰-=≤≤-=≤=y y X Y dx x f y X y P y Y P y F )(}{}{)( 由于02≥=X Y , 且P{Y = 0} = 0, 所以当y ≤ 0时, 其分布函数F Y (y) = 0, 于是Y 的概率密度为 ⎪⎩⎪⎨⎧≤>-+='=.0,0,0)],()([21)()(y y y f y f y y F y f X X Y Y 例如, 设X ~ N (0, 1), 其概率密度为2221)(x e x -=πϕ(-∞ < x < +∞), 则的概率密度为 ⎪⎩⎪⎨⎧≤>=⎪⎩⎪⎨⎧≤>+=----.0,0,0,21.0,0,0),2121(21)(22122y y e y y y e e y y f y y y Y πππ 称Y 服从自由度为1的分布.习 题 课一、要点与要求本章主要内容是把随机事件数量化, 使得随机事件极其概率能够用随机变量极其分布函数来表示, 以便使用微积分等数学工具研究随机现象. 这一章是本课程的重点.1︒ 求离散型随机变量X 的分布律时, 首先要确定X 的取值, 然后求出对应于各取值的事件的概率, 要注意验证∑∞===11}{n k x X P , 否则不正确.两点分布、二项分布、泊松分布是三种常用离散型随机变量的概率分布.2︒ 使用概率密度f (x)描述连续型随机变量X, f (x)满足f (x) ≥ 0, ⎰∞+∞-=1)(dx x f . 对于任意(a, b), 有 ⎰=<<b a dx x f b X a P )(}{. 均匀分布、正态分布、指数分布是三种常用连续型随机变量的分布.3︒ 可以使用分布函数统一描述离散型随机变量和连续型随机变量. 当分布函数F(x)中含有待定常数时, 常利用0)(lim =-∞→x F x , 1)(lim =+∞→x F x 或F(x + 0) = F(x)来确定该常数. 而当概率密度f (x)及分布律中含有待定常数时, 常利用⎰∞+∞-=1)(dx x f 或∑∞===11}{n k x X P 来确定该常数. 有概率密度f (x)求分布函数F(x), 要在相应的区间段把F(x)写成f (x)的变上限积分, 利用公式)()(x f x F =', 可由分布函数F(x)求概率密度f (x).离散型随机变量的分布函数为分段函数, 若随机变量X 的取值为n 个, 则要分为n + 1段, 其图形是右连续的阶梯曲线.4︒ 对正态随机变量, 我们有Φ(-x) = 1 - Φ(x). 若),(~2σμN X , 则⎪⎭⎫ ⎝⎛-Φ-⎪⎭⎫ ⎝⎛-Φ=<<σμσμa b b X a P }{. 5︒ 随机变量的函数是一个重要概念. 对连续型随机变量X 的函数Y = g(X), 要了解求Y 的分布的原理和方法, 当g(x)是严格单调函数时, Y 的概率密度可使用公式计算出来.本章中的概念比第一章少, 并且多数概念容易理解, 重点是计算问题. 对离散型随机变量, 求它的分布律实质上是第一章内容的继续, 要用到第一章中的许多内容; 对连续型随机变量, 在进行各种计算时, 涉及到高等数学中的知识, 主要是定积分的计算(其中包括无穷限的广义积分), 要牢记积分的基本公式, 掌握简单的换元积分法和分部积分法, 同时要掌握简单的极限计算.二、典型例题例1 选择题1. 设F 1(x)与F 2(x)分别为随机变量X 1与X 2的分布函数, 为使F(x) = a F 1(x) - b F 2(x)是某一随机变量的分布函数, 在下列给定的各组数值中应取(98数三)( ) A (A) 52,53-==b a ; (B) 32,32==b a ; (C) 23,21=-=b a ; (D) 23,21-==b a . 2.设X 1与X 2是任意两个相互独立的连续型随机变量, 它们的概率密度分别为f 1 (x)与f 2 (x), 分布函数分别为F 1(x)与F 2(x), 则(2002数一)( ) D(A) f 1 (x) + f 2 (x)必为某一随机变量的概率密度; (B) f 1 (x) f 2 (x)必为某一随机变量的概率密度;(C) F 1(x) + F 2(x)必为某一随机变量的分布函数; (D) F 1(x) F 2(x)必为某一随机变量的分布函数.3. 设随机变量X 服从正态分布),(2σμN , 则随σ 的增大, 概率P{|X - μ| < σ}(95)( ) C(A) 单调增大; (B) 单调减小; (C) 保持不变; (D) 增减不定.4. 设随机变量X 与Y 均服从正态分布, )4,(~2μN X , )5,(~2μN Y . 记p 1 = P{X ≤ μ - 4}, p 2 = P{Y ≥ μ + 5}, 则(93)。
概率论与数理统计 第二章 随机变量及其分布
其中 (0) k!
k=0, 1, 2,···
则称r.v.X服从参数为的泊松分布。记为: X ~ ()
例4: 某信息服务台在一分钟内接到的问讯次数X服从 参数为的泊松分布,已知任一分钟内无问讯的概率为 e-6,求在指定的一分钟内至少有2次问讯的概率。
解: X ~ ( ),且PX 0 e6 即 e e6 6
件{X=5年}的概率为多少呢?
描述非离散随机变量统计特征,我们讨论它落在 某区间的概率。
这相当于,只要知道,对任意实数x,事件{Xx}的概率.
Q {a X b} {X b}{X a}
§3 随机变量的分布函数(P31)
定义
(P31) 设X是随机变量,x是任意实数,函数 F(x)=P{Xx}称为随机变量X的分布函数。
P{c X d}= d f (x)dx= d 1 dx=d c
c
c ba ba
这说明X落在(a, b)中任一区间的概率只与该区间的长度成正 比,而与该区间的位置无关,这就是均匀分布的概率意义。
例2.长途汽车起点站于每时的10分、25分、55分发车
,设乘客不知发车时间,于每小时的任意时刻随机地到
0
0, x 0 F (x)=P( X x)=x, 0 x 1
1, x 1
§4 连续型随机变量及其概率密度(P34)
一、概率密度(P34)
1. 定义 对于随机变量X,若存在非负函数 f(x),(-<x<+),使对任意实数x,都有
F (x)=P( X x)= x f (u)du
则称X为连续型随机变量, f(x)为X的概率密度 函数,简称概率密度或密度函数. 常记为:
X
x
R
概率论与数理统计第二章 随机变量及其分布
15
例4: 甲、乙两名棋手约定进行10盘比赛,以赢的盘数 较多者为胜. 假设每盘棋甲赢的概率都为0.6,乙赢的概 率为0.4,且各盘比赛相互独立,问甲、乙获胜的概率 各为多少? 解 每一盘棋可看作0-1试验. 设X为10盘棋赛中甲赢的 盘数,则 X ~ b(10, 0.6) . 按约定,甲只要赢6盘或6盘 以上即可获胜. 所以
定义:若随机变量X所有可能的取值为x1,x2,…,xi,…,且 X 取这些值的概率为 P(X=xi)= pi , i=1, 2, ... (*)
则称(*)式为离散型随机变量X 的分布律。 分布律的基本性质: (1) 表格形式表示: pi 0, i=1,2,... (2)
i
pi 1
X pk
x1 p1
这里n=500值较大,直接计算比较麻烦. 利用泊松定理作近似计算: n =500, np = 500/365=1.3699>0 ,用 =1.3699 的泊松分布作近似 计算:
(1.3669) 5 1.3669 P{ X 5} e 0.01 5!
23
例2: 某人进行射击,其命中率为0.02,独立射击400次,试求击 中的次数大于等于2的概率。 解 将每次射击看成是一次贝努里试验,X表示在400次射击中 击的次数,则X~B(400, 0.02)其分布律为
k 0,1
14
(2) 二项分布 设在一次伯努利试验中有两个可能的结果,且有 P(A)=p 。则在 n 重伯努利试验中事件 A发生的次数 X是一个 离散型随机变量,其分布为
P ( X k ) C nk p k q n k
k =0, 1, 2 ,, n
称X 服从参数为n,p的二项分布,记为 X~b(n, p) 对于n次重复一个0-1试验. 随机变量X表示: n次试验中, A发生的次数. 如: 掷一枚硬币100次, 正面出现的次数X服从二项分布. b(100, 1/2) 事件 X~
概率论与数理统计 第二章_随机变量及其分布
第二章随机变量及其分布一、学习要求、重点难点1、随机变量的概念、类型、引入随机变量的意义;2、离散型随机变量的概率分布,几种常用的离散型分布;3、连续型随机变量的概率分布,几种常用的连续型分布;4、分布函数的概念及计算;5、随机变量函数的分布;6、随机变量的几种数字特征:期望、方差等的概率及其计算;7、二元随机变量的概念及相关计算;8、大数定理及中心极限定理。
二.内容提要随机变量及其分布通过随机事件及其概率的讨论,使我们对随机现象的统计规律有了初步的认识。
但是一个随机现象常常涉及很多事件,如果孤立地、静止地去研究某个事件,很难对随机现象的整体有所了解。
为此,可引入随机变量的概念,这样就能非常方便地研究随机现象的各种可能结果,以及各种可能结果能以多大的概率发生等问题。
引人随机变量的基本思想就是为了更好地研究随机现象,对随机现象的结果(即样本空间中每一个样本点)进行量化处理,这样一来对随机现象的研究就转为对随机变量的研究。
第一节随机变量一、随机变量及其类型1.概念一般地,设A 为某个随机事件,则一定可以通过如下示性函数使它与数值发生联系每一个随机试验的结果自然地对应着一个实数,而在后两个例子中,这种对应关系是人为地建立起来的。
这样一来,随机事件的研究就可化为对随机变量的研究。
因此事件的运算就可化为数值的运算。
特别是进行了这样一步数学抽象以后,许多随机试验就可统一起来概括成各种数学模型加以研究。
例如,统计上“正态模型”、“指数模型”、“贝努利实验模型”等可以概括现实生活中大批实际问题,我们通过对这些典型的数学模型的研究就能更加深入研究随机现象,对随机现象的研究成果具有很强的现实和理论意义。
由此可见,无论哪一种性质,所谓随机变量,不过是随机试验的结果(即样本点)和实数之间的一一对应关系。
这与数学分析中函数的概念本质上是一致的。
只不过在函数概念中,f(x)的自变量x 为实数,而随机变量的概念中,随机变量)(ωξ的自变量为样本点ω,因为对每个试验结果ω都有函数)(ωξ与之对应,所以)(ωξ的定义域是样本空间,值域是实数域。
《概率论与数理统计》第二章 随机变量及其分布
两点分布或(0-1)分布
对于一个随机试验,如果它的样本空间只包含两个
元素,即Ω={ω1,ω2},我们总能在Ω上定义一个服从 (0-1)分布的随机变量
来描述这个随机X试验X的(结)果 。10,,当当
1, 2.
例如,对新生婴儿的性别进行登记,检查产品的质量 是否合格,某车间的电力消耗是否超过负荷以及前面多 次讨论过的“抛硬币”试验等都可以用(0-1)分布的随 机变量来描述。(0-1)分布是经常遇到的一种分布。
设随机变量X只可能取0与1两个值,它的分布律是 P{X=k}=pk(1-p)1-k,k=0,1 (0<p<1), 则称X服从(0-1)分布或两点分布。
(0-1)分布的分布律也可写成
X
0
1
pk
1-p
p
二项分布与伯努利试验
考虑n重伯努里试验中,事件A恰出现k次的概率。 以X表示n重伯努利试验中事件A发生的次数,X是一个 随机变量,我们来求它的分布律。X所有可能取的值为o, 1,2,…,n.由于各次试验是相互独立的,故在n次试 验中,事件A发生k次的概率为
X
x1
x2
…
xn
…
pk
p1
p2
…
pn
…
在离散型随机变量的概率分布中,事件 “X=x1”, “X=x2”....“X=xk”,...构成一个完备事件 组。因此,上述概率分布具有以下两个性质:
(1) pk 0, k 1, 2,L
(2) pk 1
k
满足上两式的任意一组数 pk , k 1, 2,L 都可以成为 离散型随机变量的概率分布。对于集合xk , k 1, 2,L
P{ X
k}
20 k
(0.2)k
《概率论与数理统计》第二章随机变量及其分布
第二章随机变量及其分布 ....................................................................................................... - 1 - 第一节随机变量及其分布函数 ..................................................................................... - 2 - 一随机变量概念 ....................................................................................................... - 2 -二随机变量的分布函数 ........................................................................................... - 3 -基础训练2.1 ............................................................................................................... - 6 - 第二节离散型随机变量及其概率分布............................................................................ - 6 - 一离散型随机变量及其概率分布............................................................................ - 6 -二常见的几种离散型随机变量及其分布................................................................ - 8 -基础训练2.2 ............................................................................................................. - 13 - 第三节连续型随机变量及其概率分布.......................................................................... - 13 - 一连续型随机变量及其分布的概念与性质.......................................................... - 14 -二常见的几种连续型随机变量及其分布.............................................................. - 16 -基础训练2.3 ............................................................................................................ - 21 - 第四节随机变量函数的分布 ......................................................................................... - 21 - 一离散型随机变量函数的分布.............................................................................. - 21 -二连续型随机变量的函数分布.............................................................................. - 22 -基础训练2.4 ............................................................................................................ - 25 - 综合训练二 ....................................................................................................................... - 25 - 内容小结及题型分析二 ................................................................................................... - 25 - 拓展提高二 ....................................................................................................................... - 25 - 阅读材料二 ....................................................................................................................... - 25 - 数学实验二 ....................................................................................................................... - 25 -第二章随机变量及其分布【本章导读】本章主要讲述随机变量与分布函数,一维离散型随机变量、连续型随机变量的概率分布,常见分布及函数的分布.【本章用到的先修知识】级数的运算,变限积分,分段函数的积分,无穷积分.【本章要点】随机变量的概念,分布函数,分布律,概率密度,常见随机变量的分布,函数的分布.在上一章中,我们用样本空间的子集,即基本事件的集合来表示随机试验的各种结果.这种表示的方式对全面讨论随机试验的统计规律性及数学工具的运用都有较大的局限. 在本章中,我们将介绍概率论中另一个重要的概念:随机变量. 随机变量的引入,使概率论的研究由个别随机事件扩大为随机变量所表征的随机现象的研究. 这样,不仅可更全面揭示随机试验的客观存在的统计规律性,而且可使我们用高等数学的方法来讨论随机试验.第一节 随机变量及其分布函数一 随机变量概念在第一章里,我们主要研究了随机事件及其概率,读者可能会注意到在随机现象中,有很大一部分问题与实数之间存在着某种客观的了解. 例如,在产品检验问题中,我们关心的是抽样中出现的废品数;在车间供电问题中,我们关心的是某时间段正在工作的车床数;在电话问题中关心的是某一段时间内的话务量等. 对于这类随机现象,其试验结果显然可以用数值来描述,并且随着试验的结果不同而取不同的数值。
概率论与数理统计第二章随机变量及其分布
设随机变量X服从参数为 分布,即 例2.3.1.设随机变量 服从参数为 的0-1分布 即: 设随机变量 服从参数为0.3的 分布 X P 0 1 ,求X的分布函数 求 的分布函数 的分布函数.
i
0.3 0.7
解:(1) 当x<0时,F(x)=P{X≤x}= 时
∑P{X = x }=0 (2)当0≤x<1时,F(x)=P{X≤x}= ∑P{X = x } =P{x=0}=0.3 当 时 (3)当1≤x时,F(x)=P{X≤x}= ∑P{X = x } 当 时
xi ≤x xi ≤x i xi ≤x i
=P{X=0}+P{X=1}=1 F(x) 分布函数图形如下 1 0.3 0 1 x
3.离散型随机变量 的分布函数的性质 离散型随机变量X的分布函数的性质 离散型随机变量 (1)分布函数是分段函数 分段区间是由 的取值点划分成的 分布函数是分段函数,分段区间是由 分布函数是分段函数 分段区间是由X的取值点划分成的 左闭右开区间; 左闭右开区间 (2)函数值从 到1逐段递增 图形上表现为阶梯形跳跃递增 函数值从0到 逐段递增 图形上表现为阶梯形跳跃递增; 逐段递增,图形上表现为阶梯形跳跃递增 函数值从 (3)函数值跳跃高度是 取值区间中新增加点的对应概率值 函数值跳跃高度是x取值区间中新增加点的对应概率值 函数值跳跃高度是 取值区间中新增加点的对应概率值; F(x) (4)分布函数是右连续的 分布函数是右连续的; 分布函数是右连续的 1 (5) P{X=xi}=F(xi)-F(xi-0) 0.3
记为 X~B(n,p)
m P X = m) = Cn pm(1− p)n−m (
m=0,1,2,...,n
随机变量X所服从的分布称为二项分布,n为实验次数 注:(1)随机变量 所服从的分布称为二项分布 为实验次数 随机变量 所服从的分布称为二项分布 为实验次数; (2)该实验模型称为 次独立重复实验模型或 重Bernoulli实验模型 该实验模型称为n次独立重复实验模型或 实验模型; 该实验模型称为 次独立重复实验模型或n重 实验模型 (3)若A和Ac是n重Bernoulli实验的两个对立结果 成功”可以指二 若 和 实验的两个对立结果,“成功 重 实验的两个对立结果 成功” 者中任意一个,p是 成功”的概率 者中任意一个 是“成功”的概率. 例如:一批产品的合格率为 有放回地抽取 有放回地抽取4次 每次一件 每次一件, 例如 一批产品的合格率为0.8,有放回地抽取 次,每次一件 取得合格 一批产品的合格率为 品件数X,以及取得不合格品件数 服从分布为二项分布 品件数 以及取得不合格品件数Y服从分布为二项分布 以及取得不合格品件数 服从分布为二项分布, X对应的实验次数为 对应的实验次数为n=4, “成功”即取得合格品的概率为 成功” 对应的实验次数为 成功 即取得合格品的概率为p=0.8,
《概率论与数理统计》第二章随机变量及其分布知识点
第二章随机变量及其分布2.1随机变量为全面研究随机试验的结果,皆是随机现象的统计规律性,需要将随机试验的结果数量化,即把随机试验的结果与实数对应起来.2.1.1随机变量的定义定义一:设Ω为随机试验E 的样本空间,若对Ω中的每一个样本点ω都有一个确定的实数)(ωX 与之对应,则称)(ωX X =为定义在Ω上的随机变量.随机变量通常用大写字母X、Y、Z 或希腊字母ηξ,等表示,而表示随机变量所取的值时,一般用小写字母x,y,z 等表示.2.1.2引入随机变量的意义随机变量因其取值方式不同,通常分为离散型和非离散型两类.非离散型随机变量最重要的是连续型随机变量.2.1.3随机变量的分布函数定义二:设X 是一个随机变量,称+∞<<-∞≤=x x X P x F },{)(为X 的分布函数.对任意实数)(,2121x x x x <,随机点落在区间(21,x x ]内的概率为:)()(}{}{)(121221x F x F x X P x X P x X x P -=≤-≤=<<分布函数的性质:(1)1)(0≤≤x F (2)非减(3),0)(lim )(==-∞-∞→x F F x ,1)(lim )(==+∞+∞→x F F x 事实上,由事件+∞≤-∞≤x x 和分别是不可能事件和必然事件(4)右连续)()(lim 00x F x F x x =+→2.2离散型随机变量及其概率分布2.2.1离散型随机扮靓及其概率分布定义三:设X 是一个随机变量,如果他的全部可能取值只有有限个或可数无穷多个,则称X 是离散型随机变量.设随机变量X 的全部可能取值为,,,,,n i x i ...21=X 取各个可能取值的概率n i x p x X P i i ,,,,...21)()(===,则称为随机变量X 的分布律,离散型随机变量X 的分布律也可以表示为:X X1X2...Xn ...P(X)P(x1)P(x2)...P(xn)...离散型随机变量X 的分布律满足:(1)),...(,...,2,1,0)(非负性n i x p i =≥(2))(1)(1规范性=∑+∞=i i x p 易得X 的分布函数为:)(}{}{)(∑∑≤≤===≤=xx i xx i i i x p x X P x X P x F 即,当i x x <时,0)(=x F ;当1x x <时,0)(=x F ;当21x x x <<时,)()(1x p x F =;当32x x x <<时,)()()(21x p x p x F +=;......当n n x x x <<-1时,)(.....)()()(21n x p x p x p x F +++=;......2.2.2常用离散型随机变量的分布1.两点分布(“0-1”分布)定义四:若一个随机变量X 只有两个可能取值21x x ,,且其分布为:10,1)(,)(21<<-====p p x X P p x X P 则称X 服从21x x ,处参数为p 的两点分布.2.二项分布若随机变量X 的全部可能取值为0,1,2,...,n,且其分布律为,,,,,n k q p C p k X P k n k k n ...,210,)(===-其中,0<p<1,q+p=1,则称为X 服从参数为n,p 的二项分布,或称X 服从参数为n,p 的伯努利分布,记为)(~p n B X ,3.泊松分布定义五:若一个随机变量X 的分布律为:...210,0,!)(,,,=>==-k k e k X P kλλλ则称X 服从参数为λ的泊松分布,记作)(~λP X .易见:(1)...210,0)(,,,=≥=k k X P (2)1!!}{00=====-+∞=-+∞=-+∞=∑∑∑λλλλλλe e k e k ek X P k k k k k 4.二项分布的泊松近似引言:对于二项分布B(n,p),当实验次数n 很大时,计算其概率很麻烦.例如:10001,5000(~B X 定理1:(泊松定理)在n 次伯努利试验中,事件A 在每次试验中发生的概率为n p (注意这与实验的次数有关),如果∞→n 时,λ→n np (λ》0为常数),则对于任意给定的k,有!)1(lim k ep p C kkn kk nn λλ--∞→=-(np =λ)2.3连续型随机变量及其概率密度2.3.1连续型随机变量及其概率密度定义六:设)(x F 为随机变量X 的分布函数,若存在非负函数)(x f ,对任意实数x ,有⎰∞-=x dt t f x F )()(,则称X 为连续型随机变量,称)(x f 为X 的概率密度函数或分布密度函数,简称概率密度.概率密度具有下列性质:(1)0)(≥x f (2)1)(=⎰+∞∞-dx x f 连续型随机变量的性质:(1)连续型随机变量X ,若已知其密度函数)(x f ,则根据定义,可求其分布函数)(x F ,同时,还可求得X 的取值落在任意区间(a,b]上的概率为⎰=-=≤<ba dxx f a F b F b X a P )()()(}{(2)连续型随机变量X 取任意指定值)(R a a ∈的概率为零,因为⎰∆-→∆→∆=<<∆-==axa x x dxx f a X x a P a X P )(lim }{lim }{00故对连续型随机变量X ,则有⎰=-=<<=≤≤ba dxx f a F b F b X a P b X a P )()()(}{}{(3)若)(x f 在点x 处连续,则)()('x f x F =2.3.2常用连续型随机变量的分布1.均匀分布定义七:若连续型随机变量X 的概率密度=)(x f 其他bx a ab <<⎪⎩⎪⎨⎧-,,01则称X 在区间(a,b)上服从均匀分布,记作),(~b a U X 易见:(1);0)(≥x f (2)1)(=⎰+∞∞-dx x f 求得其分布函数:.;;,,,10)(b x b x a a x a b ax x F ≥<<≤⎪⎩⎪⎨⎧--=2.指数分布定义八:若随机变量X 的概率密度为⎩⎨⎧>=-其他,00,)(x e x f x λλ其中,0>λ是常数,则称X 服从参数λ的指数分布,简记为)(~λe X .易见:(1);0)(≥x f (2)1)(=⎰+∞∞-dx x f 易求出其分布函数:⎩⎨⎧>-=-其他。
《概率论与数理统计》第2章 随机变量及其分布
第二章 随机变量及其分布
注 意 点 (2)
第11页
对离散随机变量的分布函数应注意: (1) F(x)是递增的阶梯函数; (2) 其间断点均为右连续的; (3) 其间断点即为X的可能取值点; (4) 其间断点的跳跃高度是对应的概率值.
23 April 2012
第二章 随机变量及其分布
例2.2.1 已知 X 的分布列如下:
0,
x 0, x 0.
求 (1) 常数 k. (2) F(x).
解:
(1) k =3.
(2)
1 e3x , x 0,
F(x) 0,
x 0.
23 April 2012
第20页
第二章 随机变量及其分布
第21页
例2.2.4
1 x,
设
X
~
p(
x)
1
x,
0,
1 x 0 0 x1
其它
第二章 随机变量及其分布
第8页
2.2.1 离散随机变量的分布列
设离散随机变量 X 的可能取值为: x1,x2,……,xn,……
称 pi=P(X=xi), i =1, 2, …… 为 X 的分布列. 分布列也可用表格形式表示:
X x1 x2 …… xn …… P p1 p2 …… pn ……
23 April 2012
第二章 随机变量及其分布 y
第35页
O
μ
x
23 April 2012
第二章 随机变量及其分布
第36页
正态分布的性质
(1) p(x) 关于 是对称的. 在 点 p(x) 取得最大值.
p(x)
σ 小
(2) 若 固定, 改变,
p(x)左右移动,
概率与数理统计 第二章-2-离散型随机变量及其分布律
(0–1)分布的分布律也可以写成:
P{X k} pk (1 p)1k , k 0,1,0 p 1.
两点分布的模型为:
(1)Ω= {1, 2}, 只有两个基本事件。
P({1}) = p , P({2}) = 1-p =q.
令
X
()
1, 0,
1, 2,
(2) W A A ,有两个结果。
1
2
P 0.04 0.32 0.64
PX 0 0.2 0.2 0.04
PX 1 0.80.2 0.20.8 0.32
PX 2 0.8 0.8 0.64
(2) ∵是并联电路 ∴ P{线路接通} =P{只要一个继电器接通} =P{X≥1} =P{X=1}+P{X=2}=0.32+0.64=0.96
所以,X 的概率分布为
P{X k } C4k p k (1 p )4k ,
k 0, 1, 2, 3, 4 .
(1) 伯努利试验 若随机试验E只有两个可能的结果: 事件A发生与事件A不发生,则称这样的 试验为伯努利(Bermourlli)试验。记
P(A) p, P(A) 1 p q (0 p 1),
P{X=1}:o o o Co41 p1(1 p)41
P{X=2}:o o oo oo oo C42opo2(1oop)42
P{X=3}:ooo oo o o oo oooC43 p3(1 p)43 P{X=4}:oooo C44 p4(1 p )44 p4
其中“×”表示未中,“○”表示命中。
P(A) p, P(A) 1 p ;
③ 各次试验相互独立。
我们关心的问题是:
n次的独立伯努利试验中,事件A发生的次数 及A发生k次的概率。
2014年自考 概率论与数理统计串讲讲义 第二章 随机变量及其概率分布
p = P ( A) = P ( X = 1) = EX
例2
设某射手的命中率为 p,X 为其一次射击中击中目标的次数,则 X~ B(1, p )
ห้องสมุดไป่ตู้
(2)二项分布:设 X~ B(n, p ) ,则 P ( X = k ) = Cn
k
p k (1 − p) n −k , k = 0,1, 2," , n
应用背景:n 次独立重复抽样中某事件 A 发生的次数 X~ B(n, p ) ,其中 概率。
第二章
随机变量及其概率分布
1. 离散型随机变量 P ( X = xk ) = pK ≥ 0 p =1 ∑ K K
例1 设 ,则 c = 1 − 0.5 − 0.2 = 0.3
2.常见离散型随机变量
(1)0—1 分布:设 X ~ B(1, p ) ,则 应用背景:一次抽样中,某事件 A 发生的次数 X ~ B(1, p ) ,其中
5k −5 (2) P ( X ≤ 5) ≈ ∑ e k =0 k !
5
3.随机变量的分布函数:X 的分布函数为
F ( X ) = P ( X ≤ x) , − ∞ < x < +∞ F ( x) 的性质:① 0 ≤ F ( x) ≤ 1
②若 x1 <
x2 ,则 F ( x2 ) − F ( x1 ) ≥ 0
∫a
b
f ( x)dx ,其中 a < b 任意,则称 X 为连续型随机变量。
∫
x
−∞
f (u )du ; f ( x) = F ′( x)
其中
f ( x) 为 X 的概率密度,满足
f ( x) ≥ 0 PK ≥ 0 (注意与分布律的性质: +∞ PK = 1 相对照) ∑ f ( x ) dx 1 = ∫−∞ K
概率论与数理统计第2章 随机变量及其分布
12
2.二项分布 如果随机变量X的分布律为
13
14
例2.5 某种药物对某种疾病的治愈率为0.8,若5人 服用此药,写出治愈人数的分布律.至少有2 人治愈的概 率是多少? 解 设X表示5人中治愈的人数,将每一个人服用药 物后是否治愈看成一次试验,各次试验是相互独立的, 则X~B(5,0.8).于是
36
图2.4
37
图2.5
38
正态分布是概率论中最重要的分布,在自然现象和 社会现象中,大量的随机变量都服从正态分布.例如,测 量误差、人的身高和体重、股票价格、农作物的产量、 海洋波浪的高度等都服从或近似服从正态分布. 许多其他分布常用正态分布来作为近似分布,另外, 在数理统计中可以看到,许多重要的分布,都由正态分 布随机变量的函数导出.
5
2.2 离散型随机变量及其概率分布
2.2.1 离散型随机变量的概率分布 离散型随机变量X的所有可能取值为有限个或可列 无限个.为了描述离散型随机变量X,我们不仅要知道X 有哪些可能取值,还需要知道它取每个可能值的概率. 定义2.2 设离散型随机变量X的所有可能取值为 x1,x2,…,xk,…,
6
24
25
图2.1
26
27
28
2.3.2 常用的连续型概率分布 1.均匀分布 如果随机变量X的概率密度函数为
29
2.指数分布 若连续型随机变量X的概率密度为
30
31
图2.2
32
33
3.正态分布 若连续型随机变量X的概率密度为
34
图2.3
35
(2)图形关于直线x=μ对称.这表明,μ是正态分布 的中心.如果固定σ,改变μ的值,则正态分布曲线沿着x 轴平行移动而不改变其形状(图2.4).可见,正态分布 的密度曲线的位置完全由参数决定.因此μ称为位置参数; (3)如果固定μ,改变σ的值,当σ增大时,曲线的 峰值降低,曲线变得平坦;反之,若σ减小,则峰值变 大,曲线变得陡峭(图2.5),故σ称为形状参数;
《概率论与数理统计》教学课件(共8章)第2章 随机变量及其概率分布
显然,p1+p2+p3+p4=1。
2.1 离散型随机变量
2.1.2 离散型随机变量的分布律
(2) X为直到取得白球时的取球次数。因为每次取出的黑球仍放回去,所以X的所有可能取值是一
切正整数1, 2, …,n, ….由于是放回抽样,故每次抽球的试验是独立的。由独立事件的概率乘法公式,得
X的分布律:
p1=P{X=1}=25, p2=P{X=2}=35×25=265,
概率论与数理统计
第2章 随机变量及其概率分布
2.1 离散型随机变量 2.2 连续型随机变量 2.3 分布函数 2.4 随机变量函数的分布
2.1 离散型随机变量
2.1.1 随机变量的概念
在第1章中,我们讨论了随机事件及其概率.为了全面研究随机试验的结果,我们引入随机变量这 一十分重要的概念。我们所讨论的随机事件几乎无一例外地可用随机变量来描述,用随机变量描述随 机现象是概率论中最重要的方法。
P{X>6}=P{X=7}+P{X=8}+P{X=9} =C97(0.2)7(0.8)2+C98(0.2)8(0.8)+(0.2)9 ≈0.0003.
这一结果表明,供应6个人的需电量,超负荷的可能性仅为0.03%。也就是说,平均在大约55.6h 中,可能有一分钟超负荷。
2.1 离散型随机变量
2.1.3 几种常见的概率分布律
称X=X(ω)为该试验的一个随机变量。
本书中,用大写字母X, Y, Z, W等表示随机变量,用小写字母x, y, z, w等表示实数。
随机变量的取值随着试验的结果而定,因而在试验之前,只能知道它可能取值的范围,而不能预
知它取哪一个值。且试验的所有结果的出现都有一定的概率,因而随机变量的取值也有一定的概率。
《概率论与数理统计》第二章 随机变量及其分布教案
第二章随机变量及其分布§2.1随机变量及其分布教学目的要求:使学生掌握随机变量、离散型随机变量、连续型随机变量的概念及其分布,会应用这些概念、分布求分布列.教材分析:1.概括分析:概率论所要考察的是与各种随机现象有关的问题,并通过随机试验从数量的侧面来研究随机现象的统规律性.为此,就有必要把随机试验的每一个可能的结果与一个实数联系起来.随机变量正是为适应这种需要而引进的。
随机变量实质上是定义在样本空间Ω={e}上的一个实值单值函数X(e).从此,对随机事件的研究转变为对随机变量的研究,通过随机变量将各个事件联系起来,进而去研究随机试验的全部结果.而且,随机变量的引入,使我们有可能借助于微积分等数学工具,把研究引向深入.2.教学重点:随机变量、离散型随机变量、连续型随机变量的概念及其分布函数.3.教学难点:求随机变量分布函数.教学过程:在第一章里,我们研究了随机事件及其概率,可以会注意到,在某些例子中,随机事件和实数之间存在着某种客观的联系.例如,在伯努利概型这一节中,曾经讨论过“在n 重伯努利试验中,事件A 出现k 次”这一事件的概率,如果令ξ=n 重伯努利试验中事件A 出现的次数则上述“n 重伯努利试验中事件A 出现k 次”这个事件就可以简单地记作(ξ=k),从而有P(ξ=k)=⎪⎪⎭⎫ ⎝⎛k n p k q n-k.并且ξ所有可能取到的数值也就是试验中事件A 可能出现的次数:0,1,…,n.在另一些例子中,随机事件与实数之间虽然没有上述那种“自然的”联系,但是我们常常可以人为地给它们建立起一个对应关系.例如抛掷一枚均匀的硬币,可能出现正面,也可能出现反面,现在约定若试验结果出现正面,令η=1,若试验结果出现反面,令η=0,这时就有:{试验结果出现正面}=(η=1),{试验结果出现反面}=(η=0).在上述例子中,对每一个试验结果ω,自然地或人为地对应着一个实数X(ω),这与高等数学中熟知的“函数”概念本质上是一致的.只不过在函数概念中,函数f(x)的自变量是实数x,而在X(ω)的自变量是样本点ω.因为对每一个试验结果ω,都有实数X(ω)与之对应,所以,X(ω)的定义域是样本空间,显然值域是实数域.显然,一般来讲此处的实数X 值将随ω的不同而变换,它的值因ω的随机性而具有随机性,我们称这种取值具有随机性的变量为随机变量。
概率论与数理统计--第二章 随机变量及其分布(2.1-2.3)
中恰有 k只 (k 0 ,1 , ,20 )一级品的概率是多少 ?
分析 这是不放回抽样.但由于这批元件的总数很 大, 且抽查元件的数量相对于元件的总数来说又 很小,因而此抽样可近似当作放回抽样来处理.
把检查一只元件是否为 一级品看成是一次
验 , 检查 20 只元件相当于做 20 重伯努利试验 .
随机变量 离散型 非离散型 其它
连续型 离散型
随机变量所取的可能值是有限多个或
无限可列个, 叫做离散型随机变量.
小 结
1. 概率论是从数量上来研究随机现象内在规 律性的,因此为了方便有力的研究随机现象, 就 需将随机事件数量化,把一些非数量表示的随机 事件用数字表示时, 就建立起了随机变量的概 念. 因此随机变量是定义在样本空间上的一种特 殊的函数.
(3)随机变量与随机事件的关系
随机事件包容在随机变量这个范围更广的概 念之内.或者说 : 随机事件是从静态的观点来研究 随机现象,而随机变量则是从动态的观点来研究随 机现象.
实例3
结果:
掷一个硬币, 观察出现的面 , 共有两个
e ( 反面朝上 ), 1
e ( 正面朝上 ), 2
若用 X 表示掷一个硬币出现正面的次数, 则有
故所求概率为 P { X 2 } 1 P { X 0 } P { X 1 }
1000 999 1 0 . 9999 0 . 0001 0 . 9999 1 np ( n ) 二项分布 泊松分布
1000
3. 泊松分布
解 以X 记20只元件中一级品的只数 ,
因此所求概率为 则 X ~ b ( 20 , 0 . 2 ),
20 k 20 k P { X k } ( 0 . 2 ) ( 0 . 8 ) ,k 0 , 1 , , 20 . k
概率论与数理统计教案第2章 随机变量及其分布
概率论与数理统计教学教案 第2章 随机变量及其分布授课序号01教 学 基 本 内 容一.随机变量1. 随机变量:设E 是随机试验,样本空间为S ,如果对随机试验的每一个结果ω,都有一个实数()X ω与之对应,那么把这个定义在S 上的单值实值函数()X X ω=称为随机变量.随机变量一般用大写字母,,X Y Z ,…表示.2.随机变量的两种常见类型:离散型随机变量和连续型随机变量. 二.分布函数1. 分布函数:设X 是一个随机变量,x 是任意实数,称函数{}(),F x P X x x =≤-∞<<∞为随机变量X 的分布函数,显然,()F x 是一个定义在实数域R 上,取值于[0,1]的函数.2.几何意义:在数轴上,将X 看成随机点的坐标,则分布函数()F x 表示随机点X 落在阴影部分(即X x ≤)内的概率,如下图.3.对任意的实数,,()a b c a b <,都有:授课序号02(,)B n p ,其中在二项分(1,)B p X 服从(0-1)分布是二项分布的特例,简记0,1,2,...,其中λ为大于()P λ.在一次试验中出现的概率为(12,kk nnC p p -.)说明:泊松定理表明,泊松分布为二项分布的极限分布,即在试验次数很大,而n np 不太大时,()G p.)说明:几何分布描述的是试验首次成功的次数次才取得第一次成功,前)超几何分布:若随机变量X的分布律为H n N(,,件不合格,从产品中不放回)超几何分布与二项分布之间的区别:超几何分布是不放回抽取,二项分布是放回抽取,因此,二项两个分布之间也有联系,当总体的容量授课序号03(,)U a b .内的任一个子区间()E λ.1,0,xe x λ-⎧->⎪⎨⎪⎩其它.)定理:(指数分布的无记忆性)设随机变量()E λ,则对于任意的正数{}{P X s t t P X >+>=为连续型随机变量,若概率密度为2(,N μσ处取到最大值,并且对于同样长度(iii )当参数μ固定时,σ的值越大,()f x 的图形就越平缓;σ的值越小,()f x 的图形就越尖狭,由此可见参数σ的变化能改变图形的形状,称σ为形状参数.(iv )当参数σ固定时,随着μ值的变化,()f x 图形的形状不改变,位置发生左右平移,由此可见参数μ的变化能改变图形的位置,称μ为位置参数.(4)标准正态分布(0,1)XN(i )概率密度221(),2x x e x ϕπ-=-∞<<∞(ii )分布函数221(),.2t xx e dt x π--∞Φ=-∞<<∞⎰(iii )根据概率密度()x ϕ的对称性,有()1().x x Φ-=-Φ (5)定理:(标准化定理)若2(,)XN μσ,则(0,1).X Z N μσ-=(6)标准化定理的应用:设,,()x a b a b <为任意实数,则(){}{}{}(),X x x x F x P X x P P Z μμμμσσσσ----=≤=≤=≤=Φ{}{}()().a X b b a P a X b P μμμμμσσσσσ-----<≤=<≤=Φ-Φ6.“3σ”法则:设2(,)XN μσ,则{33}(3)(3)2(3)10.997,P X μσμσ-<<+=Φ-Φ-=Φ-≈即正态分布2(,)N μσ的随机变量以99.7%的概率落在以μ为中心、3σ为半径的区间内,落在区间以外的概率非常小,可以忽略不计,这就是“3σ”法则. 三.例题讲解例1.车流中的“时间间隔”是指一辆车通过一个固定地点与下一辆车开始通过该点之间的时间长度.设X 表示在大流量期间,高速公路上相邻两辆车的时间间隔,X 的概率密度描述了高速公路上的交通流量规律,其表达式为:0.15(0.5)0.15,0.5,()0,x e x f x --⎧≥⎪=⎨⎪⎩其它.概率密度()f x 的图形如下图,求时间间隔不大于5秒的概率.例2.设随机变量X 表示桥梁的动力荷载的大小(单位:N ),其概率密度为13,02;()880,x x f x ⎧+≤≤⎪=⎨⎪⎩其它.求:(1)分布函数()F x ;(2)概率{1 1.5}P X ≤≤及{1}P X >.例3.某食品厂生产一种产品,规定其重量的误差不能超过3克,即随机误差X 服从(-3,3)上的均匀分布.现任取出一件产品进行称重,求误差在-1~2之间的概率.例4.设随机变量X 在(1,4)上服从均匀分布,对X 进行三次独立的观察,求至少有两次观察值大于2的概率.例5.设随机变量X 表示某餐馆从开门营业起到第一个顾客到达的等待时间(单位:min ),则X 服从指数分布,其概率密度为0.40.4,0,()0,xex f x -⎧>⎪=⎨⎪⎩其它.求等待至多5分钟的概率以及等待3至4分钟的概率.例6.汽车驾驶员在减速时,对信号灯做出反应所需的时间对于帮助避免追尾碰撞至关重要.有研究表明,驾驶员在行车过程中对信号灯发出制动信号的反应时间服从正态分布,其中μ=1.25秒,σ=0.46秒.求驾驶员的制动反应时间在1秒至1.75秒之间的概率?如果2秒是一个非常长的反应时间,那么实际的制动反应时间超过这个值的概率是多少?例7.设某公司制造绳索的抗断强度服从正态分布,其中μ=300千克,σ=24千克.求常数a ,使抗断强度以不小于95%的概率大于a .授课序号0450。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章 随机变量及其概率分布
1. 离散型随机变量
()01k K K K
P X x p p ==≥⎧⎪⎨=⎪⎩∑ 例1 设 ,则3.02.05.01=--=c
2.常见离散型随机变量
(1)0—1分布:设X ~),1(p B ,则
应用背景:一次抽样中,某事件A 发生的次数X ~),1(p B ,其中EX X P A P p ====)1()(
例2 设某射手的命中率为p ,X 为其一次射击中击中目标的次数,则X ~),1(p B
(2)二项分布:设X ~),(p n B ,则()(1),0,1,2,
,k k n k n P X k C p p k n -==-=
应用背景:n 次独立重复抽样中某事件A 发生的次数X ~),(p n B ,其中()p P A =为事件A 在一次抽样中发生的概率。
例3 某射手的命中率为0.8,X 为其5次射击中命中目标的次数,则X 取的可能值为5,,1,0 ,52()0.80.2k k k P X k C -==,即X ~)8.0,5(B
记住:若X ~),(p n B ,则np EX =,)1(p np DX -=
(3)泊松(Poisson )分布 若(),0,1,2,!K
P X k e k k λλ-===则称X 服从参数λ的泊松分布,且DX EX ==λ,记X ~)(λB ,0>λ
应用背景:偶然性事件发生的次数X 一般服从某个参数的泊松分布,如某地的降雨的次数,车祸发生的次数等等。
另外,当Y ~),(p n B ,且n 很大,P 很小时,令np =λ,则()!k
P Y k e k λλ-=≈
例4 一个工厂生产的产品中的次品率0.005,任取1000件,计算
解:设X 表任取的1000件产品中的次品数,则X ~)005.0,100(B ,由于n 很大,p 很小,令5==np λ
则(1)55551
50
6151!
15!051)1()0(1)2(------=--=--≈=-=-=≥e e e e e X P X P X P (2)5
505(5)!k
k P X e k -=≤≈∑
3.随机变量的分布函数:X 的分布函数为
)()(x X P X F ≤=,+∞<<∞-x
)(x F 的性质:①1)(0≤≤x F
②若21x x <,则0)()(12≥-x F x F
③1)(,0)(=+∞=-∞F F
④)()(b F b X P =≤,)(1)(),()()(b F b X P a f b F b X a P -=>-=≤<
例5 设X 的分布函数⎩⎨⎧≤>+=-0,
00,)(x x be a x F x λ,其中0>λ,则______=a b=______. 解:由1)(=+∞F 知1=a (因为a be a F x x =+=+∞-+∞→)(lim )(λ)
由0)(=-∞F ,及题设0≤x 时0)(=x F ,故0)1()()(lim 0=+=+=-→+b be a x F x x λ
综上有⎩⎨⎧≤>-=-0,
00,1)(x x e x F x λ,即1,1-==b a
例6 设X 的分布函数⎪⎩
⎪⎨⎧≥<≤<=e x e x x x x F ,11,ln 1,0)(
求 )5.22(),30(),2(≤<≤<≤X P X P X P
解:2ln )2()2(==≤F X P
101)0()3()30(=-=-=≤<F F X P
25.1ln 2ln 5.2ln )2()5.2()5.22(=-=-=≤<F F X P
4. 连续型随机变量
若((,))()b a P X a b f x dx ∈=
⎰,其中b a <任意,则称X 为连续型随机变量。
此时,⎰∞-=x
du u f x F )()(;)()(x F x f '=
其中 )(x f 为X 的概率密度,满足⎪⎩⎪⎨⎧=≥⎰∞+∞
-1)(0)(dx x f x f (注意与分布律的性质:⎪⎩⎪⎨⎧=≥∑K K K P P 10相对照)
例7 设X 的概率密度为⎪⎩⎪⎨⎧≥<=1
,01,)(x x c x f ,则c=________ 解:由⎰+∞∞-=1)(dx x f 知⎰-==1112c cdx ,故2
1=c
5.常见连续型随机变量
(1)均匀分布:设X ~),(b a U ,则⎪⎩⎪⎨⎧≤≤-=其他,0,1)(b x a a b x f ,⎪⎪⎩⎪⎪⎨⎧≥<≤--<=b x b x a a b a x a x x F ,
1,,0)(
2b a EX +=,12
)(2a b DX -=
例8 设X ~),(a a U -,且31)1(=
>X P ,则a=______ 解:易知1>a 且⎰
=a dx x f 131)(,即⎰=a dx a 13
121 解得3=a (2)指数分布)(λE 设X ~)(λE ,则⎩⎨⎧≤>=-0,00,)(x x e x f x λλ,⎩
⎨⎧≤>-=-0,00,1)(x x e x F x λ λ1=EX ,21λ
=DX 应用背景:描述电子元件,某类动物的寿命,或服务时间等。
例9设X 为某类电子元件的寿命,求这类元件已经使用t 时,仍能正常工作的概率(设X ~)(λE )。