连续型随机变量.共39页文档
连续型随机变量
连续型随机变量连续型随机变量是统计学中的一个重要概念,它指的是取值可以是一段连续的数值区间的随机变量。
与离散型随机变量不同,连续型随机变量可以取无限个可能的取值,这对于处理实际问题中的测量数据非常有用。
一个典型的连续型随机变量可以是某个人的身高,身高可以是从0厘米到无穷大的任意一个数值。
这个身高的分布可以用一个概率密度函数来描述,例如正态分布。
这意味着大多数人的身高会集中在某一个区间,而在极端的身高上有较少的人。
连续型随机变量的概率密度函数有一些特殊的性质。
首先,概率密度函数必须非负且总体积为1,因为随机变量必然会取一个值。
其次,概率密度函数在某一个取值上的积分可以表示该随机变量小于或等于该值的概率。
以在一个公共汽车站等待下一辆公共汽车的时间为例。
假设公共汽车的到达时间是一个连续型随机变量。
这个随机变量可以取任意的非负数值,而且可能的取值范围是无限的。
如果我们对这个随机变量进行建模,可以使用指数分布来描述公共汽车的到达时间。
指数分布的概率密度函数非常有用,因为它可以很好地反映出公共汽车到达的随机性。
概率密度函数在某个时间点上的值表示了在这个时间点下等待公共汽车的概率。
通过计算概率密度函数在一个区间上的积分,我们可以得到在这个区间内等待公共汽车的概率。
连续型随机变量在统计学中有很多应用。
它们可以用于模拟实际问题中的随机变量,如股票价格、交通流量和天气变化等。
通过对连续型随机变量进行建模和分析,我们可以更好地理解随机现象,并做出相应的预测和决策。
总之,连续型随机变量是一种重要的概念,它可以描述取值在一段连续区间上的随机变量。
概率密度函数是描述连续型随机变量的常用工具,它可以帮助我们分析随机现象并做出相应的推断和决策。
通过数学建模和统计分析,我们可以更好地理解和应用连续型随机变量。
连续型随机变量是统计学中的一个重要概念,它指的是取值可以是一段连续的数值区间的随机变量。
与离散型随机变量不同,连续型随机变量可以取无限个可能的取值,这对于处理实际问题中的测量数据非常有用。
概率统计2.4(绝对)连续型随机变量
4.正态分布
正态分布是应用最广 泛的一种连续型分布.
德莫佛(De Moivre)最早发现 了二项分布的一个近似公式,这 一公式是正态分布的首次露面.
正态分布在十九世纪前叶由高 斯(Gauss)加以推广,所以通常称 为高斯分布.
德莫佛
(I) 正态分布的定义
若X 的 p.d.f. 为
f (x)
1
=P{a X b}= b f (x)dx a
注1 密度函数的几何意义为
P(a X b)= b f (u)du a
例2、设X的密度函数为
Ax(3x 2) 0 x 2
f (x) 0
其他
试确定常数A,并求 P(1 X 1)
f (x)dx 1
2
Ax(3x 2)dx 1
A 1
0
12
1
0
1
P(1 X 1) f (x)dx f (x)dx f (x)dx
1
1
0
1 1 x(3x 2)dx 1
0 12
6
二、几个常用的连续型分布
1. 均匀分布 U(a, b) 若r.v.X的p.d.f.为
( x)2
e 2 2
2
, 为常数, 0
亦称高斯 (Gauss)分布
x
则称 X 服从参数为 , 2 的正态分布。
记作 X ~ N ( , 2 )
(II)正态分布 N (, 2 ) 的图形特点
x x
(a)正态分布的密度曲线是一条关于对称的钟形 曲线. 特点是“两头小,中间大,左右对称”.
c
c ba ba
例3.公共汽车起点站于每时的10分、25分、55分 发车,设乘客不知发车时间,于每小时的任意时刻 随机地到达车站,求乘客候车时间超过10分钟的 概率。
第三章 连续型随机变量
上一页
下一页
返回
退出
分布函数的性质(2) 使用分布函数计算以下概率: P{ξ(ω)≥x}=1 - P{ξ(ω)<x} =1-F(x) P{ξ(ω)≤x}=F(x+0) P{ξ(ω)>x}= 1 - P{ξ(ω) ≤ x} = 1-F(x+0) P{ξ(ω)=x}= P{ξ(ω) ≤ x} - P{ξ(ω) <x} = F(x+0)-F(x) 对于离散型随机变量 P(ξ=ai)=pi 来说, ξ(ω)的分布函数为
p ( y ) F ( y )
p ( x ) p ( y x ) d x (3.55)
由对称性可知
p ( y ) F ( y )
p ( y x ) p ( x ) d x (3.56)
由(3.35)和(3.36)给出的运算称为卷积,通常 记为:
n
服从 N ( i , i2 ) 分布的随机变量,则
n n
i 1
i
仍然是
一个服从 N ( , 2 ) 的随机变量,并且其参数为
i 1
i
,
2
i 1
2 i
总目录
上一页
下一页
返回
退出
多维随机变量函数的分布(7-4)
(二)商的分布
设(ξ, η)是一个二维随机变量,密度函数为
F ( x ) P ( ( ) x )
ai x
P ( ( ) a i )
总目录 第一节 上一页 下一页 返回 退出
例3.1 等可能的在[a,b]上投点,以ξ表示落点的位置, 则ξ的分布函数为: 当x<a时, F ( x ) P ( ( ) x ) 0 当a<x<b时,
连续型随机变量
-3
-2
-x -1
1
x
2
3
P(| X |< a ) = 2Φ (a ) − 1
例2
设ξ~N(0,1),求使P{︱ξ︱>x}=0.1 的x。
解: P { ξ > x } = 2[1 − Φ( x )]
1 Φ( x ) = 1 − P{ ξ > x } = 1 − 0.5 × 0.10 = 0.95 2
如ξ ~ N (0,1),则P{ ξ > x } = 2[1 − Φ( x )]
证明:
P{ ξ > x } = 1 − P{ ξ ≤ x } = 1 − P{ ξ < x } = 2[1 − Φ( x )]
例1:设ξ~N(0,1),借助于标准正态分布的分 布函数 Φ(x)的表计算: (1) P{ξ < −1.24};
解:(1)由分布函数性质得
1 x⎞ ⎛ 0 = lim F ( x ) = lim ⎜ A + e ⎟ = A x → −∞ x → −∞ 3 ⎠ ⎝ 1 −2 x ⎞ ⎛ 1 = lim F ( x ) = lim ⎜ B − e ⎟ = B x → +∞ x → +∞ 3 ⎠ ⎝
1 1 2 (2)因为 lim− F ( x ) = ≠ F (0) = 1 − = x→0 3 3 3
x=µ
µ
x
(5)
Fµ ,σ ( x ) = Φ(
x−µ
σ
x=µ
)
φ(x)
µ
f 0 , 0. 1 ( x )
f 0 ,1 ( x )
f 0 , 2 .5 ( x )
µ固定时, σ的值越小,f(x)的图形就愈尖、越狭。 σ的值越大,f(x)的图形就愈平、越宽。
连续型随机变量
21
下面是我们用某大学学生的身高的数据画出的频率 直方图. 直方图
红线是拟合 红线是拟合 的正态密度 曲线
可见,某大学学生的身高应服从正态分布 可见,某大学学生的身高应服从正态分布.
22
标准正态分布
f (x) =
1 2 πσ
e
−
( x − µ )2 2σ 2
dx = −
−2
−e
= 0.2325
10
10
λe−λx , x ≥ 0 f ( x) = X ~ e(λ) 0, x<0 s X:表示某元件的寿命 对任意的 , t > 0
P(( X > s + t ) ∩( X > t )) P( X > s + t | X > s) = P( X > s) P( X > s + t ) 1 − P( X ≤ s + t ) 1 − F(s + t ) = = = = P( X > s) 1 − P( X ≤ s) 1 − F(s)
−
2
dt
σ 2π
∫
t2 ∞ − e 2 −∞
dt +
∫
t2 − ∞ te 2 −∞
dt
=µ
D( X ) = σ 2
20
正态分布的应用与背景 正态分布是最常见最重要的一种分布,例如 正态分布是最常见最重要的一种分布 例如 测量误差; 人的生理特征尺寸如身高、 测量误差 人的生理特征尺寸如身高、体重等 ; 正常情况下生产的产品尺寸:直径、长度、 正常情况下生产的产品尺寸 直径、长度、重量 直径 高度等都近似服从正态分布. 高度等都近似服从正态分布
= − xe
常见的连续型随机变量
02 均匀分布
定义和性质
定义
均匀分布是一种连续型概率分布,在 概率论和统计学中,均匀分布也叫矩 形分布,它是对称概率分布,在相同 长度间隔的分布概率是等可能的。
性质
均匀分布具有等可能性、对称性、均 匀性等特点。其分布函数是一条斜线 ,概率密度函数是一个常数。
概率密度函数和分布函数
概率密度函数
均匀分布的概率密度函数是一个常 数,表示为f(x) = 1/(b-a),其中a 和b是区间的端点,x属于[a, b]。
伽玛分布的概率密度函数具有指数函数和幂函数的乘积形式,形状 参数和尺度参数分别控制分布的形状和尺度。
性质
伽玛分布具有可加性,即多个独立同分布的伽玛随机变量的和仍然 服从伽玛分布。
贝塔分布
定义
贝塔分布是一种在[0,1]区间上的连续型概率分布,常用于描述比例、概率等随机变量的分布情况。
概率密度函数
贝塔分布的概率密度函数具有幂函数和Beta函数的乘积形式,形状参数控制分布的形状。
跨学科交叉融合
连续型随机变量的研究涉及数学、统 计学、计算机科学等多个学科领域。 未来,跨学科交叉融合将成为推动连 续型随机变量研究发展的重要趋势。 通过整合不同学科的优势和资源,我 们可以更深入地理解连续型随机变量 的本质和规律,为解决实际问题提供 更有效的手段和方法。
THANKS FOR WATCHING
均匀分布
在某一区间内,每个取值的可能性都 相等。
03
指数分布
描述某些随机事件发生的时间间隔的概率分 布,如放射性元素的衰变时间、电话交换台
的呼叫间隔时间等。
05
04
正态分布
一种钟形曲线分布,具有广泛的应用 背景,如自然和社会科学中的各种测 量误差、产品质量控制等。
连续型随机变量.
任给长度为l的子区间(c,c+l), ac<c+lb, 有
P{c < X c l}
c l
c
c l
f ( x)dx
1 dx l . ba ba
目 录 前一页 后一页 退 出
c
例5: 某观光电梯从上午8时起,每半小时运行一趟. 某人在上午8点至9点之间到达,试求他等候时间少 于5分钟的概率.
解:对任意实数t, f(t)非负,又
f (t )dt 0dt et dt e t
0
0
0
1
则 f(t)是连续型随机变量的概率密度.
目 录
前一页
后一页
退 出
参数的确定
例2: 设随机变量X的概率密度为
x Ae ,x<0 f ( x) x Ae , x 0
P{X < t} 1 F (tF )( t) 1 et , t 0
指数分布的特点:无后效性(无记忆性)
若X服从指数分布, 则任给s,t >0, 有 P{X>t+s| X > t}=P{X > s}, 事实上 P{ X t , X t s} P{ X t s | X t} P{ X t}
f ( x) Ae ,
x
求(1)系数A;(2)X的分布函数. ( < x < ) 解:
(1)1
f ( x)dx
0
Ae dx
x
0
Ae dx
x
Ae
x 0
Ae
x 0
连续性随机变量详解
解 X 的分布函数为
F(
x)
1
e
1x 2000
,
0,
x 0, x 0.
第22页
(1) P{X 1000} 1 P{X 1000} 1 F (1000)
1
e 2 0.607. (2) P{ X 2000 X 1000}
P{ X 2000, X 1000} P{ X 1000}
4
(2
x)d
x
1,
解之得
0
3
2
(2)由 k 1 知 X 的概率密度为 6
x 6
,
f
(x)
2
x 2
,
0,
0 x 3, 3 x 4, 其它.
k 1. 6
第11页
由 F ( x) x f ( x)d x 得
0, x 0,
x x d x,
0 x 3,
F ( x)
0 3
(2) f ( x)d x 1;
证明
1 F() f (x)d x.
(3)
P{ x1 X x2} F ( x2 ) F ( x1)
x2 f ( x)d x;
x1
证明 P{ x1 X x2} F ( x2 ) F ( x1)
x2 f ( x) d x x1 f ( x) d x x2 f ( x)d x.
0
f (t)dt
x
f (t)dt
0
0
x
0dt 1dt ,
则F(x) x;
0
当1 x时, x
f (t)dt
0
f (t)dt
1
f (t)dt
x
f (t)dt
0
1
连续型随机变量
分布函数 F(x)
定义: F(x) P X x
性质: 0≤F(x)≤1; F(-∞)=0 , F(+∞)=1。
应用:※ (1) P(a X b) F(b) F(a)
(2) P X c 1 F(c)
(3)P X d F(d)
定义:设函数 Biblioteka (x) 在区间 规定:上连续,
称此函数为 f (x) 在
性质1: 性质2: 性质3:积分可加性
二、概率密度函数的性质
由定义知,概率密度函数 f(x) 具有以下性质:
1.非负性:f (x) 0( x );
2.归一性: f (x)dx 1; [确定待定参数]※
例1:设随机变量X的概率密度函数为
0, x 0或x 1 f (x) kx, 0 x 1
教学重点:连续型随机变量概率密度函数的概念、性 质及其应用,概率密度函数与分布函数间的关系。
基本初等函数的导数公式
基本初等函数的导数公式
不定积分的基本公式
C
xC
1 x1 C ( 1)
1
ln | x | C
ex C
ax C
ln a
不定积分的基本公式
sin x C
cos x C
tan x C cot x C
f (x)dx 1
设有一克金,被碾成沿x轴分布的一片面积为1的金箔
1.概率密度函数的几何解释
[密度函数定义]
x
F (x) f (t)dt
[密度函数求区间概率]
b
P(a X b) f (x)dx a
2.零概率事件与不可能事件是一回事吗?
注: 连续型随机变量取某一确定值的概率为零. 即,不可能事件与零概率事件的关系:
经济数学课件 7.2连续型随机变量
根据分布列计算分布函数:
例1 求掷硬币的随机变量 X 的分布函数。
随机变量 X 的分布列为: X 0 1
p1 2
1 2
所以 当 x 0 时,P{X x} 0 ;
当 0 x 1时,P{X x} P{X 0} 1 ;
=
(1 2
1
arctan1) ( 1 2
1
arctan(1))
=
1 2
3)
f (x)
=
F
(
x)
=(1
2
1
arctan
x)
=
1
(1
x2)
三、几个重要的连续型随机变量
1)均匀分布
设随机变量 X 在区间 a,b 上的概率密度函数
f ( x) 为常数 1 ,即
ba
1
f
(
x)
b
a
0
a xb 其它
则称X 在a,b上服从均匀分布,记作 X ~ U(a,b)。
例3:某公共汽车站每隔6分钟有一辆汽车通 过.乘客到达该汽车站的任一时刻是等可能的,
求乘客等车时间不超过2分钟的概率
解: 由题意知,等车时间 X 是一个均匀分布
的随机变量,即 X ~ U[0,6] ,
二、三个重要分布
则它的密度函数为
1
f
(
x)
6
0
0 x6 其它
因此
P{X 2}
21
21
dx
第二节 连续型随机变量
一、分布函数
定义:
设 X 为一个随机变量,x 是任意实数,函数
F(x) P{X x}称为随机变量 X 的分布函数。
6连续型随机变量
1 2π e
x2 − 2
(− ∞ ,
+ ∞)
称之为标准正态分布。 称之为标准正态分布。
其分布函数为
t2 − 2
Φ (x ) =
−∞
∫ ϕ (t )dt =
x
1 2π
−∞
∫e
x
dt
(− ∞ <
x < +∞ )
教科书上都附有标准正 态分布表 ,由此可得 Φ( x )值.
如 P(X ≤1 : .65) =0 .9505
Ae−3x , x ≥ 0 ; f (x) = x < 0. 0,
试确定常数A,以及 X 的分布函数. 的分布函数.
A=3
1−e−3x , x ≥ 0 ; F(x) = ∫ f (t)dt = −∞ x < 0. 0,
x
一个靶子是半径为2米的圆盘, 例2 一个靶子是半径为2米的圆盘,设击中靶上 任一同心圆盘上的点的概率与该圆盘的面积成正比, 任一同心圆盘上的点的概率与该圆盘的面积成正比, 并设射击都能中靶, 表示弹着点与圆心的距离, 并设射击都能中靶,以X表示弹着点与圆心的距离, 试求随机变量X的分布函数. 试求随机变量X的分布函数.
求 P ( X < 0 ).
解:
0−2 =1−Φ 2 P < 0) =Φ (X σ σ
4−2 −Φ2−2 P 2 < X < 4) =Φ ( σ σ
2 −Φ(0) = 0.3 =Φ σ
2 = 0.8 Φ σ
Φ ( x )值的计算:
x > 0, Φ ( x) 直接查表,
x = 0,
x < 0,
连续性随机变量详解课件
常见连续性随机变量类型
均匀分布
在给定区间内取值概率相等的连 续性随机变量,常用于描述某些
物理实验中的随机现象。
指数分布
描述两次连续事件发生时间间隔的 概率分布,常用于可靠性工程和寿 命分析。
正态分布
又称高斯分布,是一种钟形曲线分 布,广泛应用于自然科学和社会科 学的许多领域,如测量学、经济学 等。
02
概率密度函数
定义与性质
• 定义:对于连续性随机变量,概率密度函数(Probability Density Function,简称PDF)描述了变量取某一特定值的相 对可能性。与离散型随机变量的概率质量函数不同,概率密度 函数的值并不是概率,而是一种概率的密度,其积分结果才表 示概率。
定义与性质
偏度和峰度
定义
性质
应用
偏度衡量了数据分布的对称性,峰度 则描述了数据分布的尖锐程度。
对于正态分布,偏度为0(完全对称 ),峰度为3(适中尖锐)。其他分 布的偏度和峰度可能与这些值有所不 同。
在实际问题中,偏度和峰度可用于识 别数据的分布类型。例如,在金融风 险管理领域,偏度和峰度可能用于检 测金融数据的“厚尾”现象,即极端 事件发生的概率是否高于正态分布所 暗示的概率。这对于设计有效的风险 管理策略至关重要。
06
连续性随机变量的模拟与 计算
生成连续性随机变量的பைடு நூலகம்机数
逆变换采样法
通过利用连续型随机变量的累积分布函数的反函数来生成随机数。首先生成一个均匀分布的随机数, 然后通过反函数转换为目标分布的随机数。
接受-拒绝采样法
适用于复杂分布,不易直接生成随机数的情况下。通过选择一个容易采样的参考分布,并在满足一定 条件下接受或拒绝采样结果,以逼近目标分布。
连续型随机变量常见的几种分布 (2)
33
现在您浏览到是三十三页,共五十页。
例3. 已知自动车床生产的零件的长度X(毫米)服从正
态分布 N(50,0.752),如果规定零件的长度在
501.5毫米之间为合格品.
求:生产零件是合格品的概率
解: X~ N(5,0 0.725) 所求的概率为:
P(X501.5)P (4.5 8 X5.5 1 )
30
现在您浏览到是三十页,共五十页。
(6) 3 原则
由标准正态分布的查表计算可以求得, 当X~N(0,1)时,
P( |X| 1) = 2 (1)- 1 = 0.6826
P( |X| 2) = 2(2)- 1 = 0.9544
P( |X| 3) = 2 (3)- 1 = 0.9974
这说明:X 的取值几乎全部集中在 [ -3, 3 ] 区间 内,超出这个范围的可能性仅占不到 0.3%
(x)
(x)
密度函数 ( x )
24
现在您浏览到是二十四页,共五十页。
分布函数 ( x )
▲ 标准正态分布的重要性
任何一个一般的正态分布都可以通过线性变换
x 转化为标准正态分布.
引理: 若X~ N(,2),则:ZX~ N(0,1)
(一般正态分布与标准正态分布的关系)
证明: Z X 的分布函数 : 为
12
现在您浏览到是十二页,共五十页。
德莫佛
高斯
(1). 正态分布的定义
若随机变量 X 的概率密度为:
f (x)
1
( x )2
e , 2 2 x
2
其中: 和 2都是常数, 任意, >0, 则 称 X 服从参数为 和 2 的正态分布.
第三章 连续型随机变量
解
F (t ) = P (T ≤ t )
当t≤0时,F(t)=0; 时 ; 当t>0时,F(t)=P(T≤t)=1-P(T>t) 时 时刻之前无汽车过桥) =1-P(在t时刻之前无汽车过桥) - ( 时刻之前无汽车过桥 =1-P(Xt=0)=1-e-λt -
于是
λe − λt f (t ) = F ' (t ) = 0
O
a
b
x
O
a
b
x
例3.3 设随机变量X~U[1, 6] ,求一元两次方程 设随机变量 t2+Xt+1=0有实根的概率。 有实根的概率。 有实根的概率 解 ≥0时 方程有实根。 当∆=X2-4≥0时,方程有实根。所求概率为 ≥0
1 , 1 ≤ x ≤ 6, f ( x) = 5 (x 0, 其它. 其它.
第三章 连续型随机变量
• • • • • 一维连续型随机变量 常用的连续型随机变量 二维连续型随机变量 条件分布与随机变量的独立性 随机变量函数的分布
3.1一维 一维连续型随机变量及其分布 一维
一、一维连续型随机变量及其概率密度函数
若存在非负可积函数f(x) 1、定义 X是随机变量 若存在非负可积函数 是随机变量,若存在非负可积函数 ,(-∞<x<+∞),使对一切实数a,b(a<b),均有 + ,使对一切实数 均
P (c < X ≤ d ) = ∫ f ( x)dx = ∫
c
d
d
c
x < a, 0, x −a 的图像分别为 , a ≤ x < b, f(x),F(x)的图像分别为 X的分布函数 F ( x) = 的分布函数 b − a x ≥ b. F(x) f(x) 1,
连续型随机变量
第三章连续型随机变量教学目的与要求1.熟练掌握一维随机变量分布函数的概念与性质..熟悉一维离散型随机变量的分布函数与分布列的关系;2. 准确理解一维连续型随机变量分布函数与分布密度的概念及其关系,熟记常见的几种分布的表达形式.3.熟练掌握二维随机变量的联合分布函数的性质.了解多维随机变量的联合分布.4.熟悉二维连续性随机变量的分布函数与分布密度的计算公式.5. 掌握二维连续型随机变量的边际分布函数与分布密度的计算公式.6. 熟悉随机变量函数的分布函数与分布密度的计算公式.7. 准确理解连续型随机变量数字特征的含义与性质,掌握连续型随机变量的数字特征的计算公式.理解、应用契贝晓夫不等式.8.了解条件分布与条件期望、回归与第二类回归的相关内容..教学重点一、二维连续型随机变量的分布教学难点一、二维随机变量函数的分布教学方法讲解法教学时间安排1~2. 随机变量及其分布函数3~4. 一维随机变量及其分布5~6. 多维随机变量及其分布7~8. 习题辅导9~10. 一维连续型随机变量函数的分布11~12.二维随机变量函数的分布13~16.随机变量的数字特征、契贝晓夫不等式教学过程1~2. 第一节 随机变量及分布函数一、问题的提出在第二章中我们研究了离散型随机变量,在那里,随机变量取有限个或可列个值,有很大的局限性.而随机现象出现的一些变量,如“测量某地气温”,“某型号显象管的寿命”等等,它们的取值是可以充满某个区间或区域的.,那么对于这种更一般的随机变量,如何来描述它的统计规律呢 ?例如,设一质点等可能地落入区间[,]a b 内的任何一点,且一定落入这个区间.在这里“等可能”的含义是指,所投的点落在[,]a b 中的任一子区间[,]B c d =中的概率,与B 的长度B l 成正比,而与B 在[,]a b 中的位置无关.如果记“点落入B 中”这事件为B ,则上述等可能性即意味着()B l d cP B b a b a-==-- 如果落在[,]a b 中的点的坐标为()a b ωω≤≤,令 ()()a b ξωωω=≤≤这样就得到了一个随机变量()ξω,它的取值充满了整个区间[,]a b ,显然用‘分布列’是行不通的,需另找一个合适的“工具”.前面已指出“点落入B 中”的概率与B 的长度B l 成正比,设[,][,]B c d a b =⊂,又000(())()0l P P b aωξωωωω=====-就有()(()d c P c d P P B b aξ-≤≤===-点落在B 中),又因为()0P d ξ== 所以()()P c d P c d ξξ≤≤=≤<而()()()P c d P d P c ξξξ≤<=<-< 于是()()()P c d P d P c ξξξ≤≤=<-<这就告诉我们,为了掌握()ξω的统计规律,只要对于任意实数x ,知道(())?P x ξω<=就够了.这个概率与x 有关..由此引入下述定义.二、分布函数的定义与性质定义3.1 定义在样本空间Ω上,取值于实数域的函数()ξω,称为是样本空间Ω上的(实值)随机变量,并称 ()(()),(,)F x P x x ξω=<∈-∞∞是随机变量()ξω的概率分布函数.简称为分布函数. 分布函数的性质:(1)单调性 若12,x x <则12()()F x F x ≤; (2)()lim ()0x F F x →-∞-∞==()lim ()1x F F x →+∞+∞==(3)左连续性 (0)()F x F x -= 证明 (1)显然.(2) 因为0()1,F x ≤≤且()F x 单调,故lim ()lim ()lim ()lim ()x m x n F x F m F x F n →-∞→-∞→+∞→+∞==都存在,又由概率的完全可加性有11(()){[()1]}(()1)l i m (()1)l i m ()l i m ()n nn m i m n m P Pn n P n n P i i F n F m ξωξωξωξω∞=-∞∞→+∞=-∞=→-∞→+∞→-∞=-∞<<+∞=≤<+=≤<+=≤<+=-∑∑所以必有lim ()0x F x →-∞=, l i m ()1x F x →+∞= 成立.(3)因为()F x 是单调有界函数,其任一点的左极限(0)F x -必存在,为证明左极限连续,只要对某一列单调上升的数列 12,()n n x x x x x n <<→→∞证明lim ()()n n F x F x →∞=成立即可.这时,有11()()(())F x F x P x ξω-=≤<1111111111{[()]}(())[()()]lim[()()]lim ()()n n n n n n n n n n n n n P x x P x x F xF x F x F x F x F x ξωξω∞+=∞+=∞+=+→∞+→∞=≤<=≤<=-=-=-∑∑由此即得()lim ()(0)n F x F x F x →∞==-反过来还可以证明,任一满足这三个性质的函数,一定可以作为某个随机变量的分布函数.因此,满足这三个性质的函数通常都称为分布函数. 由分布函数还可以下列事件的概率:{()}1(){()}(0){()}1(0){()}(0)()P x F x P x F x p x F x P x F x F x ξωξωξωξω≥=-≤=+>=-+==+-由此可见,形如12121212{()},{()},{()},{()}x x x x x x x x ξωξωξωξω≤≤<<<≤≤<这些事件以及它们经过有限次或可列次并、交、差以后的概率,都可以由()F x 算出来,所以()F x 全面地描述了随机变量()ξω的统计规律.三、一维离散型随机变量的分布函数如果()ξω是一个离散型随机变量,它们的分布列为1212a a p p ⎛⎫⎪⎝⎭那么()ξω的分布函数为 ()(())(())i ia xF x P x P a ξωξω<=<==∑例3.1 若ξ只取一个值a ,即有()1p a ξ==,求ξ的分布函数()F x . 解 易知1,()()0,x aF x p x x a ξ>⎧=<=⎨≤⎩其图形如3.1图所示.由图3.1可以看到()F x 是一个左连续的,阶梯状的函数,在x a =处有一个跃度为 1()P a ξ== 例3.2 设ξ是参数为λ的普哇松分布的随机变量,即(),0,1,2,!kP k e k k λλξ-===求ξ的分布函数.解 因()()()!kk xk xF x P x P k e k λλξξ-<<=<===∑∑所以()F x 的图形如图3.2所示.由图3.2 可看到,()F x 也是一个阶梯状的左连续函数,在(0,1,2,)x k k ==处有跳跃,跃度为ξ在x k =处的概率.(0)()(),0,1,2,!kF k F k P k e k k λλξ-+-====例3.3 设离散型随机变量ξ的分布列如下:(1) 求ξ的分布函数;(2)求333(0),(1),(1)222P P P ξξξ≤≤≤<<< 解 当0,(,]x x ≤-∞内不含ξ的任何可能值,故()0F x =; 当01,(,]x x <≤-∞内仅含点10x =,从而1()10F x =; 当12,(,]x x <≤-∞内仅含有120,1x x ==,从而()()(01)167(0)(1)101010F x P x P P P ξξξξξ=<==⋃===+==+= 当2,(,]x x >-∞内含点1230,1,2x x x ===,从而()()(012)(0)(1)(2)1631101010F x P x P P P P ξξξξξξξ=<==⋃=⋃===+=+==++=(2)3167(0)(01)2101010P P ξξξ≤≤==⋃==+= 36(1)(1)2103(1)()02P P P P ξξξ≤<===<<=∅=小结 由上面的讨论可以看到,分布函数.作为概率是事件()x ξ-∞<<的概率,同时它又是实变量x 的单值函数,这是我们在数学分析中早已熟悉的对象,而且分布函数()F x 又具有相当好的性质,有利于数学处理,引入随机变量和分布函数这两个概念,就好像在随机现象和数学分析之间架起了一座桥梁,有了这座桥梁,“数学分析”这个强有力的工具才有可能进入随机现象的领域中来.由此可以体会到随机变量及分布函数这两个概念的地位和作用.因此在讨论问题时一定要注意分布函数的本质属性.本节还讨论了离散型随机变量的分布函数,至此,对于离散型随机变量统计规律的描述我们已学了两种方法——分布列与分布函数法,两种描述方法各有特点,各有侧重.分布列反映了随即变量取每一个可能值的概率,而分布函数则反映的是随机变量从-∞到x 的总体分布情况. 因此,离散型随机变量的分布函数实际上是一个分布列从-∞到x 的累加,在计算离散型随机变量事件的概率时应注意随机变量取可能值.务必认真理解分布函数的概念.3~4. 第二节 一维连续型随机变量及其分布一、一维连续型随机变量及其分布的概念与性质定义3.2 若()ξω是随机变量,()F x 是它的分布函数,如果存在函数()p x ,使对任意的x ,有 ()()xF x p y dy -∞=⎰(*)则称()ξω为连续型随机变量,相应的()F x 为连续型分布函数.同时称()p x 是()F x 的概率密度函数或简称为密度.由分布函数的性质即可验证任一连续型分布的密度函数()p x 具有下述性质:(1)()(2)()1p x p x dx ∞-∞≥=⎰反过来,任意一个R 上的函数()p x ,如果具有以上两个性质,即可由(*)式定义一个分布函数()F x .由(*)式可知,连续型随机变量的分布函数是连续函数.给定随机变量ξ的概率密度函数()p x ,由(*)式可求出分布函数()F x .这说明连续型随机变量的概率密度函数也完全刻画了随机变量的概率分布.且由概率密度函数()p x 可直接求出ξ落在任意区间[,]a b 内的概率.事实上,如果随机变量()ξω的密度函数为()p x ,则对任意的1212,()x x x x <,有 211221(())()()()x x P x x F x F x p y dy ξω≤<=-=⎰(**)这一结果有很简单的几何意义:()ξω落在12[,)x x 中的概率,恰好等于在区间12[,)x x 上由曲线()y p x =形成的曲边梯形的面积(如图3.4中的影阴部分),而()1p x dx ∞-∞=⎰式表明,整个曲线()y p x =以下,x 轴以上的面积为1. 由(**)式还可以证明,连续型随机变量()ξω取单点值的概率为零,也就是说对任意的x ,(())0P x ξω==,于是有12122(())(())(())P x x P x x P x ξωξωξω≤≤=≤<+= 2112(())()x x P x x p y dy ξω=≤<=⎰(***)如果()p x 在某一范围内的数值比较大,则由(***)式与(**)式可知,随机变量落在这个范围内的概率也比较大,这意味着()p x 的确具有“密度”的性质,所以称它为概率密度函数.此外由()()xF x p y dy -∞=⎰式可知,对()p x 的连续点必有()'()()dF x F x p x dx== 例3.4 设随机变量ξ的分布函数为200()0111x F x Ax x x <⎧⎪=≤<⎨⎪≥⎩求常数A 及密度函数.解 由()F x 的连续性,有21(10)lim (1)1x F Ax F -→-===,所以,1A =,密度函数为 201()00,1x x p x x x ≤<⎧=⎨<≥⎩例3.5 已知随机变量ξ的分布密度为,01()2,120,0,2x x p x x x x x <≤⎧⎪=-<≤⎨⎪≤>⎩(1) 求相应的分布函数()F x ;(2) 求(0.5),( 1.3),(0.2 1.2)P P P ξξξ<><< 解由分布函数的定义可知 当0x ≤时,()()00xF x P x dx ξ-∞=<==⎰当01x <≤时,2()()02xx F x P x dx ydy ξ-∞=<=+=⎰⎰当12x <≤时,012011()()0(2)212xF x P x dx xdx y dy x x ξ-∞=<=++-=--⎰⎰⎰ 当2x >时,01201211()()0(2)0122x F x P x dx xdx x dx dy ξ-∞=<=++-+=+=⎰⎰⎰⎰综上所述220,01,012()121,1221,2x x x F x x x x x ≤⎧⎪⎪<≤⎪=⎨⎪--<≤⎪⎪>⎩1(0.5)(0.5)8( 1.3)1(1.3)0.245(0.2 1.2)(1.2)(0.2)0.66P FP F P F F ξξξ<==>=-=<<=-=二、常见的几种连续型随机变量及其分布 1、 均匀分布若随机变量()ξω的概率密度函数为1()0a xb p x b a⎧≤≤⎪=-⎨⎪⎩其他时,则称随机变量()p x 服从[,]a b 上的均匀分布.显然()p x 的两条性质满足.其分布函数为0()1x a x a F x a x b b a x b<⎧⎪-⎪=≤≤⎨-⎪>⎪⎩这正是上一节讲过的引例.均匀分布可用来描述在某个区间上具有等可能结果的随机试验的统计规律性.例如,在数值计算中,假定只保留到小数点后一位,以后的数字按四舍五入处理,则小数点后第一位小数所引起的误差,一般可认为在[0.5,0.5]上服从均匀分布.在一个较短的时间内,考虑某一股票的价格ξ在[,]a b 内波动的情况,若区间[,]a b 较短,切无任何信息可利用,这时可近似认为ξ~[,]U a b .2、 指数分布例3.4 设母鸡在任意的00[,]t t t +的时间间隔内下蛋个数服从()(()),0,1,2,!k tt t P k e k k λλξω-===问两次下蛋之间的“等待时间”η服从怎样的分布函数?解 设前一次下蛋时刻为零,因为η不可能为负,所以当0t ≤时,显然有 ()0P t η<=而当0t >时,因为在等待时间内鸡不下蛋 ()(()0)t t ηξω>== 所以有()(()0)tt P t P e ληξω->===于是()1()1tP t P t e ληη-≤=->=-还因为11()()n t t n ηη∞=<=≤-由概率的下连续性(定理1.1)即得11()11(){()}lim ()lim[1]1n n t tnn P t P t P t n n ee λληηη∞→∞=---→∞<=≤-=≤-=-=-从而描述η的分布函数为1,0()()0,0t e t F t P t t λη-⎧->=<=⎨≤⎩概率中称这个分布函数是参数为λ的指数分布.而随机变量的概率函数为,0()0,0x e x p x x λλ-⎧>=⎨≤⎩注:许多“等待时间”是服从这个分布的;一些没有明显“衰老”机理的元器件的寿命也可以用指数分布来描述.所以指数分布在排队论和可靠性理论等领域中有着广泛的应用.例3.5 设一大型设备在任何长为t 的时间内发生故障的次数()~()N t P t λ,求 (1)相继两次故障之间的时间间隔T 的概率分布.(2)求在设备无故障工作8小时的情形下,在无故障工作8小时的概率. 解 (1)由于{}T t >={到时刻t 时故障数为0},从而0()()1()1(()0)()110!ttF t P T t P T t P N t t e e λλλ--=<=->=-==-=-1688(16,8)(16)(2)(16|8)(8)(8)1(16)1(16)1(8)1(8)P T T P T P T T P T P T P T F ee P T F eλλλ---≥≥≥≥≥==≥≥-<-====-<-从(2)可看出指数分布的一个很重要的性质,将这个性质称为失去记忆性. 3.正态分布例3.5 若,(0)μσσ>是两个常数,则22()2(),x p x x μσ--=-∞<<∞ (*)是一个密度函数.因为这时()0p x >为显然.又令x μσ-222()22()x y p x dx edx e dy μσ--∞∞∞--∞-∞-∞==⎰⎰这时有22222212y x y edy edxdy π+∞∞∞---∞-∞-∞⎛⎫=⎪⎪⎭⎰⎰在令cos sin x r y r θθ=⎧⎨=⎩这时变换的雅可比式J r =,而22220|1r r e rdr e ∞--∞=-=⎰所以有22222211()122y r edy erdr d πθππ∞∞---∞⎛⎫==⎪ ⎪⎝⎭⎰⎰⎰于是()1p x dx ∞-∞=⎰这说明由(*)给出的的确是一个密度函数,这个密度函数称为正态密度,相应的分布函数为22()2(),y xF x edy x μσ---∞=-∞<<∞⎰并且称()F x 为正态分布,记作2(,)N μσ.如果一个随机变量()ξω的分布函数是正态分布,也称()ξω是一个正态变量.正态分布是概率论中最重要的一个分布,高斯(Gauss )在研究误差理论时曾用它来刻划误差.经验表明许多实际问题中的变量,如测量误差、射击时弹着点与靶心间的距离、热力学中理想气体的分子速度、某地区成年男子的身高等都可以认为服从正态分布.进一步的理论研究表明,一个变量如果受到大量微小的、独立的随机因素的影响,那么这个变量一般是正态变量.正态分布的密度函数()p x 关于x μ=点对称,在x μ=处达到极大,当μ固定时,σ的值愈小,()p x 的图像就愈尖、愈狭,σ的值愈大,()p x 的图像就愈平、愈宽.由此可见,如果()p x 在μ点的附近愈尖、愈高,则随机变量在μ点附近取值的概率也愈大.事实上,对任一服从2(0,)N σ的随机变量ξ有2222222222323(())0.688(2()2)0.955(3()3)0.997x x x P edx P e dx P edx σσσσσσσσσσξωσσξωσσξωσ-------≤≤=≈-≤≤=≈-≤≤=≈⎰这说明,随机变量ξ的绝对值不超过σ的概率略大于2/3,不超过2σ的概率在95%以上,而超过3σ的概率只有0.003,即(3)0.003P ξσ>≈因为(3)P ξσ>很小,在实际问题中常常认为它是不会发生的.也就是说,对服从2(0,)N σ分布的随机变量ξ来说,基本上认为有3ξσ≤,这种近似的说法被实际工作者称作是正态分布的“3σ”原则.(0,1)N 分布常常称为是标准正态分布,其密度函数通常以()x ϕ表示,相应的分布函数则记作()x Φ,所以22()()y xxx y dy edy --∞-∞Φ=ϕ=⎰附录中给出了(0,1)N 分布的()x ϕ和()x Φ的表,如果要查(,)N 2μσ分布,只要通过一个函数关系(变换)就能解决.设ξ是2(,)N μσ分布的随机变量,则22()2()y xP x e dy -μ-σ-∞ξ<=⎰这时,令ξ-μη=σ则η也是一个随机变量,并且有()()()2P x P x P x ξ-μη<=<=ξ<σ+μ22()2y x e dy -μ-σ+μσ-∞=对上述积分作变量代换,令y u -μ=σ即得22()()u xp x edu x --∞η<==Φ⎰由此可知η是一个服从(0,1)N 分布的标准正态随机变量。
连续随机变量
x
x0 0, 2 1 / 2 x , 0 x1 F ( x) 2 1 / 2 x 2 x 1, 1 x 2 1, x2
ቤተ መጻሕፍቲ ባይዱ
P{X(0.5,1.5)}= F(1.5)-F(0.5)=3/4
例2. 设X的密度函数为
Ax(3x 2) 0 x 2 p ( x) 其他 0
f ( x )dx 2
0
1 x x e e dx 2
0
1
x
2 设随机变量X的概率密度为 f ( x) ae 求常数a.
a
1 2
例1.已知随机变量X的概率密度为
0 x1 x f ( x) 2 x 1 x 2 0 其它
15 45
解:设A—乘客候车时间超过10分钟
X—乘客于某时X分钟到达,则XU(0,60)
P( A) P{10 X 15} P(25 X 45} P{55 X 60}
5 20 5 1 60 2
2. 指数分布 Exp( ) 若r.v.X的p.d.f.为 e x , x 0
德莫佛
(I) 正态分布的定义
若X 的 p.d.f. 为
亦称高斯 (Gauss)分布
( x )2 2 2
f ( x)
1 2
e
x
, 为常数, 0 则称 X 服从参数为 , 2 的正态分布 记作 X ~ N ( , 2 ) 2 ( x ) ? 2 1 2 e dx 1 2
因为:
(4) P a X b P a X b P (a X b )
第二章3连续型随机变量
解: ⑴.由密度函数的性质 f x dx
1
得 1
解得,
f x dx
2
f x dx f x dx
2 0
0
2
2
f x dx
2
c 4 x 2 x
0
8 2 3 2 dx c 2 x x c 3 3 0
而 {X=a} 并非不可能事件
{ X R {a}} 并非必然事件
可见, 由P(A)=0, 不能推出 A 由P(B)=1, 不能推出B= 称A为几乎不可能事件,B为几乎必然事件.
因此,对连续型随机变量,概率为0未必是不可能事件; 概率为1未必是必然事件。
f 注释5° ( x 0 ) 表示 { X x 0 }的概率 .
对
X 落在该区间中的概率就
越小.
f (x)
1 2
0
h
h
x
⑶.曲线
y f x 在 x 处有拐点;曲线
y f x
以 Ox 轴为渐近线.
f (x)
0
⑷.若 固定,而改变 移动,但不改变其形状 由参数 所确定.
h
h
x
例3 某路公交车每10分钟来一趟,一位随机到达的乘 客候车时间X是一随机变量,求: (1)概率密度;
(2)候车时间至少8分钟的概率。
解: (1)X服从均匀分布,
1 f ( x ) 10 0 X [ 0 , 10 ] 其它
(2)候车时间至少8分钟的概率:
P { 8 X 10 }
x
判断:f(x)=sinx在哪一区间上是某一连续型 随机变量的密度函数 1 (1)x∈[0,/2] (2)x∈[0,] (3)x∈[0,3/2]